2023年3月16日,微软推出了名为Mi

ChatGPT 是当前最热门的话题之一,它是由 OpenAI 开发的一种基于大规模语言模型的对话系统,可以用于文本生成、机器翻译、自动问答、语音识别、情感分析、代码编写等多个任务。OpenAI发布ChatGPT后,仅用时2个月其月活跃用户数量就超过了1亿。为进一步了解ChatGPT,在本期的推文中我们将简单介绍ChatGPT的历史进程,并举例说明一些使用技巧。除此之外,我们还将介绍ChatGPT与其他工具的结合。

一、ChatGPT的介绍

(1) GPT-12018 年,OpenAI 发布了名为 “Improving Language Understanding by Generative Pre-Training” 的模型,即 GPT-1。GPT-1是一个基于transformer架构的神经网络, 其架构包含了12个transformer block, 同时每个block中又含有12个self-attention, 总共有1.17亿个参数。GPT-1 的主要应用领域包括机器翻译、文本摘要、对话系统等。由于其出色的性能,GPT-1 在生成文本和机器翻译等任务中都获得了很高的成绩。(2)GPT-2

2019年,OpenAI推出了名为”Generative Pre-trained Transformer 2″(GPT-2)的模型,它是ChatGPT的第二个版本。与GPT-1不同的是,GPT-2的训练数据大约是GPT-1的10倍,同时引入了一种名为Masked Language Model(MLM)的新的无监督预训练任务。该模型旨在预测在文本序列中被遮盖(masked)的单词。通过训练MLM模型,可以使模型学习到词语间的相互关系和语言结构,从而提高其在自然语言理解、问答和文本生成等任务上的性能。

(3)GPT-3

2020年,OpenAI推出了名为“Generative Pre-training Transformer 3”(GPT-3)的模型架构,该模型架构也是一种基于Transformer的神经网络模型。但是与GPT-2相比,GPT-3在模型规模、训练数据、模型参数等方面都有了大幅提升。其中GPT-3模型的参数量达到了1.75万亿,是GPT-2的10倍以上。此外,GPT-3还支持few-shot learning,即只需要给定几个示例就能进行推理和生成任务。这意味着GPT-3可以从更少的数据中学习,并在处理新的任务时也能够获得较好的表现。

(4)GPT-42023年3月15日OpenAI 发布了最新的多模态语言模型GPT-4,其中OpenAI官方运用这样一句话“GPT-4 is OpenAI’s most advanced system, producing safer and more useful responses”来介绍GPT-4. 与之前的版本相比,GPT-4能够进行图像的输入和长文本的输入,是该版本的一个重要功能。

二、ChatGPT的使用技巧

(1)网络波动问题

点击运行后,如果出现了上述答复,则说明网络存在波动。解决方法是刷新当前页面。但需要注意的是,如果在输入框内输入了很多内容,需要先复制一下,然后再刷新页面,否则这些内容将消失不见。

(2)相同问题下可能给出不同的回答

对于一个相同的问题,在您重复运行后,ChatGPT给出的回答可能会不一样,因为它会根据上次给出的答案去调整这次的回答内容。因此,对于使用者来说,需要考虑到这一点并选择适合的答案,就像下面这些问题会给出不同的结果一样。

(3)使用过程中尽可能详细地描述您的问题

对于您想让ChatGPT帮你解决的一个问题,您描述的越详细,ChatGPT给出的结果就会越准确,这也是您个性化使用它的最好方法,让我们看一下示例。

(4)回答框的长度限制

ChatGPT回答的长度被限制在了5000词以内,超过5000词的部分不会显示出来,但对于一些答案比较长的任务来说,会出现答案不完整的情况,就比如下面的示例:

对于这个问题,ChatGPT在答案中间进行了截断,造成了很不好的使用体验。这里给出两种解决思路,一种是对于答案比较多的问题,您可以对ChatGPT进行调试,让它以模块的形式给出您的答案,每个模块占用1个回答框,这样就可以避免截断的问题。另一种解决办法就是Upgrade to Plus,这样您就可以使用新发布的GPT-4版本,这个版本可以支持25000词的回答。(5)需要警惕虚假答案ChatGPT在回答问题的时候,可能会出现一些不存在的东西。比如您想利用ChatGPT查阅文献,一方面它会根据您的输入内容去查阅它的数据库,另一方面它可能还会根据您的关键词去生成一些从未发表过的文献,这是需要您在使用时额外关注的一件事情。

三、ChatGPT与其他工具的结合

(1) GitHub Copilot X2023年3月23日,Github推出了编程辅助工具Copilot 的全新版GitHub Copilot X[1],该版本接入GPT-4模型,并且新增了聊天和语音功能,允许使用者利用自然语言询问如何完成特定的编程任务。Copilot X 在开发者体验中添加了聊天功能[Copilot Chat]。该功能可以识别开发人员输入的代码、显示错误消息,并将其嵌入到 IDE 中。与此同时,开发人员可以深入分析和解释代码块的用途,生成单元测试,甚至获得针对错误的建议修复。在使用该功能时,要注意其只专注于编程问题,若问题与编程无关,将迅速关闭无关内容。

(2)Microsoft 365 Copilot

2023年3月16日,微软宣布推出Microsoft 365 Copilot,再次引起广泛关注。该软件基于GPT-4技术,通过结合人工智能大型语言模型LLM模型和Microsoft 365应用中的数据,实现了将文字转化为强大的生产力工具。Microsoft 365 Copilot可以与Microsoft365的应用软件相结合,根据简单的命令,这些应用能够自动生成文档、根据文档创建演示文稿、分析Excel的表格数据等功能,提高办公效率。此外,Microsoft 365 Copilot还可以将用户数据与应用程序相关联,根据一个自然语言的提示来实现会议内容总结、文档整理等任务。例如,用户可以通过该软件整理会议笔记,将会议内容转化为一份详细的文档;或者使用该软件分析Excel表格数据,提取需要的信息,以便更好地完成工作。Microsoft 365 Copilot的出现,让人们在文字处理方面更加高效,同时也为人工智能在生产力领域的应用提供了新的思路和方向。

Copilot in Word:只需简短的提示,就可以帮助使用者创建初稿,或者在当前文档上添加内容、重写、总结。例子:

1)根据文档及[电子表格]中的数据写一份两页的项目提案

2)简练第三段内容

3)根据大纲创建一份草稿

Copilot in Excel:帮助分析数据,或者根据使用者的问题生成对应的模型。例子:

1)插入表格

2)对变量进行分析

Copilot in PowerPoint: 根据 Word 文档创建演示文稿。例子:

根据文档创建一个5页的幻灯片

参考文献

[1] https://github.com/features/preview/copilot-x.

Microsoft 365 的 Copilot 功能是一项全新的工作模式,将改变我们的工作方式。

关键词:2019 年,OpenAI 推出了名为 “Generative Pre-trained Transformer 2” (GPT-2) 的模型,即 GPT-2。它是 ChatGPT 的第二个版本,跟 GPT-1 相同之处是仍采用了transformer 的网络架构。不同之处是 GPT-2 的训练数据大约是 GPT-1 的 10 倍,同时 GPT-2 引入了一种名为Masked Language Model(MLM) 新的无监督预训练任务,该模型主要目的是预测在文本序列中被遮盖(masked)的单词。通过训练 MLM 模型,可以使模型学习到词语间的相互关系和语言结构,这有助于提高模型在自然语言理解、问答和文本生成等任务上的性能。2020 年,OpenAI 推出了名为 “Generative Pre-trained Transformer 3” (GPT-3) 的模型架构,它也是一种基于 Transformer 的神经网络模型,但是与 GPT-2 相比,GPT-3 在模型规模、训练数据、模型参数等方面都有了大幅提升,其中 GPT-3 模型的参数量达到了 1.75万亿,是 GPT-2 的 10 倍以上。此外,GPT-3 还支持 few-shot learning,即只需要给定几个示例就能进行推理和生成任务。

Leave a Reply