GPT4:多模态模型带来的文本与图像双重视野

文章主题:GPT4, 多模态模型, 语言理解, 语言生成

666AI工具大全,助力做AI时代先行者!

在3月15日的凌晨时分,OpenAI公司揭开了ChatGPT的神秘面纱,正式推出了全新的“升级版”GPT4模型。OpenAI官方网站迅速响应,立即发布声明称,GPT4是一个具备图像与文本输入能力,并能输出的多模态模型,这无疑标志着OpenAI在深度学习领域的最新突破。

在 OpenAI 发布的最新演示视频中,我们发现 GPT-4 的语言理解和生成能力已经超越了其竞争对手 ChatGPT。这一突破使得 GPT-4 能够解答那些 ChatGPT 难以处理的问题,同时还能描述和理解图像。在界面设计上,OpenAI 巧妙地设置了一个“系统”面板,使用户能够根据自己的需求自定义聊天机器人的角色,从而使 GPT-4 在未来能够更好地满足用户在个性化的方面的期待,实现更为深入的拟人化。

在OpenAI的演示视频中,公司的总裁兼联合创始人格雷格·布罗克曼展示了一段令人印象深刻的内容。他呈现出一种惊人的能力,即GPT-4能够完成GPT-3.5所无法实现的某些任务。这一成果展示了人工智能技术的巨大进步,也预示着未来的发展方向。

GPT4比ChatGPT强在哪?

据相关报道,近期在网上炒得火热的ChatGPT起源于GPT3.5模型,而GPT4的性能则远超GPT3.5,展示了更为出色的语言理解能力,某些任务甚至超越了ChatGPT的表现。

在OpenAI的演示视频中,公司总裁兼联合创始人格雷格·布罗克曼(Greg Brockman)选择了一篇论文,并请求ChatGPT将其精炼为一串由每个单词都以“G”开头的句子。尽管ChatGPT成功地实现了这个目标,但是无法确保每个单词都遵循这个规则。相比之下,GPT4在这个任务上表现得相当出色。

GPT4 now supports up to 3.2 million tokens (approximately 240,000 words) as an acceptable text input length, demonstrating remarkable performance on a variety of professional and academic exams that mirror human capabilities. For instance, it has achieved a top-10 performance in the simulated legal exam, while its predecessor, GPT-3.5, lags behind at the bottom of the pack.

另一重大突破是,GPT4可以认识图片了。

ChatGPT只能通过向其输入文字提问才能生成文字回答,但GPT4可以直接输入图像,并令其用语言描述图像内容。在演示案例中,GPT4就详细描述了布罗克曼发给它的电脑网页截图,甚至精确描述了该截图的中心、左侧和右侧分别是什么内容。

除了描述图片内容外,使用者还可以基于图片向GPT4提其他问题,如布罗克曼在演示中输入了一张拿着照相机的松鼠漫画,并询问GPT4“这张图片好笑在哪?”,GPT4回答,“这张图片展现了一个松鼠拿着照相机,像专业摄影师一样拍摄松果,其笑点在于这实际上只有人类才做得到,松鼠是吃松果的,我们不能指望它像人类一样会用照相机。”

GPT4可以描述漫画图片的“笑点”在哪 (OpenAI演示视频截图)

贝壳财经记者注意到,此项功能如广泛应用,将给视障人士带来极大的便利。布罗克曼表示,目前GPT4的识图功能正在与合作伙伴一起应用于一个名为“做我的眼睛”的项目。

此外,相比ChatGPT默认始终如一的语气,记者注意到OpenAI此次展示的AI聊天界面左侧有一个“系统”选项,用户可以在此指定GPT4的背景设定,如“你是一个程序员”“你是一个报税人员”等,而具体的问题可以在右侧界面提出,GPT4可以结合用户向它定义的角色回答用户提出的问题。

事实上,进行角色扮演是ChatGPT就能够实现的功能,如贝壳财经记者指定ChatGPT扮演“英语老师”并指出记者输入语句的语法错误后,ChatGPT就可以按照要求实现该功能,但如果不总在提问里强调这一“角色设定”,ChatGPT总会忘记其应该扮演的角色。对此,OpenAI的新设置或能避免这一问题。

在可以预见的未来,该功能也将让基于GPT4的聊天机器人更富感情色彩,相比OpneAI在展示视频中给GPT4定义的程序员等角色,用户在实际使用中更倾向于让聊天机器人扮演“男/女朋友”“亲密伙伴”等角色,以填补内心的情感空白,这将在未来让聊天机器人拥有更加广阔的市场和更加复杂的社会意义。

ChatGPT Plus会员才能申请使用 新版必应已应用部分功能

布罗克曼表示,目前GPT4的许多功能正在优化中,面向公众还需一段时间。不过,据微软方面透露的消息,新版必应搜索已经通过GPT4增强了功能。

目前,虽然OpenAI开放了GPT4的API接口,但只有ChatGPT Plus会员才能获得具有使用上限的GPT4访问权限,而其他用户需要排队申请内测。这导致GPT4发布结束后,有大批新订用户涌入OpenAI网站,以至于OpenAI的付款系统被“挤爆了”。

3月15日,贝壳财经记者通过OpenAI进入GPT4的API接口申请页面发现,想加入GPT4的候补名单,需要填写姓名、邮件、公司组织编号以及计划如何使用GPT4等问题。

不过,OpenAI也在官方网站上给出了目前GPT4存在的不足,如其仍然存在包括社会偏见、捏造事实、对抗生成等已知限制。OpenAI对此表示,随着社会对AI模型的接受,将增加透明度,鼓励并促进用户教育和更广泛的人工智能素养,并致力于扩大人们在培养AI模型方面的输入途径。

3月15日,当贝壳财经记者咨询ChatGPT是否了解GPT4时,ChatGPT回答道,“我了解的知识只截至2021年4月,此时还没有关于GPT4的官方公告或发布日期。但预计OpenAI将继续开发和改进其语言模型,这最终可能导致将来发布新版本的GPT。作为一名语言模型,我一直在学习和适应新的数据和技术进步,所以我将继续随着这些发展而发展。”

记者联系邮箱:luoyidan@xjbnews.com

新京报贝壳财经记者 罗亦丹

编辑 陈莉

校对 陈荻雁

举报/反馈

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply