【券商聚焦】华泰证券:ChatGPT多模态功能升级 促AI应用
金吾财讯 | 华泰证券发研报指,据OpenAI官网,ChatGPT将在未来两周内对Plus用户与企业用户开放新功能,包括语音对话能力以及图像读取与理解(图生文)能力。语音对话的功能针对ios及安卓客户端开放,图生文能力将向全平台开放。该行看到ChatGPT在语音对话及图生文等功能上的更新是其在多模态化上的进一步迭代,提升用户的使用便捷性和场景范围。AI生态企业的垂直应用有望受益于AI工具在语音、图像等多模态领域的完善,由文本、语音、图像向更复杂模态的视频、3D模型的AIGC也将持续推进。
该行指,此外,OpenAI于9月20日在官网宣布推出文生图AI工具的最新迭代版本DALL·E3。相较于前代,DALL·E3在提示词辅助生成及文本理解、图片生成细节丰富度上有显着的提升。DALL·E3将于10月初面向ChatGPTPlus和企业用户开放。OpenAI在官网指出希望能够构建安全并且有益的AGI,因而逐步丰富目前的产品功能,包括此次的语音及图像相关的能力。另外,据TheInformation,谷歌也将推出最新多模态AI大模型Gemini。该行认为,随相应功能开放后,头部大模型公司的多模态道路有望加速推进,AI生态企业的垂直应用有望受益于语音、图像等多模态能力的完善。