《ChatGPT升级:看、听、说能力增强,OpenAI应对担忧》

文章标签:OpenAI, ChatGPT, 语音识别, 图像处理

近日,人工智能领域的领军企业OpenAI公司发布了一项重大进展,其核心技术ChatGPT实现了“多模态”交互能力。据公司透露,ChatGPT现在能够“看、听、说”,甚至能够以合成的声音做出反应,同时处理图像信息。这一突破性的技术进步标志着人工智能研究领域又向前迈进了一步。

自GPT-4推出以来,OpenAI便不断推陈出新,近日更是带来了一次重大升级,推出了全新一代聊天机器人。这一次的更新力度空前,因为它不仅让用户能够在ChatGPT移动应用中体验语音对话,更提供了五种不同风格的合成声音供用户选择,从而让机器人的回应更加贴近用户的期望。此外,用户还可通过ChatGPT分享图像,并可对其进行标注或分析,以便更好地满足特定需求。

OpenAI宣布,这些更新变化将在未来两周内向付费用户提供。值得注意的是,尽管语音功能将仅限于支持iOS和Android设备的应用程序,但是图像处理功能却可在所有平台上正常使用。

 与此同时,OpenAI、微软谷歌和Anthropic等聊天机器人领导者之间的人工智能军备竞赛的赌注也在不断上升。为了鼓励消费者将生成式人工智能应用到日常生活中,科技巨头们不仅竞相推出新的聊天机器人应用,还竞相推出新的功能,尤其是在今年夏天:谷歌宣布对其聊天机器人巴德(Bard)进行一系列更新,微软在必应(Bing)中添加了视觉搜索功能。

在今年初,微软对人工智能领域的领军企业OpenAI进行了进一步的投资,增加投资额达到100亿美元,从而使它成为今年最大的人工智能投资项目。据PitchBook数据显示,今年4月,OpenAI成功完成了3亿美元的股票发售,其估值达到了270亿至290亿美元。此轮融资由红杉资本和其他知名投资公司共同参与,显示出OpenAI在人工智能领域的重要地位和巨大的发展潜力。

作为一篇高质量的科技文章,我们需要深入探讨人工智能生成的合成声音所可能带来的影响。尽管这种技术能够为用户提供更加自然的使用体验,但同时也存在着被用于深度伪造的风险。据相关专家警告,网络威胁行为者和研究人员已经开始尝试利用深度伪造技术来突破网络安全系统的防御。因此,对于这一领域的研究,我们应当保持警惕并采取相应的预防措施。

在本周一的一份声明中,人工智能研究公司OpenAI对于有关合成声音的担忧做出了回应。他们确认,合成声音是由该公司直接合作的配音演员所创作的,而非从陌生人处搜集。这一举措旨在确保合成声音的来源透明且可靠,以消除公众对这些技术应用的疑虑。

原内容未涉及OpenAI如何运用用户语音输入以及如何保障数据安全的相关信息。目前,OpenAI尚未就评论请求作出回应。根据其服务条款,消费者在符合法律规定的范围内拥有对自己输入的所有权。

现在送您60元福利红包,直接提现不套路~~~快来参与活动吧!
海量资讯、精准解读,尽在新浪财经APP

责任编辑:李桐

OpenAI, ChatGPT, 语音识别, 图像处理

Leave a Reply