讯飞星火认知大模型公测引发争议,功能表现到底如何?

文章主题:电影, 音乐, 美食

666AI工具大全,助力做AI时代先行者!

本文由速途网(sootoo123)原创

作者 / 赵佳茹

5月的第一个大模型来了,你看好讯飞星火吗?

🎉 2023年1月,BuzzFeed宣布与OpenAI合作,利用ChatGPT的创意生成能力来帮助公司激发二级市场。这标志着全球科技巨头们对人工智能技术的深入探索和应用。🚀在这一年中,OpenAI不仅推出了ChatGPT,还展示了其强大的自然语言处理和对话理解能力。这款人工智能助手能够理解和生成人类语言,为用户提供各种各样的信息和服务。它不仅可以回答问题,还可以创作文章、写故事、设计广告等。除了BuzzFeed,全球各大科技巨头也纷纷宣布有GPT相关技术储备。谷歌、微软、百度、阿里巴巴、字节跳动、腾讯、华为、科大讯飞等公司都在积极研发和应用人工智能技术,以提升产品和服务的质量和用户体验。在未来,随着人工智能技术的不断发展和完善,我们期待看到更多的创新和突破。无论是ChatGPT这样的聊天机器人,还是其他形式的人工智能技术,都将对我们的生活产生深远影响。

🎉 今天是科大讯飞的超级日子!🎉首先,让我们来聊聊讯飞星火大模型的发布。在5月6日,科大讯飞宣布了这个令人兴奋的消息!🚀然后,我们来看看科大讯飞是如何开启公测的。4月24日,科大讯飞突然对外开启了公测的大门!🎉 你只需要填写一份问卷调查,就能获得测试资格!🎉所以,如果你对人工智能感兴趣,或者想要了解最新的科技动态,那么不要错过这次机会!🚀#科大讯飞 #人工智能 #公测

🎉 科大讯飞的反向跳票策略备受关注!他们提前开启了公测,这无疑是对讯飞星火认知大模型的高度信任和信心的体现。

🎉 讯飞星火认知大模型发布会现场,科大讯飞董事长刘庆峰分享:“认知大模型初出茅庐,仍在快速成长与迭代中。若仅凭单一案例验证哪个系统更优或劣,实无意义。”

但这款大模型的表现到底如何?速途网根据科大讯飞的科学评测体系来体验一把。

拿小问题细数“星火”的各项功能

🎉 发布会现场,科大讯飞的刘庆峰董事长向我们展示了通用人工智能的七大维度能力。这包括了文本生成、逻辑推理、语言理解、数学能力、代码能力、知识问答和多模态能力。这些能力让人工智能能够更好地理解和处理自然语言,从而实现更高效的工作。🌟 在展示中,科大讯飞还展示了星火认知大模型在各种场景下的表现。例如,在写发言稿、邮件、营销方案和英文写作等方面,星火认知大模型都能展现出出色的能力。而且,它还能以小红书的文本形式生成内容,这无疑为用户提供了更多的选择。🎉 科大讯飞的这些能力不仅提升了人工智能的工作效率,也使得人工智能能够更好地理解和处理自然语言。在未来,我们期待看到更多这样的创新和突破,让人工智能真正成为我们的得力助手。

🎉 注意到的是,在手机或PC浏览器中打开讯飞星火,都能够实现语音输入问题!就目前市面上的类ChatGPT产品而言,仅科大讯飞实现了语音输入和输出,这点值得称赞!当然,这主要得益于科大讯飞多年在智能语音方面的研究,与讯飞听见、讯飞有声等产品内容的基础相关。

据速途网深度体验显示,目前版本的讯飞星火大模型为单模态人工智能大模型,支持文字信息。但速途网在5月5日选择官方推荐的对话“用emoji表情为我介绍电影《泰坦尼克号》”,星火的回答中出现错码/乱码的情况。

不过,在今日讯飞星火认知大模型发布会期间,速途网再次测试该问题后发现,讯飞星火出现了emoji表情,与此前回复有所差别,不再出现乱码,这说明讯飞星火已经迭代。

紧接着,速途网又以“今年母亲节是哪天?”“今年母亲节是几月几日?”进行提问。

对于问题中的“今年、哪天”,星火只能反馈到今年是2023年,当提示词更加精准到“几月几日”时,回答也定位到了2023年5月14日。

对于汉语口语化的词“哪天”,讯飞星火的理解能力表现中规中矩。

此外,速途网通过语音识别输入提问问题“请帮我筹划一下,今年母亲节我该送给妈妈什么礼物?”讯飞星火的回答与文心一言、ChatGPT等目前已发布的大模型并未有什么差距。

图为讯飞星火认知大模型

图为百度文心一言

图为ChatGPT3.5大模型

当速途网提问“我在北京,她在山西,我该如何在母亲节体验孝心?”

讯飞星火则回复“即使身在不同的城市,也可以通过以下方式在母亲节体验孝心”,这其中值得注意的是第3个方案中,“为她做饭”,显然不在同一个城市无法为妈妈亲手做一顿丰盛的饭菜,AI的逻辑性还有待提升。

在讯飞星火发布会期间,科大讯飞董事长刘庆峰的测试中,讯飞星火能够理解“高兴、自豪”等情感词,其理解能力在发布会表现比较良好,由此看来,星火大模型在发布会期间迭代为最新的版本,但在发布会的现场演示中,多语种、逻辑推理和数学能力的演示过程中表现出了不足。

在科大讯飞现场的演示中,讯飞星火能够合成虚拟人视频进行文本朗读也引发了网友的关注,在现场演示中,不到30秒的时间就可以直接生成一段女生形象的虚拟人朗读上述生成的文本。

但速途网在目前的测试版本中对讯飞星火进行提问,将星火大模型生成的五一旅游计划进行虚拟人朗读操作后发现目前的版本中还未支持合成虚拟人视频,对此,也有不少网友猜测,生成虚拟人视频功能或许将在未来成为收费项目。

对此,速途网也联系到科大讯飞工作人员,她表示,目前的版本中不支持生成虚拟人视频,还未开放全功能版本,将在后续开放全功能版本。

在速途网的测试中也注意到,讯飞星火大模型目前在理解能力、逻辑能力以及数学能力中展示的并不完美,甚至在发布会现场演示也出现了外语回答中夹杂中文字样的回复,但整体来看,科大讯飞能在5个月的时间内交付出讯飞星火也证明了其多年的技术积累,也希望在今后快速的迭代中,讯飞星火能够达到客户满意的程度。

“AI+”的时代来临

科大讯飞等中国企业勇敢对标ChatGPT

此外,科大讯飞董事长刘庆峰也在发布会现场提出了“纯大模型技术的攻克缺陷”,针对“新知识难以及时更新”、“事实类问答容易张冠李戴”、“史实、传统典籍等容易编造情节”,科大讯飞针对目前存在的问题也提出了解决方案,更是宣布在今年的三个阶段的升级计划:

第一阶段,在6月9日,突破开放性问答,如实时问答;多轮对话能力再次升级;数学能力再上台阶;

第二阶段,在8月15日,突破代码能力;多模态交互能力正式开放给客户;

第三阶段:10月24日,在通用大模型领域对标ChatGPT,中文超越,英文相当。

当然这一计划公布,不禁也让网友为科大讯飞捏了一把汗,到底是刘庆峰的口嗨还是中国高新技术企业的自信?

如果说讯飞星火认知大模型的发布是科大讯飞在“秀肌肉”,那将其大模型运用并实践在了产品中,也是大模型的具体落地形式,让大模型有了“用武之地”,也在真正意义上实现了“AI+”的趋势来临。

对于星火认知大模型未来的行业应用,刘庆峰表示,将主要应用在教育、办公、汽车、数字员工四大方面。

速途网注意到,在科大讯飞发布会进行到第二部分,刘庆峰演示科大讯飞学习机、翻译笔、办公本等硬件产品和讯飞输入法、讯飞听见 APP、虚拟人等软件产品的AI能力,展示了全线接入讯飞星火后,能够进行作文的评阅修改、英文语法、单词修改、文章润色等功能,以及科大讯飞语音识别翻译等技术,给不少用户带来了新功能的惊喜。

以讯飞星火为代表的认知大模型技术,注定会在人工智能领域、各行各业掀起新的变革。事实上,AI大模型此刻的光鲜亮丽,是众多科技企业多年的技术沉淀与积累。

短短几个月,国内就超过10来家企业推出了大模型产品,让人感觉到中国企业科技研发能力的强大。在充满不确定性的内外环境下,中国企业能够深耕认知AI,可以预见的是,在新一轮行业变革中,以百度、科大讯飞、昆仑万维、出门问问等为代表的中国企业已经站在了前沿。速途网期待更多中国企业的研究成果出现,还将持续关注国内最新的人工智能成果。

AI时代,掌握AI大模型第一手资讯!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

扫码右边公众号,驾驭AI生产力!

Leave a Reply