大模型革命:百度文心一言引领AI新潮,我国科技巨头谁将跟进?

文章主题:百度文心一言, 人工智能, 聊天机器人, 通用人工智能

666AI工具大全,助力做AI时代先行者!

本文是由问题如何看待百度文心一言发布会第二天,百度集团股价大涨15%?触发的联想和展望。

在2022年的11月份,OpenAI的ChatGPT首次成功地将其聊天机器人的技能提升至具有某种程度的通用人工智能(AGI)能力,并且在短短两个月的时间内,成功吸引了1亿的用户。这一结果表明,大型语言模型的性能已经顺利地跨越了用户体验的临界点,甚至一个最纯粹的AI产品——聊天机器人,也能在短时间内取得如此巨大的成功。

所有这些都远远超出了包括OpenAI在内的整个科技行业的预期。过去几年中,大多数人以及许多科技公司都认为,AI仅仅是一种改善产品体验的技术,它可能需要花费很多年的时间来改进产品的用户体验,但不会去创造全新的、具有独特体验的产品。然而,现在聊天机器人在用户体验方面已经突破了临界点,这标志着AI技术正在走向一个全新的阶段。

对百度来说,这是一次难得的再造百度的机会。

百度拥有两次重振旗鼓的机会。首先,是已经在路上运行的自动驾驶技术,它已经投入超过了1000亿元人民币,并且有望在未来实现更广泛的应用。其次,则是当前的文心大模型,这是百度在人工智能领域长期积累的成果,其家族成员包括视觉大模型、生物计算大模型等,这些模型已经发展了好几年,积累了丰富的经验和技术。

(其实从美国到中国很多AI行业内非常多人对生物计算大模型都寄予厚望。)

关于为何是 OpenAI 而非其他公司率先推出广受关注的产品,尽管 ChatGPT 的成功得益于强大的支持,但如何发挥这种优势确实是技术进步的产物。

大模型能力作为基础的产品具有很高的技术壁垒和初始优势。当确实存在巨大的用户和商业需求时,百度有可能开发出比现有业务的总价值更高的产品。

(关于技术发展和先发优势的一些观点,我最后再单独介绍。)

百度是目前国内企业里最有决心、最有条件干成这件事的公司。

关于决心,实际上无需过多言辞。作为继OpenAI之后的第二个发布同类产品并公开测试的企业,百度展现出了强烈的决心。尽管谷歌举行了相关产品的发布会,但并未开放测试,这使得国内的其他大型企业只能口头承诺开发类似ChatGPT的产品,却尚未制定具体的时间表,更无法让公众实际体验到这些产品。

决心和条件的基础大概可以总结为两个。

第一,类似ChatGPT、文心一言的大模型对于搜索引擎的体验有很大的影响,甚至说可能重塑搜索体验。百度和Google对此看得再重也不为过。腾讯、阿里、字节等大厂的产品形态离聊天机器人更远,数据积累会更差,执行这件事的决心也会天然就差一些。

第二,百度对AI、研究院的投入持续十余年了,对文心大模型的投入也是国内最早一批。技术上有积累,所以能在国内率先发布。国内其他互联网公司对AI的投入虽然也是不少,但是近年很多大厂的AI研究部门其实都在背负短期盈亏指标。要知道,大模型的研发投入是长年累月的,但是回报是突破临界点忽然出现的。考虑到训练出一个大模型要上亿人民币的成本,要下定决心且说服领导做大模型,这个决心对国内互联网公司非常不容易。说服领导这个事,甚至让做大模型难上加难。。

但是真正抓住这个再造百度的机会也还有长路要走。

AI的技术和品牌上,百度在国内牢牢占据先机。

但是大模型驱动的产品形态会怎么演变、延伸到更多领域?产品的形态现在还属于比较蛮荒的初创期,未来的可能性还有很多,尽管这些可能性可能需要更大的模型去支撑。

产品上的发展,还需要投入很多资源去尝试、去试错。

哪些公司有这样的魄力能真正地收缩力量再重拳出击?

大概这样的公司才能成为最后的赢家。

作为一个PhD和AI Researcher,最后从技术和产业的角度展望一下大模型。

一,正如上面提到的,虽然ChatGPT是大力出奇迹,但是怎么发大力确实是技术进步的结果。

ChatGPT是OpenAI开发的,但是也是站在很多其他机构的论文的肩膀上才能实现的。没有RLHF这个人工参与的数据增强方法,没有方便scale的Transformer模型架构,没有之前的等等技术,ChatGPT绝对无法问世。这些年AI顶会这么多论文当然有很多“废纸”,但是事实上真金白银也就藏在这些“废纸”里。不客气地说一句,废物自然只能看到废纸,看不到AI研究到产业循环已经是所有学科里最快的了。

ChatGPT绝对是AI学术发展的一大胜利果实。反过来,ChatGPT会驱动更多财力、人力投入AI的大发展中。和中文互联网上处处可见的AI泡沫将破的情形不同,目前依然还是AI快速发展的黄金期,只是不能再刻舟求剑罢了。

二,大模型的研发有很强的先发优势和护城河。

现在已经不是很多年前做人脸识别那个年代。几个人的团队就能在几个月时间里追上先发玩家的年代一去不复返了。AI领域很多方向的研究不足以构建护城河,但是大模型是例外。

如果说过去几十年有一个让中国长期追赶、念念不忘但始终不能望其项背的产业,那么大概是芯片产业。芯片的护城河很强的原因是研发投入大,周期长,但偏偏又有摩尔定律——每18个月CPU性能翻倍。摩尔定律对先发者来说是护城河,对后追赶者来说却是一条令人感觉一丝绝望的定律。

恰巧,大模型也有类似的定律。甚至更可怕。

大模型的摩尔定律是——每18个月翻10倍(即每5.7个月翻倍)。

这说明大模型的进化度比计算芯片还要指数级地快!

这也说明大模型所需要的GPU数量会随时间指数级地增加!

考虑到大语言模型的涌现能力(Emergent Abilities of Large Language Models),很多任务能力就是要模型大于一个阈值才会忽然出现,小于一个阈值就一点没有。

综上所述,我们可以有如下推论。

推论一:如果一个公司的GPU数量不能维持在新一代大模型所需要的量级,并随时间指数增强,那么它就不能成为大模型的头部玩家。所以大模型是天然属于巨头的游戏。

推论二:如果一个公司的大模型小于某个阈值,就会缺失某些涌现出的能力。所有玩家都会努力追求最大的模型,以获得竞争对手没有的能力,突破新的临界点。所以大模型是大者通吃的游戏。

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply