《AI芯片:大模型的算力挑战与解决方案》

文章标签:关键词:OpenAI,AI大模型,算力

打开凤凰新闻,查看更多高清图片

(图片来源:Eurasiantimes)

10月6日消息,据报道,ChatGPT背后的美国 AI 公司OpenAI 计划自研 AI 芯片,从去年开始进行内部讨论,甚至已经开始评估 AI 芯片公司的潜在收购目标,以解决其所依赖的 AI 芯片短缺以及成本高昂问题。

据报道,OpenAI团队提出了三种人工智能大模型的算力采购方案。首先,他们建议研发自家的AI芯片。其次,OpenAI也愿意与英伟达等芯片制造商展开更深入的合作。最后,他们计划在英伟达之外寻求多元化的芯片供应来源,以实现超越英伟达的目标。

在2022年的时候,OpenAI的CEO奥特曼(Sam Altman)就曾经公开表示,英伟达的GPU芯片供应短缺,会对公司的运营造成严重的影响。

作为全球Al训练领域市场的领导者,英伟达占据了95%的市场份额。然而,随着其主流产品GPU(图形处理器)的短缺以及AI算力成本的不断上升,即使是实力强大的OpenAI也必须寻求新的解决方案,以确保不会长期受到“卡脖子”的影响。

OpenAI CEO 奥特曼(Sam Altman)

算力成本猛增,OpenAI寻求定制 AI 芯片

自2023年以来,AI大模型的浪潮由ChatGPT引领,席卷全球。这一趋势正在推动AI朝着更为通用的方向发展。然而,算力的短缺和高昂的价格已经成为限制AI发展的主要障碍。

黄仁勋,这位杰出的企业家,作为英伟达的创始人和首席执行官,凭借其卓越的领导才能和对AI行业的深刻理解,成功地将该公司引领至全球数据中心AI加速市场的领导地位。在全球AI训练领域,英伟达更是以95%的市场占有率独占鳌头,成为了这场AI大战中最大的赢家。英伟达在全球数据中心AI加速市场的优势地位以及其对AI技术的深度挖掘和应用,使得黄仁勋及其公司获得了丰厚的利润。据相关数据显示,英伟达公司的市值已经超过1万亿美元,而黄仁勋的个人身家也达到了令人瞩目的399亿美元。总的来说,黄仁勋以其卓越的领导下,英伟达在全球AI市场中取得了显著的优势,并为其赢得了巨大的经济利益。

近年来,随着数据处理需求的迅速增长,尤其是算力的需求,英伟达的GPU产品线变得越来越受欢迎。其中,英伟达A100显卡因其卓越的性能表现,已经成为了衡量一家公司算力水平的标志性设备。如此抢手的产品,供应紧张,以至于其 availability已经成为行业内的一个重要议题。

据统计,OpenAI在其训练GPT-3.5模型的过程中,投入了1万至3万颗英伟达GPU。根据集邦咨询的报告,如果我们以英伟达A100显卡的性能作为基准,那么运行ChatGPT可能会需要3万块英伟达GPU显卡。

价格方面,目前国内可以买到的H800价格已经高达20万/张,而A100/A800价格已涨至15万、10万/张左右。以2000P算力需求为例,H800 GPU单卡算力2P,需要1000张,预测用卡成本为2亿元;A800单卡算力约为0.625P,需要数量为3200张,预计用卡成本就高达3.2亿元。

在购买GPU显卡之外,服务器整机配置运算也是一个不可忽视的因素。这包括但不限于CPU性能、存储容量、NV-Link通讯连接等方面。此外,我们还需要考虑到电力消耗、场地租金以及运维成本等费用。据相关数据显示,这些因素的综合成本可能会超过6亿元。与此同时,OpenAI目前正采用微软的超级昂贵超级计算机,这种计算机耗资数亿美元,采用了数万颗英伟达芯片的Azure云进行算力训练。

但是,自OpenAI公布GPT企业云业务以来,微软与 OpenAI 关系正渐行渐远,有消息显示,微软也在开发定制 AI 芯片。

事实上,不止是OpenAI,这一波算力需求浪潮中,谷歌、亚马逊、微软、Meta等大科技巨头公司都一直在设计 AI 芯片到业务当中。例如,谷歌最新发布的Pixel 8系列手机采用Google Tensor G3芯片和Titan M2协处理器,均是谷歌自研产品;而亚马逊最新发布的自研ARM服务器CPU芯片Graviton 3E,也应用于其AWS云业务当中。

然而,OpenAI 没有研发 AI 芯片的经验,一颗芯片从立项到量产至少两年以上的时间,目前尚不清楚 OpenAI 是否会继续推进定制芯片计划,而且芯片的成效如何也有待时间检验。

路透引述业内人士称,这是一项巨额投资,每年研发成本可能高达数亿美元。同时,OpenAI 正考虑收购一些 AI 芯片公司以加快自研芯片进程。

但定制 AI 芯片可能需要数年时间,这意味着,OpenAI 仍会长期以来英伟达、AMD等芯片供应商。

有趣的是,The information于10月4日报道称,Meta公司放弃定制VR/AR芯片,团队已解散,转而使用芯片高通提供的处理器芯片。

因此,OpenAI这款定制 AI 芯片最终是否真的可用,仍需时间检验。

另有消息显示,软银计划投资10亿美元与奥特曼一起建立新的 AI 硬件公司,而苹果设计师 Jony Ive也和奥特曼讨论打造一款新的 AI 硬件产品。

大模型市场竞争加剧,谷歌、亚马逊转投OpenAI竞争对手

就在亚马逊宣布投资几天后,传出OpenAI的竞争对手、人工智能(AI)独角兽公司Anthropic正进行再融资。

据The information 10月4日报道,成立仅两年的Anthropic公司正在与谷歌和其它投资人谈判,计划再完成至少20亿美元(约合人民币143.94亿元)的新一轮融资,投后估值或将达到200-300亿美金之间——是今年3月公司40亿估值的5倍以上。

随后,AI 大模型市场竞争加剧,谷歌、亚马逊也开始关注并布局 OpenAI 的竞争对手。

据悉,Anthropic AI公司于2021年、由OpenAI 前研究副总裁达里奥·阿莫迪(Dario Amodei)、GPT-3论文一作Tom Brown等人建立。当时,Amodei领导的研究人员在对公司的发展方向存在分歧后离开了OpenAI,他们担心微软对OpenAI的投资会使其走上更加商业化的道路,偏离公司最初想法。

2022年12月,Anthropic团队在arxiv上发布了一篇题为《Constitutional AI: Harmlessness from AI Feedback》论文,描述了一个基于无监督方式训练、520亿参数的模型 AnthropicLM v4-s3,直接对标OpenAI的GPT-3模型。

今年1月,Anthropic发布了基于AnthropicLM v4-s3、新的 AI 聊天机器人模型产品Claude,被认为是ChatGPT的有力竞品。

今年2月4日,谷歌旗下云计算部门Google Cloud宣布与Anthropic建立新的合作伙伴关系,而且消息指谷歌向Anthropic投资接近4亿美元(约合人民币20.3亿元),新融资将使Anthropic投后估值增至近50亿美元。

谷歌投资之前,Anthropic公司已筹集超过7亿美元融资,投资者包括FTX创始人SBF成立的加密货币对冲基金Alameda Research等。而谷歌投资Anthropic原因之一,是公司CEO多次表达ChatGPT对于其搜索、广告等业务带来的威胁与影响。

据The information报道,Anthropic向投资者表示,此前公司年收入一直在 1 亿美元左右,但由于与亚马逊深度合作,预计其2023年收入大幅增长,将达到2亿美元,月收入接近1700万美元;到2024年底,Anthropic 希望年收入将达到5亿美元,是Anthropic估值的1/200倍,远高于OpenAI的估值倍数。

(作者|林志佳)

关键词:OpenAI,AI大模型,算力

Leave a Reply