文章ChatGPT引领科研与产业变革:大语言模型的发展与应用

文章主题:ChatGPT, 自然语言模型, 科研范式变革, 产业变革

666AI工具大全,助力做AI时代先行者!

转自:俞陶然

自ChatGPT诞生以来,我国上海地区的学术界和产业界已经成功研发出了包括MOSS、“曹植”以及“魔力写作”在内的多款大型自然语言模型。在这些模型中,MOSS由复旦大学的研究团队打造,目前正处于校园网内的试运行阶段,预计将在本月升级完毕并实现开源;而“曹植”则是由达观数据公司负责开发,同样处于试运行阶段,计划在今年的上半年正式推出;“魔力写作Magic Writer”则是由竹间智能公司打造,目前已经得到了多家企业用户的试用,个人用户版本的“灵感闪写”和“文胆”微信小程序也已经上线一个月。对于ChatGPT所引发的科研范式变革和产业变革,我们应如何理解和应对呢?政府、高校院所和企业又应当采取何种行动呢?为此,我们有幸采访到了三位大语言模型的开发负责人,他们从各自的视角分享了对这一问题的看法。

科研范式变革涉及众多学科

在科学研究的範式轉換中,有两个層次需要關注。首先,诸多學科領域開始導入人工智慧,進行名為AI for Science(人工智慧推動科學研究)的項目。其次,在人工智慧領域內,傳統的自然語言處理技術正在逐漸被以大語言模型為基礎的通用人工智能(AGI)研究所取代。這一觀點是由复旦大学計算機科學技術學院教授兼MOSS開發團隊負責人邱锡鹏提出的。

在诸多学科领域,AI for Science近年来正在兴起。越来越多的科研人员在用人工智能系统分析海量数据,从中得出一些人脑很难想到的科学结论。2020年,“阿尔法折叠2”系统精准预测了蛋白质三维结构,被《科学》杂志评为2020年十大科学突破之一。去年,ChatGPT的惊艳亮相指出了一条新的AI for Science路径——让大语言模型“阅读”大量科学文献后,利用其生成内容的不确定性来进行“头脑风暴”,设计新的科研规划或技术路线。

在我国的人工智能领域,ChatGPT的出现颠覆了传统的句法分析等研究思路。它的强大自然语言理解和生成能力使得人们逐渐认识到,对于大型语言模型而言,句法分析等中间步骤并非必要。因此,各类科研团队纷纷调整研究方向,有的开始研发自家的大型语言模型,有的则是将自研的小型模型与开源的大模型进行融合,以打造更为出色的混合式模型。这样的转变无疑反映了大型语言模型在人工智能领域的地位日益重要,也预示着未来该领域的研究方向将更加聚焦于提高模型的性能和实用性。

“灵感闪写”微信小程序

“灵感闪写”以及”魔力写作”是混合式模型产品的代表。竹间智能的创始人兼首席执行官,微软(亚洲)互联网工程院前副院长简仁贤阐述,他们公司通过将自研的自然语言处理(NLP)小模型与大型语言模型相结合,并进行精细的调整,成功实现了优秀的用户体验。举例来说,记者打开”灵感闪写”的小程序,仅需输入一些关键词,就能快速生成包括商业计划书、公众号文章、带货笔记等各种类型的文本,同时还可以附带插图。而”魔力写作”则更胜一筹,除了可以生成文本,还具备对话功能。在学习了企业的知识库之后,它可以回答员工以及客户的各类问题。

国内科技界要重视AGI研究

在科研精神和产业革新的大背景下,邱锡鹏强调,我国科技界应当关注通用人工智能的研究,而非仅仅聚焦于GPT模型及其应用的实践。通用人工智能的目标是使机器具备类似于人类的广泛能力,从而不再受限于特定的任务需求。近期,微软发布的评估报告指出,GPT-4在能力和广度上的表现已经接近人类水平,这使得它有可能被视为AGI系统的发展起点。在此背景下,包括OpenAI、谷歌和华盛顿大学在内的多家知名机构都已经转向研究基于大型模型的AGI。

在当前的科技革命浪潮中,我国必须加大力度,积极投身于通用人工智能的研究领域,以确保自身不落后于时代发展。为此,我们需要将多模态感知能力,如视觉和语音等,融入到大型语言模型中,从而提升大模型与现实世界的互动效能。此外,我们还需构建一个以通用人工智能为核心的产学研合作生态系统,推动科技创新,实现产业升级。

邱锡鹏教授(左一)带领团队研发MOSS。(来源:复旦大学)

遵循这一思路,复旦科研团队正在升级MOSS。作为国内第一个对话式大语言模型,MOSS今年2月启动内测后引发广泛关注。目前,邱锡鹏和博士生孙天祥等人一方面在提升它的中文水平,中文词语训练量已由内测启动时的300亿增至1000亿;另一方面,他们在为MOSS添加联网搜索、图片生成等功能,让它可以上网获取新的知识,向通用人工智能系统演进。

复旦团队计划本月完成升级并开源,公布MOSS模型参数和训练细节,与学术界和产业界分享大语言模型开发经验,还能让企业在开源模型基础上开发各种应用,促进产业生态繁荣。

建议发挥新型举国体制优势

谈及大语言模型产业前景,达观数据董事长兼首席执行官陈运文预测,产业上游是算力供应商,中游是百度等开发C端通用大模型的大企业和开发B端服务大模型的企业,下游是开发各种应用的中小企业。其中,B端服务大模型的参数量是C端通用大模型的1/5~1/3,适合较大规模的企业开发。

达观数据研发的“曹植”就是一个B端服务大模型,参数量超过500亿,公司希望它像曹植那样有“七步成诗”能力,成为满足金融、政务、制造等行业需求的智慧大脑。它拥有ChatGPT的所有功能,可以生成贷后管理报告、投行申报文档、法律文书等各类文本,也可以与用户对话。“我们想打造垂直、专用、自主可控的国产大模型。”陈运文说,“为了能生成长篇专业文本,比如上百页的报告,我们开发了一个能输入复杂指令的表单界面,有望为企业员工大幅减负。”

“曹植”大语言模型架构(来源:达观数据)

在研发过程中,达观数据也有些烦恼——公司只有100张GPU(图形处理器)卡,而要“跑”大模型,至少需要1000张GPU卡。为此,陈运文只能到处“化缘”借卡。在他看来,新型举国体制适用于大语言模型研发和产业化,国家和地方政府可建立人工智能公共算力池,租给企业和高校院所使用。“一张A800 GPU卡的价格是8万元,公共算力池可配备5000—10000张卡,所以建设成本在10亿元内。开发大模型产品的企业可分时租用池里部分GPU,大幅节省自购算力资源的成本。”

新型举国体制还可在大模型的中文预训练中发挥作用,推动图书馆、出版社、新闻机构等拥有高质量中文语料库的单位与人工智能企业合作,提高大模型的中文知识水平。

简仁贤也表达了人工智能企业的心声:在这轮产业变革中,希望政府和投资机构更多地关注、支持中小企业。大模型并非只有“BAT”等巨头才“玩得起”,事实上,OpenAI就属于创业期的中小企业。创业公司决策效率高、创新能力强的优势,在大模型技术创新中得到了充分体现。“就像OpenAI与微软的合作一样,创业公司与大企业、投资机构联手,有望开发出颠覆性产品。”

海量资讯、精准解读,尽在新浪财经APP

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply