商汤科技新品亮相:ChatGPT战局加剧,AI技术再创新高峰!
文章主题:商汤, ChatGPT, AI大模型, 自然语言处理
商汤正式加入ChatGPT战局!
就在昨日,商汤科技在一场盛大的发布会上展示了其全面的技术实力。从模型文生图到代码生成,再到制作视频以及2D/3D数字人的呈现,商汤科技展现出了其在人工智能领域的卓越能力。
话不多说,直接上图。
一个人类站在非常有未来感的建筑面前,畅想平行宇宙种种可能。
只需5分钟真人视频素材,活灵活现的数字人就来了。
还有代码翻译实时演示,码农狂喜。
日日新,又日新
这些让所有人惊呆的大模型能力,便来自商汤的「日日新SenseNova」大模型体系。
「日新SenseNova」这一名字取自《礼记·大学》中,汤之盘铭曰「苟日新、日日新、又日新」。
它寓意着在模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI更多可能。
在这个庞大的模型体系中,商汤科技自主研发了一系列先进的AI模型,涵盖了广泛的应用领域。其中,中文语言大模型商量SenseChat是该公司的核心成果之一,它具备强大的自然语言理解和生成能力,能够为用户提供精准、流畅的语言服务。此外,商汤还开发了一系列生成式AI模型与应用,包括但不限于AI文生图创作、2D/3D数字人生成以及大场景/小物体生成等。这些模型的应用范围覆盖了各个行业,为商汤的技术实力和市场竞争力提供了有力支撑。
商量SenseChat:妙解复杂问题,创作一流文本
商量SenseChat是商汤最新研发的中文语言大模型,有1800亿参数。
模型训练使用了大量数据,并充分考虑了中文语境,能够更好地理解和处理中文文本。
活动现场,商量SenseChat不仅能进行单轮对话,而且多轮对话,超长文本理解能力上表现出色。
在单轮对话上,理解句子含义,判断句子合理性不在话下。
另外,还能够进行逻辑推理,比如正确完成非命题和命题的逻辑问题。
问它旺仔的爸爸有三个孩子,老大叫大毛,老二叫二毛,老三叫什么?
在多轮对话中,商量SenseChat还具备出色的语义理解、创造力和共情能力。
能够为你提供情感上的抚慰,比如「如何提高自我认识,更好地了解自己?」
它还可以进行共同创作,比如与人一人一句共同创作儿童故事。
总之,SenseChat在超长文本理解方面具有显著优势,能够协助用户迅速地与大型语言模型进行互动,从而获取所需的知识和答案。例如,用户可以利用SenseChat快速掌握《专利法》等复杂领域的核心要义。
此外,商汤直接把商量SenseChat用在了代码开发上,推出了AI代码助手。
更刺激一点在于,他们这次竟然上了现场实时演示,而且还是镜头直接怼屏幕的那种。
据相关报道,一款创新的AI代码助手已经问世,为程序员们带来了诸多便利。此工具具备代码补全、注释生成代码、测试代码生成、代码翻译、代码修正、代码重构以及复杂度分析等多重功能,将极大地提高编程效率。
与此同时,AI代码助手还支持中英文,以及多种编程语言,并能够快速适应码农个性化编码风格。
在内部实验中,我们的AI代码助手表现出了惊人的效果。它使得代码编写的速度提升了62%,同时,HumanEval测试集的了一次通过率达到了40.2%的惊人成果。
作为商汤科技董事长兼CEO的徐立在公开场合表示,下一代软件开发的趋势将是以人工智能为基础的“AI for AI”。同时,他提出了一种新的二八定律,即在软件开发过程中,80%的代码由AI自动生成,而剩余的20%则由人工参与。这一观点充分体现了人工智能技术在现代软件开发中的重要地位和广阔前景。
除了写代码,商量SenseChat已经用在医疗场景中,比如问诊分诊、医疗知识科普、疾病鉴别诊断。
未来,将继续拓展在药物治疗、手术方案等方面的问诊能力,帮助医生进一步提升诊疗效率。
真·全能AI
除了发布中文语言大模型,当前,最火的就是生成式AI了,商汤在该领域也展开了全方位的布局。
基于「日日新SenseNova」大模型体系,商汤自研了包括秒画SenseMirage、如影SenseAvatar、琼宇SenseSpace、格物SenseThings等一系列生成式AI模型及应用。
文生图创作平台「秒画SenseMirage」
文生图有多强,其实你刚刚也见证到了。秒画SenseMirage能够展现光影真实、细节丰富、风格多变,还能支持6K高清图的生成。
该模型基于超10亿参数自研文生图生成模型,支持二次元、三次元等多种生成风格。
另外,用户还可以自主训练,可基于单卡,5分钟内定制属于自己的LoRA 模型@20张训练图片。
对创作者来说,生成模型开源社区汇聚了1万+开源模型,结合自研模型及训练能力,为其提供了更加完善的内容生产工具。
AI数字人视频生成平台「如影SenseAvatar」
谈到元宇宙,就需要数字化分身Avatar。
如今,无需专业拍摄设备,通过文字驱动,你就可以快速、高效打造一个高度逼真的数字形象。
如影SenseAvatar仅需要5分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。
甚至,只需提供一个粗略的想法,文案也有了。此外,它还能支持百种语言,让你轻松创作跨国际化内容。
除了打造短视频,「如影SenseAvatar」还可以轻松制作教育、企业,娱乐文化等领域的视频。
3D内容生成平台「琼宇SenseSpace/格物SenseThings」
格物SenseThings可基于3D内容生成技术实现对空间和物体的复刻与交互,并支持再编辑再创作。
除了数字人,基于NeRF,商汤的琼宇SenseSpace可以进行场景生成,复刻和还原真实空间。
琼宇SenseSpace生成的场景不仅支持自由漫游,还支持实时交互和编辑。
比如进行城市生成,高度还原场景细节。
甚至有厘米级的重建精度,可通过实时渲染和互动带来超真实感的场景。
多源数据融合带来超精细化的清晰度和细节效果。
另外,格物SenseThings可以进行物体3D内容生成。
它能够良好支持复杂结构物体复刻,并做到光照精准复刻,材质完美还原。
以上是日日新SenseNova大模型体系带来的强大内容生成能力,不论在图片、还是数字人、视频上,直接打破了人类创意天花板,将重塑行业生态。
释放大模型这么多能力,商汤的底气在哪?
5年磨一剑,直指AGI
2023年,由AIGC及ChatGPT引领的新一轮人工智能热潮已箭在弦上。
其实,早在2018年,商汤就开始着手AI大模型研发。只不过,这个概念,今年才被炒火。
到现在,这家AI公司已经5年多的技术沉淀和实践经验。已经打造了CV、NLP、AIGC多个AI大模型。
2019年,商汤最先推出了10亿参数量规模的视觉模型,实现了当时业界最好的算法效果。
那时,商汤已经具备了千卡并行的系统能力,使用了上千张GPU卡进行单任务训练。
在2021-2022年,商汤还训练了百亿参数规模的超大视觉模型,这相当于千亿参数语言模型的训练量。
目前,商汤已成功研发了320亿参数量的全球最大的通用视觉模型。
该模型已经实现了高性能的目标检测、图像分割和多物体识别算法,并在自动驾驶、工业质检、医疗影像等多个领域得到广泛应用。
今年3月,商汤还开源了多模态多任务通用大模型书生(INTERN)2.5,有30亿参数。
商汤这家前沿AI科技公司,不仅有着深厚的算法积淀,最重要的是还有强大的基础设施——SenseCore AI大装置。
在急需算力的当下,商汤SenseCore AI大装置以5000 Petaflops超大规模算力和出色的并行计算能力,为大模型研发提供强大的算力基础设施。
现有27000块GPU,可输出5000 PetaFlops算力,能够以最大4000卡规模集群进行单任务训练,并可做到7天以上不间断的稳定训练。
算法,算力有了,数据怎么来?
一直以来,商汤在智慧城市、智慧商业等领域的长期耕耘,积累了海量真实世界的高质量视觉数据。
徐立表示,模型的能力应考量包括参数量和数据量。而参数量和数据量的乘积即计算量,即模型的能力可以用所依赖计算量来做标定。这就是新时代下,算法、数据和算力的新公式。
发布会现场,商汤基于「日日新SenseNova」大模型体系和AI大装置SenseCore,面向商业伙伴提供API。
其中包括图片生成,自然语言生成,视觉感知通用任务与标注服务,客户可以根据自己想要的内容进行调用。
在推进AGI布局上,商汤向所有人展示了大模型+大算力的战略布局。
未来,商汤还将继续推进「日日新SenseNova」大模型体系的建设,将AGI作为核心发展目标。
日复一日,在大模型研发实现AGI突破,让AI惠及每个人。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!