云素材PPT模板超市 ChatGPT与PPT 2023-08-03

英伟达GTC2023：ChatGPT引领AI行业变革，英伟达全面赋能底层硬件

文章主题：自然语言处理, 人工智能, 硬件设备, 云计算

本文来自格隆汇专栏：中金研究作者：黄天擎成乔升等

在3月22日的GTC 2023大会上，英伟达展现了其在ChatGPT、半导体光刻、元宇宙、量子计算、智能驾驶等多个领域中的软硬件布局。该公司发布并更新了一系列具有行业代表性的产品，其中包括H100 NVL GPU（适用于ChatGPT大模型部署）、PCIe H100等硬件，以及AI超级计算服务DGX Cloud、光刻计算库CuLitho、GPU加速量子计算系统等。通过GTC 2023，我们可以得出以下观察结果：首先，英伟达预计ChatGPT对算力的需求将会迅速增长，因此公司前瞻性地布局了GPU推理平台，并结合其在训练领域的优势地位，底层硬件架构的迭代升级可能会进一步加快。其次，硬件制造商的AIGC软硬结合生态系统已经初具规模，公司预计Nvidia DGX Cloud将可以通过云端服务加速强算力硬件和AI应用软件向下游商业公司的渗透。我们相信，在ChatGPT不断渗透的大背景下，高性能计算硬件与AIGC应用将逐渐形成一个互动反馈的飞轮效应。国内相关产业链的公司也将在产业转型的过程中深度参与到这个变革中来。

摘要

ChatGPT的快速发展正在推动AI产业的变革与升级，而英伟达则在这一过程中扮演着举足轻重的角色。为了满足训练与推理领域的高需求，GPT模型在内存和计算方面的优势显得尤为重要。在最近的GTC会议上，英伟达推出了一款专为训练大型语言模型（LLM）设计的H100 NVL GPU，能够轻松应对拥有1750亿参数的GPT-3大模型，从而大幅加速LLM的训练过程，降低其处理成本。与此同时，英伟达还通过L4/L40产品的更新，进一步巩固了其在GPT模型训练及推理领域的领导地位。除此之外，英伟达还提到了其针对加速云数据中心的Grace CPU。该产品被认为在未来有可能在提高带宽的同时降低功耗，从而更好地适应ChatGPT的推理工作负载。这一系列举措都显示出英伟达作为行业龙头的积极布局和战略思考。另一方面，随着ChatGPT的不断渗透，AI产业也在加速实现转型升级。在这个过程中，英伟达的积极参与和贡献 couldn’t be ignored。

DGX Cloud AI超级计算服务不仅提供硬件支持，更致力于打造多样化的AIGC算力提供形式。在今年的GTC会议上，英伟达推出了DGX Cloud服务，它能够帮助企业迅速获取训练高级模型所需的基础设施和软件。该公司在GTC 2023上明确表示，未来将每月租赁3.7万美元的DGX Cloud实例，这些实例都配备了8个H100或A100 80GB GPU。此外，他们还将通过软件收费模式来提供强大的算力基础。我们观察到，DGX Cloud以云服务的形式展示了硬件制造商在未来AIGC普及时代下软硬结合商业模式的可能性，而这一业务的推出可能会加速超强算力与AI应用库在下游商业公司的渗透速度。

风险

AIGC落地不及预期，宏观经济不振影响终端需求。

正文

ChatGPT引领AI行业变革，英伟达全面赋能底层硬件

在GTC 2023上，英伟达展示了其在训练、推理及云服务等多个领域的ChatGPT布局。我们坚信，要充分发挥GPT大模型的潜力，必须对其海量预训练数据进行深入挖掘，同时依赖更高级别的硬件设备进行支持。因此，算力基础设施建设或将成为未来产业竞争的新焦点。我们对GTC 2023及相关产品的发展历程进行了深入梳理与总结，旨在为我国产业链上的其他公司提供借鉴意义，共同推动产业进步。

作为一家在人工智能领域具有领导地位的公司，英伟达在训练模型的过程中展现出强大的算力优势，这得益于其在GPU并行计算方面的独特技术以及早先的布局。在过去的十年里，从2010年推出的GTX 580显卡到2020年支持1750亿参数处理的A100芯片，英伟达一直致力于提升计算能力，推动生成式大模型的突破。这种对算力的执着追求和前瞻性布局使英伟达在AI训练领域占据了行业领先地位，且仍在不断提升其计算实力。

图表1：GPT带来的算力需求升级

资料来源：英伟达官网，中金公司研究部

GPT大模型的算力需求提升，已经促使我国科技巨头纷纷采用英伟达的H100产品。首先，Oracle公司已经推出了搭载H100 GPU的全新OCI计算裸机GPU产品。其次，META已经在内部为团队部署了基于H100的Grand Teton AI超级计算机。此外，OpenAI也计划在Azure超级计算机上使用H100，以推动其持续的AI研究。在2023年的GTC event中，H100针对生成式AI、大型语言模型（LLM）和推荐系统的开发、训练和部署进行了优化，采用了FP8精度，使得LLM的训练及推理速度比上一代的A100更快，这无疑将简化了AI的开发过程。

图表2：DGX H100 GPU

资料来源：英伟达公司官网，中金公司研究部

图表3：在多专家模型（3950亿个参数）训练过程中H100与A100性能对比

资料来源：英伟达公司官网，中金公司研究部

AI推理：AI视频、图像生成、大型语言模型部署及推荐系统加速部署。在2023GTC中，英伟达推出全新GPU推理平台：基于加速AI视频、图像生成、大型语言模型部署和推荐系统，形成了4种配置（L4 Tensor Core GPU、L40 GPU、H100 NVL GPU、Grace Hopper超级芯片）、1个体系架构和1个软件栈的产品体系。

图表4：英伟达全新推理平台构成

资料来源：英伟达官网，中金公司研究部

其中H100 NVL GPU受到了较为广泛的关注：英伟达在GTC 2023公开表示，该产品将配备双GPU NVLink（两块94GB HBM3的PCIe H100 GPU），或将实现比现用A100快10倍的速度，可处理拥有1750亿参数的GPT-3大模型，并支持商用PCIe服务器扩展，适用于训练大型语言模型（LLM）。英伟达认为该产品有望显著降低大模型的构建成本。

除H100 NVL GPU，英伟达针对GPT模型，再次提及针对加速云数据中心的Grace CPU，公司指出该产品未来有望在提高带宽的同时降低功耗，适配ChatGPT等新类型的推理工作负载。虽然目前行业仍处在快速搭建算力的阶段，但我们看到英伟达作为行业头部企业，同步布局训练与推理领域，构建硬件层面的全面生态，对中国产业具有借鉴意义。

图表5：NVIDIA Grace Hopper超级芯片逻辑设计

资料来源：英伟达官网，中金公司研究部

云服务：DGX Cloud降低AI超级计算机服务使用门槛。在GTC 2023，英伟达推出DGX Cloud，即通过浏览器就可协助企业快速访问训练高级模型所需要的基础设施和软件。据GTC 2023，英伟达计划在未来以月租3.7万美元的形式开放DGX Cloud实例（每个实例均集成了8个H100或A100 80GB GPU），通过软件收费模式提供强大的算力基础。

据GTC 2023，英伟达目前已经与微软Azure、谷歌OCP、Oracle OCI等多家头部公司进行合作，免除了企业购置、部署和管理本地基础设施的复杂步骤，通过DGX Cloud加速企业为生成式AI和其他应用训练模型的过程。我们认为DGX Cloud通过云服务的方式展现了硬件厂商在未来AIGC普及时代下软硬结合商业模式的雏形，同时该业务的推出或将进一步加快超强算力与AI应用库向下游商业公司的渗透速率。

图表6：英伟达合作的云服务厂商名单

资料来源：英伟达官网，中金公司研究部

基于NVIDIA DGX Cloud提供的强大的算力基础，英伟达与谷歌、微软、Oracle合作开发了一系列应用模型NVIDIA AI Foundations（包括文本生成模型构建服务NVIDIA NeMo、视觉语言模型构建服务NVIDIA Picasso、生命科学服务 NVDIA BioNeMo等）。我们认为，云服务或将成为GPT模型成熟过程中的重要商业模式之一。

图表7：英伟达NVIDIA AI Foundations

资料来源：英伟达官网，中金公司研究部

前沿应用领域持续投入，半导体光刻、元宇宙、量子计算、智能驾驶等多领域齐头并进

半导体光刻：将加速计算引入计算光刻领域，向2nm工艺节点推进。在GTC 2023，英伟达发布了与台积电、ASML和Synopsys合作开发的CuLitho，该产品作为加速光刻基础计算的算法库，英伟达认为或将有助于突破光刻技术的物理极限。根据发布会介绍，CuLitho将在GPU上运作，与在硅片上创建图案的光刻相比，能够有效减少CPU的巨大计算工作量；同时晶圆厂生产过程中可以借助CuLitho提升3-5倍的掩模板生产效率。

图表8：计算光刻原理

资料来源：英伟达官网，GTC Keynote，中金公司研究部

元宇宙：“数字孪生”工业模拟应用Omniverse持续推进研发。英伟达在此次GTC 2023推出Omniverse Cloud，将其作为一种PaaS（Platform as a Service）服务，帮助客户在核心产品的制造业务流程中实现标准数字化。目前，Microsoft Azure是Omniverse Cloud的首家云服务提供商，提供了大规模部署企业服务所需的云基础设施和功能，包括安全、身份和存储；宝马同样宣布将扩大对NVIDIA Omniverse平台的使用，在其全球生产网络中构建和运营工业元宇宙应用程序。通Omniverse，宝马可以将数据聚合到大规模、高性能的模型中，连接其特定领域的软件工具，完全虚拟地规划和优化工厂项目，并实现跨地点、跨设备、多用户实时协作，从而缩短生产时间，提高工厂效率。

图表9：Microsoft Azure为英伟达提供云服务

资料来源：英伟达公司官网，GTC Keynote，中金公司研究部

图表10：宝马虚拟工厂

资料来源：英伟达公司官网，GTC Keynote，中金公司研究部

量子计算：GPU加速量子计算系统DGX Quantum赋能高性能低延迟计算。英伟达在GTC上推出了全球首个GPU加速量子计算系统DGX Quantum，通过将加速计算平台与Quantum Machines的量子控制平台OPX结合，实现GPU和量子处理单元（QPU）之间的亚微秒延迟以及校准、控制、量子纠错和混合算法。同时，DGX Quantum使用了最新的开源CUDA量子软件平台，能够在一个系统中集成和编程QPU、GPU和CPU。

图表11：DGX Quantum合作企业

资料来源：英伟达公司官网，GTC Keynote，中金公司研究部

图表12：NVIDIA Quantum-2性能

资料来源：英伟达公司官网，GTC Keynote，中金公司研究部

智能驾驶：集中式计算平台DRIVE Orin助力汽车安全化发展。近年来，智能汽车快速发展的同时，安全问题也备受关注。英伟达在GTC 2023表示，目前可扩展的DRIVE-Orin平台每秒可执行高达254万亿次的操作，使其能够为人工智能驾驶舱和自动驾驶功能提供动力，同时运行大量深度神经网络，以提供安全性和可靠性。英伟达宣布未来将与比亚迪加强合作，为比亚迪提供支持开发和新软件驱动服务的计算空间，最终将更加安全智能的汽车推向市场。

图表13：DRIVE Orin硬件架构