2025年英伟达开发者大会如期召开。
相比2024年公司股价气势如虹、市值突破3万亿美元,今年英伟达需要面临更多算力需求质疑,股价走低。在美国时间3月18日主题演讲中,英伟达CEO黄仁勋强调AI推理时代算力需求更加旺盛,并推出新一代AI芯片以及配套系统、硅光网络交换机等新品,亮相首款推理模型、首款人形机器人模型、首个推理软件等,全面备战人工智能推理时代。
不过,会后英伟达股价下跌3.4%,报收115.43美元/股;3月19日开盘,A股光通信、算力板块走弱。
算力规模增长将超百倍
自从DeepSeek证明采用极低的算力成本可以进行模型开发后,就引发了市场对算力需求是否持续的质疑,全球算力总龙头英伟达股价从1月下旬大跌。英伟达官方及黄仁勋就曾在多个场合表示,DeepSeek主要在模型推理上运用了创新技术,而AI推理依然需要大量英伟达GPU和高性能网络。
本次开发者大会上,黄仁勋大方承认,人工智能行业在模型训练上的整体需求放缓,不过,他强调DeepSeek在模型推理上的创新,AI推理时代即将到来,Scaling Law法则对规模的要求不仅不会变小,反而会进一步扩大。
Scaling Law(扩展定律)是人工智能领域的核心理论,指模型性能与参数规模、数据量、计算资源之间的正相关关系。这项定律长期以来也被黄仁勋奉为圭臬,以打造AI算力帝国。
黄仁勋表示,当前从生成式AI发展到Agentic AI(智能体),最终到物理AI(Physical AI)是行业新的发展方向。在生成式AI阶段,“Scaling Law”法则集中体现在模型训练的预训练环节;而在Agentic AI阶段,由于其强调自主性与复杂问题解决能力,每一步逻辑思考过程都需要“模型推理”,推理将成为核心动力。
他预测,推理所需算力需求规模增长能“轻松超过去年估计的100倍”,未来行业需要更多、性能更强的AI芯片,数据中心建设的投入到2028年将达到1万亿美元。
本次演讲中,黄仁勋重点展示了英伟达“护城河”CUDA-X库生态系统最新概况,涵盖了从物理学、生物学,到量子计算等各个科学领域,以及海量软件库,构建起AI软件基础设施,通过“软硬一体”的战略,降低AI开发门槛,加速AI应用的落地。
下半年推出下一代架构
相比以往,本次发布会上,英伟达锚定AI推理需求,推出专为AI推理打造的NVIDIA Blackwell Ultra GPU。相比上一代B200 GPU,它性能提升50%,基于低精度的四位浮点数格式FP4标准算力约为15P FLOPS,内存从192GB提升到288GB,搭载业内最先进的HBM3e。在此基础上,HGX B300 NV16运用NVLink高速互联网络连接8个Blackwell Ultra GPU,在大模型推理速度上相较于上一代Hopper架构提升了11倍。
黄仁勋表示,Blackwell已经在全力生产中,客户需求量非常庞大。Blackwell的核心目标是构建“AI工厂”,如同工业革命时期的工厂一样,AI工厂将大规模生产Token(词元,人工智能的基本构成单元),驱动各种智能应用。
面向企业部署AI的产品线方面,英伟达推出了采用Blackwell Ultra芯片的工作站DGX station以及DGX Spark。据介绍,今年下半年,预计思科、戴尔、惠普、联想和超微将率先推出基于Blackwell Ultra的服务器;浪潮旗下Aivres、华擎机架、华硕、富士康、技嘉、英业达、和硕、广达、纬创和纬颖等硬件制造商也将提供Blackwell Ultra服务器解决方案。
从去年开始,英伟达芯片架构更新周期从两年加速到一年。最新芯片路线图显示,英伟达将在2026年下半年推出基于下一代Rubin架构的Rubin GPU,算力性能约是Blackwell Ultra GPU的3.3倍;2027年下半年推出Rubin Ultra GPU,在相同标准下算力为100P。两款产品将采用HBM4、HBM4e先进AI内存。到2028年,英伟达还将推出新一代Feynman架构产品。
另外,英伟达推出首款开源模型推理软件Dynamo,大幅提高开源模型的推理效率。据介绍,在GB200 NVL72机架组成的大型集群上运行DeepSeek-R1模型时,Dynamo能将每个GPU生成的Token数量提高30倍以上,处理同样推理任务速度快30倍。
打造物理AI引擎
随着AI数据工厂规模的扩张,网络基础设施也需要同步彻底革新。
本次发布会上,英伟达还发布两款硅光网络交换机,分别是适用于企业网络的NVIDIA Spectrum-X和适用于专用计算集群的NVIDIA Quantum-X。这两款产品首次利用“光电共封装技术”(CPO)将光通信直接集成到交换机上,是英伟达商用化硅光交换机产品。英伟达希望通过将硅光子技术直接集成到交换机中,突破超大规模和企业网络的传统限制,为目前万张、十万张GPU的数据中心向百万张GPU的AI工厂过渡奠定基础。
黄仁勋表示,围绕云、企业以及机器人,英伟达分别打造了“AI基础设施”。机器人作为具身智能载体,英伟达推出了生成机器人训练数据的物理世界模型Cosmos、人形机器人基础模型GROOT N1以及3D实时仿真平台Omniverse;
其中,本次新推出的GROOT N1是通用机器人基础模型,也是全球首款开源的人形机器人功能模型。该模型采用双系统架构,建立在合成数据生成和模拟学习的基础上,能模仿人类认知,具备“快思考”和“慢思考”能力,可让机器人实现抓取、操作和使用工具等动作,开发者还能用自己的数据对其进行微调。另外,英伟达利用Omniverse平台来调节Cosmos生成模型,通过集成物理引擎和GPU加速技术,实现虚拟环境的无限扩展和精确控制,利用合成数据解决机器人训练的数据问题。
面向机器人仿真,英伟达联合谷歌DeepMind和迪士尼研究院共同开发打开源物理引擎Newton,用于模拟人工智能、机器人和机器学习。在演讲现场,名叫Blue的机器人上台露面,与黄仁勋互动,该机器人配有英伟达最新的GR00T N1机器人通用基础模型。
本次开发者大会上,英伟达对量子计算的态度发生转变,宣布将在波士顿建设NVIDIA加速量子研究中心(NVAQC)。据介绍,NVAQC将使用最先进的英伟达GB200 NVL72机架级系统以及CUDA-Q量子开发平台,帮助实现量子系统的复杂模拟,开发新的混合量子算法和应用程序。
去年谷歌发布的Willow芯片攻克困扰量子计算研究30年的“量子纠错”难题,市场升温带动量子计算概念股股价上涨;今年2月,微软宣布推出全球首款拓扑量子计算芯片Majorana1,验证了拓扑量子比特的可行性,也被视作为未来规模化应用奠定了基础。而黄仁勋曾在今年1月表示要造出“非常有用的量子计算机”,可能需要20年。该评论导致量子计算相关股票应声下跌。
对于市场担忧量子计算颠覆性影响,黄仁勋表示,量子计算不会单独取代现有的计算技术,而是作为AI计算能力的补充。未来的量子计算将成为AI超级计算机的“增强工具”,在药物开发、新材料制造等特定高复杂性领域发挥作用。