在圣何塞sap中心的聚光灯下,英伟达创始人黄仁勋用近两小时的演讲,勾勒出从芯片到外太空的ai技术版图。这场被业界称为"技术宣言"的发布会,不仅推出覆盖ai全链条的硬件矩阵,更抛出2025-2027年ai芯片营收突破万亿美元的预测,将科技竞争推向新维度。
作为发布会核心的vera rubin超级计算平台,由七颗专为ai全流程设计的芯片构成:vera cpu负责智能体推理,rubin gpu主导模型训练,nvlink 6实现芯片间光速互联,connectx-9 supernic处理网络加速,bluefield-4 dpu管理存储安全,spectrum-6以太网芯片构建数据中心骨架,新整合的groq 3 lpu则专攻解码环节。这个集成72颗gpu与36颗cpu的nvl72机架,相比前代平台将大型模型训练的gpu需求削减75%,推理能效提升10倍,成本降低90%。
在推理战场,英伟达通过"双芯分治"策略重塑行业规则。针对大语言模型推理中计算密集的预填充阶段与带宽密集的解码阶段,rubin gpu与groq 3 lpu形成黄金组合。后者内置的500mb sram缓存以150tb/s带宽实现每秒万亿次内存访问,使万亿参数模型推理吞吐量提升35倍。这种架构创新让256颗lpu组成的lpx机架,可与nvl72并肩作战,构建起从训练到推理的完整闭环。
软件生态层面,英伟达推出nemoclaw智能体框架与nemotron开源联盟。基于openclaw打造的nemoclaw,通过混合架构实现本地模型与云端前沿模型的协同工作,其openshell环境为智能体提供安全沙箱。在模型层,由mistral ai等八家企业组成的nemotron联盟,正联合训练下一代基础模型,该模型将在英伟达dgx cloud训练后开源发布,形成对抗闭源巨头的生态壁垒。
自动驾驶领域迎来重大突破。比亚迪、吉利等车企宣布采用drive hyperion平台开发l4级自动驾驶车辆,uber则计划2028年前在28个城市部署英伟达全栈自动驾驶车队。新发布的alpamayo 1.5推理模型,可同时处理视频、运动历史、导航指令和自然语言输入,开发者通过文本提示就能调整车辆行为,标志着自动驾驶从规则驱动向认知驱动的跨越。
在基础设施层面,dsx air数字孪生平台允许客户在硬件到位前模拟ai工厂运行,将部署周期从数月压缩至数小时。配合发布的vera rubin dsx参考设计和omniverse蓝图,已吸引cadence、西门子等工业软件巨头接入。针对数据中心能效问题,dsx max-q技术可在固定电力下增加30%基础设施部署,dsx flex软件则将ai工厂转化为电网灵活资产,预计释放100吉瓦闲置容量。
存储架构迎来革命性更新。专为智能体设计的bluefield-4 stx,通过cmx上下文记忆平台在gpu内存外扩展高性能推理层。该架构使token吞吐量提升5倍,能效提高4倍,数据摄取速度翻倍,已获得dell、hpe等存储厂商的采用。
游戏业务持续突破技术边界。dlss 5神经渲染技术通过实时理解场景中的角色材质、光照条件,为游戏注入照片级真实感。这项被黄仁勋称为"图形学gpt时刻"的创新,已获得贝塞斯达、卡普空等厂商支持,预计今年秋季随新游戏同步推出。
在发布会压轴环节,英伟达宣布进军太空计算领域。space-1 vera rubin计算模块专为太空环境设计,在轨道推理场景中提供25倍于h100的算力,可直接运行大语言模型处理卫星数据。配合igx thor工业平台和jetson orin超紧凑模块,英伟达正构建"天地一体"的ai计算网络,将智能延伸至地球轨道之外。














