在gtc 2026大会上,英伟达正式推出了专为智能体系统设计的groq 3 lpx机架。这款新型机架聚焦于低延迟与长上下文处理需求,被定位为vera rubin平台的ai推理加速器,预计将于今年下半年正式投入市场。
groq 3 lpx机架采用全液冷散热方案,基于mgx基础设施架构构建。其核心配置包含32个1u计算托盘,每个托盘集成8颗groq 3(lp30)芯片。每颗芯片搭载500mb片上sram,使得整个机架的片上存储容量达到128gb,并实现40pb/s的sram带宽。这种设计显著优化了输出生成速度,同时将系统响应延迟控制在极低水平。
在系统互联方面,每颗lp30芯片通过96条112gbps的c2c链路与其他组件连接。单个计算托盘可扩展至384gb dram内存,通过结构扩展逻辑与头节点cpu实现内存资源整合。这种分层存储架构既保证了片上sram的高效利用,又能在处理超大规模任务时提供dram作为补充支持。
据英伟达披露,groq 3 lpx的部署将使vera rubin平台的推理能效实现质的飞跃。每兆瓦功耗下的推理吞吐量可提升35倍,特别在处理万亿参数级模型时,能为运营商带来最高10倍的营收增长空间。这一突破主要得益于芯片架构对长上下文处理的优化,以及系统级内存带宽的指数级提升。














