ai推理芯片领域迎来新突破,初创企业positron近日对外展示了其第二代asic芯片设计——asimov。这款芯片被宣称在token能效与性价比方面表现卓越,可达到英伟达rubin gpu的五倍水平,引发了行业广泛关注。
positron团队深入分析后指出,当前transformer推理运行的主要瓶颈并非算力,而是内存。基于这一洞察,asimov芯片在设计上采取了内存优先的策略。通过优化设计,该芯片实现了高达90%的内存带宽利用率,同时从架构层面减少了不必要的远程数据传输,有效提升了数据处理效率。
从硬件配置来看,asimov芯片由两个计算模块构成,每个模块均配备了支持多种数据格式的脉动阵列。在内存方面,每个计算模块直接连接432gb的lpddr5x内存,并通过pcie 6.0或cxl 3.0接口连接至多720gb的kv cache缓存内存。整个芯片的热设计功耗(tdp)为400w,内存总容量高达2304gb,总带宽达到2.76 tb/s,且支持风冷散热方案。
在系统集成方面,asimov芯片支持16tbps的芯片间互联,可构建多样化的拓扑结构。其推出的titan推理服务器系统采用19英寸4u机架规格,集成了4颗asimov芯片。该系统能够支持16t参数模型的推理任务,并具备10m的上下文窗口容量。更引人注目的是,单个系统最多可扩展至4096套titan,展现出强大的扩展能力。
据positron公司透露,asimov芯片的研发工作正在稳步推进,目标是在2026年底完成芯片流片,并计划于2027年初正式投入量产。这一时间表的公布,让业界对这款芯片的实际表现充满期待。









