taalas“模型即芯片”引热议,是颠覆者还是昙花一现?-九游会j9登录入口

   时间:2026-02-25 00:06 作者:杨凌霄

一家名为taalas的加拿大芯片初创公司,凭借其宣称颠覆英伟达的技术路线,在人工智能领域引发了广泛关注。这家成立于2023年的公司,于近期推出了首款专为ai推理优化的芯片hc1,声称在特定场景下性能远超传统gpu方案,甚至可能重塑ai芯片市场格局。

hc1芯片的核心突破在于其“模型即芯片”的设计理念。与传统asic(专用集成电路)仍需通过软件编译将模型转化为芯片指令不同,taalas直接将特定大模型“刻”入芯片硬件,通过eda(电子设计自动化)流程将模型转化为定制电路。这种设计使得数据无需在内存和计算单元间频繁移动,理论上可消除“内存墙”瓶颈,显著提升推理速度并降低功耗。据公司披露,采用30芯片集群时,hc1在运行meta开源大模型llama 3.1 8b时,推理速度可达每秒12000 tokens,能效较传统gpu方案提升50倍,峰值速度更接近17000 tokens/秒,构建成本和功耗分别降至传统方案的1/20和1/10。

taalas的技术路线与其创始人柳比沙·巴伊奇(ljubiša bajić)的背景密切相关。这位曾在amd担任架构师的业界资深人士,此前创立了ai芯片独角兽tenstorrent,并主导过开源risc-v架构的软硬件协同设计。2022年后,巴伊奇联合妻子莱拉·巴伊奇(前amd系统工程高级经理)及asic设计专家德拉贡·伊格纳托维奇(drago ignjatovic),组建了taalas的核心团队,成员多来自amd、苹果、谷歌等科技巨头。公司成立仅一年便完成5000万美元首轮融资,截至目前已累计融资超2亿美元,资本市场的青睐为其技术探索提供了充足弹药。

hc1的商业化路径清晰而激进:客户提交模型后,taalas在一周内完成电路设计,再通过台积电代工在两个月内交付定制芯片。这种“模型-芯片”强绑定的模式,在测试中展现出惊人性能。公司宣称,hc1在llama 3.1 8b上的推理速度是英伟达h200的48倍、b200的34倍,甚至超越了估值230亿美元的asic明星企业cerebras的同类产品。实测演示中,大模型对用户问题的响应速度达到“秒回”级别,引发业界对ai交互体验变革的想象。

然而,hc1的“极致优化”也伴随显著争议。质疑者指出,其测试数据可能基于特定场景的优化,实际通用性存疑。有芯片爱好者分析,hc1或通过预置答案实现“速度秒杀”,但面对动态问题时可能表现不佳。更关键的是,大模型迭代速度远超芯片交付周期——当前顶尖模型的优势窗口仅月余,而taalas的定制芯片需至少两个月生产,可能导致“芯片未量产,模型已过时”的困境。hc1的“只读”模式限制了模型更新能力,若底层大模型架构发生变革,现有芯片可能面临彻底淘汰的风险。

尽管如此,taalas的技术方向仍获得部分专家认可。中国科学院计算技术研究所副研究员赵永威认为,其“硬连线”模式代表未来芯片发展趋势,尽管当前应用价值有限,但为后续研究提供了重要参考。科技记者蒂莫西·普里克特·摩根(timothy prickett morgan)则指出,taalas的芯片更新成本相对模型训练成本微不足道,若主要模型发布间隔延长,其技术或迎来更广阔市场。低延迟、低功耗的特性也使其在边缘计算场景(如机器人、自动驾驶、高端手机)中具备潜力,这些领域对定制化模型的需求与hc1的设计理念高度契合。

面对争议,taalas已规划技术迭代路线。公司宣布将于今年冬季推出第二代hc2芯片,承诺进一步提升执行速度和性能。同时,巴伊奇透露正在开发适用于中等规模推理模型的产品,试图拓展技术适用范围。然而,要真正挑战英伟达的霸主地位,taalas不仅需证明其技术在大规模模型中的可行性,还需构建类似cuda的开发者生态——这或许是比芯片性能更艰巨的长期挑战。

 
 
更多>同类内容
推荐图文
推荐内容
点击排行
智快科技微信账号
itbear微信账号

微信扫一扫
加微信拉群
电动汽车群
科技数码群

网站地图