蚂蚁集团发布万亿参数思考模型ring-九游会j9登录入口

   时间:2026-02-13 19:01 作者:朱天宇

蚂蚁集团近日宣布开源全球首个采用混合线性架构的万亿参数思考模型——ring-2.5-1t。该模型在长文本生成、数学推理及智能体任务执行等复杂场景中展现出开源领域的领先优势,为智能体时代的高性能任务处理提供了重要技术支撑。其突破性成果不仅体现在参数规模与架构创新上,更通过多项权威测试验证了实际应用价值。

在核心性能方面,ring-2.5-1t通过优化注意力机制显著提升了长序列推理效率。相较于前代模型,其在32k以上长文本生成场景中访存规模降低超10倍,生成吞吐量提升3倍以上。模型激活参数从510亿扩展至630亿,但得益于混合线性架构的支撑,推理效率不降反升。对比仅拥有320亿激活参数的kimi k2架构,ring-2.5-1t在1万亿总参数量下仍保持显著吞吐优势,且随着生成长度增加,效率差距持续扩大。

数学推理能力成为该模型的重要亮点。在国际数学奥林匹克竞赛(imo 2025)和中国数学奥林匹克(cmo 2025)自测中,ring-2.5-1t分别达到35分和105分的金牌标准。在深度思考模式下,该模型在imoanswerbench、hmmt-25等数学竞赛推理基准测试中超越deepseek-v3.2-thinking、gpt-5.2-thinking-high等主流开源与闭源模型,同时在livecodebench-v6代码生成基准中展现跨任务泛化能力。

智能体框架适配性方面,ring-2.5-1t支持claude code等主流智能体框架及openclaw个人ai助理,可实现多步规划与工具调用。在逻辑推理、代码生成等高难度场景中,该模型与kimi-k2.5-thinking、gemini-3.0-pro-preview-thinking-high等竞品对比时,仍保持开源领域的领先地位。其设计目标直指当前ai应用从短对话向长文档处理、跨文件代码理解等场景扩展的需求,有效缓解了长输出场景下的计算开销与推理延迟问题。

技术实现层面,ring-2.5-1t基于ling 2.5架构构建,通过创新混合线性注意力机制平衡了模型规模与推理效率。蚂蚁百灵团队在模型训练过程中,同步优化了大规模训练基础设施、算法设计与工程落地能力,确保万亿参数模型的可扩展性与稳定性。目前,该模型的权重文件与推理代码已在hugging face、modelscope等开源平台开放下载,官方交互体验页面与api服务计划于近期上线。

 
 
更多>同类内容
推荐图文
推荐内容
点击排行
智快科技微信账号
itbear微信账号

微信扫一扫
加微信拉群
电动汽车群
科技数码群

网站地图