小米mimo加入价格战！api价格直降99% 推理优化成降价底气-九游会j9登录入口

时间：2026-05-27 19:04 作者：唐云泽

国产大模型市场再掀波澜，小米正式宣布加入api价格战。继deepseek宣布永久降价后，小米mimo-v2.5系列api价格同步大幅下调，最高降幅达99%，同时推出新版token plan计费体系，取消上下文窗口长度差异化定价策略。

根据最新定价方案，mimo-v2.5输入缓存命中价格降至0.02元/百万tokens，未命中输入为1元/百万tokens，输出价格为2元/百万tokens；pro版本对应价格分别为0.025元、3元和6元。值得注意的是，此次调整彻底取消了此前按256k/1m上下文窗口长度区分的价格体系，实现全场景统一计价。这一策略与deepseek-v4-pro的定价模式形成直接对标，后者输入缓存命中价格已压至0.01元/百万tokens。

计费体系改革成为本次调整的核心亮点。小米同步升级token plan套餐，在维持原价基础上将credits额度提升至原有水平的5-8倍。以mimo-v2.5为例，39元lite套餐在95%缓存命中率场景下可支持超5亿tokens使用量，659元max套餐更突破100亿tokens。针对agent与code类高缓存命中场景，实际可用额度还将进一步提升。为验证新体系效果，小米披露其"百万亿token创造者激励计划"已提前完成发放，所有有效期内用户credits额度于5月27日零时自动重置并切换新规则。

技术层面的突破为价格调整提供支撑。小米团队通过优化sglang hicache架构，将kv cache在gpu/cpu/ssd多级存储间的数据搬运量减少至原方案的1/7，可缓存token数量提升5倍。配合专家并行方案优化和输入长度分桶策略调整，集群输入吞吐能力显著增强，单位token成本得以有效控制。这种技术驱动的成本优化路径，与deepseek通过缓存命中策略提升效率的做法形成行业共振。

市场格局正经历剧烈变动。在openrouter全球应用调用榜中，mimo-v2.5-pro排名已从月初的榜首滑落至第14位，hermes agent模型月调用榜更是跌至第16名。当前三甲被deepseek-v4-flash、匿名模型owl alpha及deepseek-v4-pro占据，显示市场竞争进入白热化阶段。与此同时，行业呈现明显分化态势：阿里暂停coding plan低价套餐，字节下架相关产品，智谱则将2026年一季度api价格上调83%，与小米、deepseek的降价策略形成鲜明对比。

小米的激进策略与其财务表现形成微妙关联。最新财报显示，公司一季度营收991亿元同比下降10.9%，净利润61亿元同比下滑43.1%，但研发支出同比增长33.4%至90亿元，研发人员数量创下26048人的历史新高。管理层在财报会上强调，ai业务投入将根据发展状况动态调整，预期投资规模可能进一步扩大。这种"增收不增利"背景下仍坚持技术投入和市场扩张的策略，折射出国产大模型厂商在商业化道路上的艰难抉择。

更多>同类内容

卢伟冰辟谣小米yu9传言内部代号“昆仑”新	石头科技荣膺福布斯dtc跨境影响力品牌，以
爱玛科技与华为深化合作：以技术赋能携手，	华策影视否认解散电影部门传闻内容战略升