在5月20日的阿里云峰会上,一场关于云计算未来的深度变革被正式揭开。阿里云宣布完成了一次从底层芯片到上层产品入口的全栈技术重构,旨在打造一个面向ai时代的新型云底座。这一举动不仅回应了外界对阿里云巨额投入的质疑,更展示了其在ai基础设施领域的雄心壮志。
阿里云资深副总裁刘伟光指出,随着agent技术的突破,未来的云计算负载将发生根本性变化。传统的稳态负载模式,即企业长期占用计算资源运行网站或数据库,将逐渐被agent的突发性和无规律性负载所取代。agent能够在毫秒间发起多次模型调用,并在任务完成后立即销毁环境,这种模式对云计算资源提出了全新的挑战。
为了应对这一挑战,阿里云提出了“agentic cloud”的概念,区别于以往的“ai native cloud”。agentic cloud不仅关注模型的生产迭代,更致力于为智能体提供运行时所需的全套能力,包括沙箱环境、ai网关、记忆管理和安全防护等。这一变革意味着,阿里云正在从单纯的算力提供者,转变为agent运行的操作系统。
在芯片层面,阿里云公布了自研芯片的路线图,并发布了新一代训推一体ai芯片真武m890。该芯片拥有144gb显存和800gb/s的片间互联带宽,性能是上一代的3倍。配套发布的icn switch 1.0互联芯片,则进一步提升了芯片间的通信效率。阿里云计划在未来两年内推出算力更强的真武v900和真武j900芯片,以与模型迭代节奏保持同步。
在模型与推理平台方面,阿里云通过百炼平台构建了大规模gpu资源集群,并针对agent场景优化了技术栈。该平台通过池调度提升gpu资源利用率,通过上下文缓存减少重复计算开销,并通过吞吐弹性调度应对并发请求的波峰波谷。百炼平台还引入了agentic rl机制,基于agent实际执行反馈进行强化学习,使模型在真实场景中持续迭代优化。
阿里云的最新模型qwen3.7-max在性能上也有了显著提升。在三方机构的全球大模型盲测中,qwen3.7-max位列国产模型第一,与国际顶尖模型如gpt、claude和gemini不相上下。更令人瞩目的是,qwen3.7-max在真武m890芯片上自主完成了生产级ai计算内核的编写与调优,性能较官方版本提升10倍,充分展示了模型与芯片协同进化的潜力。
技术架构的重构也带来了商业逻辑的转变。阿里云预计,agent驱动的maas收入将逐渐取代传统的ecs收入,成为其最大的产品线。这一转变意味着,阿里云的商业模式将从以虚拟机为计量单位的资源收入,全面切换为以token为计量单位的ai收入。阿里云还通过开放生态策略,接入了多家第三方模型,以提供更具性价比的推理服务。








