阿里近日推出qwen3.5中型模型系列,包含qwen3.5-122b-a10b、qwen3.5-35b-a3b和qwen3.5-27b(dense)三款开源模型,同时上线qwen3.5-flash(qwen3.5-35b-a3b生产版本)api至阿里云百炼平台。这一系列模型在指令遵循、研究生级推理、数学竞赛能力、多语言知识及智能体工具使用等12项测评中,展现出与gpt-5 mini、claude sonnet 4.5等国际顶尖模型相当的综合性能。
开发者社区对qwen3.5系列反响热烈。多位开发者指出,这些模型在本地推理场景中具备显著优势,实现了"小体格大性能"的突破。有用户测算,qwen3.5-35b-a3b可将月度服务成本从2000欧元(gemini服务)压缩至50欧元,降幅达97.5%。该模型在16gb显存设备上可处理32k上下文,每秒完成60-70个任务,尽管单次推理消耗约6k token,但输出准确性得到保证。
技术测评显示,qwen3.5-122b-a10b作为全能型选手,在多模态、视频处理及多语言场景表现突出,包揽mmlu-pro、mmlu-redux等知识维度测评冠军。qwen3.5-35b-a3b专注智能体深度能力,在bfcl-v4、tau2-bench等智能体工具使用测评中领先,空间智能表现尤为亮眼。qwen3.5-27b则以工程实用性见长,在swe-bench verified编程测评中登顶,同时保持交互、长文本处理及数学能力的优势。
在多模态应用测试中,三款模型展现出专业级理解能力。当输入"公鸡根雕"图片时,模型不仅准确识别材质为崖柏,还能结合传统文化解读象征意义,并给出5000-15000元的专业估价。视觉编程测试中,qwen3.5-27b成功生成包含智能体头像、功能演示的虚拟助手九游会j9登录入口官网代码,虽在交互细节上略逊于397b版本,但已满足多数商业场景需求。
技术升级方面,qwen3.5系列采用五项创新:通过早期融合训练实现视觉语言统一基础;门控delta网络与稀疏混合专家架构提升推理效率;百万级智能体环境的强化学习扩展增强现实适应性;语言支持扩展至201种方言;多模态训练效率接近纯文本训练水平。这些改进使模型在保持高性能的同时,显著降低部署成本。
市场数据显示,qwen系列在企业级大模型领域优势扩大。2025年下半年日均调用量占比达32.1%,较上半年提升近一倍,领先字节豆包(21.3%)和deepseek(18.4%)。此次中型模型矩阵的完善,将进一步巩固阿里在智能体开发、多模态应用等细分市场的领先地位。开发者可通过hugging face、魔搭社区及qwen chat平台体验新模型。















