阿里近日推出Qwen3.5中型模型系列,包含Qwen3.5-122B-A10B、Qwen3.5-35B-A3B和Qwen3.5-27B(Dense)三款开源模型,同时上线Qwen3.5-Flash(Qwen3.5-35B-A3B生产版本)API至阿里云百炼平台。这一系列模型在指令遵循、研究生级推理、数学竞赛能力、多语言知识及智能体工具使用等12项测评中,展现出与GPT-5 mini、Claude Sonnet 4.5等国际顶尖模型相当的综合性能。
开发者社区对Qwen3.5系列反响热烈。多位开发者指出,这些模型在本地推理场景中具备显著优势,实现了"小体格大性能"的突破。有用户测算,Qwen3.5-35B-A3B可将月度服务成本从2000欧元(Gemini服务)压缩至50欧元,降幅达97.5%。该模型在16GB显存设备上可处理32k上下文,每秒完成60-70个任务,尽管单次推理消耗约6k token,但输出准确性得到保证。
技术测评显示,Qwen3.5-122B-A10B作为全能型选手,在多模态、视频处理及多语言场景表现突出,包揽MMLU-Pro、MMLU-Redux等知识维度测评冠军。Qwen3.5-35B-A3B专注智能体深度能力,在BFCL-V4、TAU2-Bench等智能体工具使用测评中领先,空间智能表现尤为亮眼。Qwen3.5-27B则以工程实用性见长,在SWE-bench Verified编程测评中登顶,同时保持交互、长文本处理及数学能力的优势。
在多模态应用测试中,三款模型展现出专业级理解能力。当输入"公鸡根雕"图片时,模型不仅准确识别材质为崖柏,还能结合传统文化解读象征意义,并给出5000-15000元的专业估价。视觉编程测试中,Qwen3.5-27B成功生成包含智能体头像、功能演示的虚拟助手官网代码,虽在交互细节上略逊于397B版本,但已满足多数商业场景需求。
技术升级方面,Qwen3.5系列采用五项创新:通过早期融合训练实现视觉语言统一基础;门控Delta网络与稀疏混合专家架构提升推理效率;百万级智能体环境的强化学习扩展增强现实适应性;语言支持扩展至201种方言;多模态训练效率接近纯文本训练水平。这些改进使模型在保持高性能的同时,显著降低部署成本。
市场数据显示,Qwen系列在企业级大模型领域优势扩大。2025年下半年日均调用量占比达32.1%,较上半年提升近一倍,领先字节豆包(21.3%)和DeepSeek(18.4%)。此次中型模型矩阵的完善,将进一步巩固阿里在智能体开发、多模态应用等细分市场的领先地位。开发者可通过Hugging Face、魔搭社区及Qwen Chat平台体验新模型。
