.hd-box .hd-fr

阿里除夕夜炸场:“开源旗舰”Qwen3.5 发布,登顶全球最强开源模型

2026-02-16 16:51IT之家(清源)25评
感谢IT之家网友劍主软媒用户389454Cepvor的线索投递!

IT之家 2 月 16 日消息,今天下午,阿里在chat.qwen.ai页面低调上线了 Qwen3.5-Plus 和 Qwen3.5-397B-A17B 两款新模型。

IT之家从官方页面介绍获悉,Qwen3.5 Plus 定位为Qwen 3.5 系列最新大语言模型,Qwen3.5-397B-A17B 定位则是Qwen3.5 开源系列旗舰大语言模型。两款模型均支持文本和多模态任务

根据阿里云方面介绍,Qwen3.5 实现了底层模型架构的全面革新,其中,Qwen3.5-Plus 版本总参数为 3970 亿,激活仅 170 亿,性能超过万亿参数的 Qwen3-Max 模型,部署显存占用降低 60%,推理效率大幅提升,最大推理吞吐量可提升至 19 倍。

Qwen3.5 在 MMLU-Pro 认知能力评测中得分 87.8 分,超越 GPT-5.2;在博士级难题 GPQA 测评中斩获 88.4 分,高于 Claude 4.5;在指令遵循 IFBench 以 76.5 分刷新所有模型纪录;而在通用 Agent 评测 BFCL-V4、搜索 Agent 评测 Browsecomp 等基准中,千问 3.5 表现均超越 Gemini 3 Pro

Qwen3.5-397B-A17B 在推理、编程、智能体能力与多模态理解等全方位基准评估中表现优异,助力开发者与企业显著提升生产力。该模型采用创新的混合架构,将线性注意力(Gated Delta Networks)与稀疏混合专家(MoE)相结合,实现出色的推理效率:总参数量达 3970 亿,每次前向传播仅激活 170 亿参数,在保持能力的同时优化速度与成本。同时,语言与方言支持从 119 种扩展至 201 种,为全球用户提供更广泛的可用性与更完善的支持。

Qwen3.5 在能力、效率与通用性三个维度上推进预训练:

根据介绍,Qwen3.5 凭借高效的混合架构与原生多模态推理,为通用数字智能体奠定了坚实基础。下一阶段的重点将从模型规模转向系统整合:构建具备跨会话持久记忆的智能体、面向真实世界交互的具身接口、自我改进机制,目标是能够长期自主运行、逻辑一致的系统,将当前以任务为边界的助手升级为可持续、可信任的伙伴。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

下载IT之家APP,分享赚金币换豪礼
相关文章
大家都在买广告
热门评论
查看更多评论