阿里通义千问 Qwen3-4B-2507 双料更新:手机也能轻松跑,AI 体积小、性能强

2025-08-07 06:31IT之家 - 故渊
感谢IT之家网友 软媒用户1369491 的线索投递!

IT之家 8 月 7 日消息,通义千问 Qwen 昨日(8 月 6 日)发布公告,宣布,推出 Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507 两个模型,大幅提升性能。

官方表示,SLM(Small Language Models)对 Agentic AI 的发展极具价值,“2507”版本的 Qwen3-4B 模型,体积小,性能强,对手机等端侧硬件部署尤为友好。

IT之家援引博文介绍,在非推理(non-thinking)领域,Qwen3-4B-Instruct-2507 显著提升通用能力,目标成为更全能的端侧利器。

该模型掌握更多语言和长尾知识,上下文理解扩展至 256K,小模型也能处理长文本。该模型通用能力超越了闭源的小尺寸模型 GPT-4.1-nano,性能接近等规模的 Qwen3-30B-A3B(non-thinking)。

官方表示该模型更像一位高效的“执行专家”,遵循指令、迅速响应,更适合用于内容创作、工具调用等。

在推理(thinking)领域,Qwen3-4B-Thinking-2507 大幅提升了推理能力,AIME25 高达 81.3 分。Qwen3-4B-Thinking-2507 的推理表现可媲美中等模型 Qwen3-30B-Thinking,在聚焦数学能力的 AIME25 测评中,以 4B 参数量斩获惊人的 81.3 分的好成绩。

官方表示该模型像一位严谨的“学术专家”,面对复杂问题逐步推理,完成任务更深入可靠。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      一大波评论正在路上
        取消发送
        分享成功

        长按关注IT之家公众号
        阅读更多精彩文章

        查看更多原创好文
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享