阿里通义 Qwen2 拿下美国最新测评榜单开源大模型全球第一

2024-06-14 18:25之家网站 - -

6 月 14 日消息,图灵奖得主、Meta 首席 AI 科学家杨立昆(Yann LeCun)联合 Abacus.AI、纽约大学等机构推出全新的大模型测评基准 LiveBench AI,并公布首个测评榜单。阿里云通义千问刚刚开源的大模型 Qwen2-72B 成为排名最高的开源大模型,是前十榜单中唯一的开源大模型、唯一的中国大模型,成绩超过 Meta 的 Llama3-70B 模型。

LiveBench AI 的首次测评针对 34 个全球领先的开闭源大模型进行,结果显示,GPT-4o 排名第一,紧随其后的有 Cluade-3、Gemini-1.5 和 Qwen2-72B,其中 Qwen2-72B 是排名最高的开源大模型,也是唯一进入前十的中国大模型。

LiveBench AI 的完整榜单显示,通义千问 Qwen 系列共有 7 款模型进入榜单,分别是 Qwen2-72B、Qwen1.5-72B、Qwen1.5-110B、Qwen1.5-7B、Qwen1.5-4B、Qwen1.5-1.8B、Qwen1.5-0.5B,是除 GPT 之外入选最多的大模型团队。目前,Qwen 系列开源模型目前下载量已经突破 1600 万。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      一大波评论正在路上
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享