快手自研大模型“快意（KwaiYii）”亮相，CMMLU 中文向排名第一

2023-08-21 09:04IT之家 - 汪淼

IT之家 8 月 21 日消息，近日，快手自研的大语言模型“快意”（KwaiYii）已开启内测，并为业务团队提供了标准 API 和定制化项目合作方案。

在最新的 CMMLU 中文向排名中，快意的 13B 版本 KwaiYii-13B 同时位列 five-shot 和 zero-shot 下的第一名，在人文学科、中国特定主题等方面较强，平均分超 61 分。

IT之家查询快意 GitHub 页面发现，官方介绍显示：

快意大模型（KwaiYii）是由快手 AI 团队从零到一独立自主研发的一系列大规模语言模型（Large Language Model，LLM），当前包含了多种参数规模的模型，并覆盖了预训练模型（KwaiYii-Base）、对话模型（KwaiYii-Chat）。这里面我们介绍 13B 规模的系列模型 KwaiYii-13B，其主要特点包括：
KwaiYii-13B-Base 预训练模型具备优异的通用技术底座能力，在绝大部分权威的中 / 英文 Benchmark 上取得了同等模型尺寸下的 State-Of-The-Art 效果。例如，KwaiYii-13B-Base 预训练模型在 MMLU、CMMLU、C-Eval、HumanEval 等 Benchmark 上目前处于同等模型规模的领先水平。
KwaiYii-13B-Chat 对话模型具备出色的语言理解和生成能力，支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务，人工评估结果表明 KwaiYii-13B-Chat 超过主流的开源模型，并在内容创作、信息咨询和数学解题上接近 ChatGPT（3.5）同等水平。

据了解，快手 AI 团队将持续迭代“快意”大模型，一方面将继续优化模型性能并研发多模态能力，另一方面也在推进更多 C 端与 B 端业务场景下的落地。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。