vivo 自研蓝心大模型 7B 向全行业开源,2.6 万亿 token(附下载地址)

2023-11-09 12:15IT之家 - 汪淼

IT之家 11 月 9 日消息,在近日的 2023 vivo 开发者大会上,vivo 宣布率先开源 70 亿参数级的蓝心大模型 7B 以及对应的微调框架。

按照承诺,vivo 现已在 Hugging Face 上正式开源了 BlueLM-7B,IT之家小伙伴可在 vivo AI Lab 主页下载

BlueLM-7B 开源大模型包括 7B 基础模型和 7B 对话模型,同时 vivo 开源了支持 32K 的长文本基础模型和对话模型。

据介绍,BlueLM 采用高质量语料库进行训练,规模达到了 2.6 万亿 的 token 数,该语料库包含中文、英文以及少量日韩数据。其中 BlueLM-7B-Chat 在 C-Eval 和 CMMLU 上均取得领先结果。

BlueLM-7B-Base-32K 和 BlueLM-7B-Chat-32K 均支持 32K 长文本,在保持基础能力相当情况下,能够支持更长上下文理解。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      请登录后查看评论
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享