华为昇腾适配支持 DeepSeek-R1 复现项目 Open R1

2025-02-11 17:58IT之家 - 归泷(实习)
感谢IT之家网友 有鲫雪狐 的线索投递!

IT之家 2 月 11 日消息,华为技术有限公司今日宣布,MindSpeed 支持 DeepSeek V3 预训练、微调,同时昇腾还适配支持 DeepSeek-R1 复现项目 Open R1。

据介绍,MindSpeed 现已支持 DeepSeek V3 模型预训练微调。所使用的并行配置与模型参数如下:

DeepSeek 团队通过知识蒸馏,实现了较小的模型也能具备较强的推理能力。华为称已基于昇腾完成蒸馏流程验证,并表示经过蒸馏后的 Qwen 模型在对应领域上的评分获得显著提升,开发者可基于此参考,完成自定义蒸馏模型训练

另外,华为昇腾还适配完成 Open R1 项目的重要步骤:打通 Open R1-Zero 的 GRPO 流程,同时支持通过 vLLM 等生态库实现训练过程中的数据生成。

据介绍,Open R1 项目是 Hugging Face 官方开源的对 DeepSeek-R1 模型流程进行完全开放式复现的项目,是当前主流复现项目之一,当前已有 18K+ star 数,其目标是构建 DeekSeek-R1 训练流程的缺失部分。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      一大波评论正在路上
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享