.hd-box .hd-fr

中国移动发布“芯合”异构混合并行训练系统 1.0,支持多品牌万卡集群

2024-12-03 11:23IT之家(汪淼)4评

IT之家 12 月 3 日消息,在 11 月底的 2024 中国信息通信大会“算力网络算网一体创新发展论坛”上,中国移动研究院副院长段晓东携手天数智芯、壁仞科技、中兴、海光、瀚博等产业合作伙伴,发布了“芯合”异构混合并行训练系统 1.0

据介绍,“芯合”异构混合并行训练系统具备基于非均匀计算任务切分 ITD(Inhomogeneous Task Distribution)算法的 3D 并行策略和基于 GDR(GPU Direct RDMA)的异构芯片高速通信两大核心能力。

中国移动透露,当前,系统已实现百亿参数大模型在英伟达、天数智芯、壁仞科技、海光等 4 家智算芯片上的交叉混合训练,规模可支持万卡集群,训练加速比达 95% 以上,达到“业界领先水平”,未来将在提升智能算力资源利用率及促进国产算力发展等方面发挥重要作用。

此外,中国移动携手华为、瀚博、澎峰、海光、天数智芯等产业合作伙伴在论坛上发布了智算“芯合”算力原生基础软件栈 2.0

IT之家查询公开资料获悉,中国移动于 2023 年研发并发布“芯合”算力原生基础软件栈 1.0,首次实现智算应用一键式跨芯迁移的目标,已在山东、广西等多省市的路桥检测、智能安防等场景试点应用,降低智算应用向国产化芯片迁移的复杂度。

“芯合”基础软件栈 2.0 相较于之前实现了三大升级:

中国移动透露,当前,“芯合”算力原生基础软件栈 2.0 已实现泛 AI 应用在英伟达、英特尔、华为、瀚博、天数智芯、海光 6 家智算芯片间的一键式跨芯流转迁移,源源转换效率 > 95%,迁移性能损耗 < 10%,迁移时间 < 20s,已具备规模商用条件,未来将在提升智能算力网络自主可控水平方面发挥重要作用。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

下载IT之家APP,分享赚金币换豪礼
相关文章
大家都在买广告
热门评论
查看更多评论