北京拟对 AI 训练所需的算力推行统筹供给,整合大模型中文语料库

2023-05-17 13:49IT之家 - 汪淼

IT之家 5 月 17 日消息,北京市于 5 月 12 日发布了关于对《北京市促进通用人工智能创新发展的若干措施(2023-2025 年)(征求意见稿)》(下称《征求意见稿》)公开征集意见的公告,拟对 AI 训练所需的算力推行统筹供给

《征求意见稿》提出,加强算力资源统筹供给能力,加强与头部公有云厂商等市场主体合作,实施算力伙伴计划,并确定首批伙伴计划成员,明确供给技术标准、软硬件服务要求、算力供给规模、优惠策略等,向在京高校院所和中小企业公布一批优质算力供应商。

《征求意见稿》称,利用政府统一入口,降低公有云采购成本,普惠中小企业,同时减少企业分别面对不同云厂商的沟通成本。针对弹性算力需求,建设统一的多云算力调度平台,实现异构算力环境统一管理、统一运营,方便企业在不同云环境上无缝、经济、高效地运行各类人工智能计算任务。建设北京与河北、天津、山西、内蒙古等省(市)算力集群的直连基础光传输网络,进一步提升平台对四地算力资源感知能力,探索开展算力交易。

《征求意见稿》还表示,针对目前大模型训练高质量中文语料占比过少,不利于中文语境表达及产业应用的问题,整合现有开源中文预训练数据集和高质量互联网中文数据并进行合规清洗。同时持续扩展高质量多模态数据来源,建设合规安全的中文、图文对、音频、视频等大模型预训练语料库,通过北京国际大数据交易所社会数据专区进行定向有条件开放。

IT之家附《北京市促进通用人工智能创新发展的若干措施(2023-2025 年)(征求意见稿)》完整文件:点此查看

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      请登录后查看评论
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享