讯飞星火 X1 全新升级,整体效果对标 OpenAI o1 和 DeepSeek R1
IT之家 4 月 21 日消息,科大讯飞今日官宣,讯飞星火 X1 全新升级,是“当前业界唯一的基于全国产算力训练的深度推理大模型”。
本次升级有这些关键信息:
实现了数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务效果显著提升,在模型参数比业界同类模型小一个数量级的情况下,整体效果对标 OpenAI o1 和 DeepSeek R1。
融入了更多场景复杂类型数据,模型的泛化性也取得了进步,多个行业任务上展现出了业界领先的能力,在重点行业如教育、医疗、司法等进一步扩大了领先优势。
首发快思考、慢思考统一模型,由一个模型同时支持两种思考模式,私有化部署简便;全新升级模型定制优化工具链,支持 SFT、强化学习两种模型定制优化方案,定制门槛低。
三大核心技术创新 —— 大规模多阶段强化学习训练方法、基于快慢思考的统一训练方法、工程技术系统创新保障基于国产算力的长稳训练,助力星火 X1 全面升级。
此次星火 X1 升级,在多个任务上效果突破。根据最新测试集评测结果,星火 X1 在通用任务效果评测中全面对标 OpenAI o1 和 DeepSeek R1,在数学、知识问答等方面表现突出。IT之家附对比成绩如下:
星火 X1 除了在常见通用任务取得显著进步之外,由于融入了更多场景复杂类型数据,模型的泛化性也取得了进步,多个行业任务上展现出了业界领先的能力,在重点行业如教育、医疗、司法等进一步扩大了领先优势。
为了让更多企业能够便捷用上 AI,本次升级的星火 X1 为企业 AI 落地提供了双重支持:
首发快思考、慢思考统一模型,由一个模型同时支持两种思考模式,4 张卡(华为 910B)即可部署满血版星火 X1,私有化部署简便。
全新升级模型定制优化工具链,支持 SFT、强化学习两种模型定制优化方案,16 张卡(华为 910B)即可完成行业定制优化,定制门槛低。
讯飞星火网页端或讯飞星火 App 已上线全新升级的讯飞星火 X1,用户可体验在通用任务上深度推理和联网搜索的全新效果。
同时,星火 X1 API 也已同步上线讯飞开放平台,面向开发者和企业开放服务。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。