曦望新一代推理 GPU 芯片启望 S3 发布:单位 Token 推理成本降低 90%

2026-01-27 19:24 IT之家 - 远洋

IT之家 1 月 27 日消息,据界面新闻报道,国产 GPU 厂商曦望(Sunrise)发布了新一代推理 GPU 芯片启望 S3。这是该公司在近一年累计完成约 30 亿元战略融资后的首次集中公开亮相。

据IT之家了解,启望 S3 是一款面向大模型推理的定制化 GPGPU 芯片。据了解,该芯片在典型推理场景下的整体性价比较上一代产品提升超过 10 倍。算力与存储设计上,芯片支持 FP16 至 FP4 精度切换,采用 LPDDR6 显存方案,显存容量较上一代提升 4 倍。

在应用层面,启望 S3 在 DeepSeek V3/R1 满血版等主流大模型推理场景中,单位 Token 成本较上一代降低约 90%。

曦望还同步发布了面向大模型推理的寰望 SC3-256 超节点方案,可适配千亿、万亿级参数的多模态 MoE 推理场景。此外,曦望还联合商汤科技、第四范式等生态伙伴,共同发起“百万 Token 一分钱”推理成本计划。曦望与浙江大学签署战略合作协议,联合成立“智能计算联合研发中心”。

曦望前身是商汤科技大芯片部门,不久前宣布在一年内完成了近 30 亿元战略融资。2025 年,曦望芯片交付量已突破万片。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值 还可以 无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      一大波评论正在路上
        取消 发送
        分享成功

        长按关注IT之家公众号
        阅读更多精彩文章

        查看更多原创好文
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享