安谋科技发布新一代“周易” X2 NPU:最高可达 320TOPS 子系统
IT之家 3 月 28 日消息,安谋科技(中国)有限公司(以下简称“安谋科技”)今天正式发布自研新一代人工智能处理器“周易”X2 NPU。作为安谋科技自研 IP 的又一产品,“周易”X2 NPU 不仅在算力、精度、灵活性等方面进行大幅提升,还针对车载、边缘计算等应用场景进行了专门优化。
随着“周易”X2 NPU 的推出,安谋科技发布“周易”NPU 软件开源计划,通过开放源码,满足客户更自主、更灵活的算法移植需求。
如今,随着智能汽车产业和边缘计算的蓬勃发展,无论是分辨率从 720P 到 4K,还是单路图像到多路图像融合分析,各场景对 AI 算力的需求成倍提升。
“周易”X2 NPU 作为新一代人工智能处理器,采用第三代“周易”架构,支持多核 Cluster,最高可达 320TOPS 子系统。实时的硬件任务管理使得“周易”X2 NPU 可实现最高千万次 / 秒的任务调度,将各个计算单元的效能发挥到最佳。在算力大幅提升的同时,“周易”X2 NPU 还具有更高的精度和灵活性。在精度方面,“周易”X2 NPU 支持 int4 / int8 / int12 / int16 / int32,fp16 / bf16 / fp32 多精度融合计算,计算效率与计算密度得到显著提升。在灵活性方面,“周易”X2 NPU 在支持自定义算子、满足各种模型部署需求的基础上,还面向各类应用场景提供定制化 AI 解决方案,以进一步满足客户在智能驾驶、手机影像 AI 处理、人机交互等场景中的差异化需求。
“周易”X2 NPU 主要功能升级“周易”X2 NPU 特别针对 ADAS(IT之家注:高级驾驶辅助系统)、智能座舱、平板电脑、台式机和手机等细分应用场景进行了大量性能优化,可大幅提升手机拍照、录像中的高分辨率图像处理能力,以及车载中常用的 Transformer (IT之家注:Transformer 是完全依赖于自注意力机制来计算其输入和输出的表示的转换模型)等应用的性能,同时采用 i-Tiling 技术大幅减少带宽需求,进一步提升计算效率,让客户能更轻松地应对不断迭代的多样化计算需求。
为帮助开发者更方便、快速地进行算法移植和调试,“周易”X2 NPU 还提供了一套完善的人工智能软件平台,可以更好地满足开发者对性能调优、系统部署的需求。目前,“周易”X2 NPU 已面向客户正式交付,并且今年会有多款搭载“周易”X2 NPU 的芯片产品面世。
在“周易”NPU 软件开源计划下,安谋科技已率先对外开放 NPU 中间表示层规范、模型解析器、模型优化器、驱动等,并向相关合作伙伴提供“周易”Compass 软件平台,包括软件模拟器、调试器、C 编译器等在内的多种软件工具。在满足合作伙伴更自主、更灵活的算法移植需求的同时,进一步提升了软件开发效率,避免重复造轮。据悉,上述只是“周易”NPU 软件开源计划的第一步,安谋科技后续还将逐步开放更多资源,如模型量化、算子实现等源代码。
“周易”NPU 软件开源计划已经有第一批合作伙伴率先加入,其中部分是来自 AIoT、智能汽车、智能操作系统等领域的企业。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。