SHMT 技术推动计算变革:不动硬件,速度翻番、能耗减半

2024-02-24 13:57IT之家 - 故渊

IT之家 2 月 24 日消息,在第 56 届 IEEE / ACM 微体系结构国际研讨会上,美国加州大学河滨分校(UCR)的研究人员展示了一种全新的方法,可以实现计算速度翻番、能耗减半的效果。

研究人员表示这项技术理论上适用于从智能手机到数据中心服务器的任何处理器和加速器,但需要进一步地开发适配。

加利福尼亚大学电气与计算机工程系副教授、本研究报告的共同作者曾宏伟(Hung-Wei Tseng)表示:

你不需要增加新的处理器,可以在现有计算机平台上部署。这项技术的核心,是帮助你更合理高效地管理可用硬件资源。

研究人员开发的平台打破了传统的编程模式,团队将其称为同步异构多线程(SHMT)。传统编程模式是在一段时间内,只向系统的一个计算组件(中央处理器、图形处理器、张量处理器或其他处理器或加速器)提供数据,而 SHMT 技术在所有组件之间同时并行执行代码。

传统、现代异构和 SHMT 的并行化方法比较

SHMT 采用质量感知工作偷取(QAWS)调度策略,保持平衡控制计算质量和工作负载,因此降低了资源调用。

SHMT runtime 系统将创建一组虚拟操作(vOPS),并划分为一个或多个高级操作(HLOP),以便同时使用多个硬件资源。

根据所选政策加速 SHMT 计算

传统计算与 SHMT 的活动和闲置消耗比较

SHMT runtime 系统将 HLOPS 分配到任务队列,在目标硬件上运行。由于 HLOPS 与硬件无关,runtime 系统可根据需要将任务重定向到计算平台的一个或另一个组件。

研究人员以他们创建的测试平台为例,展示了新软件库的有效性。他们创造了一种混合体,既可以被视为智能手机,也可以被视为一种个人电脑,甚至是服务器。

该测试平台基于一块带有 PCIe 接口的背板,一台搭载英伟达 Nano Jetson 模块组的“计算单元”,通过 M.2 Key E 插槽连接谷歌 Edge 加速器(TPU)。该模块带有四核 ARM Cortex-A57 处理器(CPU)和 128 个 Maxwell 架构图形内核(GPU)。

本系统的主内存为 4 GB LPDDR4,频率为 1600 MHz,速度为 25.6 Gbps,用于存储一般数据。Edge TPU 模块额外包含 8 MB 内存,并使用 Ubuntu Linux 18.04 作为操作系统。

在一个使用标准测试应用程序的简易异构平台上运行 SHMT 软件包的结果表明,与基本计算分配方法相比,采用最有效策略的 QAWS 框架的计算速度提高了 1.95 倍,消耗显著降低了 51%。

这种方法如果应用于数据中心,可以在保持现有硬件不变的情况下,最大化性能收益。目前,所提出的解决方案尚未准备好付诸实施,但肯定会有很多人对此感兴趣。

IT之家附上参考地址

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      请登录后查看评论
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享