美国酝酿 AI「登月计划」，陶哲轩领衔 62 页报告重磅发布

新智元
2024-05-01 14:54

【新智元导读】就在刚刚，陶哲轩领衔的一份 62 页报告出炉了，总结和预测了 AI 对半导体、超导体、宇宙基础物理学、生命科学等领域带来的巨大改变。如果这些预测在几十年后能够实现，美国酝酿的 AI「登月计划」就将成真。

就在刚刚，陶哲轩领衔的一份 AI 技术对全球研究潜在影响的技术报告发布了。

这份报告长达 62 页，总结了 AI 对材料、半导体设计、气候、物理、生命科学等领域已经做出的改变，以及预测它们在未来可能由 AI 产生的改变。

报告地址：

https://www.whitehouse.gov/wp-content/uploads/2024/04/AI-Report_Upload_29APRIL2024_SEND-2.pdf

除了总结 AI 工具已经改变的科学领域的小插曲，陶哲轩等人还发出了三个呼吁 ——

1.必须赋予人类科学家更多的权能；

2.所有人必须负责任地使用 AI 工具；

3.国家层面需要共享基本的 AI 资源。

一旦必要的 AI 基础设施到位，新的科学「登月计划」将成为可能

众所周知，AI—— 可以帮助研究人员从数据中获得更多洞见，并确定最可能的解决方案；可以帮助处理日常任务，从而让研究人员能够专注于核心研究；可以帮助实现实验室流程的自动化；可以帮助完成以前很难实现的模拟；可以通过多模态基础模型将多种形式的数据汇集在一起，并在不同科学分支之间创造新的协同效应。

而当资源到位，并可以提供算力、安全的数据共享服务、开源的 AI 模型以及其他关键基础设施的访问时，我们就可以开始规划那些十分复杂且规模巨大的「登月式」科研项目。

这些项目可能包括:

- 一个模拟人类细胞复杂性的基础模型，允许在计算机上（而不是在试管或活体内），对疾病和实验性治疗进行研究；

- 一个详细的整个地球模型，使用传统和 AI 模型来描述地球系统的组成部分，同时也不断地用高度多样化的实时数据进行更新；

- 通过系统收集、处理和 AI 辅助分析现有数据和文献，以及自动化实验室合成和测试可行的候选物，来发现实用的室温超导体。

随着共享 AI 资源基础设施的出现，全新的合作形式将从规模效应中获得实质性的好处，也就是说，随着项目规模的扩大，单位成本会降低、效率会提高。

与此同时，这种合作也可以减少不同团队之间的重复工作，提高研究效率。

AI 即将颠覆的学科领域

目前人类科学发展到这个阶段，已经到达了临界点。在许多领域，我们都面临着巨大的障碍，而这些障碍一旦能克服，这些领域的进展都将迈入新的阶段。

令人兴奋的是，这些目前靠我们自己已经很难再推进太多的突破，靠 AI 很可能会被解决！

当然，为了实现这些设想，我们还面临一些必须考虑的潜在风险，并且还需要实现目标所需的资源。

AI 设计半导体，让美国稳坐第一

如今，支撑起全球经济和国家安全的现代电子设备，都需要依靠「芯片」来运行。

随着这些芯片功能的增强，它们的复杂性也在不断增加 —— 当前最先进的芯片，已经包含了高达数百亿个组件。

由于需要庞大的工程资源和复杂的基础设施，目前只有规模最大的公司才有能力制造这些高端芯片。而 AI 则可以在显著提升芯片设计质量的同时，减少所需的时间和人数。

当然，这些 AI 工具并不是要取代设计师，而是通过提高设计师的工作效率来帮助缓解专业芯片设计师短缺的问题。

现在，已经有很多专为芯片设计师开发的 AI 辅助工具，可以让初级设计师解决那些原本需要高级设计师花费大量时间来处理的问题。

同时，还有一些芯片设计 AI 智能体还能总结错误报告和设计文档，或者基于简单的英语提示为其他设计自动化工具生成脚本。

https://arxiv.org/pdf/2311.00176

甚至，正在开发中的 AI，还能够设计出比传统方法更快或更小的电路.

通过利用强化学习技术，AI 在探索可能的电路配置时会收到正面的「奖励」和负面的「惩罚」，从而使其能够调整其设计策略，最终找到那些具有理想特性的电路设计方法。

随着半导体技术的快速进步，每次更迭都需要重新设计数千种标准设计单元，从而适应新的制造工艺。对许多制造商而言，这一过程可能需要投入高达 80 人月的劳动力。

相比之下，结合了生成式 AI 用于数据聚类和强化学习用于纠正设计规则错误，能够自动化这一设计过程，将所需的工作量减少超过一千倍。

论文地址：https://dl.acm.org/doi/pdf/10.1145/3569052.3578920

与此同时，FPGA 的应用使得在最新的 AI 驱动放置和布线技术上能够快速迭代，实现了超过三倍的效率提升。

在芯片设计的创建过程中，必须对设计进行多种分析，以确保它们符合规定的标准和制造过程的约束。

在以往，为了精确掌握「寄生」特性，需要先制作电路的布局图，这一步骤往往会使设计周期的每一次迭代增加数天的手动工作。

现在，整个设计迭代过程可以在几分钟内完成，从而快速得到符合预期规格的电路。

很快，更强大的 LLM 将会化身成「芯片设计助手」—— 它们不仅能回答问题、评估和验证设计，还能执行一些常规设计任务。

此外，AI 技术将极大提升设计师的工作效率，可能增加十倍甚至更多。设计师只需把自己的注意力集中在算法和系统层面，而更细节的设计层面交给 AI 就可以了。

而且，AI 的合成与分析工具将极大缩短设计周期，使得从高层次的设计描述到完成验证的布局只需几小时，而现在这一过程需要几周时间。

PCAST 预计，通过将这些前沿技术融入芯片制造过程，美国将继续保持在半导体设计领域的领先地位，并有效缓解该领域的严重劳动力短缺问题。

甚至实现美国半导体行业的宏伟目标 —— 开发出全新的平台、方法和工具，使得芯片的生产只需现在所需人力的十分之一。

揭示宇宙的基础物理学：1 分钟模拟超算的 1 个月

关于宇宙，这些谜题始终未曾解答。

是什么「暗物质」将星系结合在一起?

又是什么「暗能量」推动所有星系间的距离加速膨胀?

最近观测到的那些古老的星系，有什么意义?

这些对于宇宙的基础理解，却能让我们实现技术上的飞跃。

比如，可能我们很难想象出一个比广义相对论更抽象、更不切实际的基础理论了，然而，它却是全球定位系统 GPS 的基础，解决了我们此前从未预想到的定位和导航问题，而其中的经济利益，以千亿美元计。

而如今，对于 AI 已经成为物理学家和宇宙学家实验和观测中工作中的重要工具，用于设计、实现和分析大多数步骤。

某些对 AI 的应用建立在目前的方法上，通过计算模拟，来比较和测试理论与数据，比如如果一个理论是正确的，数据看起来会是什么样。

▲ 通过条件密度估计对新物理学进行无监督分布内异常检测

对于超级计算机，这些模拟可能是最困难的任务，因为它们需要计算每一个粒子、恒星或星系行为的每一步。

但 AI 的好处是，它可以从这些模拟中学习更大的模型。这样，科学家就可以缩短这些超算的任务，让它能够在不到一分钟的时间内，看到一台超算一个月工作量的近似值。

通过 AI，研究人员可以扫描数百万种可能的理论，每一种都有我们字宙的不同初始图像，他们就能看到，哪一种更能解释我们实际用望远镜观察到的数据。

而到 2030 年末，我们就能用 AI 分析 Nancy Grace Roman 望远镜十年的数据。

▲ Nancy Grace Roman 太空望远镜

通过 AI 对数据进行分析，科学家们很可能会发现惊人的证据，证明我们的字宙不会在指数膨胀的冷寂中终结，而是会重复地发生大爆炸，循环重启。

AI 具有在复杂数据集中发现模式的能力，变量的数量远超人类可以跟踪的数量。

如果有新发现打破了常规规律，就会脱颖而出。

已经有粒子物理学家举办过比赛，来寻找搜索这些「异常」的最佳方法，后者很可能指向新的物理发现。而比赛的获胜者都是基于 AI 做出的发现。

▲ 通过拉格朗日深度学习生成宇宙流体动力学的有效物理定律，在混合模拟中预测暗物质超密度、恒星质量、电子动量密度等

这些 AI 方法，很可能使我们在下一代 CERN 和费米实验室加速器实验中，发现一些极其罕见、意想不到的粒子，这将有助于构建统一理论，该理论将引力与其他力相结合。

基础物理学和宇宙学，都是基于对数据进行统计分析，因此需要深入了解数据解释中的概率，这一要求也推动了 AI 在处理概率严谨性上的发展。

因为，我们需要 AI 做的，不仅是提供最有可能的答案 (「那是一张猫的照片」)，而是开发能够提供一系列可能答案、并且提供每个答案正确可能性的 AI 系统 (「有 69% 的可能性那是一只猫，22% 的可能性是土豚，8% 的可能性是气球，百分之一的可能性是冰箱」)。

▲ 物理学家正在寻找一种将量子物理学与广义相对论统一起来的理论

对于一个关键数字的测量，它会给出一组可能值，例如 68%、95% 或 99.9% 的概率。

评估不确定性，对于基础物理学至关重要，而严格遵循概率的 AI，也将为许多其他科学领域带来变革，对于科学意外的应用也意义重大。

或许 20 年后，科学家会用 AI 看到量子计算机与黑洞之间的类比，开启一种全新的测试广义相对论的台式方法，以及一种强大的新时序技术。

新材料：超导体、冷原子、拓扑绝缘体、超导量子比特

曾经，人类生活质量的重大改善，是由青铜、铁、混凝土、钢这些材料科学的进步推动的。

今天，我们生活在硅、碳氢化合物和硝酸盐的时代。不久的将来，可能就是纳米材料、生物聚合物和量子材料的时代。

而 AI 的辅助，会打开许多以往只存在于想象中的可能，包括室温超导、大规模量子计算机架构。

▲ 机器人正在劳伦斯伯克利国家实验室的 A-Lab 中合成材料

如今，科学家已经成功地用深度学习模型发现了多种材料。

比如，某私营公司的跨学科研究团队，使用 AI 设计出了数百万种新材料，近半数 AI 预测出来的新材料，都具备足够的稳定性，可以在实验室中生长。

另外，AI 也可用于改进现有材料，优化材料成分，减少对环境有害的物质。

▲ 用于预测材料拓扑性质的密度泛函理论示例

为了设计和开发新材料，来解决重大的社会挑战，美国国家科学基金会 (NSF) 已经投资了 7250 万美元。

具体来说，以下几个遇到阻碍的材料领域，很有望被 AI 解决。

超导体

去年夏天的室温超导热，让全社会都感受到了奇点临近的兴奋。

对于磁共振成像仪、粒子加速器、某些实验性的量子计算技术、全国电力网来说，超导体都是必不可少的，因为它能够无损耗地传输电能。

然而，超导体面临三个问题。

第一，就是目前已知的超导体必须冷却到接近绝对零度，也即零下 273 摄氏度，这就需要使用液氮，导致设备极其昂贵。

第二，与铜等传统导体不同，现有的超导体并不具有可塑性，会随着时间失去超导性。

第三，前驱材料的成本，还是加工成导线的成本，也都十分昂贵。

从前，我们的尝试都是依赖组合化学方法，需要筛选大量的材料组合。

▲ 为了得到常温常压超导，人类已经努力了 100 多年

因此，许多至关重要的材料的发现，都是出于偶然，期间经历了大量试验和错误。

变量如此之多，让材料价格低廉的要求如此之难，使得超导体的发现几乎不可能用传统方法解决。

而 AI，将在 3 个领域带来改变。

首先，AI 模型预测能力，使我们能够通过连接并利用现有材料、处理条件和性能方面的大量数据，来发现新材料。

从这个数据集中，可以确定化学、物理和工程中材料的模式，为研究人员提供新方法。

▲ 基于 GNoME 的发现，显示了基于模型的过滤和 DFT 如何充当数据飞轮，来改进预测

其次，人工智能模型可以预测性能（例如，预测量子比特的相于时间、热电材料的效率或超导体的临界温度），从而减少对可行候选材料实验的测试的浪费。

第三，通过将过程信息与材料组成相结合，可以在材料设计方面设定实际限制，加快新材料应用的商业化过程。

除了超导体这种「硬」材料，聚合物、流体这些「软」材料，因为材料科学中复杂的结构-性能关系，同样需要庞大的数据级和预测能力。

而且，量子计算机的基本构建部分，如冷原子、拓扑绝缘体或超导量子比特，都可以靠 AI 改进或生成。

▲ 具有 4 个量子比特的超导芯片

生命科学

美国国家科学技术委员会认为，由 AI 驱动的工具、分析和结果，将从根本上改变我们探索和理解生命的基本组成部分的方式，还会影响到包括农业和医学的生命系统。

揭开细胞功能之谜

解读细胞内部复杂的运作机制，是几个世纪以来一直困扰生物学家的难题，因为细胞的结构极其复杂且互相关联。

而 AI 就为此提供了强大的工具。

比如，AI 为蛋白质提供了新的视角。

基于 AI 的蛋白质折叠预测系统，可以利用机器学习算法预测了数百万种蛋白质的结构。

▲ 基于大规模深度学习的结构建模范围从单体蛋白质扩展到蛋白质组装

这些系统从已知蛋白质和结构的数据中学习，也从基础化学知识如原子间距离的物理约束中学习。

最近，研究人员还利用 AI 来破解蛋白质的功能，包括蛋白质如何相互作用，从而揭示细胞信号转导、代谢和基因调控等分子机制。

人工智能工具也被用来设计蛋白质，以实现与受体和其他目标特异性结合的目标。

AI 驱动的蛋白质设计，已经在开发疫苗和新型药物方面取得了成功。其中一些设计方法，正是使用了「扩散模型」和图像生成系统的填充和描边技术。

▲ 使用三轨神经网络准确预测蛋白质结构和相互作用

构建生物科学基础模型

构建生物信息学仿真工具，一个很有潜力的方法是构建面向整体细胞建模的多模态、多层次生物科学基础模型。

AI 方法使科学家能够对多种类型的数据进行多模态表征，或者「嵌入」，包括蛋白质序列和结构、DNA、RNA 表达数据、临床观察、成像数据和来自电子健康记录的数据等。

▲ 使用 RFAA 进行一般生物分子建模

例如，开发集成大型数据集的基础模型 EVO，结合 DNA、RNA 和蛋白质数据，来阐明细胞整体功能背后的相互作用。

这种多模态、多层次的模型，可以提供从原子到生理学的各种尺度的结果预测，以及分子和行为的生成。

生物科学基础模型，有望使科学家探究健康与疾病的本质，例如建立癌症模型，并探索细胞相互作用，以及癌症背后的网络如何在模拟中被破坏或「治愈」。

AI 将指导药物研发，在开始昂贵耗时的实验之前，AI 就可以通过虚拟筛选潜在的治疗化合物，减少不必要的浪费。

五点建议

为了实现以上技术进步，PACST 委员会提出了以下五点建议。

建议 1：广泛公平地共享基础 AI 资源

广泛支持易于访问的共享模型、数据集、基准和计算能力，对于确保学术研究人员、国家和联邦实验室以及较小的公司和非营利组织能够使用 AI 为国家创造利益至关重要。

在美国，最有希望的一个试点项目是 —— 国家人工智能研究资源（NAIRR），PCAST 建议尽快将 NAIRR 扩展到特别工作组设想的规模，并获得全额资助。

完整规模的 NAIRR，连同行业合作伙伴关系以及联邦和州的其他 AI 基础设施，可以作为美国或国际层面 AI 基础设施项目的基石，从而促进高影响力的研究。

建议 2：扩大对联邦数据集的安全访问

PCAST 强烈建议扩大现有的安全数据访问试点计划，并制定联邦数据库管理指南，从而加入入最先进的隐私保护技术。

这包括允许获批的研究人员有限度、安全地访问联邦数据集，以及允许向 NAIRR 等资源中心发布经过匿名化处理的数据集。

此外，PCAST 还希望能进一步执行此类授权，包括共享在联邦资助的研究数据上训练的 AI 模型，并提供足够的资源来支持所需的行动。

建议 3：支持 AI 领域的基础和应用研究，其中包括学术界、工业界、国家和联邦实验室以及联邦机构之间的合作

联邦资助的学术研究与私营部门研究之间的界限是模糊的。许多研究人员会在学术机构、非营利组织和私营公司之间流动。在这之中，私营公司目前支持了相当大比例的 AI 研发。

为了能够充分利用 AI 在科学领域的潜在优势，就必须支持各种有前景、有成果的假设和方法的研究。

因此，资助机构需要在如何与产业界合作以及哪些研究人员可以得到支持方面放宽姿态，以便促进创新研究以及不同部门之间的协作。

建议 4：在科学研究过程的所有阶段采用负责任、透明和值得信赖的 AI 使用原则

在科学研究中，使用 AI 可能会产生不准确、有偏见、有害或无法复现的结果。因此，从项目的初始阶段，就应该对这些风险进行管理。

PCAST 建议，联邦资助机构可以更新其负责任研究行为准则，要求研究人员提供负责任的 AI 使用计划。为了最大限度地减轻研究人员的额外行政负担，在列举主要风险后，机构应提供风险缓解的示范流程。

与此同时，国家科学基金会（NSF）和国家标准与技术研究所（NIST）等机构应继续支持负责任和值得信赖的 AI 的科学基础研究。

其中包括，衡量 AI 准确性、可重复性、公平性、弹性和可解释性等属性的标准基准；监测这些属性并在基准不在定义范围内时进行调整的 AI 算法；以及评估数据集中的偏差，并区分合成数据和真实世界数据的工具。

建议 5：鼓励采用创新方法将 AI 辅助集成到科学工作流程之中

科学事业是一个很好的「沙盒」，我们可以在其中练习、研究和评估人与 AI 助手之间新的协作范式。

不过，这里的目标并不是追求自动化程度的最大化，而是要让人类研究人员在负责任地利用 AI 辅助的同时，实现高质量的科学研究。

资助机构应该重视这些新工作流的出现，并设计灵活的程序、评估指标、资助模式和挑战性问题，鼓励以新的 AI 辅助方式组织和执行科学项目的战略性实验。

此外，这些工作流的实施也为来自各个学科的研究人员提供了机会，从而推进了在人机协作领域的知识。

更广泛地说，我们还需要更新资助机构、学术界和学术出版业的激励机制，来支持更广泛的科学贡献。比如，策划高质量和广泛可用的数据集，是无法通过传统研究生产力指标得到充分认可的。

参考资料：

https://mathstodon.xyz/@tao/112355788324104561

本文来自微信公众号：新智元（ID：AI_era）

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。