效率提升 1200 倍，麻省理工开发出 AI 制药新模型

智东西
2022-07-14 18:01

7 月 14 日消息，据外媒 Tech Xplore 报道，麻省理工学院的研究人员最近开发了一种叫做 EquBind 的新模型，这个模型可以提前预测新蛋白质分子的结构，提升药物开发的效率。

目前这项技术已经得到了业界内的认可，阐述这项技术的论文也将在 7 月被国际机器学习会议（ICML）接收。

一、速度提升 1200 倍，EquBind 模型能迅速筛选类药物分子

目前，药物研发是一件漫长而又昂贵的事情。其中最主要的原因就是开发药物的成本十分昂贵。这种成本不仅包括数十亿美元的资金投入，还包括长达数十年的研究时间。

而且在研发的过程中，90% 的药物都会因为无效或副作用太多而研发失败，只有 10% 的药物能够顺利通过食品和药物管理局的检查，被批准上市。

因此，制药公司会提高研发成功药品的价格，来弥补研发失败药品造成的损失，所以目前有些药物的价格居高不下。

▲ 一些蛋白质分子结构

如果研究人员想要进行药物开发，就要先找到有开发潜力的类药物分子（drug-like molecules）。药物研发进程缓慢还有另一个重要的原因，那就是现存的类药物分子数量庞大。数据显示，目前现存的类药物分子多达 10¹⁶ 种，这个数字远远超出了现有的分子计算模型的计算上限。

为了处理数据如此庞大的分子，加快药物开发的进程，麻省理工学院电子工程和计算机科学系的研一学生 Hannes Stärk 开发了一种叫做“EquBind”的几何深度学习模型。EquBind 比现存最快的分子计算对接模型运行速度快 1200 倍，能够更快地找到类药物分子。

二、EquBind 模型能精准预测蛋白质结构，提升药物研发效率

目前大多数传统的分子计算对接模型都是通过一种叫做“配体-蛋白质”（ligand-to-protein binding）的方法寻找类药物分子。具体而言，模型需要先接收大量的样本分子，然后让配体与各种分子进行结合，然后模型再对不同分子进行评分，再以最后的排名来筛选出最合适的分子。但是这种做法流程繁复，模型寻找类药物分子的效率较低。

Hannes Stärk 对这个过程做了一个形象的比喻，他说：“以前的典型的‘配体-蛋白质’方法就好像是试图让模型把钥匙插入有很多钥匙孔的锁，模型要花费大量的时间为钥匙和每一个锁孔的适配度打分，再选出最合适的那个。”

他继续解释道：“而 EquBind 可以跳过最花费时间的步骤，可以在遇到新分子时提前预测最合适的‘锁孔’，这就是所谓的‘盲配对’（blind docking）。EquBind 有内置的几何推理算法，能够帮助模型学习分子的基本结构。这个算法可以让 EquBind 在遇到新的分子时直接预测出最合适的位置，而不用花费大量的时间尝试不同的位置并打分。”

▲ 麻省理工学院

三、EquBind 模型已在业界成功应用，作者期待更多反馈

这个模型引起了治疗公司 Relay 的首席数据官帕特・沃尔特斯（Pat Walters）的注意。沃尔斯特建议 Hannes Stärk 的研究小组用这种模型来进行用于治疗肺癌、白血病和胃肠道肿瘤的药物开发。通常而言，用于这些领域药物的蛋白质配体很难用大多数传统的方法对接，但是 EquBind 却能让它们成功对接。

▲ 两种治疗肺癌的抑制剂药物

沃尔特斯说：“EquBind 为蛋白质对接问题提供了一种独特的解决方案，它解决了结构预测和绑定位点识别等问题。这种方法可以很好地利用数千种公开的晶体结构信息，EquBind 可能会以新的方式影响这个领域。”

发表这项技术的论文将在 7 月被国际机器学习会议（ICML）接收，该论文的作者 Hannes Stärk 表示：“我很期待能在这次会议上收到一些关于 EquBind 模型的改进意见。”

结语：AI 与制药适配度极佳，发展势头正盛

AI 制药是一个 2020 年才走进公众视野的新兴领域。

制药领域是一个天然的 AI 场景。新药研发的长周期、高成本、低成功率，给 AI 留下了庞大的用武之地：机器可以自主学习数据、挖掘数据，总结归纳专家经验外的药物研发规律，继而优化药物研发流程中的各个环节，这不仅可以提升药物研发效率与成功率，还有望降低研发费用和试错成本。

因为这样的特性和发展潜力，目前 AI 制药势头正盛。但也有业内人士唱衰，说 AI 在制药过程中扮演的终归只是辅助角色，绕不开行业固有的流程和机制，不可能用两三年的时间做完十年的事。

但是整体而言，目前 AI 制药领域还是不断有新的技术突破，发展蒸蒸日上。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。