7 月 14 日消息,据外媒 Tech Xplore 报道,麻省理工学院的研究人员最近开发了一种叫做EquBind的新模型,这个模型可以提前预测新蛋白质分子的结构,提升药物开发的效率。
目前这项技术已经得到了业界内的认可,阐述这项技术的论文也将在 7 月被国际机器学习会议(ICML)接收。
目前,药物研发是一件漫长而又昂贵的事情。其中最主要的原因就是开发药物的成本十分昂贵。这种成本不仅包括数十亿美元的资金投入,还包括长达数十年的研究时间。
而且在研发的过程中,90% 的药物都会因为无效或副作用太多而研发失败,只有 10% 的药物能够顺利通过食品和药物管理局的检查,被批准上市。
因此,制药公司会提高研发成功药品的价格,来弥补研发失败药品造成的损失,所以目前有些药物的价格居高不下。
▲ 一些蛋白质分子结构
如果研究人员想要进行药物开发,就要先找到有开发潜力的类药物分子(drug-like molecules)。药物研发进程缓慢还有另一个重要的原因,那就是现存的类药物分子数量庞大。数据显示,目前现存的类药物分子多达 1016种,这个数字远远超出了现有的分子计算模型的计算上限。
为了处理数据如此庞大的分子,加快药物开发的进程,麻省理工学院电子工程和计算机科学系的研一学生 Hannes Stärk 开发了一种叫做“EquBind”的几何深度学习模型。EquBind 比现存最快的分子计算对接模型运行速度快 1200 倍,能够更快地找到类药物分子。
目前大多数传统的分子计算对接模型都是通过一种叫做“配体-蛋白质”(ligand-to-protein binding)的方法寻找类药物分子。具体而言,模型需要先接收大量的样本分子,然后让配体与各种分子进行结合,然后模型再对不同分子进行评分,再以最后的排名来筛选出最合适的分子。但是这种做法流程繁复,模型寻找类药物分子的效率较低。
Hannes Stärk 对这个过程做了一个形象的比喻,他说:“以前的典型的‘配体-蛋白质’方法就好像是试图让模型把钥匙插入有很多钥匙孔的锁,模型要花费大量的时间为钥匙和每一个锁孔的适配度打分,再选出最合适的那个。”
他继续解释道:“而 EquBind 可以跳过最花费时间的步骤,可以在遇到新分子时提前预测最合适的‘锁孔’,这就是所谓的‘盲配对’(blind docking)。EquBind 有内置的几何推理算法,能够帮助模型学习分子的基本结构。这个算法可以让 EquBind 在遇到新的分子时直接预测出最合适的位置,而不用花费大量的时间尝试不同的位置并打分。”
▲ 麻省理工学院
这个模型引起了治疗公司 Relay 的首席数据官帕特・沃尔特斯(Pat Walters)的注意。沃尔斯特建议 Hannes Stärk 的研究小组用这种模型来进行用于治疗肺癌、白血病和胃肠道肿瘤的药物开发。通常而言,用于这些领域药物的蛋白质配体很难用大多数传统的方法对接,但是 EquBind 却能让它们成功对接。
▲ 两种治疗肺癌的抑制剂药物
沃尔特斯说:“EquBind 为蛋白质对接问题提供了一种独特的解决方案,它解决了结构预测和绑定位点识别等问题。这种方法可以很好地利用数千种公开的晶体结构信息,EquBind 可能会以新的方式影响这个领域。”
发表这项技术的论文将在 7 月被国际机器学习会议(ICML)接收,该论文的作者 Hannes Stärk 表示:“我很期待能在这次会议上收到一些关于 EquBind 模型的改进意见。”
AI 制药是一个 2020 年才走进公众视野的新兴领域。
制药领域是一个天然的 AI 场景。新药研发的长周期、高成本、低成功率,给 AI 留下了庞大的用武之地:机器可以自主学习数据、挖掘数据,总结归纳专家经验外的药物研发规律,继而优化药物研发流程中的各个环节,这不仅可以提升药物研发效率与成功率,还有望降低研发费用和试错成本。
因为这样的特性和发展潜力,目前 AI 制药势头正盛。但也有业内人士唱衰,说 AI 在制药过程中扮演的终归只是辅助角色,绕不开行业固有的流程和机制,不可能用两三年的时间做完十年的事。
但是整体而言,目前 AI 制药领域还是不断有新的技术突破,发展蒸蒸日上。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。