新闻  |   论坛  |   博客  |   在线研讨会
那个用AlphaGo打败人类的DeepMind,又攻克了生物学的世纪难题
硅星人 | 2020-12-02 16:22:16    阅读:213   发布文章

继AlphaGo赢了人类棋手,DeepMind将触角涉及到生物科技领域。DeepMind开发了一款人工智能软件AlphaFold,使用了AI与算法相结合的方式来预测蛋白质中氨基酸对之间的距离,以解决生物学最严峻的挑战之一——蛋白质折叠预测。

可以说,依靠AlphaFold过去50年来未能解开的谜得以解开,为更好的治疗疾病和发现****物创造了更优的条件。AlphaFold”大杀四方“CASP(Critical Assessment of protein Structure Prediction)是国际性的蛋白质结构预测的重要评估组织, 每两年进行一次蛋白质结构预测的全球试验比赛,主要目标是帮助推进从氨基酸序列中识别蛋白质三维结构的方法,被许多人认为是该科学领域的“黄金标准”。2018年,AlphaFold首次参与CASP 13的竞赛,就取得了良好的表现。最初版本的AlphaFold在众多的参与者中获得了最高的准确率。 时隔两年,AlphaFold 2 新开发的深度学习架构推动了CASP14方法的变化,他们改变策略,开发新的AI网络,使得AlphaFold 2 可以预测目标蛋白质序列的最终结构。本周 CASP表示DeepMind的AlphaFold系统在蛋白质结构预测方面取得了空前的准确性,GDT(Global Distance Test)准确性高于90%。

CASP 的John Moult教授在新闻发布会上说,"一个长达50年的重大挑战已经在很大程度上解决了。"德国进化生物学家Andrei Lupas说,AlphaFold已经帮助他找到了困扰他实验室十年的蛋白质结构问题,他希望这将改变他的工作方式和问题处理方式。Lupas还说到,“这将改变医学。改变研究。改变生物工程。改变一切。在DeepMind 8月的官方博客中也提到了AlphaFold系统可能对未来的疫情提供帮助。他们在几乎没有氨基酸序列的前提下,准确的预测了冠状病毒中的两个蛋白质结构。蛋白质折叠难题许多对于生命至关重要的化学反应,都取决于蛋白质折叠为正确的三维形状。如果蛋白质无法正确折叠,化学反应就无法完成,它就会变成“聚集物”。在过去的研究中,研究人员一直将这种聚集过程与阿尔茨海默氏症、肌萎缩性侧索硬化症、亨廷顿氏病等疾病的形成联系到一起。有证据表明,糖尿病和癌症也与蛋白质折叠失常有关联。氨基酸序列准确预测蛋白质结构的能力将对生命科学和医学带来巨大的好处。这将极大地加快了解细胞组成部分的工作,并使更快,更先进的****物发现成为可能。人们的DNA编译蛋白质的分子式,蛋白质由氨基酸链组成。但是DNA只包含氨基酸序列的信息,并没有折叠成形状的信息。在蛋白质折叠成复杂的3D结构之前,随机举例一种典型蛋白质,它所有可能配置预测所需要的时间是无法估量的,然而蛋白质本身会在几毫秒内自发折叠。预测这些链将如何折叠成蛋白质复杂的3D结构就是“蛋白质折叠问题”。
成千上万种不同的蛋白质存在每个活细胞内部,用来保持活力和健康。预测蛋白质折叠的形状很重要,因为它决定了蛋白质的功能,几乎所有的疾病,包括癌症和痴呆症,都与蛋白质的功能有关。科学家们认为蛋白质的形式决定了功能。科学家可以通过了解到的蛋白质形状,有针对的开发相关****物。科研人员在过去的五十年里,利用冷冻电子显微镜,核磁共振和X射线晶体学等方式反复试验去确定蛋白质的形状,但是耗费了大量的时间和财力也没有得出蛋白质的具体形状。科学家估计,由于氨基酸之间相互作用的状况无法估计,在出现正确的结构之前,找出典型蛋白质的所有可能构型将花费超过138亿年的时间。AlphaFold的出现使得生物学家可以通过AI的方法来取代之前繁琐和艰难的试验过程。利用AlphaFold,使用遗传密码来预测蛋白质的形状。AlphaFold在CASP 14的评估结果中,GDT总体平均得分在92.4。GDT是CASP用来衡量试验标准性的指标,范围是0-100。AlphaFold的得分可以说是在蛋白质结构的预测上达到了极高的准确性。AlphaFold的进化早在2018年,AlphaFold就参与了CASP13 的竞赛,DeepMind使用了生成神经网络,提出了候选片段,然后插入到其他更为传统的结构优化工作流程中。DeepMind将新旧技术与流水线相结合,该流水线将深度学习用于评分,将梯度下降用于目标优化。利用深度学习的AI方法应用于结构和遗传数据,以预测蛋白质中氨基酸对之间的距离。DeepMind的AlphaFold成功预测了43种蛋白质中25种的最准确结构,从而获得第13届CASP的冠军。该项目的GDT评分的中位值为68.5分,虽然没有达到项目认可的90分以上,但这个数值也远超第二名。

2020年, AlphaFold 2 再次参加 CASP14 的竞赛。这次AlphaFold创建了一个基于注意力的神经网络系统,该系统经过端到端训练,同时对所构建的隐式图进行推理。经过反复多次的测试,系统对蛋白质的基本物理结构有了更准确的预测,并且可以把时间缩短到在几天内就完成确定高精度的结构。AlphaFold还可以自行预测蛋白质结构中不同部分的可信程度。相较于上一次的CASP,DeepMind团队今年对蛋白质结构的预测更为准确,也远远超出了其他参与团队的准确度,超过了项目认可的90分。与过去几年的研究相比,AlphaFold的表现展示了准确性的绝对提高,解决了过去几十年生物学家为之困惑的难题,把蛋白质折叠难题大致解决。DeepMind再写传奇 
DeepMind2010年在伦敦成立,是一家人工智能公司和研究实验室,在2014年被Google收购。除了针对蛋白质折叠的AI程序AlphaFold, 旗下还有之前击败人类的AlphaGo计算机围棋程序,改进版本AlphaGo Zero和AlphaZero。AlphaGo技术是基于深度学习方法开发的,模仿人类玩家,无论是输是赢都会从中学习,不断完善自身能力来保证更高的获胜率。另一个是DeepMind 推出的AlphaStar,这是一款针对游戏《星际争霸 2 》推出的程序。与AlphaZero不同,AlphaStar最初是在其人类与人类游戏数据库中学习模仿最佳玩家的举动,通过监督学习直接从原始游戏数据中进行训练和强化学习。在2014年被谷歌收购之后,Deepmind的研究领域逐步扩大,尤其在医疗领域加大了研发投入,目前已有多个研究成果开始应用,例如眼底筛查、以及这次的预测蛋白质三维结构等。继AlphaGo之后,Google DeepMind首席执行官Demis Hassabis曾表示除了研究用人工智能与人类玩其他游戏之外,他希望产生更多的科学影响。“ DeepMind的最终愿景是能够构建通用AI,加快科学发现的步伐,使用它来帮助我们更好地了解周围的世界。“AlphaFold让DeepMind的愿景有了一次成功的展示,建立了一个可以真正帮人们了解世界的系统。


*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。

参与讨论
登录后参与讨论
推荐文章
最近访客