DeepMind创始人:AI 的强大,超乎我们的想象(7)
扫一扫
分享文章到微信
扫一扫
关注99科技网微信公众号
Lex Fridman:或许你可以给出一些解决 AlphaFold 的方法,与游戏不同,这是真正的物理系统。这当中什么是非常难解决的?有哪些跟解决方案是相关的?
Demis Hassabis:AlphaFold 是迄今为止我们构建的最复杂、可能也是最有意义的系统。
我们起初构建的 AlphaGo 和 AlphaZero 都是与游戏相关,但最终目标不仅仅是破解游戏,而是使用它们来引导通用学习系统,并应对现实世界的挑战。我们更多是希望致力于像蛋白质折叠这样的科学挑战,AlphaFold 是我们的第一个重要证明点。
就数据来说,创新数量大概需要30多种不同的组成算法,放在一起来破解蛋白质折叠。一些重大的创新是围绕物理学和进化生物学,建立了硬编码来约束像蛋白质中键角之类的东西,但不会影响学习系统,因此,系统仍能从案例中学习物理。
假设只有大约15万个蛋白质,即使经过40年的实验,也大概只有约5万种蛋白质结构会被发现。训练集比通常使用的数据量要少得多,但当中使用了像自我提取等各种技巧。因此,使用 AlphaFold 做一些非常有信心的预测时,将其放回训练集中使训练集更大,对 AlphaFold 工作至关重要。
实际上,为了解决这个问题,需要进行大量的创新,AlphaFold 产生的是一个直方图,一种蛋白质中所有分子之间的成对距离的矩阵,它们必须是一个单独的优化过程来创建三维结构。要使 AlphaFold 真正地从端到端,可直接从氨基酸的碱基序列到三维结构,跳过中间步骤。
从机器学习中也可以发现,越是端到端,就越能使系统变得更好,系统比人类设计者更善于学习约束条件。在这种情况下,三维结构要比有中间步骤更好,因为那必须手工进入下个步骤。最好的办法是让梯度和学习一直流经系统,从终点到想要的最终输出,再到输入。
Lex Fridman:关于 AlphaFold 的设想,那或许是生物学中一个漫长旅程的早期步骤,你认为同样的方法是否预测更复杂的生物系统的结构和功能、多蛋白质相互作用;其作为一个起点,能模拟越来越大的系统,最终模拟像人的大脑、人体这样的东西吗?你认为这是一个长期的愿景吗?
Demis Hassabis:当然,一旦我们有了足够强大的生物学系统,治疗疾病和理解生物学就是我的 To Do List 上的首要任务,这也是我亲自推动AlphaFold 的原因之一,AlphaFold 只是一个开始。
AlphaFold 解决了蛋白质结构这个巨大的问题,但生物学是动态的,我们所研究的所有东西都是蛋白质液体结合。与分子发生反应,搭建通路,最终形成一个虚拟细胞,那是我的梦想。我一直同很多生物学朋友交谈,其中就包括了克里克研究所的生物学家 Paul Nurse。对生物学和疾病发现来说,构建一个虚拟细胞是不可思议的,因为你可以在虚拟细胞上进行大量实验,最后阶段再进入实验室来验证。
99科技网:http://www.99it.com.cn
