Demis Hassabis:AI 的强大,超乎我们的想象(2)
扫一扫
分享文章到微信
扫一扫
关注99科技网微信公众号
2、 Al for science
Lex Fridman:下面我们谈谈 AlphaFold,你认为人类思维都来自于这种类似神经网络的、生物的计算糊状物,而非直接在精神上工作? Demis Hassabis: 在我看来,宇宙中最大的奇迹就是我们头骨里只有几磅的糊状物,它也是大脑和目前所知宇宙中最复杂的物体。我认为这是一台令人惊奇的高效机器,这也是我一直想构建 AI 的原因之一。通过构建像 AI 这样的智能体,将其与人类思维进行比较,或能帮助我们历史以来一直想知道的心灵的独特性,和真正的秘密、意识、做梦、创造力、情感等一切事物。 现在有了大量的工具来实现这件事。所有的神经科学工具、FMI机器都可以记录,也有 AI 计算能力可以建立智能系统。人类思维所能做的事情令人惊讶,人类创造了像计算机这样的东西,并思考和研究这些问题,也都是对人类头脑的证明,有助于我们更清晰地了解宇宙和人类的思想。 甚至可以说,我们或许是宇宙尝试和理解自己美丽的机制所在。 从另一个角度看,生物学的基本构件也可以用于理解人类思想和身体,从基本构建开始模拟和建立模型是件很神奇的事情,你可以构建越来越大的、更复杂的系统,甚至是整个人类生物学。 还有一个被认为不可能解决的问题,就是蛋白质折叠,而 AlphaFold 解决了蛋白质折叠问题,这是结构生物学史上最大的突破之一。蛋白质是所有生命都必不可少的,身体每一个功能都依赖于蛋白质。 蛋白质由它们的基因序列(也被称为氨基酸序列)指定,可以将其视为它们的基本构件。它们会在身体中、在自然界中折叠成一个三维结构,这个三维结构决定了它在身体中的功能。此外,如果你对药物或疾病感兴趣,想用一种药物化合物来阻断蛋白质的作用,前提是要了解蛋白质表面结合点的三维结构。 图注:2021年7月,DeepMind 首次通过与欧洲分子生物学实验室(EMBL)合作建立的数据库公开发布 AlphaFold 预测结果,初始数据库包含了所有人类蛋白质的98% Lex Fridman:蛋白质折叠问题的本质是,你能从氨基酸序列中得到一维的字母串吗?能通过计算立即预测出三维结构吗?这是50多年来生物学界的一个重大挑战。1972年的诺贝尔奖获得者 Christian Anfinsen 首次阐述,他推测,从氨基酸序列到三维结构是可以实现的。 Demis Hassabis: Christian Anfinsen 的这句话开启了整个计算生物学的50个边缘领域,他们被困在当中、并没有完成得很好。 在 AlphaFold 出现之前,这都是通过实验来完成的,让蛋白质结晶是件非常困难的事情,有些蛋白质不能像膜蛋白那样结晶,必须使用昂贵的电子显微镜或X射线晶体分析仪,才能得到三维结构并将其结构可视化。有了 AlphaFold 后,两个人就能在几秒钟内预测出三维结构。 Lex Fridman:有一个数据集,它在这个数据集上进行训练,以及如何映射氨基酸。令人 难以相信 的是,这个小的化学计算机能以某种分布式方法来计算,且 算 得非常快。 Demis Hassabis: 或许我们该讨论一下生命的起源。实际上,蛋白质本身是一个神奇的小生物和动物机器。提出列文塔尔悖论的科学家 Cyrus Levinthal 大致计算了一下,一般的蛋白质可能有2000个氨基酸碱基长,可以有10到300种不同的蛋白质折叠方式。而在自然界中,物理学以某种方式解决了这个问题,蛋白质会在几毫秒、或是一秒的时间内,在你的身体中折叠起来。 Lex Fridman:该序列有独特的方式来自我形成,它找到了一种在巨大可能性中保持稳定的方式。某些情况下可能会出现功能失调等情况,但大多时候是独特的映射,而这种映射并不明显。 Demis Hassabis: 如果是健康通常有一个独特的映射,那患病时,究竟问题出在哪里。例如,曾经有一个对阿尔茨海默氏症的猜想是,因为以错误的方式折叠 β-淀粉样蛋白导致折叠错位,以至于在神经元中纠缠在一起。 因此,要了解健康、功能和疾病,就需要了解它们是如何结构化的,知道这些东西在做什么超级重要。下一步是当蛋白质与某些东西相互作用时,它们会改变形状。因此在生物学中,它们不一定是静态的。 Lex Fridman:或许你可以给出一些解决 AlphaFold 的方法,与游戏不同,这是真正的物理系统。这当中什么是非常难解决的?有哪些跟解决方案是相关的 ? Demis Hassabis: AlphaFold 是迄今为止我们构建的最复杂、可能也是最有意义的系统。 我们起初构建的 AlphaGo 和 AlphaZero 都是与游戏相关,但最终目标不仅仅是破解游戏,而是使用它们来引导通用学习系统,并应对现实世界的挑战。我们更多是希望致力于像蛋白质折叠这样的科学挑战,AlphaFold 是我们的第一个重要证明点。 就数据来说,创新数量大概需要30多种不同的组成算法,放在一起来破解蛋白质折叠。一些重大的创新是围绕物理学和进化生物学,建立了硬编码来约束像蛋白质中键角之类的东西,但不会影响学习系统,因此,系统仍能从案例中学习物理。 假设只有大约15万个蛋白质,即使经过40年的实验,也大概只有约5万种蛋白质结构会被发现。训练集比通常使用的数据量要少得多,但当中使用了像自我提取等各种技巧。因此,使用 AlphaFold 做一些非常有信心的预测时,将其放回训练集中使训练集更大,对 AlphaFold 工作至关重要。 实际上,为了解决这个问题,需要进行大量的创新,AlphaFold 产生的是一个直方图,一种蛋白质中所有分子之间的成对距离的矩阵,它们必须是一个单独的优化过程来创建三维结构。要使 AlphaFold 真正地从端到端,可直接从氨基酸的碱基序列到三维结构,跳过中间步骤。 从机器学习中也可以发现,越是端到端,就越能使系统变得更好,系统比人类设计者更善于学习约束条件。在这种情况下,三维结构要比有中间步骤更好,因为那必须手工进入下个步骤。最好的办法是让梯度和学习一直流经系统,从终点到想要的最终输出,再到输入。 Lex Fridman:关于 AlphaFold 的设想,那或许是生物学中一个漫长旅程的早期步骤,你认为同样的方法是否预测更复杂的生物系统的结构和功能、多蛋白质相互作用;其作为一个起点,能模拟越来越大的系统,最终模拟像人的大脑、人体这样的东西 吗? 你认为这是一个长期的愿景吗? Demis Hassabis: 当然,一旦我们有了足够强大的生物学系统,治疗疾病和理解生物学就是我的 To Do List 上的首要任务,这也是我亲自推动 AlphaFold 的原因之一,AlphaFold 只是一个开始。 AlphaFold 解决了蛋白质结构这个巨大的问题,但生物学是动态的,我们所研究的所有东西都是蛋白质液体结合。与分子发生反应,搭建通路,最终形成一个虚拟细胞,那是我的梦想。我一直同很多生物学朋友交谈,其中就包括了克里克研究所的生物学家 Paul Nurse。对生物学和疾病发现来说,构建一个虚拟细胞是不可思议的,因为你可以在虚拟细胞上进行大量实验,最后阶段再进入实验室来验证。 就发现新药而言,从确定目标到拥有一个候选药物大约需要10年时间,如果能在虚拟细胞中完成大部分工作,或许可以将时间缩短一个数量级。为了实现虚拟细胞,必须建立对生物学不同部分相互作用的理解。每隔几年,我们就会与跟 Paul 谈论这个问题。去年在 AlphaFold 之后,我说现在终于是我们可以去做的时候了,Paul 非常激动。我们与他的实验室有一些合作。在 AlphaFold 的基础上,相信生物学会有一些惊人的进步,目前也可以看到,在 AlphaFold 开源之后已经有社区在做了。 我认为有一天,人工智能系统可能会解决像广义相对论这样的问题,而不仅仅是通过对互联网或公共医疗上的内容进行处理。这将非常有趣,看它会能够想出什么。这有点像我们之前关于创造力发明围棋的辩论,不是仅仅想出一个好的围棋动作。如果想要获得像诺贝尔奖的奖项,那它需要做的是发明围棋,而不是由人类科学家或创造者来指定。 Lex Fridman:很多人确实把科学看作是站在巨人的肩膀上,而问题是你在巨人的肩膀上真正达到了多少?也许它只是吸收了过去的不同类型的结果,最终以新的视角提供了突破性的想法。 Demis Hassabis: 这是一个很大的谜团, 我相信在过去十年甚至未来几十年中,很多新的重大突破都会出现在不同学科领域的交叉点上, 在这些看似不相干的领域之间会发现一些新的联系。人们甚至可以认为,深层思维是神经科学思想和 AI 工程思想间的一种交叉学科。 Lex Fridman:你有一篇论文是 “ 通过深度强化学习对托卡马克等离子体进行磁控制 ” ,所以你在寻求用深度强化学习来解决核聚变,做高温等离子体的控制。你能解释一下 AI 为什么 最终能解决 这个 吗? Demis Hassabis: 过去的一两年里,我们的工作非常有趣和看到了成效,我们启动了很多我的梦想项目,这些是我多年来收集的同科学领域相关的项目。如果我们能参与推动,或许能带来具有变革性的影响,科学挑战本身就是一个非常有趣的问题。 目前,核聚变面临许多挑战,主要在物理、材料、科学和工程等方面,以及如何建造这些大规模的核聚变反应堆并容纳等离子体。 我们与瑞士洛桑联邦理工学院(EPFL)和瑞士技术研究所合作,他们有一个测试反应器愿意让我们使用。这是一个惊人的测试反应堆,他们在上面尝试各种相当疯狂的实验。而我们则看的是,当进入一个新领域如核聚变时,瓶颈问题是什么?从第一原理思考阻碍核聚变运作的底层问题是什么? 在这种情况下,血浆控制是完美的。这个等离子体有100万℃,比太阳还热,显然没有任何材料可以容纳它。因此必须有非常强大的超导磁场,但问题是等离子体相当不稳定,就像在一个反应堆中持有许多颗星,提前预测等离子体会做什么,你可以在几百万秒内移动磁场来控制它接下来会做什么。 如果你把它看作是一个强化学习预测问题,这似乎很完美,有控制器,可以移动磁场和切割,但此前用的是传统的控制器。我希望有一种可控的规则是他们不能在当下对等离子体做出反应,必须是硬编码的。 Lex Fridman: AI 最终解决了核聚变。 Demis Hassabis: 去年我们在《自然》杂志上发表了关于解决这个问题的论文,把等离子体固定在一个特定的形状。实际上这几乎就像是把等离子体雕刻成不同的形状,控制它并保持在那里创纪录的时间。这是核聚变的一个未解决的问题。 把它包含在结构中并保持,还有一些不同形状更有利于能量的产生,称为滴液等等,这是很重要的。我们正与许多核聚变初创公司沟通,看在核聚变领域可以解决的下一个问题是什么。 Lex Fridman:论文标题中还有一个迷人的地方,通过解决分数电子问题来推动密度函数的前沿。你能解释一下这项工作吗 ?AI 在未来能否对任意的量子力学系统进行建模和模拟? Demis Hassabis: 人们试图写出密度函数的近似值以及对电子云的描述,观察两个元素放在一起时如何相互作用。而我们试图做的是学习一种模拟,学习一种能够描述更多化学类型的化学函数。 到目前为止,AI 可以运行昂贵的模拟,但只能模拟非常小和非常简单的分子,我们无法做到模拟大型材料。因此要建立函数近似值来展示其方程后,描述电子在做什么,所有材料科学和性质都是由电子如何相互作用来控制的。 Lex Fridman:通过功能对模拟进行总结来接近实际模拟出来的结果,这项任务的难度在于运行复杂的模拟,学习从初始条件和模拟参数的映射任务,学习函数会是什么? Demis Hassabis: 这很棘手,但好消息是我们已经做到了,我们可以在计算集群上运行大量的模拟,即分子动力学模拟,由此产生了大量的数据。在这种情况下,数据是生成的。这就是为什么我们使用游戏模拟器来生成数据,因为可以随心所欲地创造出更多的数据。如果在云端有空闲的电脑,我们就可以运行这些计算。
99科技网:http://www.99it.com.cn

Web2.0 的萌芽正如饥似渴吸收着市场的养分,但在互联网的泡沫下也风雨飘摇。
元宇宙2022-08-31
