Cleo Abram的Huge Conversations在2026年4月7日发布了一期长达一小时的对谈,嘉宾是我们的常驻人士,Google DeepMind的CEO、诺贝尔化学奖得主哈萨比斯(Demis Hassabis)。
我要说播客这种形态,还是Youtube频道们玩得更有特色。Cleo为这期节目设计了一个别致的形式。她把DeepMind过去十年的项目分别写在叠叠乐(Jenga)木块上,摆成一座塔:AlphaFold、AlphaGo、AlphaZero、Isomorphic Labs、AlphaGenome、AlphaEvolve、AlphaChip、GenCast。两人一边抽木块一边聊,抽一块聊一个。

这期最核心的不是任何一个单独的项目,而是哈萨比斯在整整一小时里把一整条DeepMind技术树串起来讲透了。他解释了每个项目解决了什么、彼此如何咬合、下一步可能通向哪里。他还罕见地承认了一件事:今天这种在ChatGPT之后被商业压力和地缘政治推着跑的AI节奏,不是他理想中的路径。如果由他定,他会把AI在实验室里再多留十年,用CERN式的协作方式,把AGI这一步走稳。
还有一个时间上的巧合值得放在开篇。这场访谈发布的同一天,Anthropic公布了新一代前沿模型Claude Mythos Preview,明确说因为这个模型发现操作系统和浏览器漏洞的能力过强,担心被恶意使用,决定暂不公开发布。Mythos只开放给Google、Microsoft、Apple、Amazon、Nvidia、JPMorgan Chase、Cisco、Broadcom、Palo Alto Networks、CrowdStrike、Linux Foundation这12家核心合作伙伴,连同另外40家组织一起组成一个叫Project Glasswing的联盟。Anthropic公布的数据是,Mythos已经在几乎所有主流操作系统和浏览器里发现数以千计的高危漏洞,包括OpenBSD里一个存在了27年的安全缺陷。这件事不是哈萨比斯说的"留在实验室十年",两者在程度上完全不同,但Anthropic选择"不对外发布、交给小圈子先用",和哈萨比斯在访谈里排在第一位的担心,是同一个问题的两面。
哈萨比斯拿诺贝尔化学奖的原因是AlphaFold。这个项目解决的是生物学50年未解的一个大问题:蛋白质折叠。蛋白质是身体里一切的基础,它的3D结构决定它的功能,而蛋白质折叠问题要解决的是,能不能仅凭一维的氨基酸序列预测出最终的3D形状。哈萨比斯把它比作生物学的费马大定理。
他在剑桥读本科时就从一个生物学家朋友那里听说过这个问题,当时同时看到三件事。这是个配得上AI的难题,虽然1990年代末还没有任何AI能碰它;如果解开,下游的药物发现和疾病理解会整条打通;改善人类健康是他眼里AI最值得去做的事。
访谈里被讲得最精彩的部分不是解题本身,而是2021年的一次内部会议。那次会议被摄像机意外拍下了。那天讨论的是AlphaFold上线之后怎么服务科学家。按行业惯例,要做一个服务器,科学家把感兴趣的蛋白质序列发过来,系统算完回传。整个结构生物学领域40多年来都是这么做的,因为预测算法都很慢,一次要几天。
会议中途哈萨比斯在手机上做了一个餐巾纸背面的估算。自然界已知的蛋白质大约2亿种,如果每10秒折叠一个,再算一下手头有多少台计算机,他突然意识到,一年之内可以把所有科学家可能想要的蛋白质结构全部预先算完,免费放到一个数据库里。
于是他说了那句后来被视频记录下来的话:"我们为什么不直接这么干?" 搭服务器、数据库、邮件客户端这一整套基础设施的工程量,比直接把2亿个结构全部算一遍还大。一个原本要建系统的会议,变成了一个干脆取消整个系统的决定。
不知道大家是否看懂这一段了。意思就是,本来是想建一个系统,科学家提一个,再算一个。结果变成了,全算完,直接提供算好的结果。
这不是一次性工程。DeepMind在欧洲生物信息学研究所有一个小团队,每年把新发现的序列批量算完更新进去。基因测序技术过去这些年比人类基因组计划时代提高了好几个数量级,原本结构生物学远远落在后头,现在AlphaFold 2让结构生物学追得上测序的速度。有人从海里舀一桶水,里面各种生物被测序完,很快就能跟上它们的结构。
这一轮扩张还有一个没想到的受益方向是植物科学。哈萨比斯说他有植物科学家朋友抱怨,植物基因组的数据量反而比哺乳动物和人类都大,很多植物有多套基因组,但研究这些"冷门物种"的科学家往往缺资源,连把蛋白质结晶出来这一步都走不下去。现在他们可以跳过结构这一关,直接去想怎么让农作物更能抵御气候变化。另一类受益者是研究疟疾、恰加斯病、利什曼病这类被忽视疾病(neglected diseases)的非营利组织。这些病影响全球数亿人,但主要分布在贫困地区,大药厂没有商业动力投入,只能靠非营利组织去做。过去这些研究者连把蛋白质结晶都困难,现在也能直接跳到药物发现阶段。
今天超过300万名科学家在用AlphaFold。DeepMind内部的判断是,基本上每一个在职的生物学家都用过。一位药企科学家告诉哈萨比斯,从现在开始几乎每一款新药的研发流程里都会用到AlphaFold。他自己最喜欢举的例子是核孔复合体(nuclear pore complex),人体最大的蛋白质之一,功能是细胞核的开合闸门。这个东西太大太复杂,长期难以结晶,也就长期没有结构。AlphaFold发布后大约半年到一年,有团队结合实验数据终于解出了这个甜甜圈一样的门到底长什么样。
哈萨比斯自己强调过一件事:AlphaFold只是药物发现链条里的一个环节。知道蛋白质的3D结构只告诉你靶子长什么样,真正要做药还需要化学设计。找到一个化合物,让它能结合到蛋白质表面的正确位置,结合强度要够,而且绝不能顺便结合到人体内其他两万种蛋白质上,否则就是毒性。和他共同获得诺贝尔奖的同事John Jumper在另一个场合也传达过同样的意思。
DeepMind为这件事专门分拆出了一家公司,叫Isomorphic Labs,做的事是把AlphaFold作为一个核心组件,再叠加更多相邻系统,可以理解为AlphaFold 3代、4代,拼成一条端到端的药物发现流水线。流程大致是这样的。AI生成候选化合物,预测它对目标蛋白质的结合强度,然后几小时内检查这个化合物会不会结合到另外两万种蛋白质里的任何一种,根据结果不断修改分子,让目标亲和力越来越强,副作用越来越少。
这是一个典型的自我迭代搜索,效率对比传统湿实验(wet lab)是几千倍甚至几百万倍的差距。湿实验并没有被取消,而是被挪到了流程最末端,只有最后少数几个候选分子需要真正在实验室验证预测是否成立。
Isomorphic Labs目前在推进18到19个药物项目,覆盖心血管疾病、癌症、免疫学等治疗领域。哈萨比斯的判断是这类技术最终会惠及几乎所有治疗领域。他给出了两个冷酷的对照数字:原本一款药物的平均开发周期是10年,只有约10%的候选药物能跑完所有临床阶段。这两个数字如果不大幅改善,人类健康的改善速度就改善不了。
这一章的问题不是哈萨比斯自己提的,是另一位诺贝尔奖得主、CRISPR发明人之一Jennifer Doudna通过视频向他抛过来的。她问得很细。CRISPR现在能够精准定位几乎任何DNA序列,但对大多数遗传病,人类还不清楚究竟是哪些DNA变化在致病。尤其是在那占基因组98%、不编码蛋白质的区域里。AlphaGenome这样的工具开始解码这98%,我们距离"AI能准确指出某个病人身上的致病突变,然后让CRISPR去修复"有多远?
AlphaGenome是DeepMind新近发布的系统。输入一段长基因序列和某个单碱基位点的突变,输出这个突变是致病还是良性的预测。哈萨比斯说它是目前世界上在这个任务上最好的系统。但他也坦率承认,现在还不够好。
更棘手的是多基因疾病。由多个突变级联触发的复杂病例,检测难度远超单点突变,但恰恰也是AI最有机会介入的地方。未来更准确的AlphaGenome版本有机会识别出"这个突变和另一个突变组合起来才致病",然后CRISPR进去修掉。哈萨比斯说他和Doudna在这条路径上有合作的可能。
"大多数人以为AlphaGo的意义是击败了李世石。"但对哈萨比斯来说,AlphaGo真正做成的事是另一件。它让哈萨比斯敢于把DeepMind的下一步转向科学问题。
要理解这件事,得先理解为什么哈萨比斯认为IBM深蓝不算"他要的AI"。1990年代末哈萨比斯读本科时,看着深蓝击败Kasparov,他觉得那不是AI。深蓝是一个专家系统,智能不住在系统里,而是住在国际象棋大师和程序员的脑子里。他们把经验蒸馏成规则,系统只是暴力执行。证据是深蓝不仅不会下别的游戏,连严格更简单的井字棋都不会。没有一个人类特级大师会学不会井字棋,所以那套东西在"泛化"这件事上显然有根本问题。
围棋则是另一个证明场。围棋是人类发明的最复杂的游戏之一,也是最古老的游戏之一。可能棋局数高达10的170次方,远超宇宙原子总数,暴力搜索彻底不可行。围棋高手描述自己的判断时用的词常常是"感觉对",这种直觉难以被编码进显式规则,恰好适合让深度强化学习上场自证。
2016年3月AlphaGo对李世石的比赛被全球2亿人观看。AlphaGo在第二局走出了著名的Move 37。它把一颗子下在了第五线上的一个早期位置,这在围棋传统里是会被老师敲手背的"坏棋"。但它不仅没坏,反而在100多手之后成为决定整盘棋的那一颗关键子,像是提前就知道自己应该在那里。
对哈萨比斯来说这是六年工作的信号弹。他们一直在构建能从经验中自主学习的系统,而这一刻证明这类系统可以产生人类没想到的创造性洞见。这也成为DeepMind后来转向科学问题的信号,包括一年后立项的AlphaFold。
AlphaGo的训练起点还保留了一些人类知识。它先学习互联网上所有能找到的人类棋谱,加上棋盘对称性这类围棋特有的先验,并在这之上叠加了Monte Carlo树搜索(MCTS),让系统能在人类经验的基础上继续探索新的分支。DeepMind的下一步是把这些人类知识全部移除,于是有了AlphaZero。名字里的"Zero"就是这个意思:零先验,只给规则。
AlphaZero从完全随机开始下,自己和自己下10万盘。数据集里即便是随机的棋也会有一些比另一些略好。用这批数据训练出版本2,再让版本2自我对弈,如此往复。在围棋和象棋这样的任务上,大约16到17代就足够从随机进化到超越世界冠军。
哈萨比斯亲自看过AlphaZero学象棋的整个过程。上午它随机乱下,午饭前他自己还能勉强和它下两盘,喝下午茶时它已经强于所有特级大师,到晚饭时它已经超过世界冠军。而且它走的是一种新的象棋,连Stockfish那类更暴力的传统引擎都没探索到的路线。
这些Alpha系列的思路没有停在游戏里。被Cleo追问今天有没有类似Move 37的创造性瞬间时,哈萨比斯举的第一个例子是AlphaTensor。它为矩阵乘法找到了新的、更快的算法。矩阵乘法是所有神经网络的底层操作,把它加速5%,对今天动辄几十亿美元训练成本的模型来说就是巨大的节省。这里出现了一个自指结构:算法本身变快,让训练变快,让下一代系统更强。类似的还有AlphaChip。芯片布线是一类难以在多项式时间内找到最优解的NP难问题,在这件事上AlphaChip某些情况下已经强于人类芯片设计师。
哈萨比斯明确说,这些AlphaGo和AlphaZero式的搜索与自我博弈思路,正是今天基础模型(他们的Gemini)还没完全攻克的部分。如何让模型在"世界模型"的基础上做长期规划、推理和搜索,他认为下一步会把Alpha系列的经验从狭窄的游戏扩展到整个世界,包括材料设计、芯片设计、量子计算机这些科学问题。
这是访谈里哈萨比斯最罕见的一次表态。
如果由他决定,他会用科学方法一步一步、严谨地接近AGI的最后阶段。像CERN一样,把全世界最好的科学家聚在一起,每一步都理解清楚再走下一步。他给这条路径估的时间是"再多10年甚至20年"。同时他也强调,不必等到AGI降临才开始收获AI的好处,可以用AlphaFold这种专门系统,在走向AGI的过程中就给人类带来具体的回报,比如癌症的治疗、新的能源、新的材料。
为什么现实不是那样?他的回答是,技术的发展不可预测。语言比所有人预期的都要容易,连乐观派都没想到会这么快。Transformer恰恰是他Google同事发明的,它加上一些强化学习,就足够让语言、概念、抽象这些原本以为需要两三次突破才能解决的东西被基本攻克。ChatGPT原本在OpenAI内部也只是个研究实验,连发布方自己都没料到会那么火。
他没有全盘否定这场被迫的高速推进,反而给出了三个肯定。进度快是最直接的好处,每个人都能用到最前沿AI,落后实验室里的版本只有3到6个月,这让社会有机会以增量方式适应AI,而不是某一天突然从"没有AGI"跳到"AGI出现"。另外,模型只有在被几百万真实用户使用时才能被真正理解,再好的内部测试也代替不了真实世界的压力测试。
他说自己首先是科学家,但也是个务实的工程师,只能接受这个世界本来的样子。这句话是他对"理想路径没走成"这件事的最终和解。
哈萨比斯对政府该拿AI做什么的想法也相当具体。他点名新加坡和阿联酋在主动用AI重做公共卫生和教育。另一个应用方向是能源网优化。DeepMind自己用AI优化了Google数据中心的冷却系统,把那部分能耗降低了约30%。他希望这些思路能被推广到更大的能源网上。
Cleo问得直接:下一次读到关于AI的新闻时,怎么判断该担心多少。
哈萨比斯的排序是这样的。
第一类是坏人,小到个人大到民族国家,把这些本来为治病、为材料、为能源设计的技术,重新用于有害目的,不管是有意的还是无意的。开篇那段Anthropic Mythos的事就是这类风险的直接案例。Anthropic自己已经说,Mythos被武器化可以变成一个全球级的网络攻击工具,所以选择先不发布。
第二类是AI本身脱轨。今天的系统还不会,但接下来2到4年,随着AI进入agentic时代,也就是能独立完成整个任务的阶段,问题会变得严峻。前沿实验室都必须想清楚,如何确保这些越来越强、越来越自主的系统,严格按照给定目标行事,不会绕过护栏,也不会意外突破护栏。考虑到它们最终会变得多强,这是一个极难的技术难题。
哈萨比斯把这两类问题称为"中期风险",尽管他自己也承认3到4年其实根本不算中期。
第三类是他认为被高估的即时风险:深度伪造和虚假信息。这些是眼前的问题,DeepMind做了SynthID这样的数字水印系统,给Gemini、VO、Nana Banana等生成内容打上AI水印,可以被检测或标记出来。他呼吁所有做生成式AI的公司都内建类似的水印。但他明确说,这类问题相比AGI层面的风险还是小问题。他希望看到前沿实验室之间、各国AI安全研究所、学术界之间,在更大的问题上有真正的国际合作。
访谈后半段Cleo说了一句诚实的话。她注意到自己的心智正在做人类历史上反复做过的那件事,寻找我们为什么特别的理由。我们曾经坚信自己在宇宙的中心,后来发现不是;我们以为只有自己会哀悼,后来发现大象也有葬礼;我们以为只有自己能创作艺术,结果Gemini也能画画。每次"特别"的边界被推一次,就得重新找一次。
哈萨比斯没有否认人类的独特性。他用Alan Turing的框架切入。图灵机是所有现代计算机的理论原型,可以计算任何可计算的东西。他和许多神经科学家认为,大脑本身可能也是一种近似图灵机,他们正在构建的AI系统也是近似图灵机,两者在计算类别上同构。另一位他尊敬的朋友Roger Penrose则相信大脑中可能存在量子效应,两人有过很多友好的辩论。目前神经科学还没找到任何大脑中的量子效应。
他小时候最爱的学科是物理,读那些伟大科学家的传记,慢慢意识到一件让他至今难以释怀的事。我们连"时间"到底是什么都说不清楚,我们只是泡在里面。量子效应、引力、意识,这些最重要的东西都还不真正理解,而大多数人被电视节目和游戏分散了注意力,他从来不是那种人。他想把AI当作一个工具,帮助理解现实本身。
这是整场访谈中最个人化的一段。他把自己做AI的最终动机,放在了"帮人类理解宇宙是什么"这件事上。
哈萨比斯坦白自己小时候科幻小说读得太多。他最爱的是Iain Banks的Culture系列,那是一个post-AGI的世界,书里发生在一千年之后,但他觉得其中一些情节可能在50年内就成立。
画面是这样的。人类安全度过了AGI时刻,AGI已经在每个人的口袋里,对社会有益。然后用它去攻克他所说的"科学中的根节点问题"——那些一旦解决就会解锁一整条新研究或应用分支的问题。AlphaFold是其中一个。其他候选包括核聚变、常温常压的室温超导体。后者一旦实现,配上最优电池,能源问题基本被解决。几乎免费的清洁能源会解锁真正意义上的星际旅行。Elon Musk在SpaceX做的事已经做得相当漂亮,但主要成本还是火箭燃料,如果能量变得几乎免费,就可以用催化厂从海水里无限制造燃料,到处做海水淡化。
然后是小行星采矿、围绕太阳的戴森球。他半开玩笑地说,水星刚好在合适的位置,材料也恰好对。最终是人类繁荣最大化,治愈那些可怕的疾病、大幅延长健康寿命、把意识带到银河系的其余地方。
他的原话时间表是:"我觉得这可以在接下来的50年内发生。"
在叠叠乐快要倒掉之前,Cleo问哈萨比斯,对那些看完这场对谈、相信这个未来、想要参与其中的人有什么建议。
他说他去大学做演讲时总是说同一句话:跟上这股潮流,把自己浸入每一种可用的工具里,让自己变成一个"超能力者"(superpowered)。
他解释起来并不绕。即便在前沿实验室内部,大量精力也只够用来打磨下一代基础模型和相邻的模型,比如Gemini、VO、Nana Banana,而这些模型能做的应用他们自己只能探索其中很小一部分。能力悬置(overhang)越来越大,发布节奏越来越快,所以对那些真正精通这些工具、并把它们应用到新领域的人,机会空间正在急剧扩大。他说一个今天的孩子,完全可能靠这些工具,在别人没想到的方向上做出一门市值数十亿美元的生意。他举的例子是OpenClaw。
这场对谈留下的不是哪一个项目,而是哈萨比斯这个人的姿态。他手里握着一个可能在这一代人手里决定人类长远命运的技术。他承认今天的节奏不是他想要的,也承认这条路被商业压力和地缘政治推得太快,但他也说自己是个务实的工程师,只能接受这个世界本来的样子。他没有假装一切都在掌控之中,也没有站到"一切都会好"的那一边。
访谈发布同一天Anthropic公布Mythos、决定不公开发布这件事,是一个巧合,但也是一个注脚。当一个前沿实验室真的做出"这个模型太强我们先不发布"的决定时,世界才真正开始面对哈萨比斯在访谈里描述的那两类严肃风险。
Q1: AlphaFold真正改变了什么?
它把蛋白质3D结构的获取,从一次几十万美元、几年人力的湿实验过程,变成几秒钟的推理。哈萨比斯在一次内部会议上做出的决定是直接把自然界已知的2亿种蛋白质全部算完,免费放出,这比搭建一个按需请求的服务器系统工程量更小。今天超过300万名科学家在用,几乎每一款新药在研发中都会用到它。它不是药物发现的终点,而是整条链条被重构的起点,Isomorphic Labs把下游的化合物设计和副作用筛查也搬进了电脑,正在推进18到19个药物项目。
Q2: 哈萨比斯对AI风险的排序是什么?
短期但相对次要的问题是深度伪造和虚假信息,通过SynthID这样的水印系统可以部分缓解。真正严重的是两个未来3到4年的问题。一是坏人把为科学设计的技术重新用于有害目的,从个人到国家都有可能,Anthropic Mythos事件就是这一类风险的直接案例。二是随着agentic AI越来越自主,如何保证它严格按照被给定的目标行事,不绕过或突破护栏。他希望前沿实验室之间能有真正的国际合作来应对这些。
Q3: 对想参与AI未来的人,他只给了一条建议,是什么?
把自己浸入每一种可用的AI工具里,让自己变成一个"超能力者"。他的判断是,即便在前沿实验室内部,能力与应用之间的悬置(overhang)也在越拉越大。模型越来越强,发布越来越快,真正去把这些能力应用到新领域的人远远不够。今天的一个孩子完全可能用这些工具,在没有人想到的方向上做出一门市值数十亿美元的生意。他举的例子是OpenClaw。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。