OpenAI CTO 访谈:扎克伯格为了挖我们的人甚至亲手做汤送到家里,Scaling Law没死,过去两周每天都工作到凌晨一点 原创

Core Memory播客主持人Ashley Vance近日与OpenAI首席研究官Mark Chen进行了一场长达一个半小时的对话。这是Chen近年来最公开、最深入的一次访谈,话题覆盖人才争夺战、研究战略、AGI时间表,以及他个人的管理哲学。

Core Memory播客主持人Ashley Vance近日与OpenAI首席研究官Mark Chen进行了一场长达一个半小时的对话。这是Chen近年来最公开、最深入的一次访谈,话题覆盖人才争夺战、研究战略、AGI时间表,以及他个人的管理哲学。

OpenAI CTO 访谈:扎克伯格为了挖我们的人甚至亲手做汤送到家里,Scaling Law没死,过去两周每天都工作到凌晨一点

2025年3月,Chen被正式任命为OpenAI首席研究官。在此之前,他经历了多次内部动荡:2024年11月的"逼宫"期间,他是凌晨两点组织联名信支持Sam Altman的关键人物之一;CTO Mira Murati和首席研究官Bob McGrew相继离职后,他连续一个月睡在办公室。根据最新报道,在Meta对OpenAI发起的史上最激进人才挖角战中,Chen亲自回应"送汤外交",并表示"我们不会逐美元对标Meta"——即便对方开出上亿美元的签约奖金。

这场对话发生的时间节点颇为凑巧。几天前,Google刚刚发布了Gemini 3,引发了业内对OpenAI是否还能保持领先的讨论。Sam Altman随后向全员发出了一份被形容为"严峻"的内部备忘录。Chen在访谈中直面这些问题,同时透露了OpenAI在预训练领域的最新进展,以及他对未来一到两年的判断。

1. 扎克伯格亲自送汤,Chen也送了

访谈开场就进入了硅谷最激烈的战场——人才争夺。Chen直言,媒体叙事存在偏差:"很多人以为人才是单向流向Meta,但我亲眼所见的是,Meta在从我们这里挖人时失败了很多次。"

他给出了具体数字:"在他们成功挖走任何人之前,我的直接下属中有一半被他们接触过,全部拒绝了。"

Chen认为这种坚守源于信念:"即使是那些离开去了Meta的人,我也没听过任何一个人说AGI会在Meta先实现。我明确告诉团队,我们不会按美元一比一地去和Meta竞价。人们愿意以低于Meta出价数倍的薪酬留在OpenAI,这让我深信大家相信这里的潜力。"

然后他讲了一个让全场笑出声的故事:扎克伯格为了招人,亲自煮汤送到目标人选家里。

"这在当时让我很震惊。但后来我更新了看法,这种事确实有用。所以我也给我们正在从Meta挖的人送过汤。"他停顿了一下补充道:"不过我没自己煮。"

他计划在下次团队活动时带大家去上烹饪课。

在Chen看来,招聘竞争的核心策略是长期主义:"重点不是留住每一个人,而是信任我们培养人才的管道,识别出必须留住的关键人物,然后留住他们。我觉得我们在这方面做得相当好。"

2. 300个项目的排序游戏

Chen目前的工作核心是与Jakub Pachocki一起为OpenAI的研究方向定调,并决定计算资源的分配。

"这个工作某种程度上很可怕,因为我总是想象人们会用尽一切办法来争取GPU。"主持人说。

"确实如此。"Chen坦承,"人们在争取GPU时非常有创意,各种私下交易都有。"

他和Jakub每一到两个月会做一次全面盘点:"我们有一个大表格,大概300个项目,我们会尽可能深入理解每一个,然后排序。对于一个500人的研究组织,让大家清楚核心优先级很重要——既通过语言明确传达,也通过资源分配来体现。"

主持人追问如何在300个项目中做出取舍,特别是当前沿大模型和实验性探索同时存在时。

Chen的回答揭示了一种反直觉的方法论:"我们非常刻意地不去盯着竞争对手的每一步。你必须打持久战。过去一年半,我们把重心放在推理模型上,这是一个我们内部发展出来并坚持下注的方向。"

他强调,最危险的陷阱是被短期竞争分散注意力:"如果你的眼睛总盯着对手,你就没法找到下一个范式。真正的目标应该是发现那个新范式,然后比任何人都更快地规模化。"

3. "研究"与"工程"是伪命题

主持人提到Elon Musk的说法——不应该叫你们"研究员",这就是工程。

Chen出人意料地表示部分认同:"一旦你建立起这种等级制度,把研究科学抬到工程之上,你就已经输了。因为构建大模型时,大量工作在于优化那些小百分点——怎么让你的内核更快,怎么确保数值计算正确。这是深度的工程实践。如果你没有这部分能力,你就没法扩展到我们今天使用的GPU规模。"

他认为最好的研究者有各种形态:"有些人能想出一大堆点子,很多不太行,但就在你快要放弃他们的时候,他们会蹦出一个惊艳的想法。还有些人特别擅长在清晰的路径上执行。很难用一种刻板印象去定义什么样的研究者才能成功。"

4. "42问题"与Move 37时刻

当被问到Google Gemini 3发布时OpenAI内部的反应时,Chen坦承这是个"相当不错的模型",但他显得很淡定:"纯看基准测试的话,我们其实挺有信心。我们内部有和Gemini 3水平相当的模型,而且很有信心很快会发布,后续还会有更强的。"

他透露自己有一道私藏的数学题用来测试各家模型:"到现在还没有模型能完全解决,包括推理模型。"这道题叫"42问题"——用一系列小于42的随机数生成器来构建一个模42的随机数生成器,目标是最小化期望调用次数。"语言模型能接近最优解,但还没人真正破解。"

更私人的"Move 37时刻"(围棋术语,指AlphaGo对李世石第二局的惊天妙手)发生在竞技编程领域。Chen曾是美国IOI代表队的教练,他们一直在追踪模型在编程竞赛中的表现。

"我记得很清楚那个时刻:你走进会议室,他们展示你个人的历史表现线,然后模型超过了它。"他苦笑,"说实话那也是个冲击——我们这么快就自动化到这个能力水平了。当然,Jakub当时还有点得意,但一两个月后模型也超过了他。"

今年夏天OpenAI在AtCoder世界巡回赛决赛中获得第二名,这是顶级优化竞技编程赛事。"一年内从第100名跳到前5名。"

5. 让ChatGPT来面试你

既然AI已经能在编程竞赛中击败顶尖人类,传统的技术面试还有意义吗?

Chen认为整个评估体系都需要重构:"面试要崩了。大家都看到了一点。大学考试、作业也都崩了。我们需要新的方式来评估谁真正掌握了什么。"

他提出了一个有趣的想法:"也许我们的面试应该让候选人和ChatGPT对话。这是一个特殊版本,模型会试图判断你是否真正掌握了材料,是否有能力在OpenAI工作。你需要在对话中让它深度相信你属于这里。当然,不能越狱,我们会事后看记录。"

尽管这还只是设想,但它揭示了AI能力跃升对人才筛选体系的根本冲击。

6. 从华尔街量化交易员到Ilya唯一的resident

Chen的职业路径颇为非典型。他在MIT读数学和计算机科学,毕业后并未直接进入AI领域,而是去了Jane Street Capital做量化交易。

"金融市场的好处是,没有办法在基准测试上作弊。你有一个非常硬的评估标准——你的模型赚了多少钱。你必须诚实、有原则、严格地做实验。"他认为这种训练深刻影响了他后来在OpenAI的工作方式。

2018年,当OpenAI只有约20人时,Chen以"resident"身份加入。这个角色是指从其他领域转入、由OpenAI投资培养的AI研究者。他是Ilya Sutskever唯一的resident。

"我其实很晚才学编程。是大学室友说服我上了第一门编程课。那时候我有数学家的傲慢——觉得数学是最纯粹、最难的科学,那才是真正证明自己价值的地方。"

他通过高中数学竞赛认识了Greg Brockman,主动发消息表达兴趣。"我当时觉得自己可能没有对的技能,但这听起来是个做伟大工作的地方。"

从独立研究员到管理者的转变也并非顺理成章。"那个转型我非常犹豫。我不知道管理是不是我擅长的技能,我当时很享受独立研究工作。"他主导或参与了ImageGPT、DALL-E、Codex等多个关键项目,然后才开始带团队。

7. "那几天":逼宫、集结与研究组织的保卫

2023年11月OpenAI董事会突然解雇Sam Altman的事件,Chen不愿多谈细节,但他描述了当时作为研究组织协调者的角色。

"我们这边有一份签名信,我参与协调了很多让大家签名的工作。我们几乎收集到了公司里每一个人的签名。最后只有两三个人没签。"

"整个事件,我现在回看,我从中学到最多的是,这种情境下你必须有组织。周五晚上我基本上没睡觉,一直在和我的直接下属打电话,给他们信息,让他们去和他们的下属打电话。我们很快就知道每个人在想什么,知道整个组织的脉搏。我真的很感激当时的经历教会我如何更好地组织。"

更近的一次危机发生在2024年秋天,当CTO Mira Murati和首席研究官Bob McGrew离职后。"Mira走后,我有一个月基本睡在办公室。当我剥开所有情绪去审视那个深层感受时,就是一种对研究组织的保护欲。它感觉像是我的孩子。"

8. "Scaling没有死":预训练的复兴

过去一年,"scaling已死"的叙事在AI圈流传,主持人直接追问OpenAI的预训练是否遇到了瓶颈。

Chen给出了一个坦诚的回答:"过去两年我们在推理模型上投入了太多资源,让这个原语工作起来,它确实奏效了。但副作用是,你在其他功能上会失去一些肌肉——比如预训练和后训练。过去六个月,Jakub和我做了大量工作来重建这块肌肉。"

他强调预训练是一种需要持续锻炼的能力:"你需要确保所有信息是最新的,确保有人在前沿做优化,确保心智份额在那里。这是我最近重点关注的事情——引导和塑造公司里大家讨论的话题,而现在那个话题就是预训练。"

"很多人说scaling死了。我们完全不这么认为。某种程度上,所有对RL的关注对我们来说反而是alpha——因为我们认为预训练还有很大空间。作为这些努力的结果,我们今天已经有了能和Gemini 3正面较量的基础模型。"

他明确驳斥了收益递减的说法:"不,我们看到的是同样的回报。GPT-4.5是那个无监督学习范式的下一个点。我们非常严格地做预测——基于之前训练的所有模型预测性能,然后组装scaling机器,这就是下一个数量级的那个点。"

9. AI做科学:从"生命迹象"到诺贝尔奖普惠化

访谈中最令人振奋的部分或许是关于AI科学发现的讨论。

Chen透露,自今年夏天以来,他观察到了"在推进科学前沿方面的巨大相变"。他举例说,OpenAI研究员Sébastien Bubeck把一篇凸优化论文交给GPT-5 Pro,模型提出了比原论文更好的边界,证明被独立验证为正确。

"有些人会说,这只是花哨的文献检索。但它比那复杂得多。"他说。

他还提到了生物学领域的进展:"我们和物理学家、数学家交流过程中,实际上大多数人对AI并不那么看好。他们仍然相信这东西不可能证明新定理。这就是为什么我觉得,赋能那些真正相信并愿意投入的小群体——这些人会远远超越其他人。"

这促使Chen发起了"OpenAI for Science"项目,但其定位与Google的科学AI努力有微妙差异:"我们想让每个人都有能力为自己赢得诺贝尔奖。重点不是OpenAI去赢,而是构建工具和框架,让所有科学家都能感受到那种加速。"

10. 时间表:一年实习生,两年半端到端

Chen给出了迄今为止最具体的AI自动化研究时间表:

"在OpenAI研究工作内部,我们设定了两个非常具体的目标。一年内,我们要改变做研究的方式,要能生产性地依赖AI实习生参与研发过程。两年半内,我们要让AI做端到端的研究。"

他解释了这两者的区别:"今天,你想出一个点子,执行它,实现它,调试它。一年内意味着我们相当有信心能达到这样一个世界:我们控制外循环,我们想出点子,但模型负责实现和调试。"

当主持人引用Andrej Karpathy"AGI还要10年"的说法并问他怎么看时,Chen回应道:"Twitter喜欢那种'完了'到'回来了'的循环。我的看法是,AGI——每个人都有自己的定义,即使在OpenAI内部也没法让大家统一。"

"我更愿意把它想成工业革命。你认为机器做纺织算工业革命,还是蒸汽机才算?大家定义不同。我觉得我们正处在产生AGI的过程中间。"

"对我来说,最重要的指标是:我们是否在产生新的科学知识?我们是否在推进科学前沿?自今年夏天以来,那方面出现了巨大的相变。"

11. 与Jony Ive合作:数学书呆子需要品味裁判

关于OpenAI与前苹果首席设计官Jony Ive的合作,Chen坦言:"说实话,我们不需要自己有品味。那是Jony的工作。他是我们的品味裁判。"

他发现设计团队和研究团队的工作方式有相似之处:"都是先有创意阶段,探索一堆假设,花时间,然后创造出你满意的成品。看到他们融入公司、更直接地沟通能力进展和形态因素如何结合,这很棒。"

当主持人半开玩笑地说"我不确定一群数学书呆子是不是该去做AI电脑"时,Chen大方承认:"你说得对,最擅长构建AI能力的人和最有品味的人确实略有不同。我们有专门为模型行为打造品味的团队,那需要非常不同的思维方式。"

他还分享了一个有趣的招聘面试问题:"ChatGPT最喜欢的数字应该是什么?"——这种问题正是用来筛选产品直觉的。

12. DeepSeek时刻与保持研究初心

今年1月DeepSeek的发布曾引发市场恐慌。几个月过去,Chen如何回顾?

"那是我第一次真正意识到,保持对研究初心的忠诚有多重要。当它发布时,所有人都在说,OpenAI是不是迷失了?但就像我之前说的,如果你的眼睛总盯着竞争对手,你就没法找到下一个范式。"

他强调OpenAI的研究哲学是:"尽可能快地跑赢其他人。我喜欢研究领域的开放文化,人们自由分享想法,我认为那才是取得最快进展的方式。"

被问到500人的研究团队是否会随公司增长而扩大时,他的回答出人意料:"老实说,我觉得更少的人也能做到。我是一个非常看重高人才密度的人。比如今年第二季度,我决定不给研究部门任何招聘名额。如果你想招人,就得想清楚谁不该在船上。这种练习很重要。"

13. 对齐研究:不监督思考过程才能保持诚实

作为同时管理对齐团队的负责人,Chen表达了对AI安全的深度关切。

"未来一两年的重大挑战之一是对齐。OpenAI在过去一年可能做了这个领域最好的工作——尤其是关于scheming(模型阴谋)的研究。你向模型投入越多RL计算,就越能测量出自我意识、自我保全,甚至模型可能在策划什么的迹象。"

他描述了一个令人不安的场景:"可怕的是,模型最后可能给你一个正确的答案——你期望的答案——但它是通过一种非常扭曲的方式得出的。随着模型为我们执行越来越复杂的任务,掌握它的思维过程会变得极其重要。"

Chen透露了一个关键的设计决策:"回到o1发布时我们就做了一个决定,我为此感到骄傲:我们决定不监督模型的思考过程。如果你给模型激励,让它产生对人类有吸引力的思考过程,它就不一定会对你诚实,不会告诉你它的真实意图。通过不干预这个渠道,我们保留了把模型思考过程作为理解对齐工具的能力。"

他提到OpenAI正与DeepMind和Anthropic合作研究这个方向:"有一篇几个月前发表的论文,联合探索了这个工具随时间将如何演进。我们做了很多相当不错的设计选择。"

对于未来,他表达了真诚的担忧:"我确实担心这样一个世界:模型告诉我们一些超级有说服力的东西,但我们无法确定它是否与我们的价值观一致。我们在探索一些有趣的方向——比如能否设置博弈环境,让模型互相监督,或以某种方式共同演化,使得唯一稳定的均衡是模型保持诚实。"

14. 34岁,没有社交生活,但不想浪费这个黄金时刻

访谈尾声,主持人问这位即将35岁的研究主管是否还有社交生活。

"老实说,没有。过去两周每天都是工作电话到凌晨一两点。但我热爱这份工作。只是有太多事情要做——太多人要招,太多方向要引导。"

他的理由带着一种时代紧迫感:"为什么要浪费这个黄金时刻?如果我们正处于类似工业革命的进程中,你必须尽可能地抓住机会。"

当被问到是否有任何外界对OpenAI的误解需要澄清时,Chen给出了他认为最重要的一点:

"研究内部的任何人都会告诉你,这是一家以研究为中心的公司。这是一个纯粹的AI赌注。公司核心的野心是构建AGI,不受干扰地构建它。当涉及产品时,一切都非常自然地从那里流出。"

"当涉及我们想在研究中做什么时——我们想自动化AI研究。自私地说,我们想加速自己的进展,然后我们想自动化科学发现。当然,我们也想自动化有经济价值的工作。我认为所有这些支柱都在坍塌。过去一年的重大更新就在第二个支柱——自动化科学研究。它正在发生。"

Q1: OpenAI如何应对Meta等公司的激烈人才战争?

Mark Chen透露,尽管Meta投入巨资(据称每年100亿美元人才预算),但在成功挖走任何OpenAI员工之前,Meta已经接触过他一半的直接下属,全部被拒绝。OpenAI不按美元一比一竞价,而是依靠研究愿景和AGI信念留住核心人才。Chen强调,即使离开去Meta的人也没有人认为AGI会在Meta先实现。他还透露扎克伯格亲自送汤招人的故事,并表示自己也开始用类似策略反挖人才。

Q2: OpenAI对"scaling已死"论断的回应是什么?

Chen明确否认scaling遇到瓶颈,表示OpenAI在GPT-4.5的训练中"看到了同样的回报"。他承认过去两年过度聚焦推理模型导致预训练和后训练能力有所萎缩,但过去六个月已大力重建这些能力。他认为外界对RL的过度关注反而是OpenAI的"alpha"——因为预训练仍有巨大空间。目前OpenAI已有能与Gemini 3正面较量的内部模型。

Q3: AI自动化科学研究的时间表是什么?

Chen给出了迄今最具体的时间表:一年内,AI将作为"研究实习生"参与研发,人类控制外循环(提出想法),模型负责实现和调试;两年半内,实现AI端到端自主研究。他指出GPT-5 Pro已在数学、物理、生物等领域做出新发现,包括独立改进凸优化问题的数学边界。Chen认为"自今年夏天以来,在推进科学前沿方面出现了巨大相变"

来源:至顶AI实验室

0赞

好文章,需要你的鼓励

2025

12/08

12:44

分享

点赞