这是一个很有信息量的讨论。2025年8月,科技投资人Peter Diamandis在他的"Moonshots"播客中,放出了1X Technologies的CEO Bernt Bornich和Link Ventures的创始人David Blundin的访谈。他们在1X位于帕洛阿尔托的新工厂里录制了这期节目。就在录制前,他们刚刚参观了工厂,看到了几十台处于不同开发阶段的Neo Gamma机器人在大楼里走来走去。
Bernt Bornich,这位从11岁就决定要做人形机器人的挪威人,在描述他的Neo Gamma机器人时,用的第一个词不是"强大",不是"智能",而是"可以拥抱的"(huggable)。
另外,这家公司目前选择了一个反直觉的商业落地路径,当特斯拉、Figure等竞争对手都在瞄准工厂和仓库时,1X却坚持要把第一批机器人送进普通人的家里。可能Bernt内心有一个历史类比:这就像个人电脑的发展史。当年IBM的大型机服务企业,而苹果等却相信电脑应该进入每个家庭。最终,是后者改变了世界。
1、"我们需要多样性的数据,工厂里没有"
当Peter Diamandis问到为什么选择家庭而不是工厂作为初始市场时,Bernt Bornich的回答分成了两个层次,每一层都值得细细品味。
"消费级硬件的规模化速度与其他一切都不同,"他说,"iPhone在十年多一点的时间里就达到了10亿台设备。对我来说,人形机器人如果不能达到规模就没有意义。总有更好的自动化系统可以解决某个特定问题。你需要规模,这样才能获得令人难以置信的可靠性、极低的成本、完整的生态系统和智能。"
但他马上提出了一个更深层的观点,这个观点触及了当前AI发展的核心瓶颈:"智能来自多样性。这在AI研究的各个领域都非常明显——从最早期开始,无论是语言模型、图像模型、视频模型,还是在这个案例中的机器人模型。你不需要重复相同的数据。如果你仔细想想,这是非常符合逻辑的。如果你在汽车工厂,你基本上是在一遍又一遍地做同样的事情。你没有在学习新东西。"
为了支撑这个观点,他分享了一个具体的经验数据:"我们之前一代的人形机器人Eve,在2022-2023年部署在安保和物流领域。大约20到40个小时后,我们的机器人就会达到学习平台期,停止为特定任务学习新东西。这取决于任务的复杂程度。如果你是在守卫一个设施,开着轮子到处跑——因为那个版本有轮子,是轮子上的人形机器人——开门之类的,这里面有一些多样性,所以你可能需要40多个小时。但如果你只是整天把这个杯子从这里移到那里,那么你可能只需要20个小时就到达学习极限了。"
他接着说:"从那里到通用智能,根本就没有路径。我们可能与人形机器人领域的其他公司有些不同,我认为我们更像是一家真正奔向AGI的公司,以及如何尽快到达那里,而不是如何在工业或类似环境中应用劳动力。"
Peter插话问道:"你说20小时、40小时是安保机器人的学习时间。那么在家庭中所有各种各样的事情,相当于多少小时?"
"我们还不知道,"Bernt坦诚地说,"在我们目前的规模上,我们还没有真正看到多样性的上限。它会到达那里,我们需要进一步多样化。但我认为你问了一个非常重要的问题。对我来说,这不仅仅是AI或机器人,而是两者的结合。如果你想想什么是富足(abundance),它是知识或智能的富足乘以劳动力或商品和服务的富足。你需要两者,它们是相辅相成的。我们在社会中的约束不总是只在智能或数据层面。它们也在我们构建的基础设施上。"
2、一个66磅的机器人如何举起150磅
Neo Gamma的物理规格令人印象深刻,但更有趣的是这些数字背后的设计哲学。这个机器人重66磅(约30公斤),但能举起150磅(约68公斤)的重量。
"这是运动员级别的重量-力量比,"Bernt解释道。在实际使用中,它可以搬运约50磅(约23公斤)的物品四处走动。电池续航时间约为4小时,充电相对快速——完全充满需要2小时,充到一半只需半小时。
当David Blundin评论说Neo Gamma"难以置信地柔软,不像C-3PO那样的金属外壳"时,Bernt分享了公司十年前的创始原则。"如果你真的想要制造能够在智能方面规模化的东西,它需要能够在我们中间生活和学习。日常生活中有太多细微之处。我们做的一切都是社交的。工作是社交的。每个任务都是社交的。我们一直在做事情的同时导航这些社交情境。世界上大部分的劳动也发生在社交环境中,当你工作时周围有其他人。物体也有社交背景——咖啡杯是空的。你需要一个新的吗?它脏了吗?还是你想要续杯?或者你整天都把杯子放在外面?"
他继续解释设计原则:"从第一性原理的角度来看,机器人需要安全,不能伤害人。它仍然需要非常有能力,需要像人类一样强壮。然后它需要令人难以置信地负担得起。你需要找到这个美妙的组合,你可以简化、简化、再简化,但仍然得到一个非常有能力的系统,这样你就可以大规模制造,真正提高质量并降低成本。"
"这就是十年前公司的创始原则。我们说,我们要制造安全、有能力和负担得起的机器人。所谓负担得起,我的意思是它将从第一性原理上就是可制造和负担得起的——非常轻便、非常节能,所以你可以有一个小电池,零件非常少,设计方式不需要严格的公差,没有特殊的合金或材料,只是令人难以置信地简单但高性能。"
关于Neo Gamma的高度,它是5英尺4英寸(约163厘米)。"这是完美的高度,"Peter评论道,"顺便说一下,这也是我妻子的身高。"Bernt补充说:"也是我妻子的身高。"
但真正让人惊讶的是机器人的关节数量,或者用专业术语说,自由度。Bernt详细解释道:"人类每条腿有6个关节,总共12个。每只手臂有7个,所以又是14个。现在12加14是26。你会看到今天很多机器人有26个自由度,这很常见。通常它们没有手腕,而是有脖子。所以这里有两个,然后就是26个。"
"我们有三个在头部,所以你可以用头部进行适当的表达,这很重要。我们从这里开始有全部7个。我们在脊柱有3个。然后,当然,我们每只手有22个。"
Peter问:"人类手部有多少个?"
"22个,"Bernt回答,"所以我们匹配了。嗯,好吧,这取决于你如何计算腕骨——你这里的小骨头让你能够弯曲手掌。在某种程度上,你可以看到那更像是四个或五个自由度,而不是两个。所以人类可能稍微多一些。但在功能上,它们非常相似。"
3、为什么大脑必须在头部
这是一个让我特别感兴趣的技术细节讨论。Peter提出了一个看似简单但实际上触及核心的问题:"你看过《机械姬》(Ex Machina)吧?当我看那部电影时,我在想,为什么大脑,那个蓝色的blob,要在头部?为什么不在服务器房间里?"
Bernt的回答揭示了硬件设计中的多重考量:"首先有一些简单的答案。头部是除非你把大脑放在那里,否则什么都没有的地方。其他地方都相当满了。构建一个具有这种功率水平的人形机器人,以如此小型化的形式,同时还有足够的空间使其完全柔软,这是一个非常困难的工程问题。所以如果我们不把它放在头部,我们要把它放在哪里?"
但更深层的原因涉及带宽问题:"你大脑中发生的非常高带宽的事情是视觉,在某种程度上还有音频、嗅觉、触觉,但视觉占主导地位。你只想最小化眼睛和计算之间的距离。传感器之间的带宽,它们大多数不会通过家庭Wi-Fi,甚至不会真正传到机器人的胃部,除非在物理接口选择上变得过于复杂。这是非常高的带宽。"
"我对此也感到震惊,"Peter说。
Bernt继续解释:"我们没有运行激光雷达,没有结构光,没有手腕摄像头,什么都没有。我们纯粹在模拟人类视觉。所以我们非常依赖它。这是非常高分辨率、非常高带宽、非常高频率的。这很好,因为这正是人脑非常接近眼睛的地方。"
"现在,这并不意味着你不能在云端做事情,我们确实在云端做事情,但从智能的角度来看,它变成了分层的。就像你的肌肉神经系统,这运行得相当快,通常以25赫兹运行。它不会上升到你的大脑。有神经元分布在你的系统中做决定。我们的机器人也有这个。我们把一些东西推到控制的电力电子设备上,只是为了延迟,为了速度。"
"然后你有大脑本身,它实际上运行得很快,通常在5到10赫兹之间。即使是5到10赫兹,延迟也非常低。这在机器人上运行。现在,如果你运行更像1赫兹的流式传输,那么你通常处于LLM首个令牌时间的领域。那是在板外运行的。但那不能解决高频触觉反馈操纵任务。那太慢了。"
4、从挪威谷仓到硅谷工厂的十年征程
Bernt的创业故事始于他11岁时的一个决定。"我11岁时就决定要做人形机器人科学,"他说。当Peter问他的灵感来自哪里时,他的答案出人意料:"本田的Asimo。"
"Asimo是一个美丽的机器人,"Bernt说,"他们很早就开始了。本田Asimo P6是90年代末的产品。那时它就能上楼梯,在舞台上跑来跑去,给某人一个球。我想它后来还迎接过奥巴马总统。它远远领先于时代。"
但从童年梦想到创办公司,中间还有漫长的路。"我建造了很多东西,但重要的是,当我创办公司时,我坐下来深入思考:好吧,我们研究过所有这些令人惊叹的机器人,但它们并没有真正成功。为什么没有成功?"
他的结论归结为一些基本原则:"首先,如果你真的想要制造在智能方面可扩展的东西,它需要能够在我们中间生活和学习。"
公司的早期充满了戏剧性。"我很幸运,有一个非常好的早期创始投资者,"Bernt回忆道,"公司不是在车库里开始的,因为我们在硅谷——我们是在谷仓里开始的,因为我们在挪威。两年后的某个时候,他卖掉了农场,所以我们不得不搬家。"
Peter问:"他卖掉农场来资助公司?"
"是的,"Bernt说,"所以这家硅谷的公司如果没有挪威投资者就不会存在。我们不会存在,因为我们不会有足够的资金运行。在挪威运营比在这里运营便宜得多。"
当被问及这位初始投资者是相信能赚大钱,还是因为对愿景和使命的热情,或是相信他个人时,Bernt回答:"我认为三者都有。结果证明相当不错。"
5、每只手22个关节背后的工程奇迹
1X Technologies最引以为豪的创新之一是他们的电机技术。这不是一个小的技术细节,而是整个机器人设计的基础。
"我们制造自己的电机,"Bernt解释道,"不仅包括电机的知识产权,还包括所有这些的制造和自动化。这个供应链非常广泛。"
Peter惊讶地说:"你们真的制造自己的电机。"
"我们有电线,"Bernt确认道,"我们以特殊的方式做这件事,1X版本的方式。电机是我们真正创新的领域之一,这实际上是我开始的方式。十年前我坐下来,做的第一件事就是设计一种不同类型的电机。"
这些电机的性能令人震惊:"我们现在Neo中的电机,扭矩重量比是世界纪录的5.5倍。"
"哇,"Peter和David几乎同时说道。
Bernt继续解释这项创新如何影响整个设计:"这就是为什么我们有如此强大的东西,我们不需要齿轮,我们可以直接拉这些肌腱来松散地模拟人类肌肉。这就是为什么它如此轻。这也是为什么它如此容易反向驱动和顺从。这就是为什么制造成本如此便宜。一切都源于此。"
"现在,当然,当你有这些电机时,你就可以开始使用肌腱。但是你需要投入大量时间来弄清楚如何使用肌腱。然后就是所有的材料科学,让肌腱能够持续数百万、数百万、数百万次循环。这些都是真正困难的研究问题。它们甚至不是工程问题,而是困难的研究问题。我们花了很多时间来解决所有这些问题。"
他还提到了一个有趣的细节:"没有我们制造的电机,你就无法在电子学和功率放大以及一般的电机驱动方面进行一些相当重要的创新。有很多东西汇聚在一起。没有磁学方面的一些创新,你就无法设计我们今天的电机。"
最令人惊讶的是,Bernt透露他们使用AI来设计这些电机:"我坐下来做的第一件事是编程一个网络来学习如何制造电机。"
Peter惊讶地问:"你通过AI设计了电机?那是多久以前?"
"十多年前一点,"Bernt回答,"那不是Transformers,但对于那种用例来说没关系。"
6、定价策略:每月300美元还是一次性3万美元
关于Neo Gamma的定价,这场对话揭示了一些重要信息。Peter提出了他心中的数字:"我脑海中的数字是3万美元购买,或者每月300美元租赁,每天10美元,每小时40美分。我在正确的范围内吗?"
"我认为我们可以做得更好,但是的,"Bernt回答。
"好吧,那太棒了,"Peter说,"但我的意思是,你需要做得更好吗?"
"不,我的意思是,毫不犹豫地说,那已经足够好了。但在那种情况下,我认为人们可以想象拥有几个这样的机器人。"
Bernt进一步解释了他对市场的看法:"我认为这真的取决于你通过什么视角来看待这个问题。我认为显然每个人都会想要一个机器人。我认为这个陪伴方面的美妙之处被低估了。因为人形机器人是AI的如此美妙的界面。当你与它交谈时,你会看到它的肢体语言,它可以看着你,它看到谁在与它交谈,方向,所有这些东西。"
他分享了一个个人故事:"我11岁的女儿能做的就是她只想坐在沙发上和机器人旁边谈论事情。这显然将是它的一个重要方面。我认为它不是另一只宠物,但也不是人类。它是介于两者之间的东西。就像我说的,它有点像我的Hobbes。如果你读过《凯文和霍布斯》,它就是Hobbes。"
关于市场规模,Peter引用了一些统计数据:"为了参考,地球上大约有10亿辆汽车。你可能认为会更多,但地球上大约有80亿部智能手机。"
当讨论到零件数量时,对比更加惊人。Bernt说:"我们有几百个零件。一辆汽车大约有5万个。"
"5万个,所以简单得多,"Peter说。
"一辆汽车重4000磅,"Bernt补充道,"我们的机器人重66磅。所以我认为它们真的不能与汽车相比。我看到很多人将人形机器人与汽车进行比较,但我认为你应该回到绘图板。这不是汽车。如果你做得真的很好,它更接近冰箱。这是一个非常复杂的冰箱,但它比汽车更接近冰箱。"
7、远程操作(遥操作)还是完全自主?一个被误解的争论
关于Tesla在活动中展示的Optimus机器人大多是远程操作的这一事实,Bernt有着独特的见解。
"我认为远程操作得到了不应有的坏名声,"他说。Peter问:"为什么?"
Bernt解释道:"我认为这是因为人们对'这是远程操作还是自主的'没有足够的清晰度。但它就是标记数据。它是专家演示。如果你看看任何训练出来的大型AI模型,都有大量的人坐下来手工标记数据,查看示例,写出问答,并引导这个非常高质量的数据集来使其工作。"
他进一步阐述:"所以你在通用信息上进行预训练。我们也这样做,只是使用机器人发生的一切。然后你有一个非常高质量的微调数据集。在机器人学中,那就是远程操作,因为它是专家演示。它是手工标记的数据。没有什么不同。我只是认为在发生什么方面缺乏一些透明度。"
Peter提出了一个关键观点:"我认为反对意见是,如果你有一个演示,比如一个视频,让它看起来能做某事,但实际上它不能,因为你手工编码了它。"
"它显然可以,但它不能自己做,"Bernt回应道,"但我认为你说得很对,如果它能在物理上做到这一点,如果机制能做到这一点,神经网络无论如何都会立即填补那个盲点,一旦你训练了它。所以我认为这完全合理。"
关于1X如何使用远程操作,Bernt详细解释了他们的方法:"在早期,当我在家里有Neo Gamma时,它将是基线自主的,但会有时候它需要引入远程操作员。所以你会有总部的远程操作员,如果它需要帮助,或者做一些复杂的事情,或者它出错了,远程操作员可以介入并实际完成任务。"
他描述了两种不同的模式:"我称之为最佳努力自主模式,我们刚刚谈到的。然后你有任务调度。就像我家里的机器人现在正在做的那样。所以我拿出手机,我安排并说,嘿,在这些时间之间,这些是我想要你为我做的任务。今天是洗我的白色衣物。然后有一个包裹要送来,我可以在门口接收它并把它放进冰箱。还有就是一般整理。"
"我已经设定了我不在家的时间。就像这些时间我在工作。完成它就行。现在,我不在乎这是自主发生还是通过远程操作员。很多通过远程操作员发生,因为其中一些任务相当复杂,我们还不知道如何足够好地自动化它们。"
8、隐私和安全:邀请机器人进入你的家
当谈到将机器人带入家庭的隐私和安全问题时,Bernt非常坦诚。
"首先,这很大程度上关乎透明度,"他说,"如果你是像你这样的第一批在家里拥有Neo Gamma的人之一,Peter,我们在隐私与成为早期采用者之间进行了一些权衡。因为没有数据,我们无法改进产品。当然,我们会尽一切努力确保这是按照你的条件的隐私,你处于控制之中。但如果我们要改进产品,我们确实需要你的数据。"
他详细解释了他们的隐私保护措施:"他们正在做一些非常重要的事情,我们也在做,那就是我们公司的任何人都不能听到或看到那些数据。这将进入训练模式。但它不会经过人类。"
"现在,如果我们想查看那些数据,有时你可能需要,对吧?可能就像,让我们弄清楚这里发生了什么,因为显然有些事情在多个机器人上发生,我们想弄清楚是什么。然后我们会向你的手机发送通知,说,嘿,这个特定的窗口,我们想要审查数据,你会得到那些数据的视频。然后如果你说是,那么我们得到解密密钥,我们可以查看数据。如果你说不,那么我们不能。所以你处于控制之中。"
他还提到了一个有趣的细节:"实际上,即使是关于进入训练数据,我们总是在训练上运行24小时的延迟。所以如果有什么你真的不想要的,即使在训练数据中,比如这从未发生过,从存在中抹去它,你可以进去并在它进入训练权重之前删除它。"
关于远程操作的隐私问题,Bernt解释道:"当涉及到远程操作时,当然没有办法在不看到玻璃杯的情况下完成这项任务。所以我们做一些抽象,这样你实际上看不到人。你有点像只看到blob,你只看到你正在交互的对象。我们可以在交互上做很多事情,在过滤方面确保隐私。"
"但我们在这里做的最重要的事情是,没有人进入你的机器人的远程操作,除非你批准它。它在机器人上非常明显,比如灯光变化,就像有人在你的机器人里,这是你从一大批操作员中批准的预选操作员之一,比如这是为你服务的四个。"
9、从做饭到太空组装:安全边界在哪里
在Peter提到希望Neo Gamma能为他做"完美的照烧三文鱼"时,Bernt的回答揭示了安全考虑的深度。
"我希望能为你做完美的照烧三文鱼,"Bernt说,"但我必须自己做。我不会让机器人做。因为这是我们现在推出时实际上不会做的事情之一。这是出于安全考虑。"
他解释了背后的逻辑:"我在这十年里努力工作的是制造本质上安全的机器人。我的意思是,如果出了大问题,它不小心打到你,那可能会很痛,但不太可能严重伤害你。一旦你拿起一壶沸水,就不再保证你是安全的。所以我们通常避免任何危险物体,这样我们可以在开始时确保安全。"
"当然,随着时间的推移,随着AI的改进,我们对所有行为都是安全的越来越有把握,我们将允许烹饪和其他事情。所以我们正在对此进行内部项目,但我们不会在开始时向客户推出,只是出于安全考虑。"
然而,当谈到太空应用时,Bernt变得兴奋起来。"我认为我们有巨大的优势,因为机器人非常轻。虽然我猜Elon正在努力解决这个问题,但送入轨道的有效载荷仍然很昂贵。"
他继续说:"其次,我们的大部分东西实际上在太空中工作得很好。我们必须对电机上的环氧树脂做一些处理。那不会非常真空硬。"
Peter开玩笑地提议:"如果你想在零重力下训练,我的公司之一是零重力公司。这些抛物线飞行。我们让斯蒂芬·霍金体验了零重力。也许Neo Gamma应该是下一个。"
"那太好了,"Bernt回应道,"我实际上认为这有真正的用例。一件事是在火星上建立基地或其他什么,对吧?但即使在我们到达那里之前,只是在轨道组装。这是极高价值的任务。"
他详细阐述了太空应用的愿景:"我认为在那里,实际上,我们会使用远程操作。我之所以这么说,是因为错误的成本太高了,你想使用你拥有的最聪明、最专业的人类。在我们达到超级智能之前,那将是人类。你有人在轨道上,你有机器人在外面,延迟非常低,你可以以非常自然的方式远程操作,就像它是你自己的身体一样,如何完成所有这些在轨组装任务。它们可以非常复杂,你仍然可以以非常高的精度完成它们,而且你不会危及人员。当然,当你做了一段时间后,你有数据来自动化所有这些,这非常有趣。"
10、中国的机器人运动会与美国的落后
话题转向中国在机器人领域的发展时,Bernt的观察既赞赏又担忧(自然是替美国)。
"首先,我认为我们这里需要同样的东西,"他说,"我们可能没有意识到,但当然我们需要同样的东西。我认为中国的生态系统令人难以置信。我不知道世界上还有什么地方可以去那么快地开发硬件。"
他详细描述了中国硬件生态系统的优势:"你需要什么东西,你去这里的角落买一台机器,有什么东西坏了,你就过马路买一些新组件。有人在那边的街角做回流焊。这是一个令人难以置信的生态系统。"
"我认为湾区地区,我的意思是,硅谷,毕竟深圳也是一个弯曲,但硅谷这个湾区——如果我们想要真正达到同样水平的硬件快速迭代,还有很长的路要走。"
他特别强调了制造知识的重要性:"我认为这被高度低估了。想想磁铁。我们有优秀的材料科学家,他们知道磁铁是如何工作的,可以设计非常好的磁铁。但是我们缺少那个知道的人,是的,你做了书上告诉你的所有事情,但你知道,两个小时后你必须向左搅拌,而不是向右。有太多这样的东西。这在中国非常分散。有太多的工艺知识。"
当Peter问到这在中国是如何发展的而不是在美国时,Bernt思考道:"我不确定。我认为中国的创业社区非常活跃。资本相当活跃。我觉得它的运行与我们喜欢认为的海湾地区非常相似。"
他提出了一个激进的解决方案:"我认为美国应该建立一些自由经济区。在这里你有加速的许可。"
"在加利福尼亚特别是,这样做将是一个明智之举,"David插话道。
"那是有史以来最简单、最好的想法,但我不知道需要什么才能通过,"Peter说。
Bernt继续说:"这是人们现在正在研究的一些东西。如果你看看Massa的Crystal Land项目梦想,例如,它与美国的这种自由经济区非常相似。"
他还指出了另一个需要解决的问题:"美国只是永远忍受、忍受、忍受。我们不仅不做硬件,我们只是不做芯片。"
Peter纠正道:"嗯,不是永远。我们在硅谷。"
"是的,"Bernt承认,"中间有一个阶段,人们有点迷失了方向。"
11、工厂规模:从年产2万到10亿的路径
关于1X的制造计划,Bernt分享了具体的数字和时间表。
"首先,只是一个小的纠正,"他说,"我们还没有建造超过100个Neo Gamma。我们建造了超过100个机器人。有多个版本。"
关于未来的生产能力:"2026年底的工厂运行率超过2万台。年化的2万台。"
"所以每月几千台,"Peter计算道。
"是的,"Bernt确认,"当然,要达到那里有一个爬坡期,所以你在2026年不会完全达到那个数字。"
"之后的工厂,我们试图遵循一个数量级的增长。我们不会完全能够做到这一点。我认为iPhone的增长是一个非常好的比较,你看到他们几乎翻倍,但当你达到某些规模时会有一些平台期,你会遇到问题。"
他详细解释了可能的瓶颈:"这里有一些相当有趣的问题,如果你要将人形机器人的制造扩展到iPhone水平。因为你会用完一些基本的东西,比如铝。例如,你不会用完地球上的所有铝,那不是我的意思,但有一定百分比的当前铝精炼你可以使用,超过这个百分比你就会真正难以获取铝。"
Peter问:"iPhone的增长是大约翻倍。那是一个有趣的统计数据,我甚至没有想到。我的意思是,你达到10亿。它更像是1.7。"
"1.7年化,哇,这不像我想的那么快,"Peter说,"所以你可以想象10万。"
"嗯,指数相当快,"Bernt说。
"是的,不,我不知道。但你可以想象在这个十年结束之前每年数十万的运行率。"
"这个十年结束?多得多,"Bernt坚定地说。
他继续解释更深层的挑战:"在那个时候,你需要真正思考什么会减慢你的速度。它归结为精炼,比如采矿和精炼,当然。但越来越多的,它实际上归结为劳动力。没有真正使用机器人作为劳动力,你不会达到那里。"
"如果你想想iPhone的增长,那么苹果基本上调动了中国人口的很大一部分进行劳动,他们仍然用完了劳动力,不得不扩展到邻国。这太疯狂了。"
"现在我认为我们在设计上做了令人难以置信的工作,所以零件很少,组装非常简单,但它仍然比iPhone更复杂。所以它看起来更复杂。"
"是的,它确实比iPhone更复杂。让我们说它需要五倍的时间,所以我们需要五倍于iPhone的劳动力。然后你就有麻烦了。"
"所以你必须自动化,"Peter说。
"是的,"Bernt确认,"当然,无论如何那都是目标。我们希望尽快达到我所说的硬起飞时刻,机器人建造机器人,机器人建造数据中心、芯片工厂、能源基础设施。"
12、世界模型:不仅仅是机器人的秘密武器
当讨论到为什么1X、Figure和Tesla等公司获得巨额估值时,Bernt揭示了一个关键的技术资产:世界模型。
"对我来说,我们的使命是创造人工劳动的富足,这跨越了数字和物理两个领域,"他说,"所以是的,它将被产品化,虽然还有一段时间,但是的,这将被产品化。"
他详细解释了世界模型的重要性:"它们当然是目前通向AGI的最知名路径。但对我们来说更重要的是,短期内,随着我们在数据收集和模型训练方面的进展,它们给了我们这个令人难以置信的机会来自动化模型的评估,包括安全性和红队测试以及所有这些事情。"
"你可以这样想,如果你训练了一个新模型,现在你想知道它是否比前一个更好,你可以将它部署到所有客户那里,几天后得到一些感觉检查,比如,嘿,人们现在更快乐了吗?这通常是怎么做的。你不想对物理系统这样做。你也不能对自动驾驶汽车这样做。"
他解释了世界模型的工作原理:"世界模型实际上是一个能够生成如果你采取特定行动会发生什么的模型。所以你可以把它想象成一个视频模型,你要求它做某事,然后它实际上不仅得到要做什么的问题,它还得到这样做的动作。它给你回的不仅是视频,还有世界的感觉,比如力量,机器人的一切。"
"所以本质上就像机器人在矩阵中。我们把机器人放在世界模型中,它不知道它在世界模型中。它认为它在真实世界中,它做它的事情。我们要求它做我们通常在家里做的事情,我们看看它做什么。我们可以放入大量的自动检查来确保它表现得更好,也确保它不做任何可能被认为不安全的事情。所以这真的是这个令人难以置信的重要和强大的评估工具。"
Peter问:"你认为这就是为什么你们和Figure以及Tesla获得巨额估值的原因吗?估值纯粹是因为,嘿,我们将销售1万台、2万台,然后20万台?还是说,不,世界模型是如此独特的资产,在数千种不同的方式中如此有价值,它成为了一个非常自我强化的进入壁垒。"
Bernt回答:"实际上,我认为机器人的收入将永远占主导地位。我确实认为真实的物理世界比人们想象的有更高的价值。我的意思是,只是让人们意识到,对吧,我们有110万亿美元的全球GDP,劳动力占其中的一半,对吧?所以TAM,总可寻址市场这里是50多万亿美元。只是如果你继续做我们已经在做的事情。它将变得更大。"
13、为什么是人形而不是章鱼形?
这是Salim Ismail经常提出的问题,Peter代他问道:"Salim总是说,为什么是两只手臂?为什么是两条腿?为什么不是六只手臂?为什么我们需要有人形?我的意思是,在厨房里,有一双额外的手臂不是更好吗?"
Bernt的回答既哲学又实用:"嗯,我认为,首先,他有点对。人形不是唯一会起作用的东西。我确实认为,我们看了很多,我不知道有任何形态因素像人类一样通用,可以在任何环境中做任何类型的劳动。我们试图简化。我们试图增加复杂性。人类是一台相当好的机器。"
他列出了选择人形的几个关键原因:"如果你的目标只是尽可能通用,那么你需要一个人形机器人。现在,如果你的目标是从人类转移知识,如果你有一个人形机器人会容易得多。我认为这是等式中最重要的部分。你不会将学习转移到一个六臂机器人上。至少更难。"
"然后,我的意思是,世界是为人类制造的。这就是黄仁勋说的,对吧?这是棕地部署。这非常真实。然后,我认为,最后,就是,你想和一个六腿机器人住在你的厨房里吗?"
但Bernt提供了一个更宏大的视角:"我将人形机器人视为通用技术的顶峰。但历史上有这种重复模式,零到一的新产品会发生这种情况。"
他用计算机的发展历史来类比:"如果你想想,比如说,计算机。它从解决非常专业任务的大型主机计算机开始。机器人学中的等价物将是工业机器人。现在出现了PC,或者甚至在PC之前,像VIX或Ataris之类的,更通用的计算机。"
"这以如此大的规模生产,它变得普遍可用。现在它质量超高,令人难以置信地可靠。它有这个巨大的生态系统,它成为解决任何问题的最佳方式。即使,这是反对人形机器人的论点,对吧?它对任务来说过于复杂。即使它对任务来说过于复杂,当你拿着你的美丽的苹果电脑写一个Word文档...我的意思是,那是我能想到的最复杂的打字机。人类掌握了纳米级芯片制造,只为了让你有一个打字机。但它实际上仍然是最便宜、最可靠的打字机,因为它是以如此大的规模制造的。人形机器人完全一样。"
"现在,如果你看看计算机现在发生了什么,因为市场已经变得如此之大,它实际上开始再次分段。现在你看到你可以在计算中开辟利基市场,它们仍然如此之大以至于有规模。所以现在你得到了AI的专用计算,物理的专用计算,各种事物的专用计算。"
"机器人学也会发生同样的事情。所以我们会到达我们有星球大战的地方,会有不同的无人机做不同的任务,它们看起来会更专门化,比如我的维修无人机,有六只手臂和剪刀手,我不知道,不像它会到达那里,但你必须首先经历这个人形阶段。所以让我们说人形是一个阶段。"
14、两个小时学会了什么,然后世界就不一样了
在谈话的最后部分,Bernt分享了他对未来十年的愿景,这个愿景远远超出了简单的家务自动化。
"首先会发生的是实际的富足意味着每个人都可以拥有他们想要的任何东西,"他说,"但不仅你可以拥有你想要的任何东西,你可以以可持续的方式拥有你想要的任何东西。因为可持续性是我们在削减成本时失去的东西。如果你实际上有能源和劳动力的富足,为什么你不以可持续的方式做事呢?"
他继续描绘更宏大的图景:"然后我认为下一个前沿,在一般建设允许每个人拥有令人难以置信的生活质量的全球基础设施之后,是我们如何解决科学中剩余的真正困难的问题?我认为这不会在没有人形机器人的情况下发生,因为你需要建造粒子加速器。你需要建造进行实验的巨大生物技术实验室。你需要做所有的实验。"
"而且,我认为这对人类幸福几乎是存在性的。我不希望天空中的神一样的AI指挥地球上所有的居民戴着眼镜为它做实验来解决科学问题。那不是我们瞄准的未来。我们希望人与机器之间有这种美丽的共生和共同发明。"
Peter提到了一个具体的应用场景:"Dennis Hassabis正在研究完整的细胞模拟器,试图闭环,但你知道,你将需要人们混合大量的化学品来真正解锁长寿、健康和化学。人形机器人可以做这项工作,因为实验室里的一切..."
"不仅它们可以做这项工作,"Bernt打断道,"我认为这是一个常见的误解。人形机器人最初会做很多工作,但一旦达到一定规模...人形机器人将制造将做这项工作的自动化系统。因为人形机器人不会用Dremel加工新零件。你会使用CNC机器。人形机器人不会通过30个人形机器人搬运汽车底盘。一般来说,这没有意义。我们有现有的自动化系统,我们会建造更多。人形机器人为你做的是建造所有这些自动化系统并让它们运行起来,并发现你目前不能用人类做的剩余差距。"
15、100亿台机器人的瓶颈不是技术,而是铝和芯片
当Peter提到Elon Musk和Brett Adcock都预测到2040年会有100亿台人形机器人时,Bernt的回答出人意料地乐观,但也指出了关键的挑战。
"我认为这可能大致正确,"他说,"我认为它可能会更早发生。我认为这真的取决于我们对如何扩展施加什么样的人为约束。"
他详细列举了需要解决的挑战:"在那个时候,你必须真正思考你如何精炼稀土?你如何开采更多的铝?你如何确保你很好地将你的劳动力引导到机器人劳动力中?你如何建设电力基础设施?顺便说一下,我们需要更多的芯片工厂。没有更多的芯片工厂,我们无法建造100亿个人形机器人。"
"我们可以帮助机器人建造这些。但我确实认为那个时间表很大程度上取决于许可流程如何进行,以及我们允许自己扩展多少和多快。但我希望我们能到达那里。"
Peter提供了一些参考数据:"我的意思是,作为参考,地球上有大约10亿辆汽车。你可能认为会更多,但是...我甚至不确定有多少iPhone,嗯,地球上有大约80亿部智能手机。"
David指出了一个关键的不平衡:"每一个这些机器人使用一个完整的GPU,可能可以使用两个。如果你说到2040年有10亿个,我们每年只生产2000万个GPU。然后TSMC现在占工厂市场份额的66%。所以他们实际上是我们试图建立的整个经济的单点故障。所以我们在工厂方面严重短缺。"
"那只是深入一层,"Bernt补充道,"看看ASML。芯片工厂的供应链更加脆弱。"
"我真的很惊讶我们没有更快地行动,考虑到Elon就在其中间。Elon在华盛顿。我们只是让这个瓶颈..."Peter说。
"我们谈论磁铁多久了?"Bernt问道,"这是只有中国才能真正制造高级磁铁的问题。不仅仅是稀土。是生产过程。"
"我认为现在,终于,人们睁开了眼睛,就像,等一下,这实际上是一个真正的问题。"
David感叹道:"我们会见了很多官员,他们完全不知道这些瓶颈,有趣的是,如果你指出它们,仍然没有反应。但它是如此尖锐和紧急。"
16、预订将在2025年开始,但这不是买产品,是买一张改变世界的门票
谈话接近尾声时,Peter问到了每个人都关心的问题:什么时候可以预订Neo Gamma?
"我会善待我的团队,不说具体日期,"Bernt说,"但它今年会发生。"
"好的,今年,2025年,"Peter确认。
"是的,"Bernt说,"现在,我们将在预订中谈论很多这个。但我们在这里做的最重要的事情是期望管理。这是令人难以置信的早期。你在这里购买的是成为这种转变一部分的门票。"
"收养一个Neo进入你的家庭。帮助我们教它,"Peter说。
"这将会很有趣,"Bernt继续,"它会有用。但它不会完美。会有很多粗糙的边缘。我们会很好地对待你。我们会一起弄清楚。这将是一个令人难以置信的有趣旅程。这就是我们今年推出的早期采用者计划。"
"你会有一个很长的等待名单,"Peter预测。
关于公司的投资者,Bernt透露:"我们有一些大型经典风险投资,比如软银、Target Global、NVIDIA、Samsung Next、OpenAI。"
Bernt最后强调了他的核心观点:"我认为越来越清楚的是,社会通向超级智能的瓶颈不是更好的算法或更彻底地抓取互联网。是更好的数据。是的,是更好的数据,然后你需要机器人来生成这些数据。但更重要的是,是物理部分。你需要更多的数据中心。你需要更多的电力。"
"要做到这一点,你需要更多的劳动力。这有点像这个引导问题。如果你只是分解金字塔,你说,超级智能由这令人难以置信的大量数据组成...以及它由计算和电力的基础设施组成,那么你会看到人形机器人是两者的解决方案。如果你只是做数学,你会看到没有那个你可能不会到达那里。你只是用完了这些基本约束。"
"我确实认为人形机器人会令人惊讶地有用,令人惊讶地快。不完美,但它会令人惊讶地有用,令人惊讶地早。"
Q1:为什么1X选择家庭市场而不是工厂?
A1:主要有两个原因。第一,消费级硬件的规模化速度远超其他领域,iPhone十年达到10亿台就是例证。第二,更关键的是,智能来自数据的多样性。在工厂环境中,机器人20-40小时后就会停止学习新东西,而家庭环境提供了无限的多样性,这是通向AGI的必经之路。
Q2:Neo Gamma的价格和生产计划是怎样的?
A2:目标价格在3万美元购买或每月300美元租赁左右,甚至可能更低。2026年底工厂年产能将超过2万台,之后每个工厂都将按数量级增长。但真正的挑战不是技术,而是铝材料供应、劳动力和芯片制造能力等基础设施瓶颈。
Q3:人形机器人与其他形态相比有什么优势?
A3:人形不是唯一可行的形态,但它是最通用的。关键优势包括:能够从人类转移知识和技能,适应为人类设计的世界,以及作为AI的自然交互界面。就像个人电脑最终成为最便宜的"打字机"一样,大规模生产的人形机器人将成为解决各种任务的最经济方案,即使对某些特定任务来说它过于复杂。
好文章,需要你的鼓励
四川大学研究团队发现,当前先进的AI模型在面对信息不完整的数学问题时,缺乏主动询问澄清信息的能力,更倾向于基于假设给出答案。
中南大学等机构联合发布TextAtlas5M数据集,包含500万图像-文本对,专门解决AI长文本图像生成难题。该数据集平均文本长度148.82词,远超现有数据集,涵盖广告、学术、教育等真实场景。配套的TextAtlasEval基准测试显示,即使最先进的商业模型也面临显著挑战,为AI图像生成技术指明了新的发展方向。
从11岁就梦想造人形机器人的Bernt Bornich,用'huggable'形容他的Neo Gamma机器人——这个能举起150磅的66磅'运动员',正以家庭为试验场突破AI学习瓶颈:'工厂20小时就触及学习天花板,而家庭环境的多样性才是通往AGI的钥匙'。
剑桥大学研究团队创建了史上最难的AI视觉测试ZeroBench,包含100道精心设计的视觉推理题目。在这项测试中,包括GPT-4o、Claude、Gemini在内的20个全球最先进AI模型全部得了0分,暴露了当前AI在基础视觉理解上的严重缺陷。研究发现AI主要在计数、空间推理等基础任务上失败,而非逻辑推理能力不足。