近期最重要的AI新闻恐怕就是:Meta宣布投资近150亿美元收购Scale AI 49%的股份,同时聘请亚历山大·王加入Meta领导全新的"超级智能"实验室了。
所以,我决定接下来介绍几家数据起家的AI创业公司,特别是独角兽级别的公司。
这期博客的主要内容来自亚历山大·王加入Meta前一个多月前,与硅谷知名孵化器South Park Commons (SPC)的一次播客访谈。很巧合,South Park Commons (SPC) 就是由Facebook第一位女性工程师Ruchi Sanghvi创立的,而且SPC团队中有多位Facebook早期员工。这期播客的主持人Aditya Agarwal也是Facebook最早的工程师之一,曾帮助构建Facebook搜索引擎、NewsFeed、Messenger等核心产品,担任过Facebook首位产品工程总监,后来成为Dropbox的CTO。在对话中,亚历山大·王也在对话中主动谈起对Facebook的工程文化理解。所以,他和扎克伯格的合作也是早有苗头。
再简单介绍一下亚历山大·王(Alexandr Wang),他1997年出生于新墨西哥州洛斯阿拉莫斯的华裔天才创业者,父母均为华裔移民物理学家。从小展现出数学和编程天赋,高中时期就赢得了美国计算机奥林匹克竞赛等多项国际竞赛奖项,青少年时期曾在问答平台Quora担任软件程序员。17岁考入麻省理工学院攻读数学和计算机科学,期间还曾在华尔街高频交易公司Hudson River Trading担任算法开发工程师。
2016年,年仅19岁的亚历山大·王做出了改变人生轨迹的决定——从MIT辍学,与同样是辍学生的Lucy Guo共同创立Scale AI。这家公司专注于为AI模型提供高质量的数据标注和评估服务,瞄准了当时被忽视但极其关键的AI基础设施领域。经过Y Combinator孵化器的培育,Scale AI迅速崛起,在短短八年时间里从三人小团队发展成为估值138亿美元的AI独角兽。
亚历山大·王也在25岁时短暂成为世界上最年轻的白手起家亿万富翁。有意思的是,扎克伯格创立Facebook的时候同样是19岁。
如今的Scale AI已成为全球AI生态系统中不可或缺的基础设施供应商,为OpenAI、Meta、Google、Microsoft等几乎所有主要AI公司提供数据服务,被业界称为"AI模型的数据工厂”。亚历山大·王在华盛顿政界也拥有深厚人脉,经常就中美AI技术竞争、国家安全等议题发表鹰派观点,被视为连接硅谷与华府的关键桥梁人物。
但在硅谷,他的负面新闻也不少,比如强烈的控制欲和管理方式。他坚持亲自审批每一个招聘名额,导致内部流程繁琐,影响员工士气和工作效率。此外,他对人才也采取较为强硬的限制措施,如限制前员工出售股票等。甚至,他通过董事会支持,解雇了创业伙伴Lucy Gu(扎克伯格也通过一些手段解雇了创业伙伴萨维林)。就更不用说,他的数据标记团队被一些媒体报道认为是一个“血汗工厂”。
当然,这部分观点我们今天就不多做介绍了,今天主要谈他的产业理解,也就是创业者最关心的核心议题:如何在"饥饿游戏"般的创业环境中存活、怎样建立不可动摇的自信心、企业销售中的认知战争、以及当前AI发展遭遇的数据墙困境等。
三个QA归纳亚历山大·王的创业方法论:
Q: 在AI创业大潮中,什么能力比技术更重要?
A: 认知套利。当80%-90%的行业信息都是噪音时,能在信息过载中保持独立判断的能力,远比单纯的技术优势更持久。Scale AI创始人亚历山大·王曾被红杉合伙人当面驳回"数据是AI生命线"的观点,因为"权威专家"说不再需要更多数据。结果?Scale AI如今估值138亿美元,而数据确实成了AI发展的最大瓶颈。成功往往源于对行业认知偏见的正确判断,而非技术领先。
Q: 初创公司如何与资金无限的科技巨头竞争?
A: 专注的稀缺性。微软、Google这些"比除10个国家外所有国家都富有"的公司虽然强大,但它们需要同时优化成千上万个目标。相比之下,像Perplexity这样专注搜索的公司,即使面对OpenAI、Google的竞争,在搜索领域仍然是最好的。专注度永远有巨大的溢价,因为注意力是唯一无法用金钱购买的稀缺资源。
Q: 为什么技术最好的公司不一定能赢得企业客户?
A: 感知比现实更重要。在大型企业决策中,纯技术优势只是成功的必要条件。Palantir的销售高管会当着竞争对手的面对客户说:"你们没选我们会后悔的,最终还是会回来找我们。"这种"不合理的自信"和感知管理能力,往往比产品功能更能影响复杂的B2B决策。理解决策者的认知框架、学会塑造有利感知,是技术创业者最容易忽视但极其关键的隐性技能。
一、创业初期的存在主义焦虑:在不确定性中寻找方向
亚历山大·王说Scale AI的诞生并非一帆风顺的叙事,而是充满了"存在主义焦虑"的挣扎过程。在进入Y Combinator孵化器的前半段时间里,他和团队陷入了典型的创业迷茫期——不知道自己在做什么,更不确定未来的方向在哪里。
"这是一种高度不确定的状态,伴随着大量的存在主义焦虑。你不知道自己的人生在做什么。"亚历山大·王回忆起那段日子时说道。他形容那时的状态就像是保存着一份又一份Google文档,里面列满了各种startup想法,然后不停地试图想出更多的创业点子。这种状态对许多创业者来说都不陌生——看似在努力工作,实际上却在原地打转。
转机来自于保罗·格雷厄姆(Paul Graham)的一篇经典文章《如何产生创业想法》。这篇文章为亚历山大·王提供了一个关键的聚焦框架:活在未来。"基本思路是活在未来,想象未来存在哪些东西,然后反向构建。"这个框架帮助他跳出了纯粹的头脑风暴模式,开始从技术发展趋势的角度思考商业机会。
然而,即便有了方向性的指导,创业初期的心理压力依然巨大。在Y Combinator这样的环境中,周围都是已经在各自项目上工作了一段时间的团队,这让任何新开始一个想法的人都感觉"已经落后了"。亚历山大·王坦承:"你会觉得自己已经落后于起跑线,因为你开始一个新想法的时候,周围每个人都已经在他们的项目上工作一段时间了。"
这种比较心理产生的焦虑是创业生态中的普遍现象。当你身处一个充满野心和竞争的环境中时,很容易被他人的进展所影响,质疑自己的选择和节奏。但亚历山大·王最终意识到,这种"落后感"往往是一种错觉,真正重要的是找到正确的方向并坚持执行。这种深刻的自我认知,为他后来在更大的商业竞争中保持定力奠定了心理基础。
二、从模糊概念到具体产品:Scale API的诞生逻辑
Scale AI的核心理念源于亚历山大·王对未来技术发展趋势的一个清晰判断:人类计算资源终将像其他计算资源一样被动态编排。在他看来,未来人们将能够像今天使用云计算API一样,通过API调用人类智力资源来完成各种任务。
"显然,未来我们将会更加动态地编排人类计算资源,就像我们今天编排其他资源,比如计算资源一样。"亚历山大·王解释道:"你会到达这样一个状态:人类计算可以像使用任何其他API一样简单,但这个API当时并不存在。"
这个洞察成为了Scale AI的核心价值主张。他们要构建的不仅仅是一家外包公司,而是一个能够让AI开发者像调用云服务一样便捷地获取高质量训练数据的平台。这个定位在当时是相当前瞻的——大多数人还没有意识到数据质量对AI模型性能的决定性影响。
产品概念确定后,亚历山大·王做了一个看似简单但事后证明极其重要的决定:购买ScaleAPI.com域名。"我花了一整晚寻找域名,ScaleAPI.com正好可用,所以我买下了它。这后来证明是一个异常明智的决定。"事实证明,"Scale"这个名字不仅朗朗上口,更完美地传达了公司的核心价值——帮助AI系统实现规模化。
紧接着,他们在Product Hunt上线了产品,获得了足够的初期关注度。但亚历山大·王强调,Product Hunt的成功只是开始,而非结束。真正的挑战是接下来的4-6个月,他称之为"漫游模式"——有了几个客户,但还在努力获取更多客户的阶段。
在这个阶段,亚历山大·王展现出了创业者必备的执行力。他亲自回复网站上每一个访客的咨询:"如果你是scaleapi.com的访客并点击了聊天泡泡,你最终会和我对话。"这种近距离接触客户的做法,让他能够深入理解用户需求,为产品迭代积累了宝贵的第一手资料。
这段经历持续了大约一年时间,亚历山大·王将其定义为"漫游期"。直到6个月后出现了一个想要大规模使用服务的客户,整个业务才开始真正成型。这个案例说明了一个道理:从概念到产品市场匹配,往往需要比预期更长的时间和更多的耐心。这种对长期主义的坚持,也体现在他后来对AI发展趋势的判断和Scale AI的战略布局中。
三、心理韧性的修炼:如何在不确定性中保持前进动力
被问及如何处理创业初期的焦虑时,亚历山大·王给出了一个颇为哲学化的回答。他首先澄清了一个误区:创业初期的痛苦并不比公司发展后期更严重。"我不确定那个时期是否比公司未来其他时期更痛苦。建立公司的过程中有很多痛苦的时刻。"
真正帮助他度过那段艰难时期的,是对Scale AI核心理念的信念。一旦团队确定了Scale的想法,亚历山大·王就产生了强烈的确信:这个东西在未来一定会存在,而现在它还不存在。"这给了我足够的梯度去工作。然后你就可以对路径产生合理的信心,相信在某个时候,你会找出如何从A点到达B点的方法。"
这种信念的力量不容小觑。在充满不确定性的创业环境中,拥有对长期趋势的清晰判断,往往比短期的战术调整更为重要。它为创业者提供了一个心理锚点,即使在最困难的时候也能保持方向感。
但亚历山大·王也承认,即便有了信念支撑,焦虑仍然是创业过程中的常态。他特别提到了Y Combinator环境中的一个心理陷阱:"最可怕的想法是,你可能已经死了,但要到三年后才会发现。"这个比喻生动地描述了创业者面临的延迟反馈困境——你今天的决策可能要很久之后才能看到结果,而在等待的过程中,不确定性会持续折磨你。
面对这种焦虑,亚历山大·王的应对策略是将不确定性转化为行动的动力。"我是一个相当焦虑的人,我把所有的不确定性转化为焦虑地做事情。"他认为,如果你能够将焦虑情绪转化为持续的执行力,至少你会感觉自己在掌舵,在朝着正确的方向前进。
这种方法论的核心在于:与其被不确定性困扰,不如通过不断的行动来获取更多信息,从而减少不确定性。每一次客户对话、每一次产品迭代、每一次市场反馈,都是在为最终的成功积累数据点。焦虑成为了进步的燃料,而非阻碍。这种心理调节能力,也为他后来面对更大规模的商业挑战和地缘政治复杂性提供了坚实的心理基础。
四、竞争哲学与心理博弈:从Palantir学到的销售真经
在讨论如何面对竞争时,亚历山大·王分享了一个让人印象深刻的Palantir故事,这个故事揭示了企业级销售中的认知战争本质。在一次政府客户的会议上,Palantir的一位高管当着亚历山大·王的面,对客户说:"你们没选择Palantir没关系,但你们会后悔的。如果一开始就选择Palantir,你们会更开心,我们也能为你们做得比其他任何人都好。不过既然你们没选,你们最终还是会回来找我们的,到时候我们还是朋友。"
这种近乎狂妄的自信表达方式让亚历山大·王震惊,但他很快意识到这背后的深层逻辑。Palantir的成功秘诀之一,就是这种"不合理的自信"。他们真诚地相信自己构建的任何软件都是"上帝赐予地球的最伟大软件",没有人能够构建出同样好的软件。
"这种自我强化的循环是很有效的。"亚历山大·王分析道。虽然从理性的第三方观察者角度看,这种态度可能显得荒谬和令人讨厌,但它确实是Palantir成功故事的一部分。这种极度的自信不仅影响了团队内部的士气,也在客户心中植入了强烈的印象。
更有趣的是,亚历山大·王透露Palantir甚至给新员工发放表演书籍。这个细节揭示了一个重要认知:企业级销售很大程度上是一种表演艺术。Palantir将自己定位为"表演团体与软件公司的结合体",这种定位帮助他们在复杂的企业决策环境中脱颖而出。
从这个案例中,亚历山大·王总结出了竞争的核心原则:你需要某种程度的"不合理的自信"来相信自己能够在市场中获胜。从长期来看,你需要相信自己能够比其他人招募到更好的人才,做出更好的产品决策,走得更远,而其他人可能没有那么在意。
他将这种态度与一位18岁的YC创始人的话联系起来:"面对竞争,就是要做得更好。就是要更好。"这种简单直接的竞争哲学,虽然听起来有些狂妄,但确实体现了成功创业者的必备心态。在高度竞争的市场中,如果你都不相信自己能赢,又怎么能让别人相信你呢?这种心理状态的培养,对于亚历山大·王后来在AI基础设施领域建立统治地位起到了关键作用。
五、企业销售的认知战争:现实vs感知的微妙平衡
亚历山大·王进一步阐述了企业级销售中的一个关键洞察:在大多数大型企业中,感知比现实更重要。这个观点挑战了许多技术创业者的固有认知,他们往往相信"好产品会自己说话"。
"在很多大型客户那里,感知比现实更真实。"亚历山大·王解释道:"现实往往是如此丑陋,人们很少真正面对现实。大多数情况下,他们只是选择相信他们生活在其中的感知。"
这个观察来自于Scale AI在服务大型企业和政府客户过程中的实际经验。与数据驱动的硅谷公司不同,大型企业的决策往往受到政治、关系、认知偏见等复杂因素的影响。在这种环境中,纯粹的技术优势可能并不足以获胜,你还需要学会"塑造感知"。
亚历山大·王强调,这并不意味着要忽视产品质量:"你仍然需要构建好产品。"但同时,你的工作不仅仅是改善现实,还要塑造感知。这就是为什么Palantir在这方面如此成功的原因——他们将自己视为"表演团体与软件公司的结合体"。
这种"感知管理"的重要性,在政府和大型企业客户中尤为突出。这些组织的决策流程复杂,涉及多个利益相关方,往往不是纯粹基于技术指标的理性决策。在这种环境中,能够有效沟通价值主张、建立信任关系、管理预期的能力,与技术能力同等重要。
但亚历山大·王也警告了这种方法的局限性。他提到了在Dropbox的经历,那里的团队相信"构建好软件,软件会自己说话",但经常发现竞争对手在他们发布新功能两天后就宣布了同样的功能。后来才发现,这些竞争对手并没有真正构建出功能,只是很擅长谈论它们。
这个例子说明了企业级市场的复杂性:一方面,你需要有实质性的产品价值;另一方面,你也需要有效的市场沟通和感知管理能力。最成功的企业往往是那些能够在这两个维度上都表现出色的公司。对于Scale AI这样服务少数大客户的企业来说,这种平衡尤为重要。正是这种深刻的市场认知,帮助Scale AI在竞争激烈的AI基础设施市场中建立了稳固的地位。
六、Scale AI的核心竞争优势:在最不性感的问题上展现创造力
谈到Scale AI的核心竞争优势时,亚历山大·王提到了一个看似矛盾的能力:在最不性感的问题上展现创造性问题解决能力。这个表述精确地概括了Scale AI的独特定位和文化特色。
"我认为对我个人以及Scale许多关键人员来说,真正的特点是创造性问题解决,但是面对的是你能想象到的最不性感的问题。"亚历山大·王解释道。Scale AI的核心业务是大规模运营——协调全世界数十万名贡献者为AI模型生产高质量数据。这听起来确实不够性感,但却是AI产业链中不可或缺的一环。
这种看似平凡的工作,在Scale AI手中变成了一门精密的科学。他们将解决数学奥赛问题的同样严谨性和创造力,应用到了数据标注的运营管理上。"我们以解决数学奥赛问题的同样尊重程度来对待这个问题,我们应用同样的技术,问自己:解决这个问题最有创意的方法是什么?我们如何分解它?我们如何对它应用科学方法?"
这种方法论的独特之处在于,它打破了传统的技术公司分工模式。许多优秀的技术团队要么专注于智力上有趣但商业价值有限的前沿问题,要么愿意解决实际问题但缺乏足够的技术深度。Scale AI的差异化在于同时具备这两种能力。
亚历山大·王观察到,业界存在两种常见的不平衡模式:"要么是优秀的团队,但他们人为地限制自己只做那些智力上有趣的深奥问题。这是一个非常常见的模式——你有一个聪明的团队,但他们在最无用的问题上工作。另一种是勇于解决任何问题的团队,但他们无法以可扩展的方式解决问题,或者不知道如何将问题抽象化以便有效解决。"
Scale AI的解决方案是创造一种文化,让员工以解决问题的经济影响而非技术难度为荣。这种价值观的转换至关重要。在学校环境中,人们习惯于通过解决越来越困难的技术问题来获得成就感,但在商业世界中,技术难度与经济价值之间往往存在反向关系。
"事实证明,许多经济价值极高的问题在技术上并不超级困难,但有很多复杂性,你需要筛选大量混乱的东西。"亚历山大·王指出:"这就是大多数好的创业机会所在的地方。"这个洞察对许多技术背景的创业者来说都极具启发性——最有价值的商业机会往往隐藏在看似平凡但实际复杂的运营挑战中。这种认知也解释了为什么Scale AI能够在AI基础设施这个看似平凡的领域建立起如此强大的竞争优势。
七、重新定义人才评价标准:生产力胜过技术炫技
亚历山大·王进一步阐述了Scale AI在人才评价和激励机制上的独特做法,这些做法直接来源于Facebook的成功经验,但在当今的技术环境中显得尤为重要。
访谈的主持人Aditya Agarwal作为Facebook早期工程师,对此有深刻的第一手经验。他分享道:"在Facebook,我们非常有意识地这样做。在大多数公司,特别是在工程阶梯上,如果你处理更困难的问题,你倾向于得到晋升。问题越困难,在某种程度上就会获得更多隐含的地位和尊重。但在Facebook,我们经常会说,不,我们实际上想要晋升最有生产力的工程师——就是那个实际产出最多代码的人。"
这种评价标准的转变具有深远的文化影响。传统的技术公司往往鼓励工程师挑战最前沿、最复杂的技术问题,但这种激励模式可能与商业价值创造脱节。Facebook的做法是有意识地提拔那些可能工作在最不性感但最有影响力项目上的工程师。
Agarwal举了一个具体例子:"也许这个人减少了我们日志中的错误数量一个数量级,但这些东西很简单。我的意思是,是的,但总得有人来做。"这种看似简单的工作——减少系统日志错误——对整个平台的稳定性和开发效率有着巨大影响,但往往不会得到与其价值相匹配的认可。
这种人才理念在AI时代显得尤为重要。当前的AI发展阶段,许多关键瓶颈并不在于算法创新,而在于大规模工程实施、数据质量管理、系统稳定性等基础工作。那些能够在这些领域做出实质性贡献的人才,往往比追求前沿算法的研究者更有价值。
传统的高级工程师对这种评价标准转变往往感到困惑。"传统的高级工程师不理解。他们会说,为什么这个人得到晋升?他们处理的是减少我们日志中错误数量的工作,但这很容易。"这种反应反映了技术社区中普遍存在的认知偏见:将技术难度等同于价值创造。
但正如Agarwal指出的,商业成功往往来自于那些愿意解决"不够酷"但极其重要问题的人。这种人才理念不仅影响了Scale AI的内部文化,也为整个AI行业的人才发展提供了新的思路。在AI基础设施建设的关键阶段,我们需要更多愿意专注于生产力而非技术炫技的人才。
亚历山大·王补充道:"Facebook做了类似的事情,这很好地类比了我们的做法。"这种从硅谷最成功公司之一学习并应用到AI创业中的做法,体现了优秀创业者善于学习和适应的能力。
八、AI代理革命的产品设计挑战:突破聊天范式的创新机遇
讨论备受关注的AI代理(Agent)技术时,亚历山大·王给出了一个相当务实但略显悲观的评估:当前的AI模型在单轮对话中表现不错,但在多轮交互中性能急剧下降。这个观察击中了当前AI代理技术发展的核心痛点。
"我们现在所处的位置是,模型在一轮对话中表现相当好,你知道,一个提示和响应,它们表现得相当好。然后随着轮次增加,性能就直线下降。"亚历山大·王毫不讳言地指出:"虽然没有人会公开承认这一点,但这就是我们的现状。"
这种性能衰减的根本原因在于当前AI模型缺乏真正的内在一致性和自我认知能力。"现在的模型甚至不知道自己不知道什么,所以它们会胡编乱造。总的来说,在多轮交互中与模型互动,感觉像是在与一台胡说八道的机器互动,这台机器在统计上更可能正确而不是错误,但它不像是一个有心智理论的实体。"
这个诚实的评估与市场上关于AI代理的许多夸大宣传形成了鲜明对比。许多公司都在宣传自己的AI代理能力,但实际体验往往令人失望。亚历山大·王的分析揭示了问题的本质:当前的技术基础还不足以支撑真正有效的多轮智能对话。
然而,亚历山大·王并不认为技术能力是AI代理普及的唯一障碍。他认为产品设计可能是更大的瓶颈:"对于这个代理的分水岭时刻,最大的障碍实际上是产品设计。"
他的观点是,当前的模型能力已经足以创造出一些真正令人惊艳的代理产品体验,问题在于我们还没有找到正确的产品形态。大多数人还不知道AI模型实际上已经很强大了,因为这些能力被困在了传统的聊天界面中。
Cursor编辑器是亚历山大·王经常引用的正面案例。"Cursor是一个很好的例子。我认为大多数工程师实际上不知道模型有多好,你把它放入Cursor中,突然间它成为了他们工作流程的一部分,使用起来更容易。"
这个例子说明了一个重要原则:AI的真正价值往往通过与现有工作流程的深度集成来实现,而不是作为独立的聊天机器人。最成功的AI应用往往是那些将AI能力无缝嵌入用户已有习惯中的产品。
亚历山大·王预测,2025年最大的创业机会之一就是找到正确的代理交互模式。关键是要"将模型从聊天范式中解放出来,变成更深入融合到基本工作流程中的东西"。这需要创业者深入理解用户的实际工作模式,而不仅仅是构建技术演示。
这种对产品设计重要性的强调,体现了亚历山大·王作为成功创业者的深刻洞察:技术能力只是成功的必要条件,如何将技术转化为用户真正需要的产品体验,才是决定成败的关键因素。
九、数据墙危机与合成数据的局限性:AI发展的新瓶颈
对于当前AI发展面临的数据稀缺问题时,亚历山大·王提供了一个深刻的行业洞察:过去12-18个月关于"更多算力就能获胜"的讨论过于简化了问题。这种观点认为谁拥有最大的计算集群,谁就能赢得AI竞赛,但现实证明事情远比这复杂。
"过去12到18个月的疯狂对话就是:谁有更多计算?谁有更多芯片?芯片越多,你就越会赢。这是一个非常缺乏细致入微的对话,关于谁拥有最大的集群,拥有最大集群的人将获胜。"亚历山大·王回忆道。但现在变得清晰的是,即使拥有更大的集群,我们也在遭遇数据限制。
这个"数据墙"的核心问题是:我们已经接近用尽所有公开可用数据的极限。传统的做法是简单地收集更多互联网数据进行预训练,但这种方法已经遇到了天花板。现在的发展需要一种计算和专门数据集的组合方法。
更重要的是,当前的进展主要来自后训练(post-training)阶段,而这个阶段对数据质量的要求与预训练完全不同。"后训练更多地受到专门数据集和高质量数据集的瓶颈制约,这些数据集看起来不像我们在互联网上拥有的数据集。"
关于合成数据(synthetic data),亚历山大·王给出了一个现实但略显悲观的评估。虽然业界对合成数据抱有很高期望,认为它可能成为数据稀缺问题的解决方案,但实际实验结果并不支持这种乐观预期。
"我认为很多关于合成数据的实验表明,如果你使用合成数据,你会失去数据分布中的很多真实丰富性。"他解释道。合成数据的本质是利用数据中的结构或先验知识来生成额外的训练样本,这作为一种范式确实有效,但不是无限的解决方案。
"合成数据基本上是利用数据中的底层结构来榨取一定数量的合成数据来改进你的模型。这显然作为一个范式是有效的,但它不是无限的追求,不是可以无限工作的东西。"亚历山大·王的评估是,合成数据显然是世界级后训练工作的一部分,但它不是我们所有扩展问题的解决方案。
这个现实意味着,未来的AI发展需要依赖新形式的人类生成数据。这正是Scale AI看到巨大机遇的地方。如果我们在扩展计算的同时也扩展数据,就可以继续取得进展。但这意味着数据生产需要与计算资源同步指数级增长。
亚历山大·王预测,在通往AGI的道路上,计算资源需要指数级扩展,数据生产也需要沿着类似的指数级曲线扩展。这两者必须协调发展,不能让其中一个远远超前于另一个。这种洞察为Scale AI的未来发展奠定了理论基础,也解释了为什么数据基础设施在AI时代变得如此关键。同时,这也预示着Scale AI在未来AI发展中将发挥越来越重要的作用。
十、AI创业的残酷真相:在信息噪音中保持独立思考
讨论AI创业与传统科技创业的区别时,亚历山大·王给出了一个犀利的观察:在任何技术新兴领域,不确定性的代价就是大量的废话。这个判断虽然听起来刺耳,但反映了当前AI创业生态的真实状况。
"在AI这个行业中,就像很久以前的软件即服务一样,存在很多不确定性和很多废话。但AI确实处于这样一个点,80%到90%的信息都是废话。"亚历山大·王毫不客气地指出。这种信息污染的程度,远超大多数人的想象。
更严重的问题是,许多投资者、产品领导者和行业专家都"确信自己的错误观点"。他们被职业角色要求拥有明确的观点和论点,但这些观点往往并非基于深入的实践经验或扎实的数据。"如果你是投资者,你的工作就是有论点,有观点,告诉LP你的论点。如果你是大型科技公司的产品领导者,你的工作就是有论点和观点。"
亚历山大·王分享了一个生动的案例来说明这种信息误导的危害。在2018年Scale AI融资时,他们的演示文稿第一页写着"数据是AI系统的生命线"。在红杉资本的合伙人会议上,一位合伙人非常大声且自信地反驳:"那不对。吴恩达刚告诉我,我们不再需要更多数据来做AI了,所以实际上没有更多数据我们也会很好。"
这个故事的戏剧性在于,一个20岁的创业者试图向经验丰富的投资人解释数据的重要性,却被权威专家的观点驳回。亚历山大·王当时只能说:"我不知道吴恩达在说什么,我确信我可以和他谈论这个,但你显然需要更多数据来做AI。"结果是那位合伙人不再关注演示,红杉最终拒绝了投资。
这个案例完美地展现了AI生态系统中的一个核心问题:权威观点与实际需求之间的巨大落差。事后看来,数据确实成为了AI发展的关键瓶颈,Scale AI也成为了价值百亿美元的公司,但在当时,"权威专家"的错误判断却误导了重要的投资决策。
基于这种观察,亚历山大·王认为AI创业最重要的能力是"弄清楚你实际相信什么,然后逆势执行"。这比听起来要困难得多,因为创业者需要在铺天盖地的信息噪音中保持独立判断,既要学习生态系统的反馈,又不能被潮流所左右。
他特别警告了盲目跟风的危险:"如果你跟随趋势,你会被搞砸,即使你可能通过跟随趋势筹集到很多钱。看看AI的历史,有大量公司通过做一些当时非常时髦和流行的事情筹集了5000万美元或1亿美元的A轮融资,但后来证明那只是个愚蠢的想法。"
AI行业已经经历了多次起伏,未来还会有更多。在这种环境中,创业者最重要的能力不是预测下一个热点,而是培养独立思考的能力,并建立持续学习和调整的机制。成功的关键在于找到那个微妙的平衡点:既要坚持自己的核心信念,又要保持对市场反馈的敏感性。
这种对独立思考的强调,也解释了为什么亚历山大·王能够在众多AI创业者中脱颖而出。在一个充满噪音和误导信息的环境中,保持清醒的判断力和坚定的执行力,往往比单纯的技术能力更为重要。
十一、竞争策略重新定义:专注胜过资本军备竞赛
面对AI领域日益激烈的竞争环境,亚历山大·王提出了一个颠覆性的观点:在AI领域创业,你并不需要大量资金,相反,需要大量资金的商业计划本身就是一个糟糕的商业模式。
"如果你的商业计划是你需要筹集大量资金因为你需要花费大量资金,那在商业术语中就是一个糟糕的生意,因为显然你想建立一个盈利的公司。"亚历山大·王直言不讳地指出。这个观点挑战了当前AI创业圈的主流认知,许多创业者都认为AI创业需要巨额资金才能与大厂竞争。
他特别批评了硅谷经常出现的"宏大野心陷阱":"硅谷经常陷入某些竞赛,追求这些宏大、雄心勃勃的目标。如果你想通过控制上帝般的基础模型来成为世界皇帝,那么你可能需要很多钱。但这可能不是这里大多数人或大多数公司的目标。"
亚历山大·王用自动驾驶汽车行业的失败案例来说明这个问题。该行业筹集了接近1000亿美元来构建大规模自动驾驶汽车,但最终几乎所有公司都失败了。唯一的赢家是Waymo,但它拥有无限的资金支持,这并不是一个可以竞争的对手。
"现在有一个真实的类比,就是如果你想踏上跑步机与训练基础模型竞争,你是在与拥有比除10个国家以外所有国家都多资金的公司竞争。这真的像是人类有史以来最富有的实体。"亚历山大·王用一个夸张但不失准确的比喻来描述当前的竞争态势:"微软应该加入G8。"
面对这种看似不可能的竞争环境,亚历山大·王提出了一个关键策略:专注于长期深耕某个特定问题领域。"至少现在在AI中,重点实际上是选择某个问题长期关注。"
他以Perplexity为例来说明这个策略的有效性。"Perplexity是这个的最佳例子。在简单的基于搜索的LLM输出方面,仍然没有其他产品能像Perplexity一样好。"尽管OpenAI、Google、Anthropic等巨头都拥有更强大的技术和更多资源,但在搜索领域,Perplexity仍然是最好的。
这个成功的关键在于专注。这些大型AI公司虽然强大,但它们需要关心和优化成千上万件事情,很难在任何特定领域做到极致专注。相比之下,像Perplexity这样专注于单一问题的公司,可以将所有资源和注意力投入到把一件事做到最好。
"他们没有花那么多钱,他们只是更专注于那个问题。所以专注总是有很大的溢价。"亚历山大·王总结道。这个洞察为AI创业者提供了一个清晰的战略方向:与其试图在所有战线上与巨头竞争,不如选择一个具体的问题领域,然后做得比任何人都好。
这种策略不仅适用于技术层面,也适用于市场定位。在AI这个快速变化的领域中,专注往往比追求全面覆盖更有效。那些能够在特定垂直领域建立深度优势的公司,往往比试图成为"通用AI平台"的公司更容易获得成功。这种战略思维也体现在Scale AI的发展轨迹中——专注于数据基础设施这一个关键环节,然后将其做到极致。
好文章,需要你的鼓励
康奈尔大学研究显示,大语言模型驱动的流量转化率比传统搜索高出近9倍。预计到2028年,更多用户将通过ChatGPT等LLM发现产品信息,而非传统搜索引擎。这种转变正在加速发生。LLM流量表现更像个人推荐而非关键词查询,用户查询长度已达23个词,会话时长超6分钟。品牌需要从SEO转向答案引擎优化AEO,确保在LLM对话中被提及,否则将变得不可见。
泰国SCBX金融集团开发的DoTA-RAG系统通过动态路由和混合检索技术,成功解决了大规模知识库检索中速度与准确性难以兼得的难题。系统将1500万文档的搜索空间缩小92%,响应时间从100秒降至35秒,正确性评分提升96%,为企业级智能问答系统提供了实用的技术方案。
Meta豪掷150亿美元押注AI数据工厂Scale AI,19岁辍学的华裔天才如何用"认知套利"打造138亿美元独角兽?"当80%行业信息都是噪音时,独立判断比技术优势更持久。"
中科院和字节跳动联合开发了VGR视觉锚定推理系统,突破了传统AI只能粗略"看图"的局限。该系统能在推理过程中主动关注图片关键区域,像人类一样仔细观察细节后再得出结论。实验显示VGR在图表理解等任务上性能大幅提升,同时计算效率更高,代表了多模态AI"可视化推理"的重要进展。