当企业纷纷抢滩AI浪潮时,一道无形的鸿沟正在形成。这份由麻省理工学院NANDA项目团队完成的研究报告,通过系统分析超过300个公开披露的AI项目,访谈52家企业代表,并在四场主要行业会议上收集153位高管的问卷反馈,揭示了一个令人震惊的现实:尽管企业在生成式AI上投入了300到400亿美元,但高达95%的组织根本没有看到任何投资回报。

这不是一个关于技术失败的故事,而是一个关于选择的故事。站在鸿沟两岸的企业,境遇截然不同。一边是5%成功跨越鸿沟的组织,他们的AI试点项目正在创造数百万美元的实际价值;另一边是绝大多数仍然困在原地的企业,他们的投资就像投进了黑洞,看不到任何对利润表的影响。研究团队将这种极端分化的现象命名为"GenAI鸿沟"。更引人深思的是,这道鸿沟的形成并非由AI模型的质量或政府监管造成,而是完全取决于企业采取的方法和策略。
那些看似相似的企业,为什么会在AI应用上呈现如此巨大的差距?答案隐藏在日常的工作场景中。ChatGPT和Copilot这类通用工具的采用率超过了80%,近40%的企业报告已经部署了这些工具,然而这些工具主要提升的是个人生产力,而非企业整体的财务表现。与此同时,那些为企业量身定制或由供应商销售的企业级AI系统,却遭遇了冷落。虽然有60%的企业评估过此类工具,但只有20%进入了试点阶段,最终只有5%达到了生产部署。大多数失败的原因在于工作流程设计僵化、缺乏上下文学习能力,以及与日常运营脱节。
通过深入分析300个公开实施案例、访谈记录和调查数据,研究团队识别出了定义这道GenAI鸿沟的四个关键模式。第一个模式是颠覆程度有限,在研究涵盖的八大主要行业中,只有两个行业显示出明显的结构性变革。第二个模式是企业悖论,那些规模最大的企业虽然在试点项目数量上遥遥领先,并且投入了更多人力资源,但在将试点转化为规模化应用方面却表现最差。第三个模式是投资偏见,企业预算严重倾向于那些可见的、面向客户的前台功能,而那些投资回报率最高的后台办公功能却被忽视。第四个模式是实施优势,通过外部合作伙伴关系实施的AI项目,其成功率是内部自建项目的两倍。
阻碍企业跨越鸿沟的核心障碍不是基础设施、不是监管政策、也不是人才短缺,而是学习能力。当前大多数GenAI系统无法保留用户反馈、无法适应具体业务场景、也无法随着时间推移而改进。少数成功跨越鸿沟的供应商和买家,正是因为他们直接解决了这些根本性的局限。那些成功的企业买家会要求AI系统深度定制以适应具体业务流程,并且基于业务成果而非软件性能基准来评估工具。他们期待系统能够与现有流程集成并持续改进。而那些满足这些期望的供应商,正在几个月内就拿下数百万美元的部署合同。
虽然大多数AI实施项目并未导致裁员,但那些已经跨越鸿沟的企业开始在客户支持、软件工程和行政管理等特定领域看到了有选择性的劳动力影响。表现最好的企业报告说,通过减少业务流程外包(BPO)支出和外部代理机构的使用,特别是在后台运营中,实现了可观的成本节约。还有一些企业通过自动化外联和智能跟进系统,提高了客户留存率和销售转化率。这些早期成果表明,当学习型AI系统针对特定流程部署时,即使不进行重大组织重组,也能够带来真实价值。
鸿沟错误的一侧:高采用率,低转型效果
站在GenAI鸿沟错误的一侧,大多数企业正面临着一个尴尬的现实:AI工具的采用率很高,但业务转型的效果却微乎其微。九个行业中有七个几乎看不到任何结构性变化。企业们正在试点各种GenAI工具,但很少有能够真正部署的。像ChatGPT这样的通用工具被广泛使用,但那些定制化的企业解决方案却因为集成复杂度高、与现有工作流程不匹配而陷入停滞。
当我们审视行业层面的转型模式时,GenAI鸿沟的表现最为明显。尽管投资规模庞大、试点项目遍地开花,但只有极少数企业真正实现了从实验到有意义的业务转型的跨越。尽管GenAI获得了高度关注,但行业层面的转型仍然有限。GenAI已经嵌入到客户支持、内容创作和分析等应用场景中,但很少有行业表现出与过去通用技术相关的深层结构性转变,比如新的市场领导者出现、商业模式被颠覆,或者客户行为发生可衡量的变化。
为了更好地量化颠覆状态,研究团队开发了一个综合性的"AI市场颠覆指数"。每个行业根据五个可观察指标从0到5打分,这些分数代表了五个维度的标准化平均值,通过公开指标和访谈得出的评估进行三角验证。研究团队测试了不同的权重方案以确认行业排名的一致性。这五个指标包括:2022年到2025年间顶级在位者的市场份额波动性,2020年后成立的AI原生公司的收入增长,新的AI驱动商业模式的出现,可归因于GenAI的用户行为变化,以及归因于AI工具的高管组织变革频率。
研究结果显示,技术行业的颠覆指数最高,达到3分,主要信号是新挑战者正在崛起(例如Cursor对比Copilot)以及工作流程的转变。媒体和电信行业紧随其后,得分2分,特征是AI原生内容的兴起、广告动态的转变,但在位者仍在增长。专业服务行业得分1.5分,虽然有效率提升,但客户交付方式基本保持不变。医疗保健和制药、消费品和零售、金融服务、先进制造业这几个行业的得分都是0.5分,分别表现为文档和转录试点但临床模式未变、支持自动化但对忠诚度和领导者影响有限、后台自动化但客户关系稳定、维护试点但供应链没有重大转变。能源和材料行业得分为0,几乎零采用、实验极少。

研究团队对权重方案进行了敏感性分析,无论如何调整五个颠覆指标的权重,技术和媒体电信行业始终保持在最高排名,而医疗保健和能源始终保持较低。专业服务行业对权重变化最为敏感,根据对效率提升与结构性变化的重视程度不同,得分在1.2到2.1之间波动。九个主要行业中有七个显示出了显著的试点活动但几乎没有或完全没有结构性变化。投资与颠覆之间的这种差距直接展示了大规模的GenAI鸿沟现象,即广泛的实验却没有带来转型。
受访者对这一现状的评价非常直白。一位中型制造业企业的首席运营官总结了普遍的情绪:"LinkedIn上的宣传说一切都变了,但在我们的运营中,没有什么根本性的东西发生了变化。我们处理合同的速度快了一些,但这就是全部的改变。"
从试点到生产部署之间存在着一道陡峭的鸿沟,这在部署率上表现得最为明显:只有5%的定制企业AI工具达到了生产阶段。聊天机器人之所以成功,是因为它们易于尝试且灵活,但在关键工作流程中却因为缺乏记忆和定制化而失败。这一根本性差距解释了为什么大多数企业仍然停留在鸿沟的错误一侧。
研究揭示了GenAI采用工具的调查与试点和实际实施之间存在急剧下降,通用解决方案和定制解决方案之间存在显著差异。通用大型语言模型(如ChatGPT和Copilot)的调查率为80%,试点率为50%,成功实施率为40%。而嵌入式或任务特定的GenAI工具的调查率为60%,试点率仅为20%,成功实施率只有5%。需要注意的是,这些数字基于个人访谈的方向性准确度,而非公司官方报告。样本量因类别而异,成功定义在不同组织间可能有所不同。研究团队将任务特定GenAI工具的"成功实施"定义为用户或高管认为造成了显著且持续的生产力或利润表影响的工具。
企业AI解决方案95%的失败率代表了GenAI鸿沟最清晰的体现。困在错误一侧的企业继续投资于无法适应其工作流程的静态工具,而那些跨越鸿沟的企业则专注于具备学习能力的系统。通用的大型语言模型聊天机器人看似显示出很高的试点到实施转化率(约83%),然而这掩盖了感知价值的更深层次分裂,也揭示了为什么大多数企业仍然困在GenAI鸿沟的错误一侧。
在访谈中,企业用户对像ChatGPT和Copilot这样的消费级工具给予了持续的正面评价。这些系统因其灵活性、熟悉度和即时效用而受到赞扬。然而,同样的用户对定制或供应商推销的AI工具却表现出压倒性的怀疑态度,将它们描述为脆弱、过度工程化或与实际工作流程不匹配。正如一位首席信息官所说:"今年我们看过几十个演示,也许有一两个真正有用。其余的要么是包装产品,要么是科学项目。"
虽然热情和预算往往足以启动试点项目,但将这些试点转化为集成到工作流程中并具有持续价值的系统仍然很少见,这一模式定义了处于GenAI鸿沟错误一侧的企业的体验。企业,这里定义为年收入超过1亿美元的公司,在试点数量和分配给AI相关计划的员工数量上领先。然而这种强度并未转化为成功,这些企业报告的试点到规模化转化率最低。相比之下,中型市场公司行动更快、更果断。表现最好的企业报告从试点到全面实施的平均时间线为90天,而企业则需要九个月或更长时间。
关于企业GenAI的五个误区也值得澄清。第一个误区是AI将在未来几年内取代大多数工作,但研究发现GenAI导致的裁员有限,而且只发生在已经受到AI显著影响的行业。高管们对未来3到5年的招聘水平没有达成共识。第二个误区是生成式AI正在改变业务,但研究显示采用率虽高,转型却很少见。只有5%的企业将AI工具大规模集成到工作流程中,九个行业中有七个没有显示出真正的结构性变化。第三个误区是企业在采用新技术方面很慢,但实际上企业对采用AI非常渴望,90%的企业认真探索过购买AI解决方案。第四个误区是阻碍AI发展的最大因素是模型质量、法律、数据或风险问题,但实际上真正阻碍的是大多数AI工具不学习、不能很好地集成到工作流程中。第五个误区是最好的企业正在构建自己的工具,但实际上内部构建的失败率是外部购买的两倍。

在令人失望的企业部署数字背后,隐藏着一个令人惊讶的现实:AI已经在改变工作方式,只是不是通过官方渠道。研究发现了一个蓬勃发展的"影子AI经济",员工使用个人ChatGPT账户、Claude订阅和其他消费者工具来自动化他们工作的重要部分,往往没有IT部门的知识或批准。规模相当可观,虽然只有40%的公司表示购买了官方的大型语言模型订阅,但超过90%受访公司的员工报告定期使用个人AI工具完成工作任务。事实上,几乎每个人都以某种形式在工作中使用大型语言模型。
在许多情况下,影子AI用户报告说,他们通过个人工具每天多次使用大型语言模型完成每周工作量的很大一部分,而他们公司的官方AI计划仍然停留在试点阶段。这个影子经济表明,当个人能够使用灵活、响应迅速的工具时,他们可以成功跨越GenAI鸿沟。认识到这一模式并在此基础上建立的企业,代表了企业AI采用的未来。具有前瞻性的企业开始通过学习影子使用情况、分析哪些个人工具提供价值,然后再采购企业替代方案来弥合这一差距。
投资配置模式也揭示了GenAI鸿沟的作用机制。50%的GenAI预算流向了销售和市场营销,但后台办公自动化往往产生更好的投资回报率。这种偏见反映了更容易的指标归因,而不是实际价值,并使企业专注于错误的优先事项。就功能重点而言,GenAI工具的投资高度集中。由于GenAI支出尚未在各个企业中正式量化,研究团队要求高管将假设的100美元分配给不同职能。销售和营销职能在受访企业中占据了约70%的AI预算分配。
需要注意的是,虽然GenAI投资的总体职能分配(例如约50%用于销售和营销)在高管访谈中相对一致,但子类别和用例细分应被视为方向性的。子类别反映了综合笔记和轶事模式,而非精确的会计核算。公司类型驱动了显著的差异。例如,制造商和医疗保健提供商通常将极少的投资用于销售和营销,而在运营方面过度投资。科技和媒体公司通常优先考虑营销、内容和开发人员生产力。专业服务倾向于文档自动化和法律合规工具。
销售和营销之所以占主导地位,不仅因为可见性,还因为结果可以轻松衡量。诸如演示量或电子邮件响应时间等指标直接与董事会级别的关键绩效指标保持一致。相比之下,法律、采购和财务职能提供的效率提升更为微妙,包括更少的合规违规、简化的工作流程或加速的月末流程,这些都很重要但很难在高管对话或投资者更新中体现。一位财富1000强制药公司的采购副总裁清楚地表达了这一挑战:"如果我购买一个工具来帮助我的团队更快地工作,我如何量化这种影响?当它不会直接推动收入或降低可衡量的成本时,我如何向我的首席执行官证明这一点?我可以说它帮助我们的科学家更快地获得工具,但这与底线影响相距甚远。"
这种投资偏见通过将资源导向可见但往往转型较少的用例,延续了GenAI鸿沟,而后台职能中投资回报率最高的机会却资金不足。除了衡量挑战之外,信任和社会认同在购买决策中仍然具有决定性作用。一家主要消费品公司的采购主管抓住了许多买家面临的困境:"我每天都会收到无数电子邮件,声称提供最佳的GenAI解决方案。有些演示令人印象深刻,但建立信任才是真正的挑战。有这么多选择涌入我们的收件箱,我们严重依赖同行推荐和我们网络的推荐。"
这突出了一个更广泛的模式:仅凭产品质量很少足够。推荐、先前的关系和风险投资介绍仍然是企业采用的更强预测因素,而不是功能或功能集。
试点为何停滞:鸿沟背后的学习差距
让企业停留在GenAI鸿沟错误一侧的主要因素是学习差距,即那些不学习、集成不良或不匹配工作流程的工具。用户喜欢ChatGPT用于简单任务,但由于其缺乏记忆而在关键任务工作中放弃它。缺失的是能够适应、记住和进化的系统,这些能力定义了鸿沟两侧之间的差异。
为了理解为什么如此少的GenAI试点项目能够超越实验阶段,研究团队调查了52个企业的执行赞助商和一线用户。参与者被要求对常见的规模化障碍按1到10的频率进行评分,其中10代表最常遇到的障碍。结果揭示了一个可预测的领导者:抵制采用新工具。然而,第二高的障碍被证明比预期的更为重要。
用户被要求对每个问题按1到10的分数进行评分,结果显示不愿意采用新工具得分最高,其次是模型输出质量担忧,然后是糟糕的用户体验、缺乏执行赞助和具有挑战性的变更管理。需要注意的是,这些分数反映的是报告频率而非障碍影响的客观测量,并且可能因行业和企业规模而有显著差异。
模型质量担忧的突出地位最初看起来违反直觉。ChatGPT和类似工具的消费者采用激增,超过40%的知识工作者个人使用AI工具。然而,那些将这些工具集成到个人工作流程的同一用户,在企业系统中遇到它们时却将其描述为不可靠。这个悖论说明了用户层面的GenAI鸿沟。
这种偏好揭示了一个根本性的紧张关系。每天使用ChatGPT完成个人任务的专业人士,对企业工作要求学习和记忆能力。大量工作人员已经私下使用AI工具,报告生产力提升,而他们公司的正式AI计划却陷入停滞。这种影子使用创造了一个反馈循环:员工知道好的AI应该是什么样子,这使得他们对静态的企业工具更加不容忍。
研究团队的后续访谈揭示了一个引人注目的矛盾。那些对企业AI工具表示怀疑的专业人士往往是消费者大型语言模型界面的重度用户。当被要求比较他们的体验时,出现了三个一致的主题。在比较通用大型语言模型界面与集成工具时,用户偏好驱动因素显示,约80%的人认为"答案更好",约70%的人表示"已经熟悉界面",约60%的人说"更信任它"。

一家中型律所的公司律师体现了这种动态。她的企业投资了5万美元购买专业合同分析工具,但她一直默认使用ChatGPT进行起草工作:"我们购买的AI工具提供了有限定制选项的僵化摘要。使用ChatGPT,我可以引导对话并迭代,直到得到我需要的确切内容。根本的质量差异是显而易见的。ChatGPT始终产生更好的输出,尽管我们的供应商声称使用相同的底层技术。"
这种模式表明,每月20美元的通用工具通常在即时可用性和用户满意度方面优于成本高出数个数量级的定制企业系统。这个悖论体现了为什么大多数企业仍然停留在GenAI鸿沟的错误一侧。
鉴于用户对消费者大型语言模型界面的偏好,研究团队调查了是什么阻止了更广泛地将其用于关键任务工作。这里的障碍被证明与一般可用性问题不同,并直接揭示了定义GenAI鸿沟的学习差距。关键工作流程集成的障碍调查显示,约60%的用户表示"它不从我们的反馈中学习",约55%说"每次需要太多手动上下文",约50%认为"无法将其定制到我们的特定工作流程",约45%表示"在边缘情况下崩溃且不适应"。
那位支持ChatGPT进行初稿的同一位律师,在敏感合同方面划清了界限:"它非常适合头脑风暴和初稿,但它不保留客户偏好的知识或从以前的编辑中学习。它重复同样的错误,每次会话都需要大量的上下文输入。对于高风险的工作,我需要一个能够积累知识并随时间改进的系统。"
这种反馈指向了让企业停留在GenAI鸿沟错误一侧的根本学习差距。用户欣赏消费者大型语言模型界面的灵活性和响应性,但需要当前工具无法提供的持久性和上下文意识。
当研究团队要求企业用户对高风险工作的不同选项进行评级时,偏好层次变得清晰。在"你会将这个任务分配给AI还是初级同事"的问题中,对于快速任务(电子邮件、摘要、基本分析),70%的人更喜欢AI,30%更喜欢人类。对于复杂项目(多周工作、客户管理),只有10%更喜欢AI,90%更喜欢人类。

结果揭示,AI已经赢得了简单工作的战争,70%的人更喜欢AI起草电子邮件,65%用于基本分析。但对于任何复杂或长期的工作,人类以9比1的比例占主导地位。分界线不是智力,而是记忆、适应性和学习能力,这正是区分GenAI鸿沟两侧的特征。
代理AI(Agentic AI),这类通过设计嵌入持久记忆和迭代学习的系统,直接解决了定义GenAI鸿沟的学习差距。与每次都需要完整上下文的当前系统不同,代理系统维护持久记忆、从交互中学习,并可以自主编排复杂的工作流程。早期的企业实验展示了端到端处理完整查询的客户服务代理、监控和批准常规交易的财务处理代理,以及跨渠道跟踪参与度的销售管道代理,这些都展示了自主性和记忆如何解决企业识别的核心差距。
跨越鸿沟:最佳建设者如何成功
站在GenAI鸿沟正确一侧的企业有一个共同的方法:他们构建能够从反馈中学习的自适应嵌入式系统。那些成功跨越鸿沟的顶级初创公司专注于狭窄但高价值的用例,深度集成到工作流程中,并通过持续学习而非广泛的功能集来扩展。领域流畅度和工作流程集成比华丽的用户体验更重要。
在访谈中,研究团队观察到GenAI初创公司之间日益分化。一些公司正在与过时的SaaS剧本作斗争,仍然困在鸿沟的错误一侧,而另一些公司则通过积极的定制和与实际业务痛点的对齐来吸引企业的注意。对GenAI工具的胃口仍然很高。几家初创公司报告在几天内签署了试点项目,并在此后不久达到了七位数的收入运行率。表现突出的不是那些构建通用工具的公司,而是那些将自己嵌入工作流程内部、适应上下文并从狭窄但高价值的立足点扩展的公司。
研究数据揭示了一个明确的模式:成功的企业和供应商是那些积极解决学习、记忆和工作流程适应问题的企业,而失败的企业要么在构建通用工具,要么试图在内部开发能力。成功的初创公司构建从反馈中学习的系统(66%的高管希望这样)、保留上下文(63%要求这样)并深度定制到特定工作流程。他们从工作流程边缘开始,进行大量定制,然后扩展到核心流程。
最成功的供应商理解,跨越GenAI鸿沟需要构建高管反复强调的系统:不仅生成内容,而且在其环境中学习和改进的AI系统。在评估AI工具时,买家一致强调一组特定的优先事项。研究团队在访谈中对这些主题进行了编码,以量化它们在采购决策中出现的频率。
高管选择GenAI供应商的方式显示,约90%的人认为"我们信任的供应商"最重要,约80%看重"深入理解我们的工作流程",约70%要求"对当前工具的最小干扰",约60%需要"清晰的数据边界",约55%期待"随时间改进的能力",约45%希望"事情变化时的灵活性"。
关于高管选择GenAI供应商的直接引用也很有启发性。关于"我们信任的供应商",有高管表示:"我们更有可能等待现有合作伙伴添加AI功能,而不是在初创公司上赌博。"关于"深入理解我们的工作流程",有人说:"大多数供应商不了解我们的审批流程或数据流是如何工作的。"关于"对当前工具的最小干扰",评论是:"如果它不能插入Salesforce或我们的内部系统,就没有人会使用它。"关于"清晰的数据边界",一位高管担心:"我不能冒客户数据与其他人的模型混合的风险,即使供应商说没问题。"关于"随时间改进的能力",反馈是:"第一周很有用,但随后它只是重复同样的错误。我为什么要使用那个?"关于"事情变化时的灵活性",有人指出:"我们的流程每季度都在演变。如果AI不能适应,我们就回到电子表格。"
对劳动力影响的担忧远低于预期。大多数用户欢迎自动化,特别是对于繁琐的手动任务,只要数据保持安全且结果可衡量。尽管传统观点认为企业抵制训练AI系统,但研究中的大多数团队表示愿意这样做,前提是好处明确且有护栏。尽管对AI感兴趣,但对新兴供应商存在明显的怀疑态度,特别是在高信任或受监管的工作流程中。许多采购负责人告诉研究团队,他们忽略了大多数初创公司的推销,无论创新如何。一家全球消费品公司的采购主管说:"我们每天都会收到数十个关于AI驱动采购工具的推销。然而,我们已建立的BPO合作伙伴已经了解我们的政策和流程。我们更有可能等待他们的AI增强版本,而不是切换到未知的供应商。"
最成功的初创公司通过执行两种策略来同时解决对学习系统的渴望和对新工具的怀疑。第一种策略是为特定工作流程定制。嵌入到非关键或相邻流程中并进行大量定制,展示明确价值,然后扩展到核心工作流程至关重要。成功的工具有两个共同特征:低配置负担和即时、可见的价值。相比之下,需要广泛企业定制的工具往往在试点阶段停滞。
从研究样本来看,成功的类别包括:用于通话摘要和路由的语音AI,用于合同和表单的文档自动化,以及用于重复性工程任务的代码生成。挣扎的类别往往是那些涉及复杂内部逻辑、不透明决策支持或基于专有启发式优化的类别。这些工具经常因深度企业特异性而遇到采用摩擦。
一些初创公司通过主导小而关键的工作流程(特别是在销售和营销方面)然后扩展而表现出色。顶级四分位数的GenAI初创公司在启动后6到12个月内达到120万美元的年化收入。根据范围的狭窄程度和执行的复杂性,可以将项目分类。狭窄范围且执行简单的项目能够快速获胜(如支出分类、合同审查),狭窄范围但执行复杂的项目处于早期试点阶段(如谈判机器人),广泛范围且执行简单的项目只能实现部分试点(如供应商风险监控),而广泛范围且执行复杂的项目则会失败(如全面采购编排)。
第二种策略是利用推荐网络。为了克服信任障碍,成功的初创公司通常使用与系统集成商的渠道合作伙伴关系、来自董事会成员或顾问的采购推荐,以及通过熟悉的企业市场进行分销。研究显示,领导者发现GenAI解决方案的方式中,供应商关系占主导地位,现有供应商合作伙伴关系占20%,新集成或合作伙伴推荐占15%。同行网络方面,非正式同行推荐占13%,董事会成员或顾问推荐占10%。活动和媒体方面,会议演示或小组讨论占9%,行业出版物或网络研讨会占6%。还有冷门入站和其他内部流程的渠道。
跨越GenAI鸿沟的窗口正在迅速关闭。企业越来越多地要求随时间适应的系统。微软365 Copilot和Dynamics 365正在整合持久记忆和反馈循环。OpenAI的ChatGPT记忆测试版预示着通用工具的类似期望。通过构建从反馈、使用和结果中学习的自适应代理,初创公司可以通过数据和集成深度建立持久的产品护城河,从而快速弥补这一差距。做到这一点的窗口很窄。在许多垂直领域,试点已经在进行中。
支持这一转型的基础设施正在通过模型上下文协议(MCP)、代理到代理(A2A)和NANDA等框架出现,这些框架实现了代理互操作性和协调。这些协议通过允许专业代理协同工作而非要求单体系统,创造了市场竞争和成本效率。这些框架构成了新兴代理网络(Agentic Web)的基础,这是一个可互操作代理和协议的网状结构,用动态协调层取代单体应用程序。
在接下来的几个季度中,几家企业将锁定几乎不可能解除的供应商关系。这18个月的时间范围反映了研究团队采访的17位采购和IT采购负责人的共识,并得到公开采购披露分析的支持,显示企业从RFP到实施的周期从两个月到18个月不等。投资于从其数据、工作流程和反馈中学习的AI系统的企业,正在创造每月复利的转换成本。一家50亿美元金融服务公司的首席信息官说:"我们目前正在评估五种不同的GenAI解决方案,但无论哪个系统最能学习和适应我们的特定流程,最终都会赢得我们的业务。一旦我们投入时间训练系统理解我们的工作流程,转换成本就变得令人望而却步。"
跨越鸿沟:最佳买家如何成功
成功跨越GenAI鸿沟的企业对AI采购的态度不同,他们像BPO客户而非SaaS客户那样行事。他们要求深度定制、从一线推动采用,并让供应商对业务指标负责。最成功的买家明白,跨越鸿沟需要合作伙伴关系,而不仅仅是购买。
在访谈中,一个洞察非常清晰:最有效的AI购买企业不再等待完美的用例或中央批准。相反,他们通过分布式实验、供应商合作伙伴关系和明确的问责制来推动采用。这些买家不仅更渴望,他们在战略上更具适应性。
在研究样本中,具有学习能力和定制化的外部合作伙伴关系约67%的时间达到部署,而内部构建的工具约为33%。虽然这些数字反映了自我报告的结果,可能无法解释所有混杂变量,但差异的幅度在受访者中是一致的。这一差距解释了为什么ChatGPT在临时任务中占主导地位但在关键工作流程中失败,以及为什么通用企业工具输给消费者大型语言模型和深度定制的替代方案。
跨越GenAI鸿沟的正确组织结构至关重要。战略合作伙伴关系成功的可能性是内部构建的两倍。成功不太依赖资源,而更多地依赖于在保留问责制的同时分散权力。跨越GenAI鸿沟的主要障碍不是集成或预算,而是组织设计。研究数据显示,当企业分散实施权力但保留问责制时,他们就会成功。
研究团队观察到GenAI实施的三种主要团队结构,这些结构在成果上存在实质性差异,反映了企业落在鸿沟的哪一侧。战略合作伙伴关系(购买)占成功部署的66%,采购外部工具,与供应商共同开发。内部开发(构建)占33%,完全内部构建和维护GenAI工具。混合模式(构建-购买)数据不足无法量化,由内部团队与外部供应商共同开发。
研究限制说明:这些百分比反映了52个企业的访谈样本,可能不代表更广泛的市场模式。成功定义在不同企业间有所不同,观察期可能无法捕捉长期实施趋势。重要限制是,这些成功率差异可能反映了组织能力而非仅仅实施方法。选择外部合作伙伴关系的企业可能在风险承受能力、采购成熟度或内部技术能力方面与那些内部构建的企业不同。外部合作伙伴关系与成功之间的相关性不一定证明因果关系。
战略合作伙伴关系在成功部署中占据了显著更高的份额,而不是内部开发工作。虽然研究团队在样本中观察到的构建计划远多于购买计划,许多企业正在探索内部开发,但成功率偏向外部合作伙伴关系。尽管缺乏关于总计划量的精确数据,但这一模式表明,尽管内部开发工作更常被尝试,但其成功率要低得多。
虽然企业经常结合方法,但通过战略合作伙伴关系构建的试点项目达到全面部署的可能性是内部构建的两倍。更引人注目的是,外部构建工具的员工使用率几乎是内部构建工具的两倍。这些合作伙伴关系通常提供更快的价值实现时间、更低的总成本和与运营工作流程更好的一致性。企业避免了从头构建的开销,同时仍然实现了定制解决方案。理解这一模式的企业能够更有效地跨越GenAI鸿沟。
在访谈中,成功跨越GenAI鸿沟的企业中出现了一致的模式:顶级买家对待AI初创公司不像软件供应商,而更像业务服务提供商,用接近用于咨询公司或BPO的基准来衡量他们。这些企业要求与内部流程和数据深度定制,根据运营结果而非模型基准对工具进行基准测试,通过早期失败进行合作,将部署视为共同演进,以及从一线经理而非中央实验室采购AI计划。
在最后一种模式中,个人贡献者和团队经理经常发挥关键作用。许多最强大的企业部署始于高级用户,这些员工已经为个人生产力尝试了ChatGPT或Claude等工具。这些"专业消费者"直觉地理解GenAI的能力和限制,并成为内部认可解决方案的早期拥护者。成功的企业不依赖中央化的AI职能来识别用例,而是允许预算持有者和领域经理提出问题、审查工具并领导推出。这种自下而上的采购与执行问责制相结合,在保持运营适应性的同时加速了采用。
尽管50%的AI预算流向销售和营销(根据高管的理论估计),但研究团队记录的一些最显著的成本节约来自后台办公自动化。虽然前台收益可见且对董事会友好,但后台部署通常提供更快的投资回报期和更清晰的成本削减。最佳企业在两个领域都产生了可衡量的价值。
前台胜利包括:潜在客户资格认定速度提高40%,通过AI驱动的跟进和消息传递,客户留存率提高10%。后台胜利包括:每年在客户服务和文档处理方面消除200万到1000万美元的BPO成本,外部创意和内容成本减少30%的代理支出,金融服务的风险检查每年节省100万美元的外包风险管理费用。
值得注意的是,这些收益是在没有实质性劳动力削减的情况下实现的。工具加速了工作,但没有改变团队结构或预算。相反,投资回报率来自减少的外部支出、消除BPO合同、削减代理费用以及用AI驱动的内部能力替代昂贵的顾问。这种模式表明,虽然销售和营销获得了大部分关注和投资,但对于愿意超越明显用例真正跨越GenAI鸿沟的企业来说,后台办公自动化可能提供更显著和可持续的回报。
关于工作影响的现实情况是,GenAI已经开始产生劳动力影响,表现为选择性替代以前外包的功能和受限的招聘模式,但不是通过大规模裁员。已经跨越GenAI鸿沟的企业展示了可衡量的外部成本削减,同时内部人员略有减少。
研究分析揭示,GenAI驱动的劳动力削减集中在历史上被视为非核心业务活动的职能:客户支持运营、行政处理和标准化开发任务。这些角色在AI实施之前就显示出脆弱性,因为它们的外包状态和流程标准化。高管们对透露由于AI导致的裁员规模持谨慎态度,但在这些企业中,客户支持运营和行政处理工作的裁员在5%到20%之间。
行业特定的招聘期望显示出与GenAI影响模式的明确相关性。在显示AI造成的结构性颠覆最小的行业(医疗保健、能源、先进制造业)中,大多数高管报告在未来五年内没有当前或预期的招聘削减。少数高管提到他们可以预期招聘减少,但承认他们目前没有系统来准确预测何时或在哪里可能发生。例如,医疗保健高管不期望减少医生或临床员工的招聘。
相反,在GenAI已经展示出可衡量影响的技术和媒体行业,超过80%的高管预计在24个月内招聘量将减少。关键发现:这种动态仍然集中在先进的AI采用者中,并且仅在目前正在经历GenAI显著颠覆的行业(技术、媒体)中。
GenAI采用为企业创造了不同的招聘策略。虽然高管对入门级或一般招聘量没有达成共识,但他们一致强调AI素养是基本能力要求。这反映了企业认识到AI熟练度代表了工作流程优化的竞争优势。一家中型制造业企业的运营副总裁说:"我们的招聘策略优先考虑展示AI工具熟练度的候选人。应届毕业生在这方面的能力往往超过经验丰富的专业人士。"
MIT的"冰山项目"分析为潜在的自动化暴露提供了定量背景:当前自动化潜力为美国劳动价值的2.27%,潜在自动化暴露为2.3万亿美元的劳动价值,影响3900万个职位。随着AI系统发展出持久记忆、持续学习和自主工具集成,这些定义跨越GenAI鸿沟的能力,这种潜在暴露将变得可行。
劳动力转型将逐渐发生,而不是通过离散的替代事件。在AI系统实现上下文适应和自主操作之前,企业影响将通过外部成本优化而非内部重组来体现。
超越个体AI代理的下一个演进是代理网络,在这个网络中,自主系统可以在整个互联网基础设施中发现、协商和协调,从根本上改变业务流程的运作方式。这一转型的基础设施已经通过模型上下文协议(MCP)、代理到代理(A2A)和NANDA等协议出现,这些协议不仅实现代理互操作性,还实现自主网络导航。在代理网络中,系统将自主发现最优供应商并在没有人工研究的情况下评估解决方案,在没有预构建连接器的情况下实时建立动态API集成,通过区块链支持的智能合约执行无信任交易,并开发跨多个平台和组织边界自我优化的新兴工作流程。
早期实验显示,采购代理独立识别新供应商并谈判条款,客户服务系统无缝跨平台协调,以及跨多个提供商的内容创作工作流程与自动化质量保证和支付。这代表了从今天的人工中介业务流程到在整个互联网生态系统中运营的自主系统的根本转变,远远超越了当前的GenAI鸿沟,重塑企业在网络化经济中发现、集成和交易的方式。
结论:弥合GenAI鸿沟
成功跨越GenAI鸿沟的企业在三个方面做得不同:他们购买而不是构建,授权一线经理而不是中央实验室,并选择深度集成同时随时间适应的工具。最具前瞻性的企业已经在试验能够在定义的参数内学习、记忆和自主行动的代理系统。
这一转型不仅标志着工具的转变,还标志着代理网络的出现:一个持久的、互联的学习系统层,可以跨供应商、领域和界面进行协作。在当今的企业技术堆栈由孤立的SaaS工具和静态工作流程定义的情况下,代理网络用能够协商任务、共享上下文和协调行动的动态代理取代了这些。
正如最初的Web分散了出版和商业一样,代理网络分散了行动,从提示转向自主的协议驱动协调。像NANDA、MCP和A2A这样的系统代表了这个网络的早期基础设施,使企业能够不是从代码而是从代理能力和交互来组合工作流程。随着企业在2026年开始通过反馈循环锁定供应商关系,跨越GenAI鸿沟的窗口正在迅速缩小。下一波采用将不是由最华丽的模型赢得,而是由那些能够学习和记忆的系统,或由那些为特定流程定制构建的系统赢得。
从构建到购买的转变,结合专业消费者采用的兴起和代理能力的出现,为能够提供学习型、深度集成的AI系统的供应商创造了前所未有的机会。那些认识到这些模式并据此行动的企业和供应商,将在后试点AI经济中建立主导地位,站在GenAI鸿沟的正确一侧。
对于目前困在错误一侧的企业来说,前进的道路很明确:停止投资需要不断提示的静态工具,开始与提供定制系统的供应商合作,并专注于工作流程集成而非华丽的演示。GenAI鸿沟不是永久的,但跨越它需要在技术、合作伙伴关系和组织设计方面做出根本不同的选择。
Q1:什么是GenAI鸿沟?
A:GenAI鸿沟是指企业在生成式AI应用上的极端分化现象。虽然95%的企业在AI上投入了大量资金却没有看到任何回报,但5%的企业已经通过AI项目创造了数百万美元的价值。这道鸿沟不是由技术质量或监管造成的,而是由企业采取的方法决定的。成功跨越鸿沟的企业专注于构建能够学习、记忆和适应的AI系统,而大多数企业仍在使用无法改进的静态工具。
Q2:为什么企业AI项目的失败率这么高?
A:企业AI项目95%的失败率主要源于学习差距。大多数GenAI系统无法保留用户反馈、无法适应具体业务场景、也无法随时间改进。虽然像ChatGPT这样的通用工具因其灵活性而受到员工欢迎,但企业级定制工具往往因为工作流程设计僵化、缺乏上下文学习能力而在试点阶段就停滞了。此外,企业更倾向于投资可见的前台功能而非高回报率的后台自动化,这种投资偏见也导致了资源错配。
Q3:企业如何才能成功跨越GenAI鸿沟?
A:成功跨越鸿沟的企业有三个共同点:第一,他们选择购买而非自建,因为外部合作伙伴的成功率是内部开发的两倍;第二,他们授权一线经理而非中央实验室来推动AI采用,让真正理解业务流程的人来选择和部署工具;第三,他们选择能够深度集成到现有工作流程并随时间学习改进的AI系统。最重要的是,这些企业像对待业务服务提供商而非软件供应商那样对待AI供应商,要求深度定制并基于业务成果而非技术指标来评估效果。
好文章,需要你的鼓励
这份由MIT NANDA项目团队完成的研究报告揭示了企业AI应用的真实现状。报告基于对52家企业的深度访谈、300多个公开AI项目的分析以及153位高管的问卷反馈,发现尽管企业在生成式AI上投入了300-400亿美元,但95%的组织没有看到任何投资回报。只有5%的企业成功跨越了"GenAI鸿沟",创造了实际价值。
这项研究开发了CaptionQA系统,通过测试AI生成的图片描述能否支持实际任务来评估其真正价值。研究发现即使最先进的AI模型在图片描述实用性方面也存在显著不足,描述质量比直接看图时下降9%-40%。研究涵盖自然、文档、电商、机器人四个领域,为AI技术的实用性评估提供了新标准。
以色列理工学院研究团队提出了一种将专家混合模型融入YOLOv9目标检测的创新方法。该方法让多个专门化的YOLOv9-T专家分工协作,通过智能路由器动态选择最适合的专家处理不同类型图像。实验显示,在COCO数据集上平均精度提升超过10%,在VisDrone数据集上提升近30%,证明了"分工合作"比单一模型更有效,为AI视觉系统提供了新思路。