深度研究系统能自我进化,谷歌发布基于扩散的TTD-DR系统 原创

深度研究系统能自我进化,谷歌发布基于扩散的TTD-DR系统

2025年2月2日,OpenAI发布了一个名叫Deep Research深度研究的功能,相当于一个能多次调用搜索工具进行报告撰写的智能体。后来,国内外AI公司也推出同类深度研究产品,包括谷歌、Anthropic、xAI、Perplexity、秘塔AI、智谱、阿里、字节等。

但谷歌认为现在市场上的深度研究产品存在明显的局限性。

深度研究系统能自我进化,谷歌发布基于扩散的TTD-DR系统

2025年7月21日,谷歌云AI研究院的研究团队开发了一种名为TTD-DR(Test-Time Diffusion Deep Researcher)的AI系统,能够像人类研究员一样,自主完成复杂的研究报告撰写工作。系统采用创新的扩散模型和自我进化算法,在生成研究报告的质量上超越了现有顶尖AI系统。

当我们写一篇深度研究报告时,通常会经历这样的过程:先在脑海中构思大纲,写出初稿,然后不断查找资料、反复修改,直到满意为止。谷歌的研究团队发现,这个看似简单的人类写作过程,其实蕴含着深刻的智慧。他们成功地将这种智慧教给了AI,创造出一个能够自主完成高质量研究报告的智能系统。

这个系统的独特之处在于,它不是简单地搜索信息然后拼凑成文,而是真正模仿人类的思维过程。就像一位经验丰富的研究员,它会先构思整体框架,写出初步草稿,然后有针对性地搜索缺失的信息,不断打磨完善。这个AI研究员在多项测试中的表现,已经超越了包括OpenAI在内的多个顶尖AI研究系统。

像画家创作一样的AI写作过程

传统的AI写作系统就像流水线工人,按部就班地完成任务:先搜索资料,再整理信息,最后生成报告。这种方法虽然能产出内容,但往往缺乏深度和连贯性。谷歌团队提出的新方法完全不同,他们让AI像画家创作油画一样工作。

深度研究系统能自我进化,谷歌发布基于扩散的TTD-DR系统

画家创作时,会先勾勒轮廓,然后逐层上色,不断调整细节,直到作品完美呈现。TTD-DR系统正是采用了类似的创作方式。它首先生成一个"粗糙的草稿",就像画家的初步素描。这个草稿可能有很多不完善的地方,信息不够准确,论述不够深入,但它提供了一个基本框架。

接下来,系统会审视这个草稿,识别出哪些地方需要更多信息支撑,哪些论点需要更有力的证据。然后,它会有针对性地搜索相关资料,就像画家为了画好某个细节而仔细观察参考物一样。获得新信息后,系统会对草稿进行"去噪"处理,其实就是去除不准确或模糊的内容,加入更精确、更有价值的信息。

这个过程会反复进行多次,每一次都让报告变得更加完善。研究团队发现,经过20次这样的迭代修改,AI生成的研究报告质量会显著提升,甚至超越许多人类研究员的作品。

自我进化的智慧组件

深度研究系统能自我进化,谷歌发布基于扩散的TTD-DR系统

如果说迭代修改是TTD-DR的第一个创新,那么"自我进化"就是它的第二个秘密武器。

想象你在组建一个研究团队,团队里有负责制定计划的策划师、负责提出问题的提问专家、负责寻找答案的调研员,以及负责撰写报告的写作高手。传统AI系统中,这些"团队成员"的能力是固定的。但在TTD-DR中,每个"成员"都能通过自我学习不断进步。

具体来说,当系统需要生成一个搜索问题时,它不会只生成一个版本,而是会同时创造多个不同的版本。然后,系统会评估哪个问题最有价值,能获得最有用的信息。通过这种方式,系统逐渐学会提出更好的问题。

同样的进化过程也发生在其他环节。在寻找答案时,系统会尝试多种搜索策略,保留最有效的方法。在撰写报告时,它会生成多个段落版本,选择最清晰、最有说服力的表达方式。这种自我进化机制确保了系统的每个组件都在不断优化,最终产出的报告质量自然水涨船高。

超越人类效率的智能协作

深度研究系统能自我进化,谷歌发布基于扩散的TTD-DR系统

研究团队通过大量实验验证了TTD-DR的效果。他们设计了多个测试场景,包括撰写长篇研究报告、回答需要深度调研的复杂问题等。在与OpenAI Deep Research的对比中,TTD-DR在长篇研究报告任务上的胜率达到了69.1%,在商业咨询类报告上的胜率更是高达74.5%。

怎么理解这个数字呢?简单来说,如果让100个评审员同时阅读TTD-DR和其他AI系统生成的报告,大约有70个人会认为TTD-DR的报告更好。这种优势不仅体现在内容的准确性上,更体现在报告的全面性、逻辑性和可读性上。

更重要的是,TTD-DR展现出了惊人的效率。传统的研究报告撰写可能需要人类研究员花费数天甚至数周的时间,而TTD-DR可以在几个小时内完成同等质量的工作。说明AI可以成为研究工作的得力助手,帮助人类更快地获取和整理信息,让研究员能够将更多精力投入到创造性思考中。

突破性的技术创新

TTD-DR的成功并非偶然,背后有着多项技术创新的支撑。研究团队巧妙地将"扩散模型"的概念应用到文本生成中。扩散模型原本是用于图像生成的技术,就像将一张模糊的照片逐步变清晰的过程。谷歌团队创造性地将这个概念用于文本,把初始的粗糙草稿看作"模糊的图像",通过不断的信息补充和优化,让它变成"清晰的报告"。

这种方法的妙处在于,它允许AI在写作过程中保持全局视野。传统方法往往是线性的,写完一部分再写下一部分,容易失去整体的连贯性。而TTD-DR始终将整个报告作为一个整体来优化,确保各部分之间的逻辑关系紧密,论述层次分明。

研究团队还解决了一个关键的技术难题:如何让AI知道什么时候该搜索新信息,搜索什么信息。他们设计了一个智能的反馈机制,让系统能够自动识别报告中的薄弱环节。比如,当系统发现某个论点缺乏数据支撑时,它会自动生成相关的搜索查询,寻找合适的证据。这种主动性和针对性,使得TTD-DR的信息搜索效率远超传统方法。

至顶AI实验室洞见

TTD-DR的出现,为许多领域带来了新的可能性。在学术研究中,它可以帮助科学家快速整理文献、撰写综述,加速科研进程。在商业领域,它能够协助分析师撰写市场研究报告、行业分析,提供决策支持。

但是,TTD-DR主要依赖文本搜索工具,还不能像人类那样浏览网页、查看图表或运行代码。对于需要深度技术分析或视觉信息处理的任务,它的能力还有待提升。

人类发明创造时,不少灵感来源于“仿生”;设计AI时,很多时候都是在“仿人”。

越来越多的实践证明,最好的AI系统不是那些试图用蛮力解决问题的系统,而是那些能够理解和模仿人类智慧的系统。通过学习人类的工作方式,AI可以变得更加智能、更加有用。

论文地址:
https://www.arxiv.org/abs/2507.16075

END

本文来自至顶AI实验室,一个专注于探索生成式AI前沿技术及其应用的实验室。致力于推动生成式AI在各个领域的创新与突破,挖掘其潜在的应用场景,为企业和个人提供切实可行的解决方案。

 

Q&A

Q1:什么是Test-Time Diffusion Deep Researcher (TTD-DR)?

A:TTD-DR是一种基于大语言模型(LLMs)的深度研究代理框架,将研究报告生成模拟为扩散过程。它通过初始草稿(“噪声”起点)和迭代的“去噪”机制,结合检索工具动态整合外部信息,逐步优化报告质量。核心设计包括报告级去噪和组件级自进化算法,显著提升了复杂研究任务中的信息整合效率和连贯性。

Q2:TTD-DR相比其他深度研究代理有哪些优势?

A:TTD-DR通过“草稿中心化”设计解决了现有代理的局限性(如信息丢失、缺乏全局上下文)。如图3所示,传统代理(如Huggingface Open DR)采用线性搜索流程,而TTD-DR通过迭代去噪和自进化算法,在长报告生成和多跳推理任务中实现最优性能。实验显示,其在LONGFORM RESEARCH等基准上的胜率超过OpenAI Deep Research达69.1%。

Q3:TTD-DR如何通过自进化算法提升研究质量?

A:自进化算法优化代理工作流的每个组件(如计划生成、搜索问题、答案合成)。如图5所示,每个组件生成多个变体,通过环境反馈(如LLM评分)和迭代修订提升质量,最终合并为高质量输出。例如,搜索答案的复杂性(图9)和查询新颖性(图10a)显著提高,从而增强最终报告的全面性。

来源:至顶AI实验室

0赞

好文章,需要你的鼓励

2025

07/25

16:32

分享

点赞