最新文章
模型越大,长期执行力越强,剑桥团队指出传统基准测试过时
2025-09-17

模型越大,长期执行力越强,剑桥团队指出传统基准测试过时

模型越大,长期执行力越强,剑桥团队指出传统基准测试过时

教会机器人在手机上“思考”的神奇方法:浙江大学团队如何让AI学会多步骤操作
2025-09-16

教会机器人在手机上“思考”的神奇方法:浙江大学团队如何让AI学会多步骤操作

这项由浙江大学与阿里巴巴通义实验室联合开展的研究,通过创新的半在线强化学习方法,显著提升了AI界面助手在多步骤任务中的表现。UI-S1-7B模型在多个基准测试中创造了7B参数规模的新纪录,为GUI自动化代理的发展开辟了新的技术路径。

可复现、可比较、可复制的智能公共坐标系:“本地AI推动计划”正式启动
2025-09-14

可复现、可比较、可复制的智能公共坐标系:“本地AI推动计划”正式启动

可复现、可比较、可复制的智能公共坐标系:“本地AI推动计划”正式启动

拳打DeepSeek R1,比肩GPT-5,百度文心X1.1真有这么强?
2025-09-10

拳打DeepSeek R1,比肩GPT-5,百度文心X1.1真有这么强?

拳打DeepSeek R1,比肩GPT-5,百度文心X1.1真有这么强?

Google DeepMind发现AI搜索的数学局限
2025-09-04

Google DeepMind发现AI搜索的数学局限

Google DeepMind发现AI搜索的数学局限

微软造出AI播音员,单次录制90分钟多人对话!看VIBEVOICE如何重新定义语音合成?
2025-08-29

微软造出AI播音员,单次录制90分钟多人对话!看VIBEVOICE如何重新定义语音合成?

微软研究院推出VIBEVOICE,这是一种革命性的AI语音合成技术,能够一次性生成长达90分钟的多人对话音频。

上下文腐烂:当百万token成为AI模型的阿喀琉斯之踵
2025-08-28

上下文腐烂:当百万token成为AI模型的阿喀琉斯之踵

上下文腐烂:当百万token成为AI模型的阿喀琉斯之踵

AI有了自知之明,准确率飙升,Meta AI团队发布DeepConf
2025-08-26

AI有了自知之明,准确率飙升,Meta AI团队发布DeepConf

AI有了自知之明,准确率飙升,Meta AI团队发布DeepConf

Google DeepMind首席科学家Jeff Dean访谈:谷歌大脑项目起因是吴恩达和我谈神经网络,看好未来AI两个方向
2025-08-26

Google DeepMind首席科学家Jeff Dean访谈:谷歌大脑项目起因是吴恩达和我谈神经网络,看好未来AI两个方向

The Moonshot Podcast发布了一期深度访谈视频,X公司"创始人"Astro Teller与Google DeepMind首席科学家Jeff Dean进行了一场近一小时的对话,回顾了Google Brain项目的早期历程。

微软研究院推出革命性提示词语言POML:普通开发者也能轻松驾驭大模型
2025-08-22

微软研究院推出革命性提示词语言POML:普通开发者也能轻松驾驭大模型

微软研究院推出革命性提示词语言POML:普通开发者也能轻松驾驭大模型

数学AI也会“装懂“?四川大学研究团队揭示AI缺失的核心能力
2025-08-21

数学AI也会“装懂“?四川大学研究团队揭示AI缺失的核心能力

四川大学研究团队发现,当前先进的AI模型在面对信息不完整的数学问题时,缺乏主动询问澄清信息的能力,更倾向于基于假设给出答案。