最新文章
北大团队揭秘AI安全训练为何如此脆弱——大模型中隐藏的“弹簧效应“
2025-10-11

北大团队揭秘AI安全训练为何如此脆弱——大模型中隐藏的“弹簧效应“

这项由北京大学人工智能研究院完成的研究,首次从数据压缩理论角度揭示了大型语言模型存在"弹性"现象——即使经过精心安全对齐,模型仍倾向于保持预训练时的行为分布。

当年只有30人在训练AGI:Anthropic预训练负责人访谈的万字实录,曾经的AI实验室都是通才,现在大家都是专才
2025-10-09

当年只有30人在训练AGI:Anthropic预训练负责人访谈的万字实录,曾经的AI实验室都是通才,现在大家都是专才

Y Combinator合伙人Ankit Gupta与Anthropic预训练负责人Nick Joseph最近进行了一次深度对话。

阿里10个团队耗时8个月,重磅开源深度研究智能体Tongyi DeepResearch
2025-09-19

阿里10个团队耗时8个月,重磅开源深度研究智能体Tongyi DeepResearch

阿里10个团队耗时8个月,重磅开源深度研究智能体Tongyi DeepResearch

ChatGPT如何改变了全球10%成年人的数字生活
2025-09-18

ChatGPT如何改变了全球10%成年人的数字生活

周有超过7亿用户在使用它,每天发送超过25亿条消息,相当于每秒钟有29000条消息在产生。

模型越大,长期执行力越强,剑桥团队指出传统基准测试过时
2025-09-17

模型越大,长期执行力越强,剑桥团队指出传统基准测试过时

模型越大,长期执行力越强,剑桥团队指出传统基准测试过时

教会机器人在手机上“思考”的神奇方法:浙江大学团队如何让AI学会多步骤操作
2025-09-16

教会机器人在手机上“思考”的神奇方法:浙江大学团队如何让AI学会多步骤操作

这项由浙江大学与阿里巴巴通义实验室联合开展的研究,通过创新的半在线强化学习方法,显著提升了AI界面助手在多步骤任务中的表现。UI-S1-7B模型在多个基准测试中创造了7B参数规模的新纪录,为GUI自动化代理的发展开辟了新的技术路径。

可复现、可比较、可复制的智能公共坐标系:“本地AI推动计划”正式启动
2025-09-14

可复现、可比较、可复制的智能公共坐标系:“本地AI推动计划”正式启动

可复现、可比较、可复制的智能公共坐标系:“本地AI推动计划”正式启动

拳打DeepSeek R1,比肩GPT-5,百度文心X1.1真有这么强?
2025-09-10

拳打DeepSeek R1,比肩GPT-5,百度文心X1.1真有这么强?

拳打DeepSeek R1,比肩GPT-5,百度文心X1.1真有这么强?

Google DeepMind发现AI搜索的数学局限
2025-09-04

Google DeepMind发现AI搜索的数学局限

Google DeepMind发现AI搜索的数学局限

微软造出AI播音员,单次录制90分钟多人对话!看VIBEVOICE如何重新定义语音合成?
2025-08-29

微软造出AI播音员,单次录制90分钟多人对话!看VIBEVOICE如何重新定义语音合成?

微软研究院推出VIBEVOICE,这是一种革命性的AI语音合成技术,能够一次性生成长达90分钟的多人对话音频。

上下文腐烂:当百万token成为AI模型的阿喀琉斯之踵
2025-08-28

上下文腐烂:当百万token成为AI模型的阿喀琉斯之踵

上下文腐烂:当百万token成为AI模型的阿喀琉斯之踵

AI有了自知之明,准确率飙升,Meta AI团队发布DeepConf
2025-08-26

AI有了自知之明,准确率飙升,Meta AI团队发布DeepConf

AI有了自知之明,准确率飙升,Meta AI团队发布DeepConf