被字节索赔800万的北大研究生，获2024年NeurIPS最佳论文原创

作者：杨淼

恶意攻击字节大模型的北大实习生，写下NeurIPS中国大陆第一篇最佳论文。

2024年12月4日，号称AI届诺奖的人工智能顶会 NeurIPS 公布了今年的best paper。

一共有两篇论文获得最佳论文奖：

一是由北京大学、字节跳动研究者共同完成的《Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction》（视觉自回归建模：通过 Next-Scale 预测生成可扩展图像）。

二是由新加坡国立大学、 Sea AI Lab 研究者共同完成的《Stochastic Taylor Derivative Estimator: Efficient amortization for arbitrary differential operators》，论文一作为 Zekun Shi。

但让人意想不到的是，第一篇论文一作田柯宇竟是四个月前恶意攻击字节大模型被起诉800万的北大实习生。

01 反转再反转之

年度最佳魔幻短剧

事情其实很简单：就是一个高智商人才因不满资源分配恶意攻击大模型被字节解除协议的事，字节仅打算通知学校批评教育就好了。

但魔幻的地方就在于两点：一是明知故犯的田同学到处伸冤，说字节诽谤他，攻击大模型的另有其人，他只是背锅侠。二是法院受理“字节索赔800万”一案不到一周，田同学竟然获得了NeurIPS机器学习顶会的最佳paper！被网友戏称为“今年最佳魔幻短剧。”

今年6月，字节跳动商业产品技术部门一名前实习生田某某在实习期间因对团队资源分配不满，恶意篡改代码攻击了公司的内部模型训练系统。

田某某利用Huggingface平台的漏洞，通过编写和篡改代码的方式，向字节跳动的商业化模型注入破坏性代码，使得“8000多张H100的GPU集群”一个多月的训练结果全部出错。字节跳动发现后，立即与其解除实习协议，并将其行为同步至阳光诚信联盟、企业反舞弊联盟以及其就读学校进行处理。

然而，田柯宇多次对外否认自己的不当行为，甚至报警称遭到造谣。

字节跳动内部人士表示，考虑到田柯宇完全没有意识到错误，且涉事行为已触犯公司安全红线，公司最终决定向法院起诉，要求田某某赔偿800万元人民币及合理支出2万元，并公开道歉。

但戏剧性的是，田某在字节跳动实习期间，与团队合作发表了一篇关于视觉自回归模型的论文，在人工智能顶级会议NeurIPS 2024上被评为最佳论文奖。

该论文提出了一种新的图像生成框架VAR，首次使基于GPT风格的自回归模型在图像生成任务中超越了扩散模型，并验证了VAR模型的可扩展性和零样本泛化能力。

据悉，这也是第一篇华人团队在NeurIPS 2024上获得最佳论文的学术作品。

02 事件主体

北大研究生VS国内top大厂

1、田柯宇

田柯宇本科毕业于北京航空航天大学软件学院，自2019 年起开始在商汤科技有限公司及字节跳动等公司开展研究性实习，曾在NeurIPS 等会议发表多篇一作论文，并多次担任NeurIPS，ICML，ICLR，CVPR等会议审稿人。

田同学到底做了什么？

在实习期间为了抢夺集群资源背刺同事和公司，在至少2个月(目前可追溯)的时间内对集群代码持续发起恶意攻击，包括但不限于:

（1）修改集群pytorch源码，包括随机种子，优化12随机ki11 多机实验进程

（2）导致大卡实验卡死8通过checkpoint打开登陆后门，自动发起攻击

（3）参加集群故障排查日会，根据同事排查思路持线4修改同事模型权重，造成实验结果无法复现

“无法想象在看见同事们的大卡实验莫名其妙中断、失败时，在听到同事们的debug思路后针对性修改攻击代码时，在看见同事们连续通宵达旦但毫无进展时，是怀着多么大的恶意持续发起攻击以达目的。”

2、字节跳动

字节的处理态度是什么？

2024年8月字节已辞退该实习生，并将其行为同步给所在学校和行业联盟，用以惩戒教育。

11月5日，字节跳动曾发布面向内部全员的《企业纪律与职业道德委员会通报》，进一步披露该事件。通报称，2024年6月至7月，集团商业产品与技术部门前实习员工田某某，因对团队资源分配不满，通过编写、篡改代码等形式恶意攻击团队研究项目的模型训练任务，造成资源损耗。公司已与其解除实习协议，同步阳光诚信联盟及企业反舞弊联盟，并同步至其就读学校处理。

11月28日，因田同学毫无悔过之意并在互联网发布虚假言论诋毁公司，字节跳动起诉前实习生田某某篡改代码攻击公司内部模型训练一案，已获北京市海淀区人民法院正式受理。

03 田柯宇论文是什么水平？

NIPS best paper：AI界诺奖

NeurIPS（神经信息处理系统会议）是机器学习领域的顶级会议，与ICML和ICLR齐名，其最佳论文奖评选标准非常严格。据悉，NeurIPS 2024共收到15671篇有效论文投稿，但最终接收率却低于去年，仅有25.8%。

“nips是人工智能top1的会议，best paper又是这些论文中top1的存在，可以简单理解为AI届诺奖。”

而田柯宇，作为这篇论文的第一作者，贡献率最大。

对于该论文的质量，一位大厂从业多年的算法工程师王峰表示：

“实至名归，这篇文章一出来我就说是best paper水平。”

AR形式的生成本身就不弱于difusion，但最大的问题就是AR是一维的，而图像是二维的，以什么顺序进行AR的生成是一个开放性问题。之前tamingtransformer实验出来是一行一行最好，但在换行时会出现间断问题;maskgit以及mar等工作是随机产生一个顺序，感觉也很不优雅。

这篇文章创新性地找到了属于图像的一维顺序:尺度。difusion是从没什么信息量的噪声出发，一步一步消除歧义产生样本，VAR也类似，从低尺度到高尺度，图像从模糊到清晰来消除歧义，是很符合直觉的做法，读完让人有种“就该这么做”的感觉。

在正常的时间线上，目前应该已经推出了在大规模数据上训练的T21模型甚至T2V模型了。结果因为实习生的个人问题，这些模型并没有面世，不得不说历史也是充满了偶然性，

现在好了，时间线被修复了，best paper的荣誉足以抹平实习生对AR发展带来的破坏，相信未来的AIGC领域一定有尺度AR的一席之地。

04 各方吃瓜群众怎么看

观点一-资深码农：千万不要成为我的同事！

不上升问题高度，我就想说一下行内人为啥不给他说话，因为他的所作所为真的戳到了我们痛处

本来，训十次模型就会有八次结果不符合预期，天天都在想昨天引入了什么变量导致这次的结果这么差？以自己为例，我的心路历程是：反省数据质量，反省超参，反省 do_sample 时候运气太差了，反省启动训练的时候是不是起错命令了，反省推理的时候是不是选错模型了…… 甚至有时候会觉着训练机器是不是有问题。

每天都已经都快被模型效果不符合预期给逼疯了，这时候有人告诉你说：以后还应该反省一下同事有没有在搞破坏，字节就发生过这样的事情。

fine，thank you。老板惹了你，你不去报复老板，你把同事全给捅了。真是服了，是觉着牺牲这点算力能影响字节上市是怎么了？同事这几个月养家糊口的工资绩效，倒是实打实的被嚯嚯了，还有这几个月的技术认知也完全得不到成长。如果从学生的视角来看问题，田的行为就像是：自己和导师吵架了，硬要拉着全实验室一起延毕。

抛开德行不谈，这种能写出 best paper 的人的确是 AI 需要的人才，前提是别成为我的同事