01 反转再反转之
年度最佳魔幻短剧
02 事件主体
北大研究生VS国内top大厂
字节的处理态度是什么?
2024年8月字节已辞退该实习生,并将其行为同步给所在学校和行业联盟,用以惩戒教育。
11月5日,字节跳动曾发布面向内部全员的《企业纪律与职业道德委员会通报》,进一步披露该事件。通报称,2024年6月至7月,集团商业产品与技术部门前实习员工田某某,因对团队资源分配不满,通过编写、篡改代码等形式恶意攻击团队研究项目的模型训练任务,造成资源损耗。公司已与其解除实习协议,同步阳光诚信联盟及企业反舞弊联盟,并同步至其就读学校处理。
11月28日,因田同学毫无悔过之意并在互联网发布虚假言论诋毁公司,字节跳动起诉前实习生田某某篡改代码攻击公司内部模型训练一案,已获北京市海淀区人民法院正式受理。
03 田柯宇论文是什么水平?
NIPS best paper:AI界诺奖
04 各方吃瓜群众怎么看
观点一-资深码农:千万不要成为我的同事!
不上升问题高度,我就想说一下行内人为啥不给他说话,因为他的所作所为真的戳到了我们痛处
本来,训十次模型就会有八次结果不符合预期,天天都在想昨天引入了什么变量导致这次的结果这么差?以自己为例,我的心路历程是:反省数据质量,反省超参,反省 do_sample 时候运气太差了,反省启动训练的时候是不是起错命令了,反省推理的时候是不是选错模型了…… 甚至有时候会觉着训练机器是不是有问题。
每天都已经都快被模型效果不符合预期给逼疯了,这时候有人告诉你说:以后还应该反省一下同事有没有在搞破坏,字节就发生过这样的事情。
fine,thank you。老板惹了你,你不去报复老板,你把同事全给捅了。真是服了,是觉着牺牲这点算力能影响字节上市是怎么了?同事这几个月养家糊口的工资绩效,倒是实打实的被嚯嚯了,还有这几个月的技术认知也完全得不到成长。如果从学生的视角来看问题,田的行为就像是:自己和导师吵架了,硬要拉着全实验室一起延毕。
抛开德行不谈,这种能写出 best paper 的人的确是 AI 需要的人才,前提是别成为我的同事
观点二:不走寻常路,天才无需被定义!
我如果是硅谷大厂高层(幻想时刻),这时正是挖人的大好时机!反正字节这么一告,全中国的大厂高校都肯定拉黑他了。此刻出手802w帮他还债,再让他欠下7年卖身契当牛马为我好好干活,田柯宇必然是感激涕零,必是自感飘零半生未遇明主愿拜我为义父。有此吕布加盟,妥善使用,怎么会拿不下新sota!
观点三:人品比人才重要
观点四:这已经属于刑事犯罪了
【有奖调研】2024年了,开发者们过得还好吗?码客人生开启了新一轮的程序员幸福指数问卷调查,参与问卷调研:https://dworks.zhiding.cn/f/DecZmP,幸运用户还可获得50元京东卡。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
Amazon研究团队开发出CompLLM压缩技术,能让AI处理长文档的速度提升4倍,内存消耗减半。该技术将长文档分段压缩成"概念嵌入",实现线性复杂度处理,解决了传统AI在处理超长文本时的计算瓶颈。实验显示在处理超长文档时性能优于传统方法,压缩结果可重复使用,为AI应用的效率优化提供了新方案。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
延世大学研究团队开发了BESPOKE评估基准,通过收集30位用户三周内2870个真实会话数据,从需求对齐、内容深度、语调和解释方式四个维度评估AI助手个性化能力。研究发现当前主流AI系统个性化表现普遍不足,平均得分仅60多分,但通过智能利用用户历史信息可显著改善效果,为开发更贴心的个性化AI助手提供了科学评估工具。