新闻中心
10月19日,字节跳动大模型练习遭实习生进犯一事引发广泛重视。据多位知情的人悄悄表明,字节跳动某技能团队在本年6月遭受了一同内部技能突击事情,一名实习生因对团队资源分配不满,运用进犯代码损坏了团队的模型练习任务
据悉,该事情的首要涉事者为一名田姓实习生所为,他利用了Huggingface(HF)渠道的缝隙,在公司的同享模型中写入了损坏代码,导致模型练习效果忽高忽低,无法产生预期的练习效果。
一位前字节技能职工表明,“字节AI Lab的实习生权限和正职职工差异不大,也使得此次事情有了产生的时机”,其也对此次事情带来的恶性影响表达了忧虑,“这件事之后肯定会极大地缩短实习生的权限”。
在音讯曝出后,该名涉现实习生企图在交际渠道上驳斥谣言,将职责推给别人,不过很快便遭到了挨近字节跳动人士的否定。
据相关知情人士在Gitbub上表述,“你(指田某)在长达2个月的时间里对集群代码进行歹意进犯,对公司近30位各级职工形成巨大损伤,让你的搭档近一个季度的作业白搭。一切的记载和检查都证明这是不容狡赖的现实!”
该名人士还共享了一则查询人员对田姓实习生 (TianKeyu)的问询录音,录音中的对话复原其进犯的进程:田某最早输入的code本来是被用于影响通讯和随机性的,“最开端的时分它并不是以进犯为意图,它是为了debug,但这的确会涉及到程序的一些运作状况。可是连续它经过一些文件,便是那些upload文件,code也会被update,code就变成了进犯code。它大约的效果便是去修正code,然后就会形成一些结果。”
录音中疑似田某自己的回应承认了其经过update使得code带有了进犯性。其也对问询人员清晰说,“首要是因为某些问题形成了咱们都十分不满”。
另据风闻称此次丢失或许超越千万美元,但内部的人说实践丢失并没有风闻中那么严峻。
据了解,该事情产生于本年6月底,现在字节跳动已对田姓实习生采取了解雇处理,并将此事通报给相关职业联盟和该实习生地点的校园。
多方音讯显现,田姓实习生为国内某高校在读博士生,于2021年9月起在字节AI Lab实习,其地点的团队刚在本年4月与北大王立威团队提出了VAR研讨,在图画生成质量、推理速度、数据功率和可拓展性等方面均超越了DiT。此外,VAR的推理速度比传统自回归模型快了约20倍。