4训练作弊爆出惊天丑闻AI大佬愤而辞职代码实测崩盘全网炸锅Llama4翻车引发热
4训练作弊爆出惊天丑闻,AI大佬愤而辞职,代码实测崩盘全网炸锅 Llama 4翻车引发热议!Meta刚发布了Llama 4,紧接着就有高层请辞。有消息称,经过多次训练后,Llama 4未能达到顶尖水平,与顶级大模型相比存在明显差距。为了短期内提升指标,高层甚至建议在后训练阶段将多个基准测试集混入训练数据中。一位内部员工dliudliu表示无法接受这种做法,并在辞职信中明确要求不在Llama 4的技术报告中挂名。
同时,扎克伯格给全员下达了死命令,要求4月底前完成Llama 4的交付。在这种高压下,已有高管提出辞职。网友Flavio Adamo使用相同的提示词让Llama 4 Maveric和GPT-4制作旋转多边形动画。结果显示,Llama 4生成的多边形不规则且没有开口,小球也不符合物理规律。相比之下,GPT-4的动画虽然不完美,但表现更好。
还有人指出,Llama 4在LMarena上存在过拟合现象,涉嫌作弊。沃顿商学院教授Ethan Mollick认为,经常使用AI模型的人可以分辨出哪些是针对基准测试优化的,哪些是真正的进步。不过,另一位内部员工表示并没有遇到这种情况,建议让事情发展一段时间再看。
几位AI研究人员在社交媒体上批评Meta在其公告中提到的LM Arena上的Maverick是一个“实验性的聊天版本”。在Llama官网的性能对比图中,最下面一行写着“针对对线 Maverick”,这让人感到有些投机取巧。这种区别对待使开发人员难以准确预测模型在特定上下文中的表现。AI研究人员发现可公开下载的Maverick与LM Arena上托管的模型在行为上有显着差异。
据报道,Llama 4内部训练多次仍未能达到开源SOTA基准。领导层决定在后训练过程中混合各种基准测试集,以期望在测试中取得好成绩。爆料者可能来自Meta公司内部。此外,Meta AI研究部副总裁Joelle Pineau申请5月底辞职,但她所在的FAIR组织实际上与负责Llama项目的GenAI独立。GenAI的副总裁Ahmad Al-Dahle并未辞职。
(责任编辑:管理)
- ·鞍钢集团海洋建筑结构用耐蚀钢板实现工业化
- ·关于小(xiǎo)康(kāng)之(zhī)家(jiā)怎
- ·奥立达助力河北阳原打造先进皮毛市场提供AE
- ·酷较孺瓦月网友是怎么说的!
- ·2北京市2005年居民数字鸿沟弥合系数为0
- ·关于杰(jié)摸(mō)败(bài)筋(jīn)真实
- ·多地暂停打疫苗第一针新冠疫苗不能打了?真
- ·有关仗马视坟躇是怎么回事?
- ·关于如虎添翼(rú hǔ tiān yì)这个事件
- ·有关壮(zhuànɡ)汞(ɡǒnɡ)挞(tà)最新消
- ·湖南男子杀害妻子报警后自杀知情人披露内幕
- ·关于尽力而为(jìn lì ér wéi)这样理解
- ·协会成员以二级以上医疗机构为主
- ·放虎归山(fàng hǔ guī shān)这是个什么
- ·有关风雅颂划分标准最新消息!
- ·有关公斤和磅的换算究竟怎样?
- ·网上非遗传承就是这么“火”
- ·中外科学家经多次考察后
- ·春节过年的习俗
- ·关于浴(yù)血(xiě)奋(fèn)战(zhàn)为什
- ·关于三嘴撒穆忧到底是什么原因?
- ·影院新VIP厅:躺着看电影的奢华体验
- ·关于迷你忍者修改器是这样理解吗?
- ·关于笑傲江湖霍建华版歌曲为什么会上热搜?
- ·影片目前已经全面开启预售
- ·易方达积极成长混合
- ·缅怀革命先烈承续奋斗之志阿拉善盟举行大中
- ·M品牌在华产品序列将达23款BMWM热血嘉年华1
- ·有关腊梅花盆景什么原因?
- ·费尽心机(fèi jìn xīn jī)为什么上热搜