11:33 · Apr 14, 2025 · Mon 科技圈🎗在花频道📮 Meta高管否认Llama 4分数造假 Meta生成AI副总裁否认了公司为提高新模型Llama 4在特定基准测试中的表现而进行调整的传言,称其“根本不属实”。他明确指出,公司并未在测试集上训练模型以抬高分数。 该传言源自社交媒体,声称Meta人为提高了Llama 4 Maverick和Scout模型的基准测试结果。有报告称这些模型在某些任务上表现不佳,以及Meta使用未发布版本在LM Arena获得高分,助长了此猜测。 Meta高管承认,不同云服务商托管的模型质量存在差异,表示模型刚发布,需要几天时… × Llama 4排名降至第32位,前期排名为作弊刷榜LM Arena📮投稿 ☘️频道 🌸聊天 😁 328 🤣 198 💊 16 🎉 9 ❤️ 5 🌚 5 👍 4 🤪 3