您现在的位置:首页 > Meta exec否认该公司人为提高了Llama 4的基准分数
Meta exec否认该公司人为提高了Llama 4的基准分数
来源:网络 日期:2025-04-08 点击:0 

“一位Meta高管否认了一个传言,即该公司训练其人工智能模型在基准测试中表现良好,同时隐瞒了模型的弱点。”
一位Meta高管周一否认了一个传言,即该公司训练其新的人工智能模型在特定基准上表现良好,同时隐瞒了模型的弱点。
梅塔生成式人工智能副总裁艾哈迈德·达尔(Ahmad Al-Dahle)在X上的一篇帖子中说,梅塔在“测试集”上训练其骆马4 Maverick和骆马4 Scout模型“根本不是真的”在人工智能基准测试中,测试集是用来评估模型训练后的性能的数据集合。测试集上的训练可能会误导性地夸大模型的基准分数,使模型看起来比实际更有能力。
上周末,一个未经证实的谣言开始在X和Reddit上流传,称Meta人为提高了其新模型的基准测试结果。该谣言似乎源于中国社交媒体网站上一个用户的帖子,该用户声称已从Meta辞职,以抗议该公司的基准做法。
关于Maverick和Scout在某些任务上表现不佳的报道助长了这一谣言,Meta决定使用一个实验性的未发布版本的Maverick,以在基准LM Arena上获得更好的分数。X上的研究人员已经观察到公开下载的Maverick与LM Arena上托管的模型在行为上的明显差异。
Al-Dahle承认,一些用户看到了Maverick和Scout在托管模型的不同云提供商之间的“混合质量”。
Al-Dahle说:“由于我们在模型准备就绪后就放弃了它们,我们预计需要几天时间才能实现所有的公共实现。”“我们将继续努力解决我们的漏洞修复和入职合作伙伴。”
关键词:人工智能,美洲驼4,Meta
《Meta exec否认该公司人为提高了Llama 4的基准分数》 在不经过允许的情况下,禁止用于商业用途或随意转载!
《Meta exec否认该公司人为提高了Llama 4的基准分数》 在不经过允许的情况下,禁止用于商业用途或随意转载!

- 严厉打击利用服务器做违法犯罪等行为
- 5月在雅典举行的TechCrunch严格意义上的VC将邀请一位特殊的客人:希腊总理
- Astro Teller将于10月加入我们的TechCrunch Disrupt 2025
- 英国初创企业Isembard获得900万美元,将关键行业的制造业务迁回国内
- OpenAI试图使其即将推出的开放式人工智能模型成为同类最佳
- 严格来说,VC将前往雅典,就欧洲创新和投资进行深入探讨
- OpenAI高管表示,如果有机会,该公司将购买谷歌的Chrome浏览器
- Rivian选举Cohere首席执行官进入董事会,这是这家电动汽车制造商看好人工智能的最新信号
- Flipkart将在IPO前将总部迁至印度
- 为什么网站测速都是红色,没有返回200状态码?
- CentOS终止更新之后的替代系统/方案
- 宝塔企业版/开心版安装升级(免绑定宝塔账号)
- Linux下面查找目录下面所有文件,并找到包含某个字符的文件
- 修改Windows远程桌面登录端口
- 把Python程序编译成Windows可执行文件exe的工具pyinstaller
- 解决:Could not resolve host: mirrorlist.centos.org; Unknown error解决方法
- 宝塔安装PHP的Swoole扩展的时候,CentOS 7提示No package 'libbrotlienc' found的解决方法
- ModuleNotFoundError: No module named 'PIL'解决方法
- 在Linux服务器上手动生成自签名证书
- Python数据类型中比较有趣的事情
- CentOS Linux下更换为阿里云的源repo