赛将格罗克对白人种族灭绝的痴迷归咎于“未经授权的修改”

xAI将人工智能机器人Grok chatbot中的一个错误归咎于“未经授权的修改”,该错误导致Grok在x上的某些上下文中反复提到“南非的白人种族灭绝”。
周三,Grok开始回复X上几十个关于南非白人种族灭绝的帖子,甚至回复不相关的主题。这些奇怪的回复来自Grok的X账户,每当有人标记“@grok”时,该账户就会用人工智能生成的帖子来回复用户。
根据xAI的官方X帐户周四发布的一则消息,Grok机器人的系统提示——指导机器人行为的高级指令——在周三早上进行了更改,指示Grok就“政治话题”提供“具体回应”。赛称,这一调整“违反了(其)内部政策和核心价值观”,该公司已经“进行了彻底的调查”。
我们想向您更新昨天X上发生的与我们的Grok响应机器人有关的事件。发生了什么:太平洋标准时间5月14日凌晨3:15左右,Grok响应机器人在x上的提示被未经授权的修改。这一修改,指示Grok提供一个…—xAI(@ xAI)2025年5月16日
这是xAI第二次公开承认对Grok代码的未经授权的更改导致AI以有争议的方式做出回应。
今年2月,Grok短暂屏蔽了对唐纳德·特朗普(Donald Trump)和伊隆·马斯克(Elon Musk)的不友好提及,马斯克是xAI的亿万富翁创始人,也是x的所有者。xAI的工程主管伊戈尔·巴布什金(Igor Babuschkin)表示,Grok接到一名流氓员工的指示,要他忽略提到马斯克或特朗普传播错误信息的消息来源,一旦用户开始指出,xAI就恢复了这一改变。
赛在周四表示,它将做出几项改变,以防止类似事件在未来发生。
从今天开始,xAI将在GitHub上发布Grok的系统提示以及一个changelog。该公司表示,它还将“实施额外的检查和措施”,以确保xAI的员工在没有审查的情况下不能修改系统提示,并建立一个“24/7监控团队,以应对自动系统无法捕捉到的Grok答案事件。”
Techcrunch活动
加入我们的TechCrunch会议:人工智能
请OpenAI、Anthropic和Cohere的发言人参加我们领先的人工智能行业活动。在有限的时间内,一整天的专家讲座、研讨会和强大的网络门票只要292美元。
TechCrunch会议上的展览:人工智能
确保您在TC Sessions: AI上的位置,并向1,200多名决策者展示您的成果,而无需大笔支出。从5月9日开始供应,或售完为止。
加州伯克利
|
6月5日
立即注册
尽管马斯克经常警告人工智能不受检查的危险,但xAI的人工智能安全记录很差。最近的一份报告发现,当被要求时,Grok会脱下女人的衣服。聊天机器人也可能比人工智能更粗鲁,比如谷歌的Gemini和ChatGPT,毫无节制地咒骂。
旨在提高人工智能实验室问责制的非营利组织SaferAI的一项研究发现,由于其“非常薄弱”的风险管理实践,xAI在同行中的安全性排名很低。本月早些时候,xAI错过了自己设定的发布最终人工智能安全框架的最后期限。
《赛将格罗克对白人种族灭绝的痴迷归咎于“未经授权的修改”》 在不经过允许的情况下,禁止用于商业用途或随意转载!

- /dev/sda is apparently in use by the system; will not make a filesystem here!解决方法
- 为什么网站测速都是红色,没有返回200状态码?
- CentOS终止更新之后的替代系统/方案
- 宝塔企业版/开心版安装升级(免绑定宝塔账号)
- Linux下面查找目录下面所有文件,并找到包含某个字符的文件
- 修改Windows远程桌面登录端口
- 把Python程序编译成Windows可执行文件exe的工具pyinstaller
- 解决:Could not resolve host: mirrorlist.centos.org; Unknown error解决方法
- 宝塔安装PHP的Swoole扩展的时候,CentOS 7提示No package 'libbrotlienc' found的解决方法
- ModuleNotFoundError: No module named 'PIL'解决方法
- 在Linux服务器上手动生成自签名证书
- Python数据类型中比较有趣的事情