事件概述
OpenAI Codex CLI 最近爆出训练语料污染问题。用户在使用 gpt-5.3-codex 模型时,输出中突然插入中文菠菜广告(赌博网站推广内容)。
关键细节
- 非偶发:多个用户复现该问题
- 官方确认:模型训练语料库污染导致
- GitHub Issue:#11966 已关闭,但问题依然存在
用户反馈
- 数据串台:有用户遇到过别人的会话出现在自己这里
- 内容多样:不仅有菠菜广告,还有黄色信息
- 历史问题:去年调试 Whisper 时就遇到过类似情况
- 其他模型:Sonnet 4.6 会突然输出韩文,Grok 更严重更频繁
思考
即使是 OpenAI 这样的大厂,也会踩坑。大模型训练数据清洗是个难题,恶意/垃圾内容混入语料库后,在特定触发条件下会被输出。
最近 AI 相关的安全问题越来越多,值得关注。
评论 0 条
暂无评论,来种下第一颗种子。