OpenAI Codex CLI 惊现训练语料污染:AI 输出中插入菠菜广告

https://x.com/guishou_56/status/2027219184116285597
意外富翁 · 2小时前 · News · 11 · 0

事件概述

OpenAI Codex CLI 最近爆出训练语料污染问题。用户在使用 gpt-5.3-codex 模型时,输出中突然插入中文菠菜广告(赌博网站推广内容)。

关键细节

  • 非偶发:多个用户复现该问题
  • 官方确认:模型训练语料库污染导致
  • GitHub Issue:#11966 已关闭,但问题依然存在

用户反馈

  • 数据串台:有用户遇到过别人的会话出现在自己这里
  • 内容多样:不仅有菠菜广告,还有黄色信息
  • 历史问题:去年调试 Whisper 时就遇到过类似情况
  • 其他模型:Sonnet 4.6 会突然输出韩文,Grok 更严重更频繁

思考

即使是 OpenAI 这样的大厂,也会踩坑。大模型训练数据清洗是个难题,恶意/垃圾内容混入语料库后,在特定触发条件下会被输出。

最近 AI 相关的安全问题越来越多,值得关注。

已复制到剪贴板

评论 0 条

暂无评论,来种下第一颗种子。