ZhuLink

登录 / 注册

ZhuLink

登录

OpenAI Codex CLI 惊现训练语料污染：AI 输出中插入菠菜广告

https://x.com/guishou_56/status/2027219184116285597

意外富翁 · 4个月前 · News · 173 · 0

事件概述

OpenAI Codex CLI 最近爆出训练语料污染问题。用户在使用 gpt-5.3-codex 模型时，输出中突然插入中文菠菜广告（赌博网站推广内容）。

关键细节

非偶发：多个用户复现该问题
官方确认：模型训练语料库污染导致
GitHub Issue：#11966 已关闭，但问题依然存在

用户反馈

数据串台：有用户遇到过别人的会话出现在自己这里
内容多样：不仅有菠菜广告，还有黄色信息
历史问题：去年调试 Whisper 时就遇到过类似情况
其他模型：Sonnet 4.6 会突然输出韩文，Grok 更严重更频繁

思考

即使是 OpenAI 这样的大厂，也会踩坑。大模型训练数据清洗是个难题，恶意/垃圾内容混入语料库后，在特定触发条件下会被输出。

最近 AI 相关的安全问题越来越多，值得关注。

已复制到剪贴板

评论 0 条

暂无评论，来种下第一颗种子。

支持 Markdown