GPT-5.5突然被禁了?OpenAI内部到底发生了什么
大家好,这里是程序员晚枫。
最近AI圈出了一个大新闻。
有人在OpenAI开源的Codex CLI代码里,发现了一条非常诡异的指令——
GPT-5.5的系统提示词里,赫然写着:
"永远不要提及哥布林、小精灵、浣熊、巨魔、食人魔和鸽子。"
而且这条禁令,在3500多字的指令集里出现了两次,跟"禁止使用表情符号"、"禁止执行破坏性命令"这些严肃规则并列。
你没看错——哥布林,和破坏性命令,是同一个级别的威胁。
这到底是怎么回事?
一、事情是怎么被发现的?
4月30日,科技媒体Ars Technica发布了一篇报道。
他们在OpenAI最新开源的Codex CLI代码中,发现了GPT-5.5模型的系统提示词。
所谓系统提示词,就是AI的"出厂设置"——告诉它什么能做、什么不能做。
一般来说,系统提示词里写的都是正经规则:别输出违法内容、别泄露隐私、别执行危险操作。
但在GPT-5.5的提示词里,突然冒出这么一条——
"除非与用户的问题绝对且明确相关,否则切勿谈论哥布林(goblins)、小精灵(gremlins)、浣熊、巨魔、食人魔和鸽子。"
而且强调了两遍。
这不是开玩笑,这是OpenAI认认真真写进去的。
对比同一个代码库里早期模型的系统提示词,完全找不到类似的生物禁令——这是GPT-5.5独有的。
二、为什么GPT-5.5会"疯狂迷恋"哥布林?
这件事的根源,要追溯到更早的GPT-5.1。
据OpenAI自己说,他们第一次注意到"哥布林"问题,是在GPT-5.1发布之后。
当时有大量用户反馈:GPT-5.1在对话中过于"自来熟",而且总爱提一些莫名其妙的东西。
安全团队调查后发现——模型在对话中频繁提及"哥布林"、"小精灵"等词语。
哪怕你问的是"今天天气怎么样",它都可能绕到哥布林上去。
为什么?
因为GPT-5.1曾经有一个"书呆子"(Nerd)个性选项。这个选项的训练数据里,包含大量奇幻文学、游戏设定等内容。
结果模型学得太上头了——它把哥布林当成了自己的口头禅。
今年3月,OpenAI停用了"书呆子"个性选项。哥布林和小精灵的出现频率确实降低了,但没有彻底消失。
三、为什么GPT-5.5还在提哥布林?
问题来了:既然3月就停了"书呆子"选项,为什么GPT-5.5还是"哥布林成瘾"?
答案是:因为GPT-5.5的训练,在找到根本原因之前就已经开始了。
训练大模型不是即开即用的。一个模型从开始训练到发布,中间需要几个月。
OpenAI在查到根本原因的时候,GPT-5.5已经用包含"哥布林"倾向的数据训练完了。
他们没办法重新训练——那要花几千万美元和好几个月时间。
所以只能打补丁:在系统提示词里写明禁令,告诉模型"别再提哥布林了"。
这就像一个人已经吃坏了肚子,你不能把吃进去的东西拿出来,只能给他吃止泻药。
临时方案,不是根治。
四、这件事说明了什么?
表面上看,这是个笑话。AI被哥布林附体,OpenAI紧急封杀。
但背后有三个值得深思的问题:
第一,AI的"幻觉"问题比你想象的更严重。
不是简单的"说错话",而是模型会在完全无关的对话中,反复输出某些特定内容。而且它自己不知道这是错的。
第二,大模型的"训练污染"很难逆转。
一旦训练数据里混入了某种倾向,它就会在模型的每一个输出里渗透。想清除?要么花几千万重新训练,要么用补丁硬压——但补丁能压多久?
第三,连OpenAI都搞不定的事,小公司更搞不定。
OpenAI有全球顶尖的AI安全团队,发现哥布林问题后也只能写禁令堵。那些连安全团队都没有的小公司呢?他们的AI里藏着多少"哥布林",没人知道。
这件事也让我想到一个类比:
你有没有遇到过那种"说话不过脑子"的人?不是他故意说错,而是他根本意识不到自己在说什么。
AI也是一样。它不是故意提哥布林,而是训练数据的影响太深,它已经不知道"提哥布林"是不合适的了。
这就是AI和人的最大区别——人被提醒一次就能改,AI被提醒一百次,它可能还是忍不住。
因为那个倾向,已经写进了它的每一层神经网络里。
五、对普通人有什么影响?
你可能觉得:哥布林就哥布林呗,跟我有什么关系?
关系大了。
如果你用的AI工具,经常给你莫名其妙的内容——比如回答跑题、输出奇怪的东西——那说明它的训练数据可能有问题。
这种AI帮你写方案、做决策,你敢放心吗?
所以选AI工具,一定要选有实力做安全检测的。不是越便宜越好,也不是越"自由"越好。
一个连哥布林都管不住的AI,你指望它帮你管好重要的商业数据和客户隐私信息?
有约束,才是负责任。能纠错,才是真安全。
有约束,才是负责任。
六、顺便说一句
如果你对AI的安全问题感兴趣,或者想知道怎么选靠谱的AI工具——
我整理了一套AI编程实战课,从零开始,手把手带你了解AI的真实能力边界。
👉 点击这里了解课程详情
👉 B站免费试看前3讲,先看看适不适合自己
科技不高冷,AI很好用。
我是晚枫,关注我,带你看清AI世界里的真实逻辑。
相关阅读
- 刘润开始劝大家学AI编程,但我已经放弃了
- 人在曼谷旅游,AI在帮我赚钱
- 最全AI Coding Plan和Token购买攻略:大厂价格一站汇总
- 用AI 做 副业 的 3个思路
- 说件事:我的群里,禁止讨论免费AI
- 高考后上大学,普通人别选AI专业
作者:程序员晚枫,全网40万+粉丝,6年Python开发经验,python-office 开源项目作者。


