电脑端 Arranger: A Role-Puzzling Adventure「排列大师:角色解谜大冒险」 Trash Goblin「变废为宝哥布林」 移动端 Teacup「茶杯」 下期预告 两款 “神秘游戏” 注:游戏截止!5/14 链接: 官网 • 打包 • PC • Android & iOS 2 个帖子 - 2 位参与者 阅读完整话题
WIRED – 7 May 26 ChatGPT Has ‘Goblin’ Mania in the US. In China It Will ‘Catch You Steadily’ OpenAI’s chatbot has some weird linguistic tics in Chinese that are driving users crazy. 6 个帖子 - 6 位参与者 阅读完整话题
Epic 本周送出 2 款 PC 游戏,分别是《变废为宝哥布林》与《排布者:角色解谜冒险》,以及手机游戏《Teacup》。一个是轻松解压的哥布林摆摊模拟器,一个是把“推箱子”玩出花的解谜冒险,没有大体量 3A,但都属于安静、舒服、适合周末慢慢玩的“小而美”作品。@Appinn 下周解锁神秘游戏 目前
https://store.epicgames.com/zh-CN/p/arranger-a-rolepuzzling-adventure-dbfde7 https://store.epicgames.com/zh-CN/p/trash-goblin-cd5fd7 一键领取: https://store.epicgames.com/purchase?offers=1-2df8b055a5674c8e9211fc51f8efd210-4fb95c3f11754061b2b1a94e60d848bd&offers=1-f14e8d865ad04b93a5df850ce7a59fe2-40980262fdb24c149094f3febfe84cb6 1 个帖子 - 1 位参与者 阅读完整话题
在《Wired》披露OpenAI曾向其编程模型下达“永远不要谈论哥布林、gremlins、浣熊、巨魔、食人魔、鸽子或其他动物或生物”的内部指令后,OpenAI已在官网发文解释这一现象,称这是一种模型在训练过程中形成的“奇怪习惯”。 OpenAI表示,这类涉及哥布林及其他生物的隐喻表达,最早是在GPT-5.1模型上被明显注意到的,尤其出现在启用“Nerdy”人格选项时。 按照该公司的说法,随着后续模型持续迭代,这种表达方式不但没有消失,反而逐步扩散。 OpenAI在说明中指出,问题的根源与强化学习训练有关:虽然相关奖励最初只施加在“Nerdy”这一人格条件下,但强化学习并不能保证学到的行为始终严格局限在触发它的条件之内。 一旦某种语言风格或表达癖好获得奖励,后续训练过程就可能将其传播到其他场景,尤其是在这些输出又被重复用于监督微调或偏好数据训练时,这种倾向还会被进一步强化。 报道称,随着OpenAI在今年3月停止提供“Nerdy”人格,这类关于哥布林和gremlins的表述确实有所减少,但并未彻底消失。 尤其是在Codex编程工具所使用的GPT-5.5模型中,由于OpenAI在查明“根本原因”之前就已经开始训练该模型,相关表达仍然残留其中。 也正因如此,OpenAI最终不得不对Codex加入非常具体的约束,明确要求它不要再提及这些神话生物。 不过,报道也提到,如果有人反而希望自己的AI在写代码时保留一点这种“哥布林风格”,OpenAI甚至还公开分享了一种可用于撤销相关限制的方法。 从这次回应来看,这场看似荒诞的“哥布林问题”背后,实际上反映的是大模型训练中的一个更现实难题:某些原本只应出现在特定人格设定下的语言习惯,可能在奖励机制和后续训练的叠加作用下外溢到更广泛的模型行为中。 对OpenAI而言,这不仅是一次关于模型风格失控的公开解释,也让外界得以窥见其在修正生成式AI细微行为偏差时所面临的复杂性。 查看评论
从 openai: 为什么我们的模型喜欢上了哥布林 | 奇怪的黑话 继续讨论: 省流: 内部训练gpt的时候,给他设定了人格,比如「书呆子」(Nerdy) 此类人格非常容易使用生物词汇 随着不断迭代,就变成了如今这个样子 我倒是没见过() 因为是英文用户专属() 文源APPso 截掉了部分无关紧要的内容() 过程中也分享一点自己的内容 https://openai.com/index/where-the-goblins-came-from 不过中文用户好像并没有这种人格: 除非是那个天马行空 原来现在选什么都没用了() 哥布林万岁≧▽≦! 顺便写了个小说 ChatGPT ChatGPT - 哥布林大合影 Shared by 星缘 via ChatGPT 还是蛮有意思的 7 个帖子 - 5 位参与者 阅读完整话题
Ars Technica – 29 Apr 26 OpenAI Codex system prompt includes explicit directive to "never talk about... Directions also include system instructions to act like "you have a vivid inner life." 10 个帖子 - 9 位参与者 阅读完整话题
IT之家 4 月 30 日消息,OpenAI 昨日(4 月 29 日)发布博文,复盘发现 GPT-5.1 系列及后续 AI 模型出现异常行为,在回答中频繁使用“哥布林”(goblin)和“小魔怪”(gremlin)等生物隐喻。 OpenAI 官方调查后发现,自从 GPT-5.1 系列发布以来,“哥布林”一词使用率上升 175%,“小魔怪”上升 52%。这一现象并非偶发,而是模型行为被特定奖励信号塑造的结果。 调查溯源发现,异常源于“书呆子”人格定制功能的训练过程。该功能仅占 ChatGPT 总回复量的 2.5%,却贡献了 66.7% 的“哥布林”提及量。 审计显示,原本用于鼓励该人格风格的奖励模型,在 76.2% 的数据集中对包含生物词汇的输出给予了更高评分。 技术团队发现,这种行为具有跨场景泛化能力。尽管奖励仅在“书呆子”条件下应用,但强化学习无法保证限制习得行为。 随着含生物词汇的输出被用于后续监督微调,模型形成了“奖励-生成-训练”的正反馈循环,导致该行为扩散至其他场景。IT之家附上相关图表如下: OpenAI 针对此问题,已采取多项措施。技术团队移除了偏好生物词汇的奖励信号,并从训练数据中过滤了包含相关词汇的内容。受限于训练周期,GPT-5.5 未能完全规避此问题,开发团队通过添加指令提示进行了缓解。 相关阅读: 《 OpenAI Codex 系统提示词披露,GPT-5.5 AI 模型“永不谈论哥布林” 》 参考 Where the goblins came from
IT之家 4 月 30 日消息,科技媒体 Ars Technica 今天(4 月 30 日)发布博文,报道称在最新开源的 Codex CLI 代码中,OpenAI 披露了 GPT-5.5 模型的系统提示词, 其中包含一条令人费解的禁令:严禁讨论哥布林、小精灵等生物。 在长达 3500 多个词的基础指令集中,一条针对特定生物的禁令引发了广泛关注,GPT-5.5 模型在和用户查询没有存在绝对且明确的关联性前, 明确禁止讨论哥布林(goblins)、小精灵(gremlins)、浣熊(raccoons)、巨魔(trolls)、食人魔(ogres)和鸽子(pigeons)等动物与生物。 这一禁令在指令中重复出现了 2 次,与“禁止使用表情符号”及“禁止执行破坏性命令”等常规操作规范并列。 对比同一 JSON 文件中早期模型的系统提示,并未发现类似的对特定生物的禁令,这表明该描述是 GPT-5.5 最新版本中特有的现象。该媒体分析认为,这可能是 OpenAI 为了解决新模型在无关对话中频繁“幻觉”出哥布林等生物内容而采取的针对性技术措施。 社交媒体上的大量用户反馈佐证了这一推测。不少用户近期投诉 GPT 在处理完全无关的话题时,会莫名其妙地聚焦于哥布林。 这种怪异的输出倾向不仅影响了用户体验,也暴露了大模型在生成控制上的不稳定性。虽然 OpenAI 工程师 Nick Pash 强调这不是营销噱头,但这一独特的“漏洞”已经演变成了社区的热门话题。 IT之家附上参考地址 models.json
https://openai.com/index/where-the-goblins-came-from/ 从GPT-5.1开始,我们的模型开始形成一种奇怪的习惯:他们越来越多地在隐喻中提到哥布林、小妖精和其他生物。与通过坦克评估或训练指标激增时出现并指向具体变化的模型漏洞不同,这个错误是悄悄渗透进来的。回答中出现一个"小妖精"可能无害,甚至很有魅力。不过,跨越模型世代,这个习惯变得难以忽视:哥布林不断繁殖,我们需要弄清它们的来源。 我们在三月发布GPT-5.4后,正式退休了"书呆子"个性。在训练中,我们去除了哥布林-仿射奖励信号,并过滤了包含生物词汇的训练数据,使哥布林更不容易过度出现或出现在不合适的语境中。不幸的是,GPT-5.5在我们找到哥布林根源之前就开始训练了。当我们在Codex中开始测试GPT-5.5时,OpenAI员工立刻注意到他们对哥布林的奇怪亲和力,于是我们添加了一个开发提示指令(新窗口打开)以减轻。毕竟,Codex相当宅。 4 个帖子 - 3 位参与者 阅读完整话题