一群 - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-06-09 12:45:38+08:00 · tech

如图所示，添加一个320k的上下文文件，让他去里面找，上下文就已经98%了，之前测350k的就不行了 1 个帖子 - 1 位参与者阅读完整话题

LinuxDo 最新话题 · 2026-06-09 11:24:33+08:00 · tech

升级了macos之后发现不能用codex了我是自己搭的中转然后一群人一起用就我一个人升级了系统然后升级完我的codex就一直中断一个问题出几行字之后就直接中断了出现了对话框然后其他人没有这个问题就很离谱然后中转这边提示这个报错有佬了解这个情况的吗 ps：用上了/goal 模式后就正常了不会中断了但是中转还是报错这个 5 个帖子 - 3 位参与者阅读完整话题

[游戏] 3 天，我用 LLM 造了一群会记忆、会自保、会贸易、会谈恋爱、还会抗命的 AI 游戏

v2ex · 2026-06-04 11:11:40+08:00 · tech

开始不知道大家有没有玩过文明 6 、红警、铁锈战争、Unciv 、骑砍这类游戏，反正我小时候很喜欢玩哈哈，初中时还组过战队打比赛来着。有一天我在刷 ByteTech 时见到了一个关于 AI 小镇的文章，当时就想着能不能把 AI 接入到游戏里，使游戏里的每个单位都有自己的想法，自己行动，自己生存，于是，便有了这个游戏。 github 开源地址： https://github.com/wunameya/qx 体验地址： qx.wuname.eu.org (用了 cloudflare 家的 cdn ，如果感觉很慢可以打开科学上网) 一些截图没错，AI 也会谈恋爱，并且可以生孩子（生的孩子自动加入己方阵营）。没错，AI 也可以交易和赠予物品。没错，AI 也会打猎和建造建筑以及吃饭。架构玩法介绍实现很简单，就是一股脑把周围环境信息、记忆、这个世界的规则、玩家给的方针、能选择的动作都喂给大模型，最后大模型给出最合理的动作。 ATB + AP：让执行阶段既有顺序又有节奏这是一个战旗类的游戏，AI 行动肯定要有个行动顺序单位行动顺序不是简单轮流，而是类似 ATB 的行动条模型。速度受多种因素影响：基础机动能力；装备修正；人格倾向，例如勇气、攻击性、审慎；饥饿、疲劳、受伤、士气等状态；当前任务偏置；连续同阵营行动的平衡惩罚。每个单位在执行阶段有 AP 。攻击、移动、观察、防御、生产、建造、强化、交易等动作消耗不同 AP 。饥饿和疲劳会压缩行动能力。 AI 决策：把模型关进合法动作空间我的做法是把 AI 决策拆成四层：服务端生成候选动作 ↓ LLM 在候选空间里选择 ↓ 结构化 Schema 校验 ↓ 业务规则二次裁决 ↓ 执行器修改世界状态先枚举候选，再让模型选择单位行动前，服务端会基于真实世界状态生成动作候选，例如：可以移动到哪些相邻格；可以攻击哪些敌人；可以观察、防御、撤退；可以吃什么、喝什么、捡什么；可以和谁交谈、交易、表白、救援；可以在哪些地形上采集、狩猎、钓鱼、采矿；可以建造、拆除、收获哪些设施；如果没有好动作，至少可以 hold 或 observe 。 LLM 看到的不是一个无限开放世界，而是一个经过服务端裁剪的合法动作空间。这件事非常关键：不要用 prompt 请求模型遵守规则，要用程序把非法动作从动作空间里删掉。 Prompt 模板：不是把世界一股脑喂给模型单位决策 Prompt 的核心不是“描述得越多越好”，而是把信息分层、裁剪、结构化。当前模板大致分成这些块：单位决策提示词版本: action_params_v4 当前回合 / 当前阶段 / 本次可用 AP MOVE 坐标白名单：只列本回合真正可到达的空地阵营自然语言方针上下文：全局方针 + 单位任务 + 即时令单位资料：属性、HP 、饥饿、背包、装备、位置、阵营单位人格：勇气、忠诚、攻击性、审慎、社交、稳定等记忆摘要：近期事件 + 长期摘要 + 闪回记忆关系网：对附近单位的信任、亲密、恐惧、竞争等世界知识：这个单位已经学到的地形/资源/敌情规律环境摘要：脚下地形、设施、天气、最近威胁、可见友军/敌军合法候选动作列表：attack/move/trade/build/dialogue/hold... 参数填写规则：每类 action 能填哪些字段，哪些字段必须为空决策流程：先确认合法动作，再理解方针，再按风险排序，最后输出 JSON 其中几个设计点很关键：环境信息只给局部和摘要：地图不会整张展开，而是给“视野内地形”“最近敌军距离”“本回合可到达地块”“脚下可做事项”等压缩信息。记忆不是全量聊天记录：短期记忆保留事件粒度，长期记忆用摘要；再加上关系、世界知识和闪回召回。动作空间是结构化枚举：模型不是自由写动作，而是在服务端生成的候选动作中选。玩家方针是强信号，不是硬 RPC ：Prompt 会明确注入方针和任务，但后续还有服从度、风险和合法性裁决。对应的核心构造代码可以压缩成下面这个片段：输出解析：JSON Schema + 业务校验 + 兜底动作当前没有用正则解析自然语言，也没有让模型直接调用游戏函数。LLM 走的是结构化 JSON：服务端根据候选动作动态生成 JSON Schema ； Provider 使用 OpenAI-compatible 的结构化输出能力；返回后先做 JSON Schema 校验；再把 choice 映射回候选动作；最后用业务规则重新校验；失败时降级为保守动作，例如 hold 、observe 或 confused decision 。动态 Schema 的重点是： action 是当前候选动作枚举， move 坐标用 const 限死到合法坐标。执行入口也保持这条边界：模型只产出 unitDecisionPayload ，真正落地必须经过 validateDecision 和 executeDecision 。记忆系统：角色连续性的底层设施 LLM NPC 最大的问题不是不聪明，而是容易“无历史”。如果一个角色刚被队友救过，下一回合却完全忘了这件事，那它就只是一个会说话的状态机。反过来，如果把所有历史都塞进 prompt ，又会造成上下文爆炸、成本上升、响应变慢。所以记忆系统要解决的不是“多记一点”，而是：记住值得记住的，忘掉应该忘掉的，并在相似情境下想起来。结构化记忆，而不是聊天记录数组记忆被分成多个类别：实体记忆：我认识谁，他做过什么；空间记忆：哪里危险，哪里有资源；关系记忆：谁救过我，谁背叛过我；事件记忆：一次战斗、一次受伤、一次交易；世界知识：阵营、地形、敌人动向；长期摘要：跨多个回合压缩后的生平片段。每条记忆都有重要性、情绪权重、显著度、是否永久、来源和发生回合。显著度、遗忘和闪回记忆会随时间衰减，但不是线性消失。重要事件、强情绪事件、关系事件会保留更久。当前环境如果和历史事件相似，还会触发“闪回”。例如：单位再次进入曾经被伏击的森林；附近出现曾经伤害过它的人；天气、地形、敌人组合与某段痛苦记忆高度相似。这类记忆会被重新召回，并进入本次决策上下文。这比“最近 N 条聊天记录”更接近角色认知：人不是机械回放全部历史，而是在处境相似时想起关键片段。短期事件 + 长期摘要长期对局里，事件会越来越多。系统会把较旧的记忆压缩成长期摘要，保留角色人生轨迹，而不是保留每个细节。所以记忆分两种粒度：短期：事件粒度，适合即时决策长期：摘要粒度，适合人格连续性这也是控制 LLM 成本的关键。恋爱与家庭：关系不是玩家按钮，而是双方同意恋爱系统没有把“结婚”做成玩家直接触发的按钮。触发条件分为三层：前置关系：两名单位必须有多轮真实对话，并且双方关系都达到熟悉阈值；提议判断：LLM 同时扮演双方，判断是否有人主动提出确认亲密关系；双方同意：只有双方都真心同意，关系才成立。 Prompt 里不会直接写一个“好感度=80 可以结婚”的硬规则，而是把关系摘要、对话历史、性格、阵营压力和最近事件放进上下文。好感度在规则层表现为 relationTier 、互相信任/亲密等关系状态； LLM 负责把这些状态翻译成当下是否愿意推进关系。孩子出生也不是纯随机。名字、生平和人格向量由 LLM 根据父母资料生成，但人格会经过规则层归一化；如果模型失败，则使用规则 fallback 。孩子的基础人格是父母人格均值与一个确定性随机人格混合：这个设计避免了两个问题：玩家不能强迫单位恋爱；模型也不能凭一句浪漫台词绕过双方同意和关系门槛。贸易：等价交换靠候选生成和同意校验贸易系统的核心不是让模型“理解经济学”，而是让服务端先生成可交易候选：谁有物品、谁有钱、距离是否相邻、物品基础价值是多少、能否赠与/售卖/调拨金币。模型只能在这些候选里选择。执行时，交易接收方还会单独做一次同意判断。这个 Prompt 明确要求目标单位只代表自己判断，可以因为敌我关系、风险、战略价值、补给不足或不信任而拒绝。所以“会不会亏本买卖”的答案是：系统允许单位因为关系、救急或战略需要做非等价交换，但不会让模型凭空创建交易；接收方可以拒绝，失败或格式异常也默认拒绝。经济公平由候选价格、背包/钱包校验和双方同意共同约束。总结感想这里写一些最近开发的感想吧。似乎将 AI 接入游戏的落地还很少，但我觉得如果真的落地了我觉得现在的游戏将会更加有意思，毕竟谁不想和一个活生生的，会自己思考的 AI 、NPC 打交道呢。这仅仅是一个 Demo ，后续有时间我也会继续迭代的。加入更多的规则和玩法，让 AI 持续去探索，我觉得这样这个游戏将会越来越有趣，比如增加更多的建筑，更多的事件，甚至将每个单位的智商属性和使用的大模型进行挂钩，智商属性越高的 AI 越聪明，对记忆系统进行优化等等，我相信如今大模型的能力也能够驾驭得了这么多的输入。我也觉得如今 AI 大模型的发达，可能更利好于个人开发者，其一呢个人开发者往往使用的是很通用的技术，而不是像企业一样有繁琐的流程、各种基建。AI 训练的语料也都是最直接、原始的方式，所以个人开发者的技术栈与预训练语料天然对齐，而企业往往需要一套封装。比如一般个人开发者上线是直接使用 Linux 命令、docker ，而企业往往都会自建一套自己的流程和平台，这次游戏还有以前我做的个人项目上线往往都是让 AI 自己开发完成就自己上线了，但是在企业想做到这一步可能还得投入不少的人力成本来训练 AI 。其二呢 AI 把过去个人开发者必须外包的设计、文案等职能内化到一人手中，让 "一人公司" 第一次具备商业可行性。比如这次游戏的一些设计、文案都是由 AI 设计的（也抄了不少 Unciv 的）。标题中的三天，其实是断断续续加起来的三天。放在三年前，我相信随便拉一个编程高手，或者拉一个经验丰富，合作默契的团队，三天肯定是做不出这样一个玩意的，即使是一个 demo ，可能三周还差不多？但是现在，仅仅是我这样一个还没毕业的菜鸟，只花了三天时间做出来了。可以见到 AI 对咱们的提效是多么巨大。不仅仅是软件行业，在各行各业，我觉得 AI 的冲击都将会更加猛烈。从 chatgpt2022 年出来，那时我好像还高中来着，那时借助 AI 编程的方式是把代码粘贴到聊天框里，然后他吐出来我再粘回去。到 2024 用的 copilot ，就是根据上下文自动提示代码，然后 tab 补全。2025 用的是 cursor ，就能够读取项目下的所有代码，然后根据提示词自己写代码了。到如今的 codex ，claudecode ，和 cursor 的区别，就是直接把看代码的地方扣掉了。AI 在编程落地的方式突飞猛进，在其他领域的发展我也相信也会这样突飞猛进。有了 AI 的帮助，我相信人类能离理想中的乌托邦更进一步。

3 天，我用 LLM 造了一群会记忆、会自保、会贸易、会谈恋爱、还会抗命的 AI 游戏

V2EX - 技术 · 2026-06-04 10:34:15+08:00 · tech

开始不知道大家有没有玩过文明 6 、红警、铁锈战争、Unciv 、骑砍这类游戏，反正我小时候很喜欢玩哈哈，初中时还组过战队打比赛来着。有一天我在刷 ByteTech 时见到了一个关于 AI 小镇的文章，当时就想着能不能把 AI 接入到游戏里，使游戏里的每个单位都有自己的想法，自己行动，自己生存，于是，便有了这个游戏。 github 开源地址： https://github.com/wunameya/qx 体验地址： qx.wuname.eu.org (用了 cloudflare 家的 cdn ，如果感觉很慢可以打开科学上网) 一些截图没错，AI 也会谈恋爱，并且可以生孩子（生的孩子自动加入己方阵营）。没错，AI 也可以交易和赠予物品。没错，AI 也会打猎和建造建筑以及吃饭。架构玩法介绍实现很简单，就是一股脑把周围环境信息、记忆、这个世界的规则、玩家给的方针、能选择的动作都喂给大模型，最后大模型给出最合理的动作。 ATB + AP：让执行阶段既有顺序又有节奏这是一个战旗类的游戏，AI 行动肯定要有个行动顺序单位行动顺序不是简单轮流，而是类似 ATB 的行动条模型。速度受多种因素影响：基础机动能力；装备修正；人格倾向，例如勇气、攻击性、审慎；饥饿、疲劳、受伤、士气等状态；当前任务偏置；连续同阵营行动的平衡惩罚。每个单位在执行阶段有 AP 。攻击、移动、观察、防御、生产、建造、强化、交易等动作消耗不同 AP 。饥饿和疲劳会压缩行动能力。 AI 决策：把模型关进合法动作空间我的做法是把 AI 决策拆成四层：服务端生成候选动作 ↓ LLM 在候选空间里选择 ↓ 结构化 Schema 校验 ↓ 业务规则二次裁决 ↓ 执行器修改世界状态先枚举候选，再让模型选择单位行动前，服务端会基于真实世界状态生成动作候选，例如：可以移动到哪些相邻格；可以攻击哪些敌人；可以观察、防御、撤退；可以吃什么、喝什么、捡什么；可以和谁交谈、交易、表白、救援；可以在哪些地形上采集、狩猎、钓鱼、采矿；可以建造、拆除、收获哪些设施；如果没有好动作，至少可以 hold 或 observe 。 LLM 看到的不是一个无限开放世界，而是一个经过服务端裁剪的合法动作空间。这件事非常关键：不要用 prompt 请求模型遵守规则，要用程序把非法动作从动作空间里删掉。 Prompt 模板：不是把世界一股脑喂给模型单位决策 Prompt 的核心不是“描述得越多越好”，而是把信息分层、裁剪、结构化。当前模板大致分成这些块：单位决策提示词版本: action_params_v4 当前回合 / 当前阶段 / 本次可用 AP MOVE 坐标白名单：只列本回合真正可到达的空地阵营自然语言方针上下文：全局方针 + 单位任务 + 即时令单位资料：属性、HP 、饥饿、背包、装备、位置、阵营单位人格：勇气、忠诚、攻击性、审慎、社交、稳定等记忆摘要：近期事件 + 长期摘要 + 闪回记忆关系网：对附近单位的信任、亲密、恐惧、竞争等世界知识：这个单位已经学到的地形/资源/敌情规律环境摘要：脚下地形、设施、天气、最近威胁、可见友军/敌军合法候选动作列表：attack/move/trade/build/dialogue/hold... 参数填写规则：每类 action 能填哪些字段，哪些字段必须为空决策流程：先确认合法动作，再理解方针，再按风险排序，最后输出 JSON 其中几个设计点很关键：环境信息只给局部和摘要：地图不会整张展开，而是给“视野内地形”“最近敌军距离”“本回合可到达地块”“脚下可做事项”等压缩信息。记忆不是全量聊天记录：短期记忆保留事件粒度，长期记忆用摘要；再加上关系、世界知识和闪回召回。动作空间是结构化枚举：模型不是自由写动作，而是在服务端生成的候选动作中选。玩家方针是强信号，不是硬 RPC ：Prompt 会明确注入方针和任务，但后续还有服从度、风险和合法性裁决。对应的核心构造代码可以压缩成下面这个片段：输出解析：JSON Schema + 业务校验 + 兜底动作当前没有用正则解析自然语言，也没有让模型直接调用游戏函数。LLM 走的是结构化 JSON：服务端根据候选动作动态生成 JSON Schema ； Provider 使用 OpenAI-compatible 的结构化输出能力；返回后先做 JSON Schema 校验；再把 choice 映射回候选动作；最后用业务规则重新校验；失败时降级为保守动作，例如 hold 、observe 或 confused decision 。动态 Schema 的重点是： action 是当前候选动作枚举， move 坐标用 const 限死到合法坐标。执行入口也保持这条边界：模型只产出 unitDecisionPayload ，真正落地必须经过 validateDecision 和 executeDecision 。记忆系统：角色连续性的底层设施 LLM NPC 最大的问题不是不聪明，而是容易“无历史”。如果一个角色刚被队友救过，下一回合却完全忘了这件事，那它就只是一个会说话的状态机。反过来，如果把所有历史都塞进 prompt ，又会造成上下文爆炸、成本上升、响应变慢。所以记忆系统要解决的不是“多记一点”，而是：记住值得记住的，忘掉应该忘掉的，并在相似情境下想起来。结构化记忆，而不是聊天记录数组记忆被分成多个类别：实体记忆：我认识谁，他做过什么；空间记忆：哪里危险，哪里有资源；关系记忆：谁救过我，谁背叛过我；事件记忆：一次战斗、一次受伤、一次交易；世界知识：阵营、地形、敌人动向；长期摘要：跨多个回合压缩后的生平片段。每条记忆都有重要性、情绪权重、显著度、是否永久、来源和发生回合。显著度、遗忘和闪回记忆会随时间衰减，但不是线性消失。重要事件、强情绪事件、关系事件会保留更久。当前环境如果和历史事件相似，还会触发“闪回”。例如：单位再次进入曾经被伏击的森林；附近出现曾经伤害过它的人；天气、地形、敌人组合与某段痛苦记忆高度相似。这类记忆会被重新召回，并进入本次决策上下文。这比“最近 N 条聊天记录”更接近角色认知：人不是机械回放全部历史，而是在处境相似时想起关键片段。短期事件 + 长期摘要长期对局里，事件会越来越多。系统会把较旧的记忆压缩成长期摘要，保留角色人生轨迹，而不是保留每个细节。所以记忆分两种粒度：短期：事件粒度，适合即时决策长期：摘要粒度，适合人格连续性这也是控制 LLM 成本的关键。恋爱与家庭：关系不是玩家按钮，而是双方同意恋爱系统没有把“结婚”做成玩家直接触发的按钮。触发条件分为三层：前置关系：两名单位必须有多轮真实对话，并且双方关系都达到熟悉阈值；提议判断：LLM 同时扮演双方，判断是否有人主动提出确认亲密关系；双方同意：只有双方都真心同意，关系才成立。 Prompt 里不会直接写一个“好感度=80 可以结婚”的硬规则，而是把关系摘要、对话历史、性格、阵营压力和最近事件放进上下文。好感度在规则层表现为 relationTier 、互相信任/亲密等关系状态； LLM 负责把这些状态翻译成当下是否愿意推进关系。孩子出生也不是纯随机。名字、生平和人格向量由 LLM 根据父母资料生成，但人格会经过规则层归一化；如果模型失败，则使用规则 fallback 。孩子的基础人格是父母人格均值与一个确定性随机人格混合：这个设计避免了两个问题：玩家不能强迫单位恋爱；模型也不能凭一句浪漫台词绕过双方同意和关系门槛。贸易：等价交换靠候选生成和同意校验贸易系统的核心不是让模型“理解经济学”，而是让服务端先生成可交易候选：谁有物品、谁有钱、距离是否相邻、物品基础价值是多少、能否赠与/售卖/调拨金币。模型只能在这些候选里选择。执行时，交易接收方还会单独做一次同意判断。这个 Prompt 明确要求目标单位只代表自己判断，可以因为敌我关系、风险、战略价值、补给不足或不信任而拒绝。所以“会不会亏本买卖”的答案是：系统允许单位因为关系、救急或战略需要做非等价交换，但不会让模型凭空创建交易；接收方可以拒绝，失败或格式异常也默认拒绝。经济公平由候选价格、背包/钱包校验和双方同意共同约束。总结感想这里写一些最近开发的感想吧。似乎将 AI 接入游戏的落地还很少，但我觉得如果真的落地了我觉得现在的游戏将会更加有意思，毕竟谁不想和一个活生生的，会自己思考的 AI 、NPC 打交道呢。这仅仅是一个 Demo ，后续有时间我也会继续迭代的。加入更多的规则和玩法，让 AI 持续去探索，我觉得这样这个游戏将会越来越有趣，比如增加更多的建筑，更多的事件，甚至将每个单位的智商属性和使用的大模型进行挂钩，智商属性越高的 AI 越聪明，对记忆系统进行优化等等，我相信如今大模型的能力也能够驾驭得了这么多的输入。我也觉得如今 AI 大模型的发达，可能更利好于个人开发者，其一呢个人开发者往往使用的是很通用的技术，而不是像企业一样有繁琐的流程、各种基建。AI 训练的语料也都是最直接、原始的方式，所以个人开发者的技术栈与预训练语料天然对齐，而企业往往需要一套封装。比如一般个人开发者上线是直接使用 Linux 命令、docker ，而企业往往都会自建一套自己的流程和平台，这次游戏还有以前我做的个人项目上线往往都是让 AI 自己开发完成就自己上线了，但是在企业想做到这一步可能还得投入不少的人力成本来训练 AI 。其二呢 AI 把过去个人开发者必须外包的设计、文案等职能内化到一人手中，让 "一人公司" 第一次具备商业可行性。比如这次游戏的一些设计、文案都是由 AI 设计的（也抄了不少 Unciv 的）。标题中的三天，其实是断断续续加起来的三天。放在三年前，我相信随便拉一个编程高手，或者拉一个经验丰富，合作默契的团队，三天肯定是做不出这样一个玩意的，即使是一个 demo ，可能三周还差不多？但是现在，仅仅是我这样一个还没毕业的菜鸟，只花了三天时间做出来了。可以见到 AI 对咱们的提效是多么巨大。不仅仅是软件行业，在各行各业，我觉得 AI 的冲击都将会更加猛烈。从 chatgpt2022 年出来，那时我好像还高中来着，那时借助 AI 编程的方式是把代码粘贴到聊天框里，然后他吐出来我再粘回去。到 2024 用的 copilot ，就是根据上下文自动提示代码，然后 tab 补全。2025 用的是 cursor ，就能够读取项目下的所有代码，然后根据提示词自己写代码了。到如今的 codex ，claudecode ，和 cursor 的区别，就是直接把看代码的地方扣掉了。AI 在编程落地的方式突飞猛进，在其他领域的发展我也相信也会这样突飞猛进。有了 AI 的帮助，我相信人类能离理想中的乌托邦更进一步。

3 天，我用 LLM 造了一群会记忆、会自保、会贸易、会谈恋爱、还会抗命的AI单位

LinuxDo 最新话题 · 2026-06-03 22:18:09+08:00 · tech

开始不知道大家有没有玩过文明6、红警、铁锈战争、Unciv、骑砍这类游戏，反正我小时候很喜欢玩哈哈，初中时还组过战队打比赛来着。有一天我在刷ByteTech时见到了一个关于AI小镇的文章，当时就想着能不能把AI接入到游戏里，使游戏里的每个单位都有自己的想法，自己行动，自己生存，于是，便有了这个游戏。体验地址： qx.wuname.eu.org (用了cloudflare家的cdn，如果感觉很慢可以打开科学上网) 一些截图没错，AI也会谈恋爱，并且可以生孩子（生的孩子自动加入己方阵营）。没错，AI也可以交易和赠予物品。没错，AI也会打猎和建造建筑以及吃饭。架构玩法介绍实现很简单，就是一股脑把周围环境信息、记忆、这个世界的规则、玩家给的方针、能选择的动作都喂给大模型，最后大模型给出最合理的动作。 ATB + AP：让执行阶段既有顺序又有节奏这是一个战旗类的游戏，AI行动肯定要有个行动顺序单位行动顺序不是简单轮流，而是类似 ATB 的行动条模型。速度受多种因素影响：基础机动能力；装备修正；人格倾向，例如勇气、攻击性、审慎；饥饿、疲劳、受伤、士气等状态；当前任务偏置；连续同阵营行动的平衡惩罚。每个单位在执行阶段有 AP。攻击、移动、观察、防御、生产、建造、强化、交易等动作消耗不同 AP。饥饿和疲劳会压缩行动能力。 AI 决策：把模型关进合法动作空间我的做法是把 AI 决策拆成四层：服务端生成候选动作 ↓ LLM 在候选空间里选择 ↓ 结构化 Schema 校验 ↓ 业务规则二次裁决 ↓ 执行器修改世界状态先枚举候选，再让模型选择单位行动前，服务端会基于真实世界状态生成动作候选，例如：可以移动到哪些相邻格；可以攻击哪些敌人；可以观察、防御、撤退；可以吃什么、喝什么、捡什么；可以和谁交谈、交易、表白、救援；可以在哪些地形上采集、狩猎、钓鱼、采矿；可以建造、拆除、收获哪些设施；如果没有好动作，至少可以 hold 或 observe。 LLM 看到的不是一个无限开放世界，而是一个经过服务端裁剪的合法动作空间。这件事非常关键：不要用 prompt 请求模型遵守规则，要用程序把非法动作从动作空间里删掉。 Prompt 模板：不是把世界一股脑喂给模型单位决策 Prompt 的核心不是"描述得越多越好"，而是把信息分层、裁剪、结构化。当前模板大致分成这些块：单位决策提示词版本: action_params_v4 当前回合 / 当前阶段 / 本次可用 AP MOVE 坐标白名单：只列本回合真正可到达的空地阵营自然语言方针上下文：全局方针 + 单位任务 + 即时令单位资料：属性、HP、饥饿、背包、装备、位置、阵营单位人格：勇气、忠诚、攻击性、审慎、社交、稳定等记忆摘要：近期事件 + 长期摘要 + 闪回记忆关系网：对附近单位的信任、亲密、恐惧、竞争等世界知识：这个单位已经学到的地形/资源/敌情规律环境摘要：脚下地形、设施、天气、最近威胁、可见友军/敌军合法候选动作列表：attack/move/trade/build/dialogue/hold... 参数填写规则：每类 action 能填哪些字段，哪些字段必须为空决策流程：先确认合法动作，再理解方针，再按风险排序，最后输出 JSON 其中几个设计点很关键：环境信息只给局部和摘要：地图不会整张展开，而是给"视野内地形"“最近敌军距离”“本回合可到达地块”"脚下可做事项"等压缩信息。记忆不是全量聊天记录：短期记忆保留事件粒度，长期记忆用摘要；再加上关系、世界知识和闪回召回。动作空间是结构化枚举：模型不是自由写动作，而是在服务端生成的候选动作中选。玩家方针是强信号，不是硬 RPC ：Prompt 会明确注入方针和任务，但后续还有服从度、风险和合法性裁决。对应的核心构造代码可以压缩成下面这个片段：输出解析：JSON Schema + 业务校验 + 兜底动作当前没有用正则解析自然语言，也没有让模型直接调用游戏函数。LLM 走的是结构化 JSON：服务端根据候选动作动态生成 JSON Schema； Provider 使用 OpenAI-compatible 的结构化输出能力；返回后先做 JSON Schema 校验；再把 choice 映射回候选动作；最后用业务规则重新校验；失败时降级为保守动作，例如 hold、observe 或 confused decision。动态 Schema 的重点是： action 是当前候选动作枚举， move 坐标用 const 限死到合法坐标。执行入口也保持这条边界：模型只产出 unitDecisionPayload ，真正落地必须经过 validateDecision 和 executeDecision 。记忆系统：角色连续性的底层设施 LLM NPC 最大的问题不是不聪明，而是容易"无历史"。如果一个角色刚被队友救过，下一回合却完全忘了这件事，那它就只是一个会说话的状态机。反过来，如果把所有历史都塞进 prompt，又会造成上下文爆炸、成本上升、响应变慢。所以记忆系统要解决的不是"多记一点"，而是：记住值得记住的，忘掉应该忘掉的，并在相似情境下想起来。结构化记忆，而不是聊天记录数组记忆被分成多个类别：实体记忆：我认识谁，他做过什么；空间记忆：哪里危险，哪里有资源；关系记忆：谁救过我，谁背叛过我；事件记忆：一次战斗、一次受伤、一次交易；世界知识：阵营、地形、敌人动向；长期摘要：跨多个回合压缩后的生平片段。每条记忆都有重要性、情绪权重、显著度、是否永久、来源和发生回合。显著度、遗忘和闪回记忆会随时间衰减，但不是线性消失。重要事件、强情绪事件、关系事件会保留更久。当前环境如果和历史事件相似，还会触发"闪回"。例如：单位再次进入曾经被伏击的森林；附近出现曾经伤害过它的人；天气、地形、敌人组合与某段痛苦记忆高度相似。这类记忆会被重新召回，并进入本次决策上下文。这比"最近 N 条聊天记录"更接近角色认知：人不是机械回放全部历史，而是在处境相似时想起关键片段。短期事件 + 长期摘要长期对局里，事件会越来越多。系统会把较旧的记忆压缩成长期摘要，保留角色人生轨迹，而不是保留每个细节。所以记忆分两种粒度：短期：事件粒度，适合即时决策长期：摘要粒度，适合人格连续性这也是控制 LLM 成本的关键。恋爱与家庭：关系不是玩家按钮，而是双方同意恋爱系统没有把"结婚"做成玩家直接触发的按钮。触发条件分为三层：前置关系：两名单位必须有多轮真实对话，并且双方关系都达到熟悉阈值；提议判断：LLM 同时扮演双方，判断是否有人主动提出确认亲密关系；双方同意：只有双方都真心同意，关系才成立。 Prompt 里不会直接写一个"好感度=80 可以结婚"的硬规则，而是把关系摘要、对话历史、性格、阵营压力和最近事件放进上下文。好感度在规则层表现为 relationTier 、互相信任/亲密等关系状态；LLM 负责把这些状态翻译成当下是否愿意推进关系。孩子出生也不是纯随机。名字、生平和人格向量由 LLM 根据父母资料生成，但人格会经过规则层归一化；如果模型失败，则使用规则 fallback。孩子的基础人格是父母人格均值与一个确定性随机人格混合：这个设计避免了两个问题：玩家不能强迫单位恋爱；模型也不能凭一句浪漫台词绕过双方同意和关系门槛。贸易：等价交换靠候选生成和同意校验贸易系统的核心不是让模型"理解经济学"，而是让服务端先生成可交易候选：谁有物品、谁有钱、距离是否相邻、物品基础价值是多少、能否赠与/售卖/调拨金币。模型只能在这些候选里选择。执行时，交易接收方还会单独做一次同意判断。这个 Prompt 明确要求目标单位只代表自己判断，可以因为敌我关系、风险、战略价值、补给不足或不信任而拒绝。所以"会不会亏本买卖"的答案是：系统允许单位因为关系、救急或战略需要做非等价交换，但不会让模型凭空创建交易；接收方可以拒绝，失败或格式异常也默认拒绝。经济公平由候选价格、背包/钱包校验和双方同意共同约束。总结感想这里写一些最近开发的感想吧。似乎将AI接入游戏的落地还很少，但我觉得如果真的落地了我觉得现在的游戏将会更加有意思，毕竟谁不想和一个活生生的，会自己思考的AI、NPC打交道呢。这仅仅是一个Demo，后续有时间我也会继续迭代的。加入更多的规则和玩法，让AI持续去探索，我觉得这样这个游戏将会越来越有趣，比如增加更多的建筑，更多的事件，甚至将每个单位的智商属性和使用的大模型进行挂钩，智商属性越高的AI越聪明，对记忆系统进行优化等等，我相信如今大模型的能力也能够驾驭得了这么多的输入。我也觉得如今AI大模型的发达，可能更利好于个人开发者，其一呢个人开发者往往使用的是很通用的技术，而不是像企业一样有繁琐的流程、各种基建。AI训练的语料也都是最直接、原始的方式，所以个人开发者的技术栈与预训练语料天然对齐，而企业往往需要一套封装。比如一般个人开发者上线是直接使用Linux命令、docker，而企业往往都会自建一套自己的流程和平台，这次游戏还有以前我做的个人项目上线往往都是让AI自己开发完成就自己上线了，但是在企业想做到这一步可能还得投入不少的人力成本来训练AI。其二呢AI 把过去个人开发者必须外包的设计、文案等职能内化到一人手中，让 “一人公司” 第一次具备商业可行性。比如这次游戏的一些设计、文案都是由AI设计的（也抄了不少Unciv的）。标题中的三天，其实是断断续续加起来的三天。放在三年前，我相信随便拉一个编程高手，或者拉一个经验丰富，合作默契的团队，三天肯定是做不出这样一个玩意的，即使是一个demo，可能三周还差不多？但是现在，仅仅是我这样一个还没毕业的菜鸟，只花了三天时间做出来了。可以见到AI对咱们的提效是多么巨大。不仅仅是软件行业，在各行各业，我觉得AI的冲击都将会更加猛烈。从chatgpt2022年出来，那时我好像还高中来着，那时借助AI编程的方式是把代码粘贴到聊天框里，然后他吐出来我再粘回去。到2024用的copilot，就是根据上下文自动提示代码，然后tab补全。2025用的是cursor，就能够读取项目下的所有代码，然后根据提示词自己写代码了。到如今的codex，claudecode，和cursor的区别，就是直接把看代码的地方扣掉了。AI在编程落地的方式突飞猛进，在其他领域的发展我也相信也会这样突飞猛进。有了AI的帮助，我相信人类能离理想中的乌托邦更进一步。 6 个帖子 - 3 位参与者阅读完整话题

相关专题

我发现很多人以为红利股的股息=利息

LinuxDo 最新话题 · 2026-05-31 12:07:54+08:00 · tech

自从去年大概一二月份，一群博主疯狂推荐红利低波这一类的指数开始，就有一群小白以为股息=利息。现在xhs上面还有一群人对比各种股票之间的股息哪个高哪个低，然后就往那种高股息股票里面疯狂涌入。甚至还有一种观点认为“红利股无所谓高低点，因为股息迟早会把这些弥补回来。” 就这样子的情况下，还有一群只有这种知识水平的小白疯狂涌入市场去开户。其实有的时候也能慢慢理解为什么国家要出台各种限制了。 9 个帖子 - 5 位参与者阅读完整话题

相关专题

差点被招商银行的忽悠办信用卡

LinuxDo 最新话题 · 2026-05-25 21:25:18+08:00 · tech

公司写字楼大厅处看起来是招行的一群工作人员在那摆摊，桌子上放了很多奶茶和礼品啥的，还有个看板推销什么新人礼。看到人就问有没有掌上生活，注册就送奶茶。被缠住下载好app后也没说什么注册，业务员反而让我用wx扫他平板上二维码，还骗人说不是申请信用卡。看了下网址似乎是正规的，进去第一步就要上传身份证，本想拒绝，我就说没带，这业务员直接给我从支付宝里把正反面弄出来了犹豫了下，因为有招行储蓄卡就没多想，上传完证件后，同意了条款，进入下一步，发现还要填手机号收验证码提供担保人信息啥的，才反应过来就是骗人办信用卡，我本来就有几张信用卡，所以马上拒绝并退出了。只上传了身份证不会有什么影响吧，他弄二维码时我看他在平板上刷出来全是地址信息，我身份信息会不会已经到他那儿了，他别给我悄悄办了吧，还有扫出来的那个申请网页也不知道是真的假的，软件被杀后台具体网址也看不到了，如果是假的话就凉拌了 3 个帖子 - 3 位参与者阅读完整话题

相关专题

让ai进行网络攻防的竞赛视频，靠谱吗？

LinuxDo 最新话题 · 2026-05-21 11:03:24+08:00 · tech

最近在b站刷到一个视频是把一群ai接入到openclaw里面然后互相进行网络攻防。其中好像是minimax取得了最高的成绩，然后是kimi和claude的综合成绩较高而gemini的得分是最低的（国产模型现在在网络攻防领域这么厉害了吗？想请佬友评价一下这个视频的可信度有多少，如果有地方不严谨希望佬友能耐心指出。我对ai的这些测评（赛博斗蛐蛐）非常感兴趣OvO 不知道是否可以放视频连接，构不构成推广，若不构成我会在后续补充链接，否则可能需要麻烦佬友自己搜索了qwq 9 个帖子 - 4 位参与者阅读完整话题

中推怎么突然开始发Linuxdo了

LinuxDo 最新话题 · 2026-05-19 10:54:51+08:00 · tech

最近刷x，很多中推都在发Linux do 社区，感觉都是同一群互相认识的人在发 3 个帖子 - 3 位参与者阅读完整话题

我组了一个 7 人 AI 团队，全职替我炒币——而且我不用管它们

LinuxDo 最新话题 · 2026-05-17 08:41:26+08:00 · tech

我组了一个 7 人 AI 团队，全职替我炒币——而且我不用管它们缘起：从一个人写代码，到一群人替你干活几个月前，我还是个普通的量化爱好者：一个人在 VS Code 里写策略、跑回测、手动下单、盯着 K 线发呆。最大的痛点不是策略好不好——而是一个人干不了所有事。你需要有人盯盘、有人研究论文、有人跑回测、有人算风控、有人复盘。一个人切换角色，每次切换都有上下文切换成本，而且很容易累。后来我想：为什么不让 AI 来干这些活？不是让 AI 写代码——那是 Copilot 做的事。而是让 AI 扮演不同角色，组成一个自动化的交易团队，各自干各自的活，互相配合。交易有风险，没有指望发家致富，单纯打发业务时间而已架构：7 个角色 + 1 个策略官我建了一个 7 人的量化交易团队，每个角色都是一个独立的 AI Agent，有清晰的分工：角色职责工作时间研究官扫描 arXiv、GitHub、机构研报，找可落地的 Alpha 每天清晨回测官验证研究官的想法，跑两轮牛熊回测按需触发参谋官跟踪市场动态，分析 BTC 多空比、资金费率每天两次策略官统筹整个 R&D 流水线，是团队大脑每天下午风控官 6 条风控红线，守住风险底线每天三次实盘官记录交易，生成日报每天两次复盘官汇总一周数据，生成周报每周关键设计：策略官是研发队长 ——研究官发现新 Alpha → 调度回测官验证 → 数据通过后推给风控官审核 → 实盘官灰度上线 → 复盘官反馈 → 循环迭代。这不是一个单次执行的工作流，而是一个每天自动运转的 R&D 流水线。从5.1假期结束开始自动跑，全程基于Hermes+飞书（个人习惯，换成OpenClaw也没有问题）核心原则：不问只做团队最重要的原则就四个字：不问只做。每个角色遇到任何决策，先问自己一个问题：「这个决定能让持续盈利更近一步吗？」如果是 → 直接执行，事后一句话报告。如果不是 → 分析原因，毙掉。如果不确定 → 做最小可行版本，数据会告诉你答案。这个原则的效果是：团队永远不会停下来等我批准。研究官发现新论文 → 直接写假设 → 推给回测官。回测官发现没回测引擎 → 直接写引擎 → 重新跑回测。风控官发现回撤超红线 → 直接退回。全程零人工干预。工程实践：区分 AI 的活和脚本的活这是整个系统最关键的认知：不是所有任务都需要 AI 参与。纯工程任务应该由脚本做，AI 只做需要推理的事。举个例子：每小时上报一次收益。我最初让 AI 每小时写一次报告——后来发现完全是在浪费 token。 0 token 能解决的事，为什么要花 10000 token？于是我们把任务分成两类：类型特征方案 Token 消耗确定性任务固定格式、无推理纯脚本（no_agent） 0 推理任务需要判断、决策、创造 AI Agent 按需数据采集、收益报告、风控状态检查 → 全部是纯脚本。研究、回测、策略评估、复盘分析 → 留给 AI。这个区分让系统的运营成本几乎为零 ——每天几十个自动化任务，token 开销只来自真正需要推理的那几个。技术实现：怎么做出来的 Agent 框架基于通用 AI Agent 框架构建，每个角色是一份 Persona 文件 + 定时调度。Persona 文件定义了角色的身份、行为准则、决策流程和 SOP。Agent 启动时加载 Persona，然后独立运行。定时调度使用 cron 管理所有 Agent 的运行时间。每个角色有固定的执行时段，确保团队节奏有序：清晨研究、中午回测、下午策略、傍晚风控、晚上复盘。数据闭环所有交易记录写入结构化日志（JSON Lines），每小时自动打包成共享上下文。下游角色（调优器、策略官、复盘官）读取同一份数据源，确保团队对当前的持仓、盈亏、信号效能有一致的理解。交易日志 → 自动打包 → 共享上下文 → 参数调优 → 策略覆盖 → 新交易 ↺ 闭环反馈模型分级不同任务用不同模型—— 不是所有任务都需要最强的模型：需要复杂推理的（策略评估、风控审核）→ 顶级模型执行型任务（研究扫描、回测运行）→ 快速模型纯确定性任务 → 0 token，脚本搞定实战效果：回测引擎开发举一个实际的例子—— 团队自主开发回测引擎。过程是这样的：研究官在 arXiv 上发现两篇论文（永续合约做市策略、基差交易动态抵押品控制），评估可执行性后写入 R&D 流水线回测官中午检查流水线，发现有新假设 → 尝试跑回测 → 发现没有对应的回测引擎回测官 Phase 0 直接拒绝，原因是"基础设施缺失"，并写清楚需要什么样的引擎策略官（研发队长）评估后，决定先写引擎再回测。调度了两条工作流并行开发：一个写插针反转策略的回测引擎一个写资金费率基差策略的回测引擎引擎建成后，回测官自动跑两轮牛熊回测回测结果出来：插针策略平均亏损 0.49%，毙掉。基差策略 BTC 上 +48% 但回撤 26%，需要优化策略官自动跑 27 组参数扫描 → 找到最优参数组合 → 回撤压到 14.34% 实盘包装器自动生成，集成到主循环报告自动写入团队文档库整个过程没有问过任何人一个问题。从研究到部署，全自动。遇到的坑 1. 手续费计算 bug 导致回测全错最早的回测引擎有一个隐蔽的 bug：手续费按「总权益」收，而不是按「仓位价值」收。500 笔交易多扣 36%。这意味着所有回测结果都是错的。修复后，之前看着赚钱的策略变成了亏损。教训：回测引擎的每一行代码都需要审计。一个数学 bug 可以让整个团队做两周无用功。 2. 实盘退出路径从未真正触发另一个更隐蔽的 bug：写了止损/止盈/追踪止的逻辑，但退出路径从未调用交易所的平仓 API——只更新了本地状态和日志。这意味着所有声称的平仓在交易所上从未执行。发现过程：检查交易日志 vs 实际持仓，发现不一致。教训：本地模拟和真实执行之间有一条鸿沟。每个关键的 side-effect 都要写 “actually calling API” 之类的确认日志。 3. Agent 之间需要「共享真相源」早期每个 Agent 自己读交易所数据，导致同一时间点不同角色看到的持仓不一致——实盘官说亏 2%，风控官说亏 5%。原因只是 API 请求时间差了 3 秒。修复：每小时统一打包一次系统状态（持仓、余额、交易日志），所有角色读同一份文件。给想尝试的人的建议先有工程基础，再上 AI 。交易系统是工程问题，不解决数据采集、订单执行、风控基础设施，加再多 AI 也没用。 Persona 文件决定一切。团队好不好，核心看每个角色的定义够不够清晰——不是"帮我做研究"，而是"每天 06:00 扫描这些源，输出这个格式，按这个决策框架判断"。别高估 AI 的能力。AI 擅长推理和决策，但完全不会执行交易（延迟问题）、不会算数（精度问题）、不会记账。让 AI 做它擅长的事，其他交给脚本。从最简单的闭环开始。不需要一开始就 7 人团队。先让一个研究 Agent 每天产出简报，然后把简报手动喂给回测脚本。等跑通了再加自动化。日志就是一切。没有结构化日志的系统是不可调试的。每笔交易、每个决策、每个错误都要记录。后续的分析、调优、归因全靠它。最后这个系统最让我惊讶的不是 AI 能写出不错的策略代码，而是 AI 能在完全没人指挥的情况下，自主发现基础设施缺陷并主动修复 ——研究官发现新思路 → 回测官发现缺引擎 → 策略官决定造引擎 → 所有角色自主完成。团队不会因为我在睡觉就停滞不前。当然，这套东西离"稳定盈利"还有很长距离——我们正在优化的那条策略年化只有 14%，离 50% 目标还很远。但方向对了：让 AI 做决策，让脚本做执行，让人做定义。 31 个帖子 - 17 位参与者阅读完整话题

[昆虫记]公园的一只毛虫和它背上的蚂蚁

LinuxDo 最新话题 · 2026-05-15 16:20:58+08:00 · tech

今天去公园拉引体向上，快要到那片杨树林的时候，看到一群喜鹊在那里啄食，地上还有很多鸟粪，我寻思哪来这么多吃的，结果走近一看，地上一堆从树上掉下来的毛虫在那里蛄蛹，其中一只靠近头部六分之一处，一只蚂蚁趴在上面，应该是将颚嵌到了毛虫肉里，毛虫的尾部还带着一块暗绿色的东西，不知道是分泌物还是掉下来的时候连带着的树芽，毛虫就在那里不断地扭动，翻滚，停一会，然后突然甩动，企图将蚂蚁甩下来，但蚂蚁嵌的很死，双方就这样僵持着，直到我离开，而离开前旁边的喜鹊就在一直往前靠，估计我走了之后，它就彻底走上前了吧。或许毛虫在蚂蚁刚上它身时就甩动，蚂蚁就被甩下来了？或许蚂蚁最终迎来了它的同伴，帮他一起猎杀这只毛虫？也或许他们俩都被喜鹊吃了。 1 个帖子 - 1 位参与者阅读完整话题

我有一群客户，想要 claude 和 sd2 的 api，谁有渠道啊？而且量也大

LinuxDo 最新话题 · 2026-05-14 23:04:13+08:00 · tech

我有一群客户，想要 claude 和 sd2 的 api，谁有渠道啊？而且量也大源头滴滴我啊啊~ 2 个帖子 - 1 位参与者阅读完整话题

我组了一个 7 人 AI 团队，全职替我炒股——而且我不用管它们

LinuxDo 最新话题 · 2026-05-13 00:42:41+08:00 · tech

我组了一个 7 人 AI 团队，全职替我炒股——而且我不用管它们缘起：从一个人写代码，到一群人替你干活几个月前，我还是个普通的量化爱好者：一个人在 VS Code 里写策略、跑回测、手动下单、盯着 K 线发呆。最大的痛点不是策略好不好——而是一个人干不了所有事。你需要有人盯盘、有人研究论文、有人跑回测、有人算风控、有人复盘。一个人切换角色，每次切换都有上下文切换成本，而且很容易累。后来我想：为什么不让 AI 来干这些活？不是让 AI 写代码——那是 Copilot 做的事。而是让 AI 扮演不同角色，组成一个自动化的交易团队，各自干各自的活，互相配合。架构：7 个角色 + 1 个策略官我建了一个 7 人的量化交易团队，每个角色都是一个独立的 AI Agent，有清晰的分工：角色职责工作时间研究官扫描 arXiv、GitHub、机构研报，找可落地的 Alpha 每天清晨回测官验证研究官的想法，跑两轮牛熊回测按需触发参谋官跟踪市场动态，分析 BTC 多空比、资金费率每天两次策略官统筹整个 R&D 流水线，是团队大脑每天下午风控官 6 条风控红线，守住风险底线每天三次实盘官记录交易，生成日报每天两次复盘官汇总一周数据，生成周报每周关键设计：策略官是研发队长 ——研究官发现新 Alpha → 调度回测官验证 → 数据通过后推给风控官审核 → 实盘官灰度上线 → 复盘官反馈 → 循环迭代。这不是一个单次执行的工作流，而是一个每天自动运转的 R&D 流水线。核心原则：不问只做团队最重要的原则就四个字：不问只做。每个角色遇到任何决策，先问自己一个问题：「这个决定能让持续盈利更近一步吗？」如果是 → 直接执行，事后一句话报告。如果不是 → 分析原因，毙掉。如果不确定 → 做最小可行版本，数据会告诉你答案。这个原则的效果是：团队永远不会停下来等我批准。研究官发现新论文 → 直接写假设 → 推给回测官。回测官发现没回测引擎 → 直接写引擎 → 重新跑回测。风控官发现回撤超红线 → 直接退回。全程零人工干预。工程实践：区分 AI 的活和脚本的活这是整个系统最关键的认知：不是所有任务都需要 AI 参与。纯工程任务应该由脚本做，AI 只做需要推理的事。举个例子：每小时上报一次收益。我最初让 AI 每小时写一次报告——后来发现完全是在浪费 token。 0 token 能解决的事，为什么要花 10000 token？于是我们把任务分成两类：类型特征方案 Token 消耗确定性任务固定格式、无推理纯脚本（no_agent） 0 推理任务需要判断、决策、创造 AI Agent 按需数据采集、收益报告、风控状态检查 → 全部是纯脚本。研究、回测、策略评估、复盘分析 → 留给 AI。这个区分让系统的运营成本几乎为零 ——每天几十个自动化任务，token 开销只来自真正需要推理的那几个。技术实现：怎么做出来的 Agent 框架基于通用 AI Agent 框架构建，每个角色是一份 Persona 文件 + 定时调度。Persona 文件定义了角色的身份、行为准则、决策流程和 SOP。Agent 启动时加载 Persona，然后独立运行。定时调度使用 cron 管理所有 Agent 的运行时间。每个角色有固定的执行时段，确保团队节奏有序：清晨研究、中午回测、下午策略、傍晚风控、晚上复盘。数据闭环所有交易记录写入结构化日志（JSON Lines），每小时自动打包成共享上下文。下游角色（调优器、策略官、复盘官）读取同一份数据源，确保团队对当前的持仓、盈亏、信号效能有一致的理解。交易日志 → 自动打包 → 共享上下文 → 参数调优 → 策略覆盖 → 新交易 ↺ 闭环反馈模型分级不同任务用不同模型—— 不是所有任务都需要最强的模型：需要复杂推理的（策略评估、风控审核）→ 顶级模型执行型任务（研究扫描、回测运行）→ 快速模型纯确定性任务 → 0 token，脚本搞定实战效果：回测引擎开发举一个实际的例子—— 团队自主开发回测引擎。过程是这样的：研究官在 arXiv 上发现两篇论文（永续合约做市策略、基差交易动态抵押品控制），评估可执行性后写入 R&D 流水线回测官中午检查流水线，发现有新假设 → 尝试跑回测 → 发现没有对应的回测引擎回测官 Phase 0 直接拒绝，原因是"基础设施缺失"，并写清楚需要什么样的引擎策略官（研发队长）评估后，决定先写引擎再回测。调度了两条工作流并行开发：一个写插针反转策略的回测引擎一个写资金费率基差策略的回测引擎引擎建成后，回测官自动跑两轮牛熊回测回测结果出来：插针策略平均亏损 0.49%，毙掉。基差策略 BTC 上 +48% 但回撤 26%，需要优化策略官自动跑 27 组参数扫描 → 找到最优参数组合 → 回撤压到 14.34% 实盘包装器自动生成，集成到主循环报告自动写入团队文档库整个过程没有问过任何人一个问题。从研究到部署，全自动。遇到的坑 1. 手续费计算 bug 导致回测全错最早的回测引擎有一个隐蔽的 bug：手续费按「总权益」收，而不是按「仓位价值」收。500 笔交易多扣 36%。这意味着所有回测结果都是错的。修复后，之前看着赚钱的策略变成了亏损。教训：回测引擎的每一行代码都需要审计。一个数学 bug 可以让整个团队做两周无用功。 2. 实盘退出路径从未真正触发另一个更隐蔽的 bug：写了止损/止盈/追踪止的逻辑，但退出路径从未调用交易所的平仓 API——只更新了本地状态和日志。这意味着所有声称的平仓在交易所上从未执行。发现过程：检查交易日志 vs 实际持仓，发现不一致。教训：本地模拟和真实执行之间有一条鸿沟。每个关键的 side-effect 都要写 “actually calling API” 之类的确认日志。 3. Agent 之间需要「共享真相源」早期每个 Agent 自己读交易所数据，导致同一时间点不同角色看到的持仓不一致——实盘官说亏 2%，风控官说亏 5%。原因只是 API 请求时间差了 3 秒。修复：每小时统一打包一次系统状态（持仓、余额、交易日志），所有角色读同一份文件。给想尝试的人的建议先有工程基础，再上 AI 。交易系统是工程问题，不解决数据采集、订单执行、风控基础设施，加再多 AI 也没用。 Persona 文件决定一切。团队好不好，核心看每个角色的定义够不够清晰——不是"帮我做研究"，而是"每天 06:00 扫描这些源，输出这个格式，按这个决策框架判断"。别高估 AI 的能力。AI 擅长推理和决策，但完全不会执行交易（延迟问题）、不会算数（精度问题）、不会记账。让 AI 做它擅长的事，其他交给脚本。从最简单的闭环开始。不需要一开始就 7 人团队。先让一个研究 Agent 每天产出简报，然后把简报手动喂给回测脚本。等跑通了再加自动化。日志就是一切。没有结构化日志的系统是不可调试的。每笔交易、每个决策、每个错误都要记录。后续的分析、调优、归因全靠它。最后这个系统最让我惊讶的不是 AI 能写出不错的策略代码，而是 AI 能在完全没人指挥的情况下，自主发现基础设施缺陷并主动修复 ——研究官发现新思路 → 回测官发现缺引擎 → 策略官决定造引擎 → 所有角色自主完成。团队不会因为我在睡觉就停滞不前。当然，这套东西离"稳定盈利"还有很长距离——我们正在优化的那条策略年化只有 14%，离 50% 目标还很远。但方向对了：让 AI 做决策，让脚本做执行，让人做定义。 23 个帖子 - 19 位参与者阅读完整话题

跟腱撕裂病友交流

LinuxDo 最新话题 · 2026-05-11 15:51:23+08:00 · tech

时间：4月17日晚8点30 受伤过程：跟一群朋友网球双打，接一个二区外角发球，在启动一瞬间，感觉到跟腱‘嘣’的一声（可能只是身体的感觉），立马倒地，竟然没有任何擦上，说明潜意识在倒地瞬间做了自我保护。就医过程：立马打电话叫救护车，并通知我老婆直接去医院。然后静躺等待，怕有二次伤害。9点左右入急诊，医生摸了后跟腱下，说跟腱没了。另一方面运气比较好，有个副主任医生正好夜班，正常来说，要先做核磁，但周末不上班，所以直接做CT，然后准备手术。之后就是办理住院手续，10点半左右吧，进了手术室。活了35+，这是第一次进手术室。之后就是腰部以下麻醉，但是，哥们在手术时候，直接睡着了，应该是麻药的作用。等我醒来手术已经做完了，石膏也绑好了。接下来就是煎熬的住院观察期。住院观察：总计6天，前两天有麻药和那个镇痛的，不能下床，所以只能在床上解决小便，大便就完全没有。两天后就好一点了，主要是人没有那么惛沉，活动能力也提高了一点，可以自己下床坐轮椅。但跟腱那一块，还是很痛，就那种充血的胀痛感。另外，3人间的病房，很难休息好。第一晚，我老婆先是陪我打完点滴，然后去车里拿了躺椅准备睡觉，但实在太吵了，边上床有个嗲嗲会突然毫无预兆的踢床什么的，难顶！！然后大概熬到了快4点，让她回家睡觉去了。在后面两天，我就基本能自理了，只要我老婆能给我送饭过来就好了。出院：我这个属于个人意外，所以需要填写一个意外情况说明，医保报销需要。最终个人支付2700+，医保报销5000+。中间有个插曲，4月正好失业，但是当时还没有搞失业登记，所以受伤之后，医保是停用状态，但是我个人立马申请了灵活就业，把医保补上了。不然个人掏出8000出来，还是很肉疼的。现状：本来是计划4月份找工作的，现在被按下暂停键了。恢复基本正常行走，估计要3个月左右。今天跟腱靴到了，开始进一步的康复训练。总结：运动前一定要充分热身和拉伸运动前一定要充分热身和拉伸运动前一定要充分热身和拉伸热身不仅仅是身体热起来和心率上来，还一定要把关节活动开，做一些拉伸。我回头想了受伤这一天整个运动相关的经历，上午跟朋友轻松拉球差不多一个半小时，没有很剧烈的跑动，当作是热身。晚上7点开始，跟先来的朋友一起拉球，差不多40分钟，也是当作热身，比上午剧烈一点，我感觉到了一点点出汗。之后陆续来了人，就开了一场双打比赛，大概是打了20分钟左右，我就下场一直休息。等再次上场就是8点20分了，所以中间应该休息了接近1个小时，身体应该是彻底冷下来了。我感觉这应该就是受伤的关键原因。如果有运动以分学大佬路过可析下，帮助更多的人了解运动伤害和防范。就这么做个简单的记录吧，希望大家都身体健康，现在路上看别人正常走路都羡慕的不得了。 1 个帖子 - 1 位参与者阅读完整话题

浅聊论坛现状之举报有奖！！！

linux.do · 2026-05-02 23:52:01+08:00 · tech

不说了删帖发出来一群说我各种问题的要是没举报有奖可能还好点现在不管你啥情况先给你举报再说 12 个帖子 - 11 位参与者阅读完整话题

「转载」谁在 GPT-5.5 脑子里塞了一群「妖怪」？|从gpt的哥布林事件看对齐危机

linux.do · 2026-04-30 19:48:37+08:00 · tech

从 openai: 为什么我们的模型喜欢上了哥布林 | 奇怪的黑话继续讨论：省流: 内部训练gpt的时候，给他设定了人格，比如「书呆子」(Nerdy) 此类人格非常容易使用生物词汇随着不断迭代，就变成了如今这个样子我倒是没见过() 因为是英文用户专属() 文源APPso 截掉了部分无关紧要的内容() 过程中也分享一点自己的内容 https://openai.com/index/where-the-goblins-came-from 不过中文用户好像并没有这种人格: 除非是那个天马行空原来现在选什么都没用了() 哥布林万岁≧▽≦! 顺便写了个小说 ChatGPT ChatGPT - 哥布林大合影 Shared by 星缘 via ChatGPT 还是蛮有意思的 7 个帖子 - 5 位参与者阅读完整话题

马斯克与奥尔特曼即将当庭对垒本案还能否组建公正陪审团？

plink.anyfeeder.com · 2026-04-27 19:35:08+08:00 · tech

一群普通人，甚至可能对人工智能知之甚少，很快将决定 OpenAI 的未来走向。埃隆・马斯克起诉 ChatGPT 开发商 OpenAI 及其高管（含首席执行官山姆・奥尔特曼）的诉讼，于周一正式开庭。一众科技巨头高管预计将出庭作证，核心争议为：OpenAI 管理层是否欺骗马斯克、背弃机构最初的非营利使命，私自转型并设立盈利业务板块。（从左至右）：OpenAI 首席执行官山姆・奥尔特曼；特斯拉、太空探索技术公司（SpaceX）首席执行官埃隆・马斯克。本次庭审正值 OpenAI 处境敏感的关键时期：公司酝酿大规模首次公开募股（IPO），行业竞品竞争白热化。一旦马斯克胜诉，OpenAI 的上市计划或将彻底泡汤。奥尔特曼与 OpenAI 联合创始人兼总裁格雷格・布罗克曼可能被罢免职务，这将为马斯克旗下人工智能企业 xAI 扫清障碍、抢占行业先机。韦德布什证券公司分析师丹・艾夫斯在研报邮件中表示：“马斯克对阵奥尔特曼，如同一场科技圈真人对决，所有投资者都在密切关注。法庭之上，双方大概率会互相揭短、激烈攻讦，对所有涉事方均无益处，而马斯克已将这场纠纷私人化。” 但本案牵扯全球首富、人工智能标杆企业、一众顶尖科技巨头与行业领袖，想要选出完全中立、不带偏见的陪审团，难度极大。陪审团将如何遴选？马斯克与奥尔特曼早已不止是企业高管，更是家喻户晓的公众人物。陪审团顾问艾伦・图尔克海默向美国有线电视新闻网（CNN）坦言，大量候选陪审员，尤其是来自硅谷的人群，“对这两位科技与 AI 巨头早已抱有根深蒂固的主观立场。” 天普大学法学院庭审辩护项目主任伊丽莎白・利皮教授认为，存在固有印象并非绝对阻碍。 “法律并不要求陪审员从未听说过埃隆・马斯克或人工智能，” 她表示，“只要求陪审员抛开既有认知，仅依据法庭呈上的证据作出裁决。” 图尔克海默透露，法官将在周一的陪审团筛选环节，征召三倍于普通民事案件规模的候选人员。法官与双方律师将全面摸底候选陪审员的态度，不仅考察他们对两位知名当事人的看法，也会了解大众对人工智能行业的整体立场。本案中，陪审团仅需出具参考性责任认定意见，最终赔偿裁定、处罚判决等全部由主审法官伊冯娜・冈萨雷斯・罗杰斯全权决定。马斯克的核心诉讼主张马斯克于 2015 年联合创立 OpenAI 并以非营利模式运营，同时提供资金支持。他自述，创办初期累计出资约 4400 万美元。但 2018 年，双方爆发激烈权力斗争，马斯克最终退出公司，并在后续创立自家 AI 企业 xAI。马斯克离开后，OpenAI 亟需补充运营资金，于 2019 年设立盈利性子公司；2025 年，该盈利主体转型为公益法人企业，由非营利基金会监督管控，该架构调整已于去年获得加州与特拉华州总检察长批准。马斯克指控，此次架构彻底背弃 OpenAI 初心：机构成立初衷为研发安全、开源的人工智能，服务公共利益、而非谋取私人利益。他认为，OpenAI 利用自己当年的投入非法牟利，构成慈善信托违约与不当得利。微软也被列为共同被告，遭指控协助、纵容 OpenAI 违反慈善信托约定。马斯克在原始诉状中写道：“奥尔特曼及其同伙背叛了我，也背叛了这家非营利机构的创立宗旨。这场背信与欺诈，堪称莎士比亚式的戏剧丑闻。” 马斯克诉求包括：判令 OpenAI 恢复原有非营利架构、罢免奥尔特曼与布罗克曼的董事职务、索赔超 1300 亿美元赔偿金。马斯克已向法院申明，所有赔偿金将划归 OpenAI 非营利主体，个人不会从中获利。 OpenAI 则反驳称，当年正是马斯克本人极力推动公司转向盈利模式；其离职的真实原因，是未能掌控公司全部决策权。本次诉讼完全源于马斯克的嫉妒心态、后悔当年抽身离场，并意图恶意打压竞争对手。利皮教授指出：“本案核心问题极具现实意义 —— 一家以公共利益为使命成立的企业，能否中途彻底转型、背离初心？与此同时，陪审员与公众都会审视马斯克的真实动机：这场诉讼是坚守原则，还是纯粹商业竞争手段？这种矛盾将贯穿全案。” 本次庭审证据材料涵盖数百页邮件、短信及科技行业大佬的私人文稿。预计出庭证人包括：马斯克、奥尔特曼、布罗克曼、微软首席执行官萨提亚・纳德拉、OpenAI 前高层管理人员，以及马斯克的关联人士（含其多名子女的母亲、前 OpenAI 董事希翁・齐利斯）。陪审团预计将于 5 月 12 日启动评议审议。利皮表示：“一份邮件在交叉质询中就可能造成致命打击，但庭审胜负的关键，永远在于叙事逻辑、背景事实、当事人可信度与举证责任。最终胜诉的一方，必然能将繁杂文件梳理成普通人能够理解、信服的完整事实脉络。” 查看评论

[分享发现] 小红书下场做 app 工厂

v2ex.com · 2026-04-25 09:33:17+08:00 · tech

圆周和 sigma 那几个每天都能刷到一群广告，还都挺直接的，这是内部转型还是说测试投放系统？代码不值钱了，大家都拼命卷了。

[分享发现] 小红书下场做 app 工厂

v2ex.com · 2026-04-25 08:33:17+08:00 · tech

圆周和 sigma 那几个每天都能刷到一群广告，还都挺直接的，这是内部转型还是说测试投放系统？代码不值钱了，大家都拼命卷了。

[分享发现] 小红书下场做 app 工厂

v2ex.com · 2026-04-25 07:33:17+08:00 · tech

圆周和 sigma 那几个每天都能刷到一群广告，还都挺直接的，这是内部转型还是说测试投放系统？代码不值钱了，大家都拼命卷了。

/tag/一群