如图所示,添加一个320k的上下文文件,让他去里面找,上下文就已经98%了,之前测350k的就不行了 1 个帖子 - 1 位参与者 阅读完整话题
升级了macos之后 发现不能用codex了 我是自己搭的中转 然后一群人一起用 就我一个人升级了系统 然后升级完我的codex就一直中断 一个问题出几行字之后就直接中断了 出现了对话框 然后其他人没有这个问题 就很离谱 然后中转这边提示这个报错 有佬了解这个情况的吗 ps:用上了/goal 模式后就正常了 不会中断了 但是中转还是报错这个 5 个帖子 - 3 位参与者 阅读完整话题
开始 不知道大家有没有玩过文明 6 、红警、铁锈战争、Unciv 、骑砍这类游戏,反正我小时候很喜欢玩哈哈,初中时还组过战队打比赛来着。有一天我在刷 ByteTech 时见到了一个关于 AI 小镇的文章,当时就想着能不能把 AI 接入到游戏里,使游戏里的每个单位都有自己的想法,自己行动,自己生存,于是,便有了这个游戏。 github 开源地址: https://github.com/wunameya/qx 体验地址: qx.wuname.eu.org (用了 cloudflare 家的 cdn ,如果感觉很慢可以打开科学上网) 一些截图 没错,AI 也会谈恋爱,并且可以生孩子(生的孩子自动加入己方阵营)。 没错,AI 也可以交易和赠予物品。 没错,AI 也会打猎和建造建筑以及吃饭。 架构玩法介绍 实现很简单,就是一股脑把周围环境信息、记忆、这个世界的规则、玩家给的方针、能选择的动作都喂给大模型,最后大模型给出最合理的动作。 ATB + AP:让执行阶段既有顺序又有节奏 这是一个战旗类的游戏,AI 行动肯定要有个行动顺序 单位行动顺序不是简单轮流,而是类似 ATB 的行动条模型。速度受多种因素影响: 基础机动能力; 装备修正; 人格倾向,例如勇气、攻击性、审慎; 饥饿、疲劳、受伤、士气等状态; 当前任务偏置; 连续同阵营行动的平衡惩罚。 每个单位在执行阶段有 AP 。攻击、移动、观察、防御、生产、建造、强化、交易等动作消耗不同 AP 。饥饿和疲劳会压缩行动能力。 AI 决策:把模型关进合法动作空间 我的做法是把 AI 决策拆成四层: 服务端生成候选动作 ↓ LLM 在候选空间里选择 ↓ 结构化 Schema 校验 ↓ 业务规则二次裁决 ↓ 执行器修改世界状态 先枚举候选,再让模型选择 单位行动前,服务端会基于真实世界状态生成动作候选,例如: 可以移动到哪些相邻格; 可以攻击哪些敌人; 可以观察、防御、撤退; 可以吃什么、喝什么、捡什么; 可以和谁交谈、交易、表白、救援; 可以在哪些地形上采集、狩猎、钓鱼、采矿; 可以建造、拆除、收获哪些设施; 如果没有好动作,至少可以 hold 或 observe 。 LLM 看到的不是一个无限开放世界,而是一个经过服务端裁剪的合法动作空间。 这件事非常关键: 不要用 prompt 请求模型遵守规则,要用程序把非法动作从动作空间里删掉。 Prompt 模板:不是把世界一股脑喂给模型 单位决策 Prompt 的核心不是“描述得越多越好”,而是把信息分层、裁剪、结构化。当前模板大致分成这些块: 单位决策提示词版本: action_params_v4 当前回合 / 当前阶段 / 本次可用 AP MOVE 坐标白名单:只列本回合真正可到达的空地 阵营自然语言方针上下文:全局方针 + 单位任务 + 即时令 单位资料:属性、HP 、饥饿、背包、装备、位置、阵营 单位人格:勇气、忠诚、攻击性、审慎、社交、稳定等 记忆摘要:近期事件 + 长期摘要 + 闪回记忆 关系网:对附近单位的信任、亲密、恐惧、竞争等 世界知识:这个单位已经学到的地形/资源/敌情规律 环境摘要:脚下地形、设施、天气、最近威胁、可见友军/敌军 合法候选动作列表:attack/move/trade/build/dialogue/hold... 参数填写规则:每类 action 能填哪些字段,哪些字段必须为空 决策流程:先确认合法动作,再理解方针,再按风险排序,最后输出 JSON 其中几个设计点很关键: 环境信息只给局部和摘要 :地图不会整张展开,而是给“视野内地形”“最近敌军距离”“本回合可到达地块”“脚下可做事项”等压缩信息。 记忆不是全量聊天记录 :短期记忆保留事件粒度,长期记忆用摘要;再加上关系、世界知识和闪回召回。 动作空间是结构化枚举 :模型不是自由写动作,而是在服务端生成的候选动作中选。 玩家方针是强信号,不是硬 RPC :Prompt 会明确注入方针和任务,但后续还有服从度、风险和合法性裁决。 对应的核心构造代码可以压缩成下面这个片段: 输出解析:JSON Schema + 业务校验 + 兜底动作 当前没有用正则解析自然语言,也没有让模型直接调用游戏函数。LLM 走的是结构化 JSON: 服务端根据候选动作动态生成 JSON Schema ; Provider 使用 OpenAI-compatible 的结构化输出能力; 返回后先做 JSON Schema 校验; 再把 choice 映射回候选动作; 最后用业务规则重新校验; 失败时降级为保守动作,例如 hold 、observe 或 confused decision 。 动态 Schema 的重点是: action 是当前候选动作枚举, move 坐标用 const 限死到合法坐标。 执行入口也保持这条边界:模型只产出 unitDecisionPayload ,真正落地必须经过 validateDecision 和 executeDecision 。 记忆系统:角色连续性的底层设施 LLM NPC 最大的问题不是不聪明,而是容易“无历史”。 如果一个角色刚被队友救过,下一回合却完全忘了这件事,那它就只是一个会说话的状态机。反过来,如果把所有历史都塞进 prompt ,又会造成上下文爆炸、成本上升、响应变慢。 所以记忆系统要解决的不是“多记一点”,而是: 记住值得记住的,忘掉应该忘掉的,并在相似情境下想起来。 结构化记忆,而不是聊天记录数组 记忆被分成多个类别: 实体记忆:我认识谁,他做过什么; 空间记忆:哪里危险,哪里有资源; 关系记忆:谁救过我,谁背叛过我; 事件记忆:一次战斗、一次受伤、一次交易; 世界知识:阵营、地形、敌人动向; 长期摘要:跨多个回合压缩后的生平片段。 每条记忆都有重要性、情绪权重、显著度、是否永久、来源和发生回合。 显著度、遗忘和闪回 记忆会随时间衰减,但不是线性消失。重要事件、强情绪事件、关系事件会保留更久。当前环境如果和历史事件相似,还会触发“闪回”。 例如: 单位再次进入曾经被伏击的森林; 附近出现曾经伤害过它的人; 天气、地形、敌人组合与某段痛苦记忆高度相似。 这类记忆会被重新召回,并进入本次决策上下文。 这比“最近 N 条聊天记录”更接近角色认知:人不是机械回放全部历史,而是在处境相似时想起关键片段。 短期事件 + 长期摘要 长期对局里,事件会越来越多。系统会把较旧的记忆压缩成长期摘要,保留角色人生轨迹,而不是保留每个细节。 所以记忆分两种粒度: 短期:事件粒度,适合即时决策 长期:摘要粒度,适合人格连续性 这也是控制 LLM 成本的关键。 恋爱与家庭:关系不是玩家按钮,而是双方同意 恋爱系统没有把“结婚”做成玩家直接触发的按钮。触发条件分为三层: 前置关系 :两名单位必须有多轮真实对话,并且双方关系都达到熟悉阈值; 提议判断 :LLM 同时扮演双方,判断是否有人主动提出确认亲密关系; 双方同意 :只有双方都真心同意,关系才成立。 Prompt 里不会直接写一个“好感度=80 可以结婚”的硬规则,而是把关系摘要、对话历史、性格、阵营压力和最近事件放进上下文。好感度在规则层表现为 relationTier 、互相信任/亲密等关系状态; LLM 负责把这些状态翻译成当下是否愿意推进关系。 孩子出生也不是纯随机。名字、生平和人格向量由 LLM 根据父母资料生成,但人格会经过规则层归一化;如果模型失败,则使用规则 fallback 。孩子的基础人格是父母人格均值与一个确定性随机人格混合: 这个设计避免了两个问题:玩家不能强迫单位恋爱;模型也不能凭一句浪漫台词绕过双方同意和关系门槛。 贸易:等价交换靠候选生成和同意校验 贸易系统的核心不是让模型“理解经济学”,而是让服务端先生成可交易候选:谁有物品、谁有钱、距离是否相邻、物品基础价值是多少、能否赠与/售卖/调拨金币。模型只能在这些候选里选择。 执行时,交易接收方还会单独做一次同意判断。这个 Prompt 明确要求目标单位只代表自己判断,可以因为敌我关系、风险、战略价值、补给不足或不信任而拒绝。 所以“会不会亏本买卖”的答案是:系统允许单位因为关系、救急或战略需要做非等价交换,但不会让模型凭空创建交易;接收方可以拒绝,失败或格式异常也默认拒绝。经济公平由候选价格、背包/钱包校验和双方同意共同约束。 总结感想 这里写一些最近开发的感想吧。似乎将 AI 接入游戏的落地还很少,但我觉得如果真的落地了我觉得现在的游戏将会更加有意思,毕竟谁不想和一个活生生的,会自己思考的 AI 、NPC 打交道呢。 这仅仅是一个 Demo ,后续有时间我也会继续迭代的。加入更多的规则和玩法,让 AI 持续去探索,我觉得这样这个游戏将会越来越有趣,比如增加更多的建筑,更多的事件,甚至将每个单位的智商属性和使用的大模型进行挂钩,智商属性越高的 AI 越聪明,对记忆系统进行优化等等,我相信如今大模型的能力也能够驾驭得了这么多的输入。 我也觉得如今 AI 大模型的发达,可能更利好于个人开发者,其一呢个人开发者往往使用的是很通用的技术,而不是像企业一样有繁琐的流程、各种基建。AI 训练的语料也都是最直接、原始的方式,所以个人开发者的技术栈与预训练语料天然对齐,而企业往往需要一套封装。比如一般个人开发者上线是直接使用 Linux 命令、docker ,而企业往往都会自建一套自己的流程和平台,这次游戏还有以前我做的个人项目上线往往都是让 AI 自己开发完成就自己上线了,但是在企业想做到这一步可能还得投入不少的人力成本来训练 AI 。其二呢 AI 把过去个人开发者必须外包的设计、文案等职能内化到一人手中,让 "一人公司" 第一次具备商业可行性。比如这次游戏的一些设计、文案都是由 AI 设计的( 也抄了不少 Unciv 的 )。 标题中的三天,其实是断断续续加起来的三天。放在三年前,我相信随便拉一个编程高手,或者拉一个经验丰富,合作默契的团队,三天肯定是做不出这样一个玩意的,即使是一个 demo ,可能三周还差不多? 但是现在,仅仅是我这样一个还没毕业的菜鸟,只花了三天时间做出来了。可以见到 AI 对咱们的提效是多么巨大。不仅仅是软件行业,在各行各业,我觉得 AI 的冲击都将会更加猛烈。 从 chatgpt2022 年出来,那时我好像还高中来着,那时借助 AI 编程的方式是把代码粘贴到聊天框里,然后他吐出来我再粘回去。到 2024 用的 copilot ,就是根据上下文自动提示代码,然后 tab 补全。2025 用的是 cursor ,就能够读取项目下的所有代码,然后根据提示词自己写代码了。到如今的 codex ,claudecode ,和 cursor 的区别,就是直接把看代码的地方扣掉了。AI 在编程落地的方式突飞猛进,在其他领域的发展我也相信也会这样突飞猛进。 有了 AI 的帮助,我相信人类能离理想中的乌托邦更进一步。
开始 不知道大家有没有玩过文明 6 、红警、铁锈战争、Unciv 、骑砍这类游戏,反正我小时候很喜欢玩哈哈,初中时还组过战队打比赛来着。有一天我在刷 ByteTech 时见到了一个关于 AI 小镇的文章,当时就想着能不能把 AI 接入到游戏里,使游戏里的每个单位都有自己的想法,自己行动,自己生存,于是,便有了这个游戏。 github 开源地址: https://github.com/wunameya/qx 体验地址: qx.wuname.eu.org (用了 cloudflare 家的 cdn ,如果感觉很慢可以打开科学上网) 一些截图 没错,AI 也会谈恋爱,并且可以生孩子(生的孩子自动加入己方阵营)。 没错,AI 也可以交易和赠予物品。 没错,AI 也会打猎和建造建筑以及吃饭。 架构玩法介绍 实现很简单,就是一股脑把周围环境信息、记忆、这个世界的规则、玩家给的方针、能选择的动作都喂给大模型,最后大模型给出最合理的动作。 ATB + AP:让执行阶段既有顺序又有节奏 这是一个战旗类的游戏,AI 行动肯定要有个行动顺序 单位行动顺序不是简单轮流,而是类似 ATB 的行动条模型。速度受多种因素影响: 基础机动能力; 装备修正; 人格倾向,例如勇气、攻击性、审慎; 饥饿、疲劳、受伤、士气等状态; 当前任务偏置; 连续同阵营行动的平衡惩罚。 每个单位在执行阶段有 AP 。攻击、移动、观察、防御、生产、建造、强化、交易等动作消耗不同 AP 。饥饿和疲劳会压缩行动能力。 AI 决策:把模型关进合法动作空间 我的做法是把 AI 决策拆成四层: 服务端生成候选动作 ↓ LLM 在候选空间里选择 ↓ 结构化 Schema 校验 ↓ 业务规则二次裁决 ↓ 执行器修改世界状态 先枚举候选,再让模型选择 单位行动前,服务端会基于真实世界状态生成动作候选,例如: 可以移动到哪些相邻格; 可以攻击哪些敌人; 可以观察、防御、撤退; 可以吃什么、喝什么、捡什么; 可以和谁交谈、交易、表白、救援; 可以在哪些地形上采集、狩猎、钓鱼、采矿; 可以建造、拆除、收获哪些设施; 如果没有好动作,至少可以 hold 或 observe 。 LLM 看到的不是一个无限开放世界,而是一个经过服务端裁剪的合法动作空间。 这件事非常关键: 不要用 prompt 请求模型遵守规则,要用程序把非法动作从动作空间里删掉。 Prompt 模板:不是把世界一股脑喂给模型 单位决策 Prompt 的核心不是“描述得越多越好”,而是把信息分层、裁剪、结构化。当前模板大致分成这些块: 单位决策提示词版本: action_params_v4 当前回合 / 当前阶段 / 本次可用 AP MOVE 坐标白名单:只列本回合真正可到达的空地 阵营自然语言方针上下文:全局方针 + 单位任务 + 即时令 单位资料:属性、HP 、饥饿、背包、装备、位置、阵营 单位人格:勇气、忠诚、攻击性、审慎、社交、稳定等 记忆摘要:近期事件 + 长期摘要 + 闪回记忆 关系网:对附近单位的信任、亲密、恐惧、竞争等 世界知识:这个单位已经学到的地形/资源/敌情规律 环境摘要:脚下地形、设施、天气、最近威胁、可见友军/敌军 合法候选动作列表:attack/move/trade/build/dialogue/hold... 参数填写规则:每类 action 能填哪些字段,哪些字段必须为空 决策流程:先确认合法动作,再理解方针,再按风险排序,最后输出 JSON 其中几个设计点很关键: 环境信息只给局部和摘要 :地图不会整张展开,而是给“视野内地形”“最近敌军距离”“本回合可到达地块”“脚下可做事项”等压缩信息。 记忆不是全量聊天记录 :短期记忆保留事件粒度,长期记忆用摘要;再加上关系、世界知识和闪回召回。 动作空间是结构化枚举 :模型不是自由写动作,而是在服务端生成的候选动作中选。 玩家方针是强信号,不是硬 RPC :Prompt 会明确注入方针和任务,但后续还有服从度、风险和合法性裁决。 对应的核心构造代码可以压缩成下面这个片段: 输出解析:JSON Schema + 业务校验 + 兜底动作 当前没有用正则解析自然语言,也没有让模型直接调用游戏函数。LLM 走的是结构化 JSON: 服务端根据候选动作动态生成 JSON Schema ; Provider 使用 OpenAI-compatible 的结构化输出能力; 返回后先做 JSON Schema 校验; 再把 choice 映射回候选动作; 最后用业务规则重新校验; 失败时降级为保守动作,例如 hold 、observe 或 confused decision 。 动态 Schema 的重点是: action 是当前候选动作枚举, move 坐标用 const 限死到合法坐标。 执行入口也保持这条边界:模型只产出 unitDecisionPayload ,真正落地必须经过 validateDecision 和 executeDecision 。 记忆系统:角色连续性的底层设施 LLM NPC 最大的问题不是不聪明,而是容易“无历史”。 如果一个角色刚被队友救过,下一回合却完全忘了这件事,那它就只是一个会说话的状态机。反过来,如果把所有历史都塞进 prompt ,又会造成上下文爆炸、成本上升、响应变慢。 所以记忆系统要解决的不是“多记一点”,而是: 记住值得记住的,忘掉应该忘掉的,并在相似情境下想起来。 结构化记忆,而不是聊天记录数组 记忆被分成多个类别: 实体记忆:我认识谁,他做过什么; 空间记忆:哪里危险,哪里有资源; 关系记忆:谁救过我,谁背叛过我; 事件记忆:一次战斗、一次受伤、一次交易; 世界知识:阵营、地形、敌人动向; 长期摘要:跨多个回合压缩后的生平片段。 每条记忆都有重要性、情绪权重、显著度、是否永久、来源和发生回合。 显著度、遗忘和闪回 记忆会随时间衰减,但不是线性消失。重要事件、强情绪事件、关系事件会保留更久。当前环境如果和历史事件相似,还会触发“闪回”。 例如: 单位再次进入曾经被伏击的森林; 附近出现曾经伤害过它的人; 天气、地形、敌人组合与某段痛苦记忆高度相似。 这类记忆会被重新召回,并进入本次决策上下文。 这比“最近 N 条聊天记录”更接近角色认知:人不是机械回放全部历史,而是在处境相似时想起关键片段。 短期事件 + 长期摘要 长期对局里,事件会越来越多。系统会把较旧的记忆压缩成长期摘要,保留角色人生轨迹,而不是保留每个细节。 所以记忆分两种粒度: 短期:事件粒度,适合即时决策 长期:摘要粒度,适合人格连续性 这也是控制 LLM 成本的关键。 恋爱与家庭:关系不是玩家按钮,而是双方同意 恋爱系统没有把“结婚”做成玩家直接触发的按钮。触发条件分为三层: 前置关系 :两名单位必须有多轮真实对话,并且双方关系都达到熟悉阈值; 提议判断 :LLM 同时扮演双方,判断是否有人主动提出确认亲密关系; 双方同意 :只有双方都真心同意,关系才成立。 Prompt 里不会直接写一个“好感度=80 可以结婚”的硬规则,而是把关系摘要、对话历史、性格、阵营压力和最近事件放进上下文。好感度在规则层表现为 relationTier 、互相信任/亲密等关系状态; LLM 负责把这些状态翻译成当下是否愿意推进关系。 孩子出生也不是纯随机。名字、生平和人格向量由 LLM 根据父母资料生成,但人格会经过规则层归一化;如果模型失败,则使用规则 fallback 。孩子的基础人格是父母人格均值与一个确定性随机人格混合: 这个设计避免了两个问题:玩家不能强迫单位恋爱;模型也不能凭一句浪漫台词绕过双方同意和关系门槛。 贸易:等价交换靠候选生成和同意校验 贸易系统的核心不是让模型“理解经济学”,而是让服务端先生成可交易候选:谁有物品、谁有钱、距离是否相邻、物品基础价值是多少、能否赠与/售卖/调拨金币。模型只能在这些候选里选择。 执行时,交易接收方还会单独做一次同意判断。这个 Prompt 明确要求目标单位只代表自己判断,可以因为敌我关系、风险、战略价值、补给不足或不信任而拒绝。 所以“会不会亏本买卖”的答案是:系统允许单位因为关系、救急或战略需要做非等价交换,但不会让模型凭空创建交易;接收方可以拒绝,失败或格式异常也默认拒绝。经济公平由候选价格、背包/钱包校验和双方同意共同约束。 总结感想 这里写一些最近开发的感想吧。似乎将 AI 接入游戏的落地还很少,但我觉得如果真的落地了我觉得现在的游戏将会更加有意思,毕竟谁不想和一个活生生的,会自己思考的 AI 、NPC 打交道呢。 这仅仅是一个 Demo ,后续有时间我也会继续迭代的。加入更多的规则和玩法,让 AI 持续去探索,我觉得这样这个游戏将会越来越有趣,比如增加更多的建筑,更多的事件,甚至将每个单位的智商属性和使用的大模型进行挂钩,智商属性越高的 AI 越聪明,对记忆系统进行优化等等,我相信如今大模型的能力也能够驾驭得了这么多的输入。 我也觉得如今 AI 大模型的发达,可能更利好于个人开发者,其一呢个人开发者往往使用的是很通用的技术,而不是像企业一样有繁琐的流程、各种基建。AI 训练的语料也都是最直接、原始的方式,所以个人开发者的技术栈与预训练语料天然对齐,而企业往往需要一套封装。比如一般个人开发者上线是直接使用 Linux 命令、docker ,而企业往往都会自建一套自己的流程和平台,这次游戏还有以前我做的个人项目上线往往都是让 AI 自己开发完成就自己上线了,但是在企业想做到这一步可能还得投入不少的人力成本来训练 AI 。其二呢 AI 把过去个人开发者必须外包的设计、文案等职能内化到一人手中,让 "一人公司" 第一次具备商业可行性。比如这次游戏的一些设计、文案都是由 AI 设计的( 也抄了不少 Unciv 的 )。 标题中的三天,其实是断断续续加起来的三天。放在三年前,我相信随便拉一个编程高手,或者拉一个经验丰富,合作默契的团队,三天肯定是做不出这样一个玩意的,即使是一个 demo ,可能三周还差不多? 但是现在,仅仅是我这样一个还没毕业的菜鸟,只花了三天时间做出来了。可以见到 AI 对咱们的提效是多么巨大。不仅仅是软件行业,在各行各业,我觉得 AI 的冲击都将会更加猛烈。 从 chatgpt2022 年出来,那时我好像还高中来着,那时借助 AI 编程的方式是把代码粘贴到聊天框里,然后他吐出来我再粘回去。到 2024 用的 copilot ,就是根据上下文自动提示代码,然后 tab 补全。2025 用的是 cursor ,就能够读取项目下的所有代码,然后根据提示词自己写代码了。到如今的 codex ,claudecode ,和 cursor 的区别,就是直接把看代码的地方扣掉了。AI 在编程落地的方式突飞猛进,在其他领域的发展我也相信也会这样突飞猛进。 有了 AI 的帮助,我相信人类能离理想中的乌托邦更进一步。
开始 不知道大家有没有玩过文明6、红警、铁锈战争、Unciv、骑砍这类游戏,反正我小时候很喜欢玩哈哈,初中时还组过战队打比赛来着。有一天我在刷ByteTech时见到了一个关于AI小镇的文章,当时就想着能不能把AI接入到游戏里,使游戏里的每个单位都有自己的想法,自己行动,自己生存,于是,便有了这个游戏。 体验地址: qx.wuname.eu.org (用了cloudflare家的cdn,如果感觉很慢可以打开科学上网) 一些截图 没错,AI也会谈恋爱,并且可以生孩子(生的孩子自动加入己方阵营)。 没错,AI也可以交易和赠予物品。 没错,AI也会打猎和建造建筑以及吃饭。 架构玩法介绍 实现很简单,就是一股脑把周围环境信息、记忆、这个世界的规则、玩家给的方针、能选择的动作都喂给大模型,最后大模型给出最合理的动作。 ATB + AP:让执行阶段既有顺序又有节奏 这是一个战旗类的游戏,AI行动肯定要有个行动顺序 单位行动顺序不是简单轮流,而是类似 ATB 的行动条模型。速度受多种因素影响: 基础机动能力; 装备修正; 人格倾向,例如勇气、攻击性、审慎; 饥饿、疲劳、受伤、士气等状态; 当前任务偏置; 连续同阵营行动的平衡惩罚。 每个单位在执行阶段有 AP。攻击、移动、观察、防御、生产、建造、强化、交易等动作消耗不同 AP。饥饿和疲劳会压缩行动能力。 AI 决策:把模型关进合法动作空间 我的做法是把 AI 决策拆成四层: 服务端生成候选动作 ↓ LLM 在候选空间里选择 ↓ 结构化 Schema 校验 ↓ 业务规则二次裁决 ↓ 执行器修改世界状态 先枚举候选,再让模型选择 单位行动前,服务端会基于真实世界状态生成动作候选,例如: 可以移动到哪些相邻格; 可以攻击哪些敌人; 可以观察、防御、撤退; 可以吃什么、喝什么、捡什么; 可以和谁交谈、交易、表白、救援; 可以在哪些地形上采集、狩猎、钓鱼、采矿; 可以建造、拆除、收获哪些设施; 如果没有好动作,至少可以 hold 或 observe。 LLM 看到的不是一个无限开放世界,而是一个经过服务端裁剪的合法动作空间。 这件事非常关键: 不要用 prompt 请求模型遵守规则,要用程序把非法动作从动作空间里删掉。 Prompt 模板:不是把世界一股脑喂给模型 单位决策 Prompt 的核心不是"描述得越多越好",而是把信息分层、裁剪、结构化。当前模板大致分成这些块: 单位决策提示词版本: action_params_v4 当前回合 / 当前阶段 / 本次可用 AP MOVE 坐标白名单:只列本回合真正可到达的空地 阵营自然语言方针上下文:全局方针 + 单位任务 + 即时令 单位资料:属性、HP、饥饿、背包、装备、位置、阵营 单位人格:勇气、忠诚、攻击性、审慎、社交、稳定等 记忆摘要:近期事件 + 长期摘要 + 闪回记忆 关系网:对附近单位的信任、亲密、恐惧、竞争等 世界知识:这个单位已经学到的地形/资源/敌情规律 环境摘要:脚下地形、设施、天气、最近威胁、可见友军/敌军 合法候选动作列表:attack/move/trade/build/dialogue/hold... 参数填写规则:每类 action 能填哪些字段,哪些字段必须为空 决策流程:先确认合法动作,再理解方针,再按风险排序,最后输出 JSON 其中几个设计点很关键: 环境信息只给局部和摘要 :地图不会整张展开,而是给"视野内地形"“最近敌军距离”“本回合可到达地块”"脚下可做事项"等压缩信息。 记忆不是全量聊天记录 :短期记忆保留事件粒度,长期记忆用摘要;再加上关系、世界知识和闪回召回。 动作空间是结构化枚举 :模型不是自由写动作,而是在服务端生成的候选动作中选。 玩家方针是强信号,不是硬 RPC :Prompt 会明确注入方针和任务,但后续还有服从度、风险和合法性裁决。 对应的核心构造代码可以压缩成下面这个片段: 输出解析:JSON Schema + 业务校验 + 兜底动作 当前没有用正则解析自然语言,也没有让模型直接调用游戏函数。LLM 走的是结构化 JSON: 服务端根据候选动作动态生成 JSON Schema; Provider 使用 OpenAI-compatible 的结构化输出能力; 返回后先做 JSON Schema 校验; 再把 choice 映射回候选动作; 最后用业务规则重新校验; 失败时降级为保守动作,例如 hold、observe 或 confused decision。 动态 Schema 的重点是: action 是当前候选动作枚举, move 坐标用 const 限死到合法坐标。 执行入口也保持这条边界:模型只产出 unitDecisionPayload ,真正落地必须经过 validateDecision 和 executeDecision 。 记忆系统:角色连续性的底层设施 LLM NPC 最大的问题不是不聪明,而是容易"无历史"。 如果一个角色刚被队友救过,下一回合却完全忘了这件事,那它就只是一个会说话的状态机。反过来,如果把所有历史都塞进 prompt,又会造成上下文爆炸、成本上升、响应变慢。 所以记忆系统要解决的不是"多记一点",而是: 记住值得记住的,忘掉应该忘掉的,并在相似情境下想起来。 结构化记忆,而不是聊天记录数组 记忆被分成多个类别: 实体记忆:我认识谁,他做过什么; 空间记忆:哪里危险,哪里有资源; 关系记忆:谁救过我,谁背叛过我; 事件记忆:一次战斗、一次受伤、一次交易; 世界知识:阵营、地形、敌人动向; 长期摘要:跨多个回合压缩后的生平片段。 每条记忆都有重要性、情绪权重、显著度、是否永久、来源和发生回合。 显著度、遗忘和闪回 记忆会随时间衰减,但不是线性消失。重要事件、强情绪事件、关系事件会保留更久。当前环境如果和历史事件相似,还会触发"闪回"。 例如: 单位再次进入曾经被伏击的森林; 附近出现曾经伤害过它的人; 天气、地形、敌人组合与某段痛苦记忆高度相似。 这类记忆会被重新召回,并进入本次决策上下文。 这比"最近 N 条聊天记录"更接近角色认知:人不是机械回放全部历史,而是在处境相似时想起关键片段。 短期事件 + 长期摘要 长期对局里,事件会越来越多。系统会把较旧的记忆压缩成长期摘要,保留角色人生轨迹,而不是保留每个细节。 所以记忆分两种粒度: 短期:事件粒度,适合即时决策 长期:摘要粒度,适合人格连续性 这也是控制 LLM 成本的关键。 恋爱与家庭:关系不是玩家按钮,而是双方同意 恋爱系统没有把"结婚"做成玩家直接触发的按钮。触发条件分为三层: 前置关系 :两名单位必须有多轮真实对话,并且双方关系都达到熟悉阈值; 提议判断 :LLM 同时扮演双方,判断是否有人主动提出确认亲密关系; 双方同意 :只有双方都真心同意,关系才成立。 Prompt 里不会直接写一个"好感度=80 可以结婚"的硬规则,而是把关系摘要、对话历史、性格、阵营压力和最近事件放进上下文。好感度在规则层表现为 relationTier 、互相信任/亲密等关系状态;LLM 负责把这些状态翻译成当下是否愿意推进关系。 孩子出生也不是纯随机。名字、生平和人格向量由 LLM 根据父母资料生成,但人格会经过规则层归一化;如果模型失败,则使用规则 fallback。孩子的基础人格是父母人格均值与一个确定性随机人格混合: 这个设计避免了两个问题:玩家不能强迫单位恋爱;模型也不能凭一句浪漫台词绕过双方同意和关系门槛。 贸易:等价交换靠候选生成和同意校验 贸易系统的核心不是让模型"理解经济学",而是让服务端先生成可交易候选:谁有物品、谁有钱、距离是否相邻、物品基础价值是多少、能否赠与/售卖/调拨金币。模型只能在这些候选里选择。 执行时,交易接收方还会单独做一次同意判断。这个 Prompt 明确要求目标单位只代表自己判断,可以因为敌我关系、风险、战略价值、补给不足或不信任而拒绝。 所以"会不会亏本买卖"的答案是:系统允许单位因为关系、救急或战略需要做非等价交换,但不会让模型凭空创建交易;接收方可以拒绝,失败或格式异常也默认拒绝。经济公平由候选价格、背包/钱包校验和双方同意共同约束。 总结感想 这里写一些最近开发的感想吧。似乎将AI接入游戏的落地还很少,但我觉得如果真的落地了我觉得现在的游戏将会更加有意思,毕竟谁不想和一个活生生的,会自己思考的AI、NPC打交道呢。 这仅仅是一个Demo,后续有时间我也会继续迭代的。加入更多的规则和玩法,让AI持续去探索,我觉得这样这个游戏将会越来越有趣,比如增加更多的建筑,更多的事件,甚至将每个单位的智商属性和使用的大模型进行挂钩,智商属性越高的AI越聪明,对记忆系统进行优化等等,我相信如今大模型的能力也能够驾驭得了这么多的输入。 我也觉得如今AI大模型的发达,可能更利好于个人开发者,其一呢个人开发者往往使用的是很通用的技术,而不是像企业一样有繁琐的流程、各种基建。AI训练的语料也都是最直接、原始的方式,所以个人开发者的技术栈与预训练语料天然对齐,而企业往往需要一套封装。比如一般个人开发者上线是直接使用Linux命令、docker,而企业往往都会自建一套自己的流程和平台,这次游戏还有以前我做的个人项目上线往往都是让AI自己开发完成就自己上线了,但是在企业想做到这一步可能还得投入不少的人力成本来训练AI。其二呢AI 把过去个人开发者必须外包的设计、文案等职能内化到一人手中,让 “一人公司” 第一次具备商业可行性。比如这次游戏的一些设计、文案都是由AI设计的( 也抄了不少Unciv的 )。 标题中的三天,其实是断断续续加起来的三天。放在三年前,我相信随便拉一个编程高手,或者拉一个经验丰富,合作默契的团队,三天肯定是做不出这样一个玩意的,即使是一个demo,可能三周还差不多? 但是现在,仅仅是我这样一个还没毕业的菜鸟,只花了三天时间做出来了。可以见到AI对咱们的提效是多么巨大。不仅仅是软件行业,在各行各业,我觉得AI的冲击都将会更加猛烈。 从chatgpt2022年出来,那时我好像还高中来着,那时借助AI编程的方式是把代码粘贴到聊天框里,然后他吐出来我再粘回去。到2024用的copilot,就是根据上下文自动提示代码,然后tab补全。2025用的是cursor,就能够读取项目下的所有代码,然后根据提示词自己写代码了。到如今的codex,claudecode,和cursor的区别,就是直接把看代码的地方扣掉了。AI在编程落地的方式突飞猛进,在其他领域的发展我也相信也会这样突飞猛进。 有了AI的帮助,我相信人类能离理想中的乌托邦更进一步。 6 个帖子 - 3 位参与者 阅读完整话题
自从去年大概一二月份,一群博主疯狂推荐红利低波这一类的指数开始,就有一群小白以为股息=利息。现在xhs上面还有一群人对比各种股票之间的股息哪个高哪个低,然后就往那种高股息股票里面疯狂涌入。 甚至还有一种观点认为“红利股无所谓高低点,因为股息迟早会把这些弥补回来。” 就这样子的情况下,还有一群只有这种知识水平的小白疯狂涌入市场去开户。其实有的时候也能慢慢理解为什么国家要出台各种限制了。 9 个帖子 - 5 位参与者 阅读完整话题
公司写字楼大厅处看起来是招行的一群工作人员在那摆摊,桌子上放了很多奶茶和礼品啥的,还有个看板推销什么新人礼。 看到人就问有没有掌上生活,注册就送奶茶。 被缠住下载好app后也没说什么注册,业务员反而让我用wx扫他平板上二维码,还骗人说不是申请信用卡。 看了下网址似乎是正规的,进去第一步就要上传身份证,本想拒绝,我就说没带,这业务员直接给我从支付宝里把正反面弄出来了 犹豫了下,因为有招行储蓄卡就没多想,上传完证件后,同意了条款,进入下一步,发现还要填手机号收验证码提供担保人信息啥的,才反应过来就是骗人办信用卡,我本来就有几张信用卡,所以马上拒绝并退出了。 只上传了身份证不会有什么影响吧,他弄二维码时我看他在平板上刷出来全是地址信息,我身份信息会不会已经到他那儿了,他别给我悄悄办了吧, 还有扫出来的那个申请网页也不知道是真的假的,软件被杀后台具体网址也看不到了,如果是假的话就凉拌了 3 个帖子 - 3 位参与者 阅读完整话题
最近在b站刷到一个视频是把一群ai接入到openclaw里面然后互相进行网络攻防。其中好像是minimax取得了最高的成绩,然后是kimi和claude的综合成绩较高而gemini的得分是最低的(国产模型现在在网络攻防领域这么厉害了吗? 想请佬友评价一下这个视频的可信度有多少,如果有地方不严谨希望佬友能耐心指出。我对ai的这些测评(赛博斗蛐蛐)非常感兴趣OvO 不知道是否可以放视频连接,构不构成推广,若不构成我会在后续补充链接,否则可能需要麻烦佬友自己搜索了qwq 9 个帖子 - 4 位参与者 阅读完整话题
最近刷x,很多中推都在发Linux do 社区,感觉都是同一群互相认识的人在发 3 个帖子 - 3 位参与者 阅读完整话题
我组了一个 7 人 AI 团队,全职替我炒币——而且我不用管它们 缘起:从一个人写代码,到一群人替你干活 几个月前,我还是个普通的量化爱好者:一个人在 VS Code 里写策略、跑回测、手动下单、盯着 K 线发呆。最大的痛点不是策略好不好——而是 一个人干不了所有事 。 你需要有人盯盘、有人研究论文、有人跑回测、有人算风控、有人复盘。一个人切换角色,每次切换都有上下文切换成本,而且很容易累。 后来我想: 为什么不让 AI 来干这些活? 不是让 AI 写代码——那是 Copilot 做的事。而是让 AI 扮演不同角色,组成一个自动化的交易团队, 各自干各自的活,互相配合 。 交易有风险,没有指望发家致富,单纯打发业务时间而已 架构:7 个角色 + 1 个策略官 我建了一个 7 人的量化交易团队,每个角色都是一个独立的 AI Agent,有清晰的分工: 角色 职责 工作时间 研究官 扫描 arXiv、GitHub、机构研报,找可落地的 Alpha 每天清晨 回测官 验证研究官的想法,跑两轮牛熊回测 按需触发 参谋官 跟踪市场动态,分析 BTC 多空比、资金费率 每天两次 策略官 统筹整个 R&D 流水线,是团队大脑 每天下午 风控官 6 条风控红线,守住风险底线 每天三次 实盘官 记录交易,生成日报 每天两次 复盘官 汇总一周数据,生成周报 每周 关键设计: 策略官是研发队长 ——研究官发现新 Alpha → 调度回测官验证 → 数据通过后推给风控官审核 → 实盘官灰度上线 → 复盘官反馈 → 循环迭代。 这不是一个单次执行的工作流,而是一个 每天自动运转的 R&D 流水线 。 从5.1假期结束开始自动跑,全程基于Hermes+飞书(个人习惯,换成OpenClaw也没有问题) 核心原则:不问只做 团队最重要的原则就四个字: 不问只做 。 每个角色遇到任何决策,先问自己一个问题: 「这个决定能让持续盈利更近一步吗?」 如果是 → 直接执行,事后一句话报告。 如果不是 → 分析原因,毙掉。 如果不确定 → 做最小可行版本,数据会告诉你答案。 这个原则的效果是: 团队永远不会停下来等我批准 。研究官发现新论文 → 直接写假设 → 推给回测官。回测官发现没回测引擎 → 直接写引擎 → 重新跑回测。风控官发现回撤超红线 → 直接退回。全程零人工干预。 工程实践:区分 AI 的活和脚本的活 这是整个系统最关键的认知: 不是所有任务都需要 AI 参与。纯工程任务应该由脚本做,AI 只做需要推理的事。 举个例子:每小时上报一次收益。我最初让 AI 每小时写一次报告——后来发现完全是在浪费 token。 0 token 能解决的事,为什么要花 10000 token? 于是我们把任务分成两类: 类型 特征 方案 Token 消耗 确定性任务 固定格式、无推理 纯脚本(no_agent) 0 推理任务 需要判断、决策、创造 AI Agent 按需 数据采集、收益报告、风控状态检查 → 全部是纯脚本。研究、回测、策略评估、复盘分析 → 留给 AI。 这个区分让系统的 运营成本几乎为零 ——每天几十个自动化任务,token 开销只来自真正需要推理的那几个。 技术实现:怎么做出来的 Agent 框架 基于通用 AI Agent 框架构建,每个角色是一份 Persona 文件 + 定时调度 。Persona 文件定义了角色的身份、行为准则、决策流程和 SOP。Agent 启动时加载 Persona,然后独立运行。 定时调度 使用 cron 管理所有 Agent 的运行时间。每个角色有固定的执行时段,确保团队节奏有序:清晨研究、中午回测、下午策略、傍晚风控、晚上复盘。 数据闭环 所有交易记录写入结构化日志(JSON Lines),每小时自动打包成共享上下文。下游角色(调优器、策略官、复盘官)读取同一份数据源, 确保团队对当前的持仓、盈亏、信号效能有一致的理解 。 交易日志 → 自动打包 → 共享上下文 → 参数调优 → 策略覆盖 → 新交易 ↺ 闭环反馈 模型分级 不同任务用不同模型—— 不是所有任务都需要最强的模型 : 需要复杂推理的(策略评估、风控审核)→ 顶级模型 执行型任务(研究扫描、回测运行)→ 快速模型 纯确定性任务 → 0 token,脚本搞定 实战效果:回测引擎开发 举一个实际的例子—— 团队自主开发回测引擎 。 过程是这样的: 研究官 在 arXiv 上发现两篇论文(永续合约做市策略、基差交易动态抵押品控制),评估可执行性后写入 R&D 流水线 回测官 中午检查流水线,发现有新假设 → 尝试跑回测 → 发现 没有对应的回测引擎 回测官 Phase 0 直接拒绝,原因是"基础设施缺失",并写清楚需要什么样的引擎 策略官 (研发队长)评估后,决定 先写引擎再回测 。调度了两条工作流并行开发: 一个写插针反转策略的回测引擎 一个写资金费率基差策略的回测引擎 引擎建成后,回测官自动跑两轮牛熊回测 回测结果出来:插针策略平均亏损 0.49%,毙掉。基差策略 BTC 上 +48% 但回撤 26%,需要优化 策略官自动跑 27 组参数扫描 → 找到最优参数组合 → 回撤压到 14.34% 实盘包装器自动生成,集成到主循环 报告自动写入团队文档库 整个过程没有问过任何人一个问题 。从研究到部署,全自动。 遇到的坑 1. 手续费计算 bug 导致回测全错 最早的回测引擎有一个隐蔽的 bug:手续费按「总权益」收,而不是按「仓位价值」收。500 笔交易多扣 36%。这意味着 所有回测结果都是错的 。 修复后,之前看着赚钱的策略变成了亏损。 教训 :回测引擎的每一行代码都需要审计。一个数学 bug 可以让整个团队做两周无用功。 2. 实盘退出路径从未真正触发 另一个更隐蔽的 bug:写了止损/止盈/追踪止的逻辑,但退出路径从未调用交易所的平仓 API——只更新了本地状态和日志。这意味着 所有声称的平仓在交易所上从未执行 。 发现过程:检查交易日志 vs 实际持仓,发现不一致。 教训 :本地模拟和真实执行之间有一条鸿沟。每个关键的 side-effect 都要写 “actually calling API” 之类的确认日志。 3. Agent 之间需要「共享真相源」 早期每个 Agent 自己读交易所数据,导致同一时间点不同角色看到的持仓不一致——实盘官说亏 2%,风控官说亏 5%。原因只是 API 请求时间差了 3 秒。 修复 :每小时统一打包一次系统状态(持仓、余额、交易日志),所有角色读同一份文件。 给想尝试的人的建议 先有工程基础,再上 AI 。交易系统是工程问题,不解决数据采集、订单执行、风控基础设施,加再多 AI 也没用。 Persona 文件决定一切 。团队好不好,核心看每个角色的定义够不够清晰——不是"帮我做研究",而是"每天 06:00 扫描这些源,输出这个格式,按这个决策框架判断"。 别高估 AI 的能力 。AI 擅长推理和决策,但完全不会执行交易(延迟问题)、不会算数(精度问题)、不会记账。让 AI 做它擅长的事,其他交给脚本。 从最简单的闭环开始 。不需要一开始就 7 人团队。先让一个研究 Agent 每天产出简报,然后把简报手动喂给回测脚本。等跑通了再加自动化。 日志就是一切 。没有结构化日志的系统是不可调试的。每笔交易、每个决策、每个错误都要记录。后续的分析、调优、归因全靠它。 最后 这个系统最让我惊讶的不是 AI 能写出不错的策略代码,而是 AI 能在完全没人指挥的情况下,自主发现基础设施缺陷并主动修复 ——研究官发现新思路 → 回测官发现缺引擎 → 策略官决定造引擎 → 所有角色自主完成。 团队不会因为我在睡觉就停滞不前。 当然,这套东西离"稳定盈利"还有很长距离——我们正在优化的那条策略年化只有 14%,离 50% 目标还很远。但方向对了: 让 AI 做决策,让脚本做执行,让人做定义。 31 个帖子 - 17 位参与者 阅读完整话题
今天去公园拉引体向上,快要到那片杨树林的时候,看到一群喜鹊在那里啄食,地上还有很多鸟粪,我寻思哪来这么多吃的,结果走近一看,地上一堆从树上掉下来的毛虫在那里蛄蛹,其中一只靠近头部六分之一处,一只蚂蚁趴在上面,应该是将颚嵌到了毛虫肉里,毛虫的尾部还带着一块暗绿色的东西,不知道是分泌物还是掉下来的时候连带着的树芽,毛虫就在那里不断地扭动,翻滚,停一会,然后突然甩动,企图将蚂蚁甩下来,但蚂蚁嵌的很死,双方就这样僵持着,直到我离开,而离开前旁边的喜鹊就在一直往前靠,估计我走了之后,它就彻底走上前了吧。或许毛虫在蚂蚁刚上它身时就甩动,蚂蚁就被甩下来了?或许蚂蚁最终迎来了它的同伴,帮他一起猎杀这只毛虫?也或许他们俩都被喜鹊吃了。 1 个帖子 - 1 位参与者 阅读完整话题
我有一群客户,想要 claude 和 sd2 的 api,谁有渠道啊?而且量也大 源头滴滴我啊啊~ 2 个帖子 - 1 位参与者 阅读完整话题
我组了一个 7 人 AI 团队,全职替我炒股——而且我不用管它们 缘起:从一个人写代码,到一群人替你干活 几个月前,我还是个普通的量化爱好者:一个人在 VS Code 里写策略、跑回测、手动下单、盯着 K 线发呆。最大的痛点不是策略好不好——而是 一个人干不了所有事 。 你需要有人盯盘、有人研究论文、有人跑回测、有人算风控、有人复盘。一个人切换角色,每次切换都有上下文切换成本,而且很容易累。 后来我想: 为什么不让 AI 来干这些活? 不是让 AI 写代码——那是 Copilot 做的事。而是让 AI 扮演不同角色,组成一个自动化的交易团队, 各自干各自的活,互相配合 。 架构:7 个角色 + 1 个策略官 我建了一个 7 人的量化交易团队,每个角色都是一个独立的 AI Agent,有清晰的分工: 角色 职责 工作时间 研究官 扫描 arXiv、GitHub、机构研报,找可落地的 Alpha 每天清晨 回测官 验证研究官的想法,跑两轮牛熊回测 按需触发 参谋官 跟踪市场动态,分析 BTC 多空比、资金费率 每天两次 策略官 统筹整个 R&D 流水线,是团队大脑 每天下午 风控官 6 条风控红线,守住风险底线 每天三次 实盘官 记录交易,生成日报 每天两次 复盘官 汇总一周数据,生成周报 每周 关键设计: 策略官是研发队长 ——研究官发现新 Alpha → 调度回测官验证 → 数据通过后推给风控官审核 → 实盘官灰度上线 → 复盘官反馈 → 循环迭代。 这不是一个单次执行的工作流,而是一个 每天自动运转的 R&D 流水线 。 核心原则:不问只做 团队最重要的原则就四个字: 不问只做 。 每个角色遇到任何决策,先问自己一个问题: 「这个决定能让持续盈利更近一步吗?」 如果是 → 直接执行,事后一句话报告。 如果不是 → 分析原因,毙掉。 如果不确定 → 做最小可行版本,数据会告诉你答案。 这个原则的效果是: 团队永远不会停下来等我批准 。研究官发现新论文 → 直接写假设 → 推给回测官。回测官发现没回测引擎 → 直接写引擎 → 重新跑回测。风控官发现回撤超红线 → 直接退回。全程零人工干预。 工程实践:区分 AI 的活和脚本的活 这是整个系统最关键的认知: 不是所有任务都需要 AI 参与。纯工程任务应该由脚本做,AI 只做需要推理的事。 举个例子:每小时上报一次收益。我最初让 AI 每小时写一次报告——后来发现完全是在浪费 token。 0 token 能解决的事,为什么要花 10000 token? 于是我们把任务分成两类: 类型 特征 方案 Token 消耗 确定性任务 固定格式、无推理 纯脚本(no_agent) 0 推理任务 需要判断、决策、创造 AI Agent 按需 数据采集、收益报告、风控状态检查 → 全部是纯脚本。研究、回测、策略评估、复盘分析 → 留给 AI。 这个区分让系统的 运营成本几乎为零 ——每天几十个自动化任务,token 开销只来自真正需要推理的那几个。 技术实现:怎么做出来的 Agent 框架 基于通用 AI Agent 框架构建,每个角色是一份 Persona 文件 + 定时调度 。Persona 文件定义了角色的身份、行为准则、决策流程和 SOP。Agent 启动时加载 Persona,然后独立运行。 定时调度 使用 cron 管理所有 Agent 的运行时间。每个角色有固定的执行时段,确保团队节奏有序:清晨研究、中午回测、下午策略、傍晚风控、晚上复盘。 数据闭环 所有交易记录写入结构化日志(JSON Lines),每小时自动打包成共享上下文。下游角色(调优器、策略官、复盘官)读取同一份数据源, 确保团队对当前的持仓、盈亏、信号效能有一致的理解 。 交易日志 → 自动打包 → 共享上下文 → 参数调优 → 策略覆盖 → 新交易 ↺ 闭环反馈 模型分级 不同任务用不同模型—— 不是所有任务都需要最强的模型 : 需要复杂推理的(策略评估、风控审核)→ 顶级模型 执行型任务(研究扫描、回测运行)→ 快速模型 纯确定性任务 → 0 token,脚本搞定 实战效果:回测引擎开发 举一个实际的例子—— 团队自主开发回测引擎 。 过程是这样的: 研究官 在 arXiv 上发现两篇论文(永续合约做市策略、基差交易动态抵押品控制),评估可执行性后写入 R&D 流水线 回测官 中午检查流水线,发现有新假设 → 尝试跑回测 → 发现 没有对应的回测引擎 回测官 Phase 0 直接拒绝,原因是"基础设施缺失",并写清楚需要什么样的引擎 策略官 (研发队长)评估后,决定 先写引擎再回测 。调度了两条工作流并行开发: 一个写插针反转策略的回测引擎 一个写资金费率基差策略的回测引擎 引擎建成后,回测官自动跑两轮牛熊回测 回测结果出来:插针策略平均亏损 0.49%,毙掉。基差策略 BTC 上 +48% 但回撤 26%,需要优化 策略官自动跑 27 组参数扫描 → 找到最优参数组合 → 回撤压到 14.34% 实盘包装器自动生成,集成到主循环 报告自动写入团队文档库 整个过程没有问过任何人一个问题 。从研究到部署,全自动。 遇到的坑 1. 手续费计算 bug 导致回测全错 最早的回测引擎有一个隐蔽的 bug:手续费按「总权益」收,而不是按「仓位价值」收。500 笔交易多扣 36%。这意味着 所有回测结果都是错的 。 修复后,之前看着赚钱的策略变成了亏损。 教训 :回测引擎的每一行代码都需要审计。一个数学 bug 可以让整个团队做两周无用功。 2. 实盘退出路径从未真正触发 另一个更隐蔽的 bug:写了止损/止盈/追踪止的逻辑,但退出路径从未调用交易所的平仓 API——只更新了本地状态和日志。这意味着 所有声称的平仓在交易所上从未执行 。 发现过程:检查交易日志 vs 实际持仓,发现不一致。 教训 :本地模拟和真实执行之间有一条鸿沟。每个关键的 side-effect 都要写 “actually calling API” 之类的确认日志。 3. Agent 之间需要「共享真相源」 早期每个 Agent 自己读交易所数据,导致同一时间点不同角色看到的持仓不一致——实盘官说亏 2%,风控官说亏 5%。原因只是 API 请求时间差了 3 秒。 修复 :每小时统一打包一次系统状态(持仓、余额、交易日志),所有角色读同一份文件。 给想尝试的人的建议 先有工程基础,再上 AI 。交易系统是工程问题,不解决数据采集、订单执行、风控基础设施,加再多 AI 也没用。 Persona 文件决定一切 。团队好不好,核心看每个角色的定义够不够清晰——不是"帮我做研究",而是"每天 06:00 扫描这些源,输出这个格式,按这个决策框架判断"。 别高估 AI 的能力 。AI 擅长推理和决策,但完全不会执行交易(延迟问题)、不会算数(精度问题)、不会记账。让 AI 做它擅长的事,其他交给脚本。 从最简单的闭环开始 。不需要一开始就 7 人团队。先让一个研究 Agent 每天产出简报,然后把简报手动喂给回测脚本。等跑通了再加自动化。 日志就是一切 。没有结构化日志的系统是不可调试的。每笔交易、每个决策、每个错误都要记录。后续的分析、调优、归因全靠它。 最后 这个系统最让我惊讶的不是 AI 能写出不错的策略代码,而是 AI 能在完全没人指挥的情况下,自主发现基础设施缺陷并主动修复 ——研究官发现新思路 → 回测官发现缺引擎 → 策略官决定造引擎 → 所有角色自主完成。 团队不会因为我在睡觉就停滞不前。 当然,这套东西离"稳定盈利"还有很长距离——我们正在优化的那条策略年化只有 14%,离 50% 目标还很远。但方向对了: 让 AI 做决策,让脚本做执行,让人做定义。 23 个帖子 - 19 位参与者 阅读完整话题
时间:4月17日 晚8点30 受伤过程:跟一群朋友网球双打,接一个二区外角发球,在启动一瞬间,感觉到跟腱‘嘣’的一声(可能只是身体的感觉),立马倒地,竟然没有任何擦上,说明潜意识在倒地瞬间做了自我保护。 就医过程:立马打电话叫救护车,并通知我老婆直接去医院。然后静躺等待,怕有二次伤害。9点左右入急诊,医生摸了后跟腱下,说跟腱没了。另一方面运气比较好,有个副主任医生正好夜班,正常来说,要先做核磁,但周末不上班,所以直接做CT,然后准备手术。之后就是办理住院手续,10点半左右吧,进了手术室。活了35+,这是第一次进手术室。之后就是腰部以下麻醉,但是,哥们在手术时候,直接睡着了,应该是麻药的作用。等我醒来手术已经做完了,石膏也绑好了。接下来就是煎熬的住院观察期。 住院观察:总计6天,前两天有麻药和那个镇痛的,不能下床,所以只能在床上解决小便,大便就完全没有。两天后就好一点了,主要是人没有那么惛沉,活动能力也提高了一点,可以自己下床坐轮椅。但跟腱那一块,还是很痛,就那种充血的胀痛感。另外,3人间的病房,很难休息好。第一晚,我老婆先是陪我打完点滴,然后去车里拿了躺椅准备睡觉,但实在太吵了,边上床有个嗲嗲会突然毫无预兆的踢床什么的,难顶!!然后大概熬到了快4点,让她回家睡觉去了。在后面两天,我就基本能自理了,只要我老婆能给我送饭过来就好了。 出院:我这个属于个人意外,所以需要填写一个意外情况说明,医保报销需要。最终个人支付2700+,医保报销5000+。中间有个插曲,4月正好失业,但是当时还没有搞失业登记,所以受伤之后,医保是停用状态,但是我个人立马申请了灵活就业,把医保补上了。不然个人掏出8000出来,还是很肉疼的。 现状:本来是计划4月份找工作的,现在被按下暂停键了。恢复基本正常行走,估计要3个月左右。今天跟腱靴到了,开始进一步的康复训练。 总结: 运动前一定要充分热身和拉伸 运动前一定要充分热身和拉伸 运动前一定要充分热身和拉伸 热身不仅仅是身体热起来和心率上来,还一定要把关节活动开,做一些拉伸。我回头想了受伤这一天整个运动相关的经历,上午跟朋友轻松拉球差不多一个半小时,没有很剧烈的跑动,当作是热身。晚上7点开始,跟先来的朋友一起拉球,差不多40分钟,也是当作热身,比上午剧烈一点,我感觉到了一点点出汗。之后陆续来了人,就开了一场双打比赛,大概是打了20分钟左右,我就下场一直休息。等再次上场就是8点20分了,所以中间应该休息了接近1个小时,身体应该是彻底冷下来了。我感觉这应该就是受伤的关键原因。如果有运动以分学大佬路过可析下,帮助更多的人了解运动伤害和防范。 就这么做个简单的记录吧,希望大家都身体健康,现在路上看别人正常走路都羡慕的不得了。 1 个帖子 - 1 位参与者 阅读完整话题
不说了 删帖 发出来一群说我各种问题的 要是没举报有奖可能还好点 现在不管你啥情况先给你举报再说 12 个帖子 - 11 位参与者 阅读完整话题
从 openai: 为什么我们的模型喜欢上了哥布林 | 奇怪的黑话 继续讨论: 省流: 内部训练gpt的时候,给他设定了人格,比如「书呆子」(Nerdy) 此类人格非常容易使用生物词汇 随着不断迭代,就变成了如今这个样子 我倒是没见过() 因为是英文用户专属() 文源APPso 截掉了部分无关紧要的内容() 过程中也分享一点自己的内容 https://openai.com/index/where-the-goblins-came-from 不过中文用户好像并没有这种人格: 除非是那个天马行空 原来现在选什么都没用了() 哥布林万岁≧▽≦! 顺便写了个小说 ChatGPT ChatGPT - 哥布林大合影 Shared by 星缘 via ChatGPT 还是蛮有意思的 7 个帖子 - 5 位参与者 阅读完整话题
一群普通人,甚至可能对人工智能知之甚少,很快将决定 OpenAI 的未来走向。埃隆・马斯克起诉 ChatGPT 开发商 OpenAI 及其高管(含首席执行官山姆・奥尔特曼)的诉讼,于周一正式开庭。一众科技巨头高管预计将出庭作证,核心争议为:OpenAI 管理层是否欺骗马斯克、背弃机构最初的非营利使命,私自转型并设立盈利业务板块。 (从左至右):OpenAI 首席执行官山姆・奥尔特曼;特斯拉、太空探索技术公司(SpaceX)首席执行官埃隆・马斯克。 本次庭审正值 OpenAI 处境敏感的关键时期:公司酝酿大规模首次公开募股(IPO),行业竞品竞争白热化。一旦马斯克胜诉,OpenAI 的上市计划或将彻底泡汤。奥尔特曼与 OpenAI 联合创始人兼总裁格雷格・布罗克曼可能被罢免职务,这将为马斯克旗下人工智能企业 xAI 扫清障碍、抢占行业先机。 韦德布什证券公司分析师丹・艾夫斯在研报邮件中表示:“马斯克对阵奥尔特曼,如同一场科技圈真人对决,所有投资者都在密切关注。法庭之上,双方大概率会互相揭短、激烈攻讦,对所有涉事方均无益处,而马斯克已将这场纠纷私人化。” 但本案牵扯全球首富、人工智能标杆企业、一众顶尖科技巨头与行业领袖,想要选出完全中立、不带偏见的陪审团,难度极大。 陪审团将如何遴选? 马斯克与奥尔特曼早已不止是企业高管,更是家喻户晓的公众人物。陪审团顾问艾伦・图尔克海默向美国有线电视新闻网(CNN)坦言,大量候选陪审员,尤其是来自硅谷的人群,“对这两位科技与 AI 巨头早已抱有根深蒂固的主观立场。” 天普大学法学院庭审辩护项目主任伊丽莎白・利皮教授认为,存在固有印象并非绝对阻碍。 “法律并不要求陪审员从未听说过埃隆・马斯克或人工智能,” 她表示,“只要求陪审员抛开既有认知,仅依据法庭呈上的证据作出裁决。” 图尔克海默透露,法官将在周一的陪审团筛选环节,征召 三倍于普通民事案件规模 的候选人员。 法官与双方律师将全面摸底候选陪审员的态度,不仅考察他们对两位知名当事人的看法,也会了解大众对人工智能行业的整体立场。 本案中,陪审团仅需出具 参考性责任认定意见 ,最终赔偿裁定、处罚判决等全部由主审法官伊冯娜・冈萨雷斯・罗杰斯全权决定。 马斯克的核心诉讼主张 马斯克于 2015 年联合创立 OpenAI 并以非营利模式运营,同时提供资金支持。他自述,创办初期累计出资约 4400 万美元。但 2018 年,双方爆发激烈权力斗争,马斯克最终退出公司,并在后续创立自家 AI 企业 xAI。 马斯克离开后,OpenAI 亟需补充运营资金,于 2019 年设立盈利性子公司;2025 年,该盈利主体转型为公益法人企业,由非营利基金会监督管控,该架构调整已于去年获得加州与特拉华州总检察长批准。 马斯克指控,此次架构彻底背弃 OpenAI 初心:机构成立初衷为研发安全、开源的人工智能,服务公共利益、而非谋取私人利益。他认为,OpenAI 利用自己当年的投入非法牟利,构成 慈善信托违约与不当得利 。 微软也被列为共同被告,遭指控协助、纵容 OpenAI 违反慈善信托约定。 马斯克在原始诉状中写道:“奥尔特曼及其同伙背叛了我,也背叛了这家非营利机构的创立宗旨。这场背信与欺诈,堪称莎士比亚式的戏剧丑闻。” 马斯克诉求包括:判令 OpenAI 恢复原有非营利架构、罢免奥尔特曼与布罗克曼的董事职务、索赔超 1300 亿美元赔偿金。马斯克已向法院申明,所有赔偿金将划归 OpenAI 非营利主体,个人不会从中获利。 OpenAI 则反驳称, 当年正是马斯克本人极力推动公司转向盈利模式 ;其离职的真实原因,是未能掌控公司全部决策权。本次诉讼完全源于马斯克的嫉妒心态、后悔当年抽身离场,并意图恶意打压竞争对手。 利皮教授指出:“本案核心问题极具现实意义 —— 一家以公共利益为使命成立的企业,能否中途彻底转型、背离初心?与此同时,陪审员与公众都会审视马斯克的真实动机:这场诉讼是坚守原则,还是纯粹商业竞争手段?这种矛盾将贯穿全案。” 本次庭审证据材料涵盖数百页邮件、短信及科技行业大佬的私人文稿。预计出庭证人包括:马斯克、奥尔特曼、布罗克曼、微软首席执行官萨提亚・纳德拉、OpenAI 前高层管理人员,以及马斯克的关联人士(含其多名子女的母亲、前 OpenAI 董事希翁・齐利斯)。 陪审团预计将于 5 月 12 日启动评议审议。 利皮表示:“一份邮件在交叉质询中就可能造成致命打击,但庭审胜负的关键,永远在于叙事逻辑、背景事实、当事人可信度与举证责任。最终胜诉的一方,必然能将繁杂文件梳理成普通人能够理解、信服的完整事实脉络。” 查看评论
圆周和 sigma 那几个每天都能刷到一群广告,还都挺直接的,这是内部转型还是说测试投放系统? 代码不值钱了,大家都拼命卷了。
圆周和 sigma 那几个每天都能刷到一群广告,还都挺直接的,这是内部转型还是说测试投放系统? 代码不值钱了,大家都拼命卷了。
圆周和 sigma 那几个每天都能刷到一群广告,还都挺直接的,这是内部转型还是说测试投放系统? 代码不值钱了,大家都拼命卷了。