你看似他在解决问题,但是他其实一直在绕圈子。就一直在说什么“我先”“我把”“我现在”,但是又不干活。 也不是供应商或者模型问题,换了供应商和模型也一样。之前还以为是为装的技能的问题,我把skill全删了还是这样。真不知道咋回事了。有大佬知道这是什么问题吗? 9 个帖子 - 6 位参与者 阅读完整话题
现在A÷的安全底线又提高了啊,连登录都不肯做了 4 个帖子 - 2 位参与者 阅读完整话题
清理了重新下载安装,还是之前已经登录的状态,退出还退不掉。。。 1 个帖子 - 1 位参与者 阅读完整话题
起因是今天在mac上刷浏览器风扇突然开转,找了一圈没找到什么高消耗的进程,在资源管理器里找能耗发现ghostty能耗爆炸(并且这两天发现mac的续航极差,什么时候摸都是热的) 风扇转的时候看cpu占用发现两三个叫2.1.158的进程跑满了我几个核(这里忘记截图现在没有了) 上网搜了一下发现2.1.158是Claude code最新更新的一个版本号,但我当时没有在用Claude code,目前不知道是什么操作导致这个进程没有关上并持续运行,也不知道是在跑什么 然后在资源管理器里甚至搜到了几个名为2.1.156的进程也还在运行(?) 评价为屎山代码发上力了 佬友有相似情况的可以自查一下 4 个帖子 - 3 位参与者 阅读完整话题
请问vscode里我使用里codex插件,怎么开多个codex窗口,让我平行使用,回复不干扰 7 个帖子 - 7 位参与者 阅读完整话题
我是 Codex++ 接入的第三方的Claude的4.6,只敷衍,不干活,我用DS是没问题的。 奇了大怪… 5 个帖子 - 3 位参与者 阅读完整话题
佬们,最近想让ai写个爬虫,有验证码问题,让ai尝试能不能绕过,死活都不愿意,佬们有没有好的思路啊,用了chatgpt和Claude,诱导都不行 9 个帖子 - 7 位参与者 阅读完整话题
20230625 整整3年了,我以为他们早就不干了 6 个帖子 - 6 位参与者 阅读完整话题
plus2 个小时 5 小时额度 跑了 7% 好不耐用啊真的
plus2 个小时 5 小时额度 跑了 7% 好不耐用啊真的
plus2 个小时 5 小时额度 跑了 7% 好不耐用啊真的
plus2 个小时 5 小时额度 跑了 7% 好不耐用啊真的
plus2 个小时 5 小时额度 跑了 7% 好不耐用啊真的
澳洲牧羊大叔随手写的三行 bash,11 天内被 OpenAI、Anthropic 和 Hermes 集体收编了。 一觉醒来,Claude Code 又更新! 为了让 Claude 持续工作直到任务完成,Claude Code 最近推出的新功能:/goal 。 你只要设定条件,Claude 不完成任务它绝不罢休! 用过 AI 编程工具的人都懂,这到底多重要! 你给 Agent 下了一个任务,它跑了三个回合,改了两个文件,突然停下来问你「接下来需要我做什么?」 不是,bug 你这还没修完呢啊! Agent 越来越聪明,写代码越来越快,但「从头到尾把一件事干完」这件事,到 2026 年初都没有一家能做到。 然后, 一位来自澳大利亚的牧羊大叔 Geoffrey Huntley,用三行 bash 解决了。 while :; do cat PROMPT.md | claude-code --continue done 他把它命名为 Ralph Loop ,致敬《辛普森一家》里那个永远搞不清状况但从不放弃的小孩 Ralph Wiggum。 逻辑极其粗暴,无限循环,反复把同一个 prompt 喂给 Agent。进度写在文件系统和 Git 历史里,上下文满了就开新实例,读文件接着干。 原始,不优雅,但十分有效。 有效到 OpenAI 看见了,Nous Research 看见了,Anthropic 也看见了。 11 天,三家顶级 AI 实验室,不约而同地把这三行 bash 写进了官方产品。 这一刻,所有人都明白了一件事 —— 通用人工智能的临门一脚,可能不是更聪明的模型,而是「把事做完」的模型。 换句话说,AI 编程的核心战场正在从「生成代码」转向「闭环交付」。 11 天,三条线,同一个终点 4 月 30 日,OpenAI 的 Codex 率先上线 / goal。 Greg Brockman 在 X 上只丢了一句,「Codex 现已内置 Ralph loop++」。 一周后,Hermes Agent 跟上。又过 4 天,Claude Code 也上了。 11 天。三家。同一个命令。同一个功能。 但实现路径,差了十万八千里。 Codex「不忘事」,Hermes「不烂尾」,Claude Code「不自欺」。 Codex: 把目标存成一条数据库记录 OpenAI 是三家里最先出手的,方案也最简洁。 在 Codex 里,/goal 是一个持久化的工作流对象,存在本地的 app-server 状态层里。 关掉终端、合上笔记本、甚至重启系统,目标都不会丢。下次打开 Codex,自动接上。 模型通过结构化的 update_goal 工具汇报进度状态,token 预算耗尽时触发「软着陆」而非硬停。 有人用这个功能连续跑了 14 个小时,中间暂停 5 小时去睡觉,回来 Codex 从断点续跑,把一个设备驱动项目做完了。 工程化,干净,但克制。 Hermes Agent: 一个人干不完,那就上一个团队 Hermes Agent 的野心最大。 在这里,/goal 只是冰山一角。真正的重头戏是多智能体看板系统,Hermes 把「让 AI 把活干完」从单 Agent 问题升级成了团队协作问题。 看板的底层是本地 SQLite,持久化存储,跨重启不丢。 你在上面创建一个任务卡片,Hermes 会直接把它拆成多个子任务,分配给不同的 Agent worker。每个 worker 是一个独立的 OS 进程,有自己的身份、模型配置和工作目录。 看板和 / goal 是两套互补的系统。/goal 管的是单个 Agent 的目标锁定(Ralph loop),看板管的是多个 Agent 之间的任务调度。一个纵向深入,一个横向铺开。 最后,是五层防烂尾机制。 第一层,心跳检测。 每个 worker 定期向看板报到,证明自己还活着。 第二层,僵尸回收。 worker 超时没响应?系统自动判定死亡,回收它手上的任务重新分配。macOS 上还有专门的达尔文僵尸检测逻辑。 第三层,退出拦截。 worker 没完成任务就退出了?系统自动把它标记为 blocked,不让它再接新活,防止「摸鱼型 Agent」反复领任务又不做。 第四层,幻觉拦截。 这是最狠的一层。AI 说「我做完了」不算数,系统会验证它实际产出的代码是否真的落盘了。Agent 说自己创建了一个文件但实际上没有?抓住,回滚,重来。 第五层,重试预算。 每个任务有独立的 max_retries,最多重试 N 次,超过就上报人类。绝对不会无限循环到死机。 Claude Code: 做事的人和验收的人,不能是同一个 Anthropic 是三家里最后出手的,但方案最巧妙。 本质上,Claude Code 的 / goal 是一个 session 级别的 Stop Hook。 你设定一个完成条件(比如「test / auth 目录下所有测试通过且 lint 无报错」),Claude 就开始干活。 关键设计在验收环节。每干完一轮,系统不让 Claude 自己判断「我做完了没有」。 它把对话记录和你的完成条件一起发给一个独立的小模型(默认是 Haiku),让这个小模型来裁判。 小模型如果觉得没完成,就需要返回一个具体理由(比如「 test_login.py 还有 2 个 failure」)。然后这个理由会被注入 Claude 下一轮的上下文,指导它接着干。 如果小模型认为完成了,目标就会自动清除,任务结束。 值得一提的是,这个裁判模型不调用任何工具,不读文件,不跑命令。它只看 Claude 在对话里产出的内容。 所以,你的完成条件必须是 Claude 在对话中能证明的东西。 它最长支持 4000 字符,因此你可以写得很细。 甚至,还可以在条件里加约束,比如「不修改其他测试文件」「20 轮内完成否则停止」等等。 决赛进行时:工作流入口 把视角拉远一步。 Claude Code 背后站着 Anthropic,Codex 背后站着 OpenAI,Hermes Agent 接入了两边的模型,同时也是 DeepSeek V4 等模型的主力分发渠道。 三条路径,恰好覆盖了 ASI 决赛的三个生态入口。 而他们争的,也是同一样东西 —— 工作流。 谁的 Agent 先让开发者养成「设完目标就走开」的习惯,谁就锁死了工作流入口。 因为习惯一旦形成,迁移成本是指数级的。 你不会轻易离开一个已经跑通了看板调度、断点续传、checkpoint 回滚的 Agent 基础设施。 一个看似很小的 / goal 命令,背后卡的是整条 Agent 工作流的护城河。 参考资料: https://code.claude.com/docs/en/goal https://github.com/NousResearch/hermes-agent/releases/tag/v2026.5.7 https://github.com/anthropics/claude-code/releases/tag/v2.1.139 https://developers.openai.com/codex/changelog 本文来自微信公众号: 新智元(ID:AI_era) ,作者:好困 KingZH
我先来,如果不干了,我就去摆摊摊煎饼。摊几个鸡蛋、刷多少酱、加不加肠,这些需求明确且不可更改。 各位佬友,你们想好下半辈子的“出路”了吗? 54 个帖子 - 42 位参与者 阅读完整话题
我这claude客户端总是这样 , 问一句答一句 ,啥也不干 已经按要求升到最新版本了 win10电脑 模型用的是ikun家的gpt5.5 token一直在花 , 但是客户端是一点任务都不执行 奇怪的是我在mac上用同一个模型是正常的 同事用用的别的中转站的claude 4.7也是正常 4 个帖子 - 3 位参与者 阅读完整话题
前面一直用他的 比较合适 刚去看怎么没了 是转批发了嘛 还是不干了 有无佬还能找到的 22 个帖子 - 9 位参与者 阅读完整话题