WWW.YOUINFO.SITE
标签聚合 年初

/tag/年初

v2ex · 2026-06-09 18:30:24+08:00 · tech

年初的时候 openclaw 刚火起来,我们惊讶于 Peter Steinberger 每天的开发效率,OpenClaw 峰值有 1 天 merge 600 commits 。我们便开始重新回顾和研究,开始一步步的向更高效率靠拢。 这小半年来我们从每天个位数的提交提升到数十次,巅峰期某天达到上百次,效率明显提升,所以我们把一点点的经验和使用的工具 Agentflow 和 it-runner 分享给大家。 (如下是 Agentflow 项目的最近提交截图) 先聊开发过程中的几个问题: 1 、手动操作和记忆消耗 AI 写代码的能力越来越强,但真正落到具体业务开发时,很多事情还是停留在“人肉调度”的阶段。 某个硬件或服务端项目,需要记住端口、环境变量、部署路径、上传方式、重启命令; 调试业务问题时,不只是跑单元测试,还要看日志、清缓存、重启服务、反复验证; 很多任务需要长期或重复运行,比如构建、部署、联调; AI 改完代码后,最好能自动执行固定流程,失败后继续让 AI 分析、修复、再验证, 避免开发者手动收集信息再转交。 这些事情单独看都不复杂,但每天重复很多次,就会非常消耗精力和考验记忆力 2 、并行开发和团队协作 我们经常同时跑多个项目、多个任务、多个 Agent 。以前用 tmux 、Cursor 、VSCode 也能跑,但时间一长会遇到几个问题: 不方便管理多个项目和多个任务; 不方便回看每个任务的历史记录; 不方便在手机或远程环境里查看进度、接手操作; 多个 Agent 同时改代码时,分支、目录、上下文容易混乱。 团队成员共同开发一个任务时,不方便共享上下文,也不容易看到其他人是怎么思考和推进任务的。 这一点在多人协作时尤其明显。 以前一个任务如果是多个人一起参与,很多上下文其实散落在微信群、飞书、终端记录、Git commit 、PR 描述里。别人要接手时,往往只能看到最终代码,很难知道前面是怎么思考的、试过哪些方案、为什么这么改。 在 AgentFlow 里,同一个任务可以由团队成员共享同一个面板。大家可以直接看到任务进度、Agent 的执行过程、其他成员写过的提示词、运行结果和后续处理思路。 这个体验对团队内部协作非常有帮助:新接手项目成员可以更快理解老成员是怎么拆解问题、怎么给 AI 下指令的;多人协作时,不需要反复同步“现在做到哪一步了”;接手任务的人也可以直接沿着前面的上下文继续推进。 成果分享 可以说 AgentFlow 不只是一个 AI 开发工具,也像是一个团队共同沉淀开发过程和业务理解的地方。 最终我们基于一些 kanban 类产品的使用体验,再结合内部孵化的 it-runner ,做出了 AgentFlow 。 官网地址: https://agentflow.geili.ai/ 简单来说,AgentFlow 想解决的是: 在浏览器里 ALL in One, 管理多个 AI 开发任务,让每个任务都可以独立运行、查看历史、执行固定流程,并且内置的 it-runner 完成测试、构建、部署、看日志、重启服务等动作。让开发者尽可能少的频繁切换终端或者 IDE. 以前很多任务需要人盯着终端一步一步操作,现在可以把流程固定下来,让 AI 改代码、跑命令、看结果、再继续修。我们团队现在每天 git commit 的次数明显变多,需求和修复都能更快推进,确实有点找到了点龙虾作者的感觉,当然还有非常大的距离。 我们也把 AgentFlow 推荐给了一些合作伙伴试用,反馈还不错。 当然,用下来也发现了一些问题。 在 AI 并行开发场景里,代码隔离非常重要。我们的体感是:一旦同时跑 2 ~ 3 个以上任务,git worktree 的收益就会非常明显。每个任务有独立目录,互相不影响,Agent 改坏了也比较好处理。 很多 kanban 类 AI 开发工具会强制使用 worktree 。 但我们发现,一部分开发者刚开始并不太习惯 worktree ,所以 AgentFlow 目前同时支持两种方式: 使用 git worktree ,适合多任务并行开发; 不使用 worktree ,适合刚开始体验或简单任务。 这样新手上手会更容易一些。等任务数量变多后,再逐步切换到 worktree 模式也可以。 免费及开源 目前 AgentFlow 还没有收费计划,先开放给大家体验,收集更多真实反馈。 https://agentflow.geili.ai/ it-runner 接下来也有开源的计划,可以先查看 https://agentflow.geili.ai/docs/it-runner/ 了解 我们也建了一个早期用户交流群,原因大家反馈问题、交流使用方式。后续如果有收费计划,早期用户会优先获得兑换码、优惠资格或较长时间的免费额度。 愿意支持顶贴的朋友,也可以留下邮箱,后续我们如上线兑换码时会统一发送 以下是 AgentFlow 的一些截图: 每个分支都可以单独运行相关 it-runner 任务 任务出错时,可以一键 ai 修复,并重启 每个分支独立的 git 、终端、文件等操作,不再需要打开 IDE 增加了新手引导,让上手更简单

v2ex · 2026-06-09 18:30:24+08:00 · tech

年初的时候 openclaw 刚火起来,我们惊讶于 Peter Steinberger 每天的开发效率,OpenClaw 峰值有 1 天 merge 600 commits 。我们便开始重新回顾和研究,开始一步步的向更高效率靠拢。 这小半年来我们从每天个位数的提交提升到数十次,巅峰期某天达到上百次,效率明显提升,所以我们把一点点的经验和使用的工具 Agentflow 和 it-runner 分享给大家。 (如下是 Agentflow 项目的最近提交截图) 先聊开发过程中的几个问题: 1 、手动操作和记忆消耗 AI 写代码的能力越来越强,但真正落到具体业务开发时,很多事情还是停留在“人肉调度”的阶段。 某个硬件或服务端项目,需要记住端口、环境变量、部署路径、上传方式、重启命令; 调试业务问题时,不只是跑单元测试,还要看日志、清缓存、重启服务、反复验证; 很多任务需要长期或重复运行,比如构建、部署、联调; AI 改完代码后,最好能自动执行固定流程,失败后继续让 AI 分析、修复、再验证, 避免开发者手动收集信息再转交。 这些事情单独看都不复杂,但每天重复很多次,就会非常消耗精力和考验记忆力 2 、并行开发和团队协作 我们经常同时跑多个项目、多个任务、多个 Agent 。以前用 tmux 、Cursor 、VSCode 也能跑,但时间一长会遇到几个问题: 不方便管理多个项目和多个任务; 不方便回看每个任务的历史记录; 不方便在手机或远程环境里查看进度、接手操作; 多个 Agent 同时改代码时,分支、目录、上下文容易混乱。 团队成员共同开发一个任务时,不方便共享上下文,也不容易看到其他人是怎么思考和推进任务的。 这一点在多人协作时尤其明显。 以前一个任务如果是多个人一起参与,很多上下文其实散落在微信群、飞书、终端记录、Git commit 、PR 描述里。别人要接手时,往往只能看到最终代码,很难知道前面是怎么思考的、试过哪些方案、为什么这么改。 在 AgentFlow 里,同一个任务可以由团队成员共享同一个面板。大家可以直接看到任务进度、Agent 的执行过程、其他成员写过的提示词、运行结果和后续处理思路。 这个体验对团队内部协作非常有帮助:新接手项目成员可以更快理解老成员是怎么拆解问题、怎么给 AI 下指令的;多人协作时,不需要反复同步“现在做到哪一步了”;接手任务的人也可以直接沿着前面的上下文继续推进。 成果分享 可以说 AgentFlow 不只是一个 AI 开发工具,也像是一个团队共同沉淀开发过程和业务理解的地方。 最终我们基于一些 kanban 类产品的使用体验,再结合内部孵化的 it-runner ,做出了 AgentFlow 。 官网地址: https://agentflow.geili.ai/ 简单来说,AgentFlow 想解决的是: 在浏览器里 ALL in One, 管理多个 AI 开发任务,让每个任务都可以独立运行、查看历史、执行固定流程,并且内置的 it-runner 完成测试、构建、部署、看日志、重启服务等动作。让开发者尽可能少的频繁切换终端或者 IDE. 以前很多任务需要人盯着终端一步一步操作,现在可以把流程固定下来,让 AI 改代码、跑命令、看结果、再继续修。我们团队现在每天 git commit 的次数明显变多,需求和修复都能更快推进,确实有点找到了点龙虾作者的感觉,当然还有非常大的距离。 我们也把 AgentFlow 推荐给了一些合作伙伴试用,反馈还不错。 当然,用下来也发现了一些问题。 在 AI 并行开发场景里,代码隔离非常重要。我们的体感是:一旦同时跑 2 ~ 3 个以上任务,git worktree 的收益就会非常明显。每个任务有独立目录,互相不影响,Agent 改坏了也比较好处理。 很多 kanban 类 AI 开发工具会强制使用 worktree 。 但我们发现,一部分开发者刚开始并不太习惯 worktree ,所以 AgentFlow 目前同时支持两种方式: 使用 git worktree ,适合多任务并行开发; 不使用 worktree ,适合刚开始体验或简单任务。 这样新手上手会更容易一些。等任务数量变多后,再逐步切换到 worktree 模式也可以。 免费及开源 目前 AgentFlow 还没有收费计划,先开放给大家体验,收集更多真实反馈。 https://agentflow.geili.ai/ it-runner 接下来也有开源的计划,可以先查看 https://agentflow.geili.ai/docs/it-runner/ 了解 我们也建了一个早期用户交流群,原因大家反馈问题、交流使用方式。后续如果有收费计划,早期用户会优先获得兑换码、优惠资格或较长时间的免费额度。 愿意支持顶贴的朋友,也可以留下邮箱,后续我们如上线兑换码时会统一发送 以下是 AgentFlow 的一些截图: 每个分支都可以单独运行相关 it-runner 任务 任务出错时,可以一键 ai 修复,并重启 每个分支独立的 git 、终端、文件等操作,不再需要打开 IDE 增加了新手引导,让上手更简单

v2ex · 2026-06-09 17:52:00+08:00 · tech

年初的时候 openclaw 刚火起来,我们惊讶于 Peter Steinberger 每天的开发效率,OpenClaw 峰值有 1 天 merge 600 commits 。我们便开始重新回顾和研究,开始一步步的向更高效率靠拢。 这小半年来我们从每天个位数的提交提升到数十次,巅峰期某天达到上百次,效率明显提升,所以我们把一点点的经验和使用的工具 Agentflow 和 it-runner 分享给大家。 (如下是 Agentflow 项目的最近提交截图) 先聊开发过程中的几个问题: 1 、手动操作和记忆消耗 AI 写代码的能力越来越强,但真正落到具体业务开发时,很多事情还是停留在“人肉调度”的阶段。 某个硬件或服务端项目,需要记住端口、环境变量、部署路径、上传方式、重启命令; 调试业务问题时,不只是跑单元测试,还要看日志、清缓存、重启服务、反复验证; 很多任务需要长期或重复运行,比如构建、部署、联调; AI 改完代码后,最好能自动执行固定流程,失败后继续让 AI 分析、修复、再验证, 避免开发者手动收集信息再转交。 这些事情单独看都不复杂,但每天重复很多次,就会非常消耗精力和考验记忆力 2 、并行开发和团队协作 我们经常同时跑多个项目、多个任务、多个 Agent 。以前用 tmux 、Cursor 、VSCode 也能跑,但时间一长会遇到几个问题: 不方便管理多个项目和多个任务; 不方便回看每个任务的历史记录; 不方便在手机或远程环境里查看进度、接手操作; 多个 Agent 同时改代码时,分支、目录、上下文容易混乱。 团队成员共同开发一个任务时,不方便共享上下文,也不容易看到其他人是怎么思考和推进任务的。 这一点在多人协作时尤其明显。 以前一个任务如果是多个人一起参与,很多上下文其实散落在微信群、飞书、终端记录、Git commit 、PR 描述里。别人要接手时,往往只能看到最终代码,很难知道前面是怎么思考的、试过哪些方案、为什么这么改。 在 AgentFlow 里,同一个任务可以由团队成员共享同一个面板。大家可以直接看到任务进度、Agent 的执行过程、其他成员写过的提示词、运行结果和后续处理思路。 这个体验对团队内部协作非常有帮助:新接手项目成员可以更快理解老成员是怎么拆解问题、怎么给 AI 下指令的;多人协作时,不需要反复同步“现在做到哪一步了”;接手任务的人也可以直接沿着前面的上下文继续推进。 成果分享 可以说 AgentFlow 不只是一个 AI 开发工具,也像是一个团队共同沉淀开发过程和业务理解的地方。 最终我们基于一些 kanban 类产品的使用体验,再结合内部孵化的 it-runner ,做出了 AgentFlow 。 官网地址: https://agentflow.geili.ai/ 简单来说,AgentFlow 想解决的是: 在浏览器里 ALL in One, 管理多个 AI 开发任务,让每个任务都可以独立运行、查看历史、执行固定流程,并且内置的 it-runner 完成测试、构建、部署、看日志、重启服务等动作。让开发者尽可能少的频繁切换终端或者 IDE. 以前很多任务需要人盯着终端一步一步操作,现在可以把流程固定下来,让 AI 改代码、跑命令、看结果、再继续修。我们团队现在每天 git commit 的次数明显变多,需求和修复都能更快推进,确实有点找到了点龙虾作者的感觉,当然还有非常大的距离。 我们也把 AgentFlow 推荐给了一些合作伙伴试用,反馈还不错。 当然,用下来也发现了一些问题。 在 AI 并行开发场景里,代码隔离非常重要。我们的体感是:一旦同时跑 2 ~ 3 个以上任务,git worktree 的收益就会非常明显。每个任务有独立目录,互相不影响,Agent 改坏了也比较好处理。 很多 kanban 类 AI 开发工具会强制使用 worktree 。 但我们发现,一部分开发者刚开始并不太习惯 worktree ,所以 AgentFlow 目前同时支持两种方式: 使用 git worktree ,适合多任务并行开发; 不使用 worktree ,适合刚开始体验或简单任务。 这样新手上手会更容易一些。等任务数量变多后,再逐步切换到 worktree 模式也可以。 免费及开源 目前 AgentFlow 还没有收费计划,先开放给大家体验,收集更多真实反馈。 https://agentflow.geili.ai/ it-runner 接下来也有开源的计划,可以先查看 https://agentflow.geili.ai/docs/it-runner/ 了解 我们也建了一个早期用户交流群,原因大家反馈问题、交流使用方式。后续如果有收费计划,早期用户会优先获得兑换码、优惠资格或较长时间的免费额度。 愿意支持顶贴的朋友,也可以留下邮箱,后续我们如上线兑换码时会统一发送 以下是 AgentFlow 的一些截图: 每个分支都可以单独运行相关 it-runner 任务 任务出错时,可以一键 ai 修复,并重启 每个分支独立的 git 、终端、文件等操作,不再需要打开 IDE 增加了新手引导,让上手更简单

v2ex · 2026-06-09 17:15:58+08:00 · tech

年初的时候 openclaw 刚火起来,我们惊讶于 Peter Steinberger 每天的开发效率,OpenClaw 峰值有 1 天 merge 600 commits 。我们便开始重新回顾和研究,开始一步步的向更高效率靠拢。 这小半年来我们从每天个位数的提交提升到数十次,巅峰期某天达到上百次,效率明显提升,所以我们把一点点的经验和使用的工具 Agentflow 和 it-runner 分享给大家。 (如下是 Agentflow 项目的最近提交截图) 先聊开发过程中的几个问题: 1 、手动操作和记忆消耗 AI 写代码的能力越来越强,但真正落到具体业务开发时,很多事情还是停留在“人肉调度”的阶段。 某个硬件或服务端项目,需要记住端口、环境变量、部署路径、上传方式、重启命令; 调试业务问题时,不只是跑单元测试,还要看日志、清缓存、重启服务、反复验证; 很多任务需要长期或重复运行,比如构建、部署、联调; AI 改完代码后,最好能自动执行固定流程,失败后继续让 AI 分析、修复、再验证, 避免开发者手动收集信息再转交。 这些事情单独看都不复杂,但每天重复很多次,就会非常消耗精力和考验记忆力 2 、并行开发和团队协作 我们经常同时跑多个项目、多个任务、多个 Agent 。以前用 tmux 、Cursor 、VSCode 也能跑,但时间一长会遇到几个问题: 不方便管理多个项目和多个任务; 不方便回看每个任务的历史记录; 不方便在手机或远程环境里查看进度、接手操作; 多个 Agent 同时改代码时,分支、目录、上下文容易混乱。 团队成员共同开发一个任务时,不方便共享上下文,也不容易看到其他人是怎么思考和推进任务的。 这一点在多人协作时尤其明显。 以前一个任务如果是多个人一起参与,很多上下文其实散落在微信群、飞书、终端记录、Git commit 、PR 描述里。别人要接手时,往往只能看到最终代码,很难知道前面是怎么思考的、试过哪些方案、为什么这么改。 在 AgentFlow 里,同一个任务可以由团队成员共享同一个面板。大家可以直接看到任务进度、Agent 的执行过程、其他成员写过的提示词、运行结果和后续处理思路。 这个体验对团队内部协作非常有帮助:新接手项目成员可以更快理解老成员是怎么拆解问题、怎么给 AI 下指令的;多人协作时,不需要反复同步“现在做到哪一步了”;接手任务的人也可以直接沿着前面的上下文继续推进。 成果分享 可以说 AgentFlow 不只是一个 AI 开发工具,也像是一个团队共同沉淀开发过程和业务理解的地方。 最终我们基于一些 kanban 类产品的使用体验,再结合内部孵化的 it-runner ,做出了 AgentFlow 。 官网地址: https://agentflow.geili.ai/ 简单来说,AgentFlow 想解决的是: 在浏览器里 ALL in One, 管理多个 AI 开发任务,让每个任务都可以独立运行、查看历史、执行固定流程,并且内置的 it-runner 完成测试、构建、部署、看日志、重启服务等动作。让开发者尽可能少的频繁切换终端或者 IDE. 以前很多任务需要人盯着终端一步一步操作,现在可以把流程固定下来,让 AI 改代码、跑命令、看结果、再继续修。我们团队现在每天 git commit 的次数明显变多,需求和修复都能更快推进,确实有点找到了点龙虾作者的感觉,当然还有非常大的距离。 我们也把 AgentFlow 推荐给了一些合作伙伴试用,反馈还不错。 当然,用下来也发现了一些问题。 在 AI 并行开发场景里,代码隔离非常重要。我们的体感是:一旦同时跑 2 ~ 3 个以上任务,git worktree 的收益就会非常明显。每个任务有独立目录,互相不影响,Agent 改坏了也比较好处理。 很多 kanban 类 AI 开发工具会强制使用 worktree 。 但我们发现,一部分开发者刚开始并不太习惯 worktree ,所以 AgentFlow 目前同时支持两种方式: 使用 git worktree ,适合多任务并行开发; 不使用 worktree ,适合刚开始体验或简单任务。 这样新手上手会更容易一些。等任务数量变多后,再逐步切换到 worktree 模式也可以。 免费及开源 目前 AgentFlow 还没有收费计划,先开放给大家体验,收集更多真实反馈。 https://agentflow.geili.ai/ it-runner 接下来也有开源的计划,可以先查看 https://agentflow.geili.ai/docs/it-runner/ 了解 我们也建了一个早期用户交流群,原因大家反馈问题、交流使用方式。后续如果有收费计划,早期用户会优先获得兑换码、优惠资格或较长时间的免费额度。 愿意支持顶贴的朋友,也可以留下邮箱,后续我们如上线兑换码时会统一发送 以下是 AgentFlow 的一些截图: 每个分支都可以单独运行相关 it-runner 任务 任务出错时,可以一键 ai 修复,并重启 每个分支独立的 git 、终端、文件等操作,不再需要打开 IDE 增加了新手引导,让上手更简单

V2EX - 技术 · 2026-06-09 17:06:00+08:00 · tech

我从年初开始,不管是自己的开源项目还是工作,99.9% 的代码已经是 CC 写的了,顺手做了一个开源的 harness 叫 Chorus 想把自己的一些实践写到里面去,整了很多功能比如细化需求啊,自动 review 啊等等 现在累计了一些用户,包括我自己每天也是高强度使用,这半年下来最大的感觉用了那么多手法,是“左移”才是最有效的 为什么 vibe coding 特别需要左移 软件工程里 shift left 是个老概念,把测试和质量挪到开发早期,比写完再抓有效得多。AI 时代这个套路收益更大,因为 agent 写代码飞快,但它对你想要什么的理解是无法保障的。 理想情况是你交代一个任务给 AI ,他 kuku 一顿操作就给你完成了,实际情况是这根本不可能,毕竟你这一句话里的信息量实在太少了,大部分要靠 AI 自己猜。我之前发了一个帖子调查大家理想的 Agent 交互方式 https://www.v2ex.com/t/1215829 大部分人都希望一句话直接撬动成果,但现阶段这么做估计会一地鸡毛 返工成本看着低,反正它写得快嘛。但人 review 的时间是真金白银,而且每改一轮上下文就乱一点,最后连最初想要什么都模糊了,最后就向着💩山一去不复返了。 让 agent 干活之前先完全搞清楚你脑子里是啥这一点远远胜过其他花里胡哨的技巧。我问了几个朋友,superpowers 插件里用的都是啥功能,结果绝大部分的人用一个 brainstorming 就结了,小部分人还会用 systematic-debugging, 这俩一个是左移一个是捅了篓子之后擦屁股 Chorus 里左移长什么样 我大概是这么搞的。 第一步是 Elaboration (细化)。粗糙的想法扔进来,Agent 主动追着问。"这个搜索是只搜标题还是带正文?""精确匹配还是模糊?""结果排序按什么?"几轮聊下来,需求就被拍扁成一份明确的描述。关键是 agent 在追问,不是人在写需求文档,门槛低很多。其实和 Branstorming 有点像但所有的决策都会记录在案,方便回看或者交接工作。有的时候想回忆起某个 Feature 做了啥,我去 Chorus 的 UI 上看一眼和 Agent 的问答记录一下就清晰了 第二步是 Proposal (提案)。Agent 基于敲定的需求出方案,包括接口怎么改、任务怎么拆、每个任务的验收标准是什么。这份方案先过一个独立的 reviewer agent 对抗检查,确认接口对得上、任务粒度合理、AC 可测,才递给用户拍板。从这个阶段开始用对抗的方式保证 Agent 写的东西真的方向对而且可以验收,而且这个单独的 Review Agent 也可以充分利用前面环节细化的记录,从第三方视角观察着一份提案有没有跑偏。 第三步是每个任务自带的验收标准 checklist 。Agent 写完代码不是说一句"我做完了"就完事,得逐条对着验收标准自检,再过一个 task-reviewer 对抗校验。这里的 Task Review Agent 又能充分利用前面细化和提案的记录来保证任务本身有没有执行歪。 这些步骤其实就为了一件事:对齐挪到前面、校验放到后面,中间写代码这段就基本能放手了。当然 Proposal 阶段偶尔也会跑偏,但概率比让 agent 直接动手低一个数量级,跑偏了 reviewer 也大概率能挡住,比撒开了写代码再改好多了。 顺便聊聊最近超火的 Claude Code 的 Workflow 最近 Claude Code 出了个 Workflow 功能,你说一句需求,主 agent 会动态写一段编排脚本,搞出几十上百个 subagent 并行跑不同维度的搜索、审查、合成,最后把结果收拢回来。 这玩意很牛,但解决的是另一个问题:在解空间不确定的时候,用 token 换覆盖面。单 agent 顾不过来 10 个维度,那就开 10 路并行各管一摊,再用一组对抗 agent 反驳每个发现,留下经得起怼的那批。 但 Workflow 不是左移。它是动手之后用更多 agent 探索更优解,重心在执行端的扩散和收敛。token 消耗是单 agent 的几十倍起步,而且 Workflow 本身的对齐环节相对轻,主要靠主 agent 一开始的理解,没有像左移那样反复跟用户确认。 我自己的体感是,绝大多数日常 coding 任务的瓶颈不在"探索得不够广",而在"开头没聊清楚"。开头方向歪了,扩散得再广也是在错的方向上扩散,最后还是要返工。 Workflow 适合那种你已经知道要什么、只是解空间太大、得靠对抗验证的活,解决方案探索啥的。日常开发主体还是要靠左移把对齐做扎实,我觉得目前 Harness 的最大作用不是搞出一大堆流程和 Agent 去干活,而是把你脑子里的东西对齐给 Agent 而且保证他按照这个思路执行到底 代码都在 Chorus 仓库 ,欢迎讨论。

V2EX - 技术 · 2026-06-09 17:06:00+08:00 · tech

我从年初开始,不管是自己的开源项目还是工作,99.9% 的代码已经是 CC 写的了,顺手做了一个开源的 harness 叫 Chorus 想把自己的一些实践写到里面去,整了很多功能比如细化需求啊,自动 review 啊等等 现在累计了一些用户,包括我自己每天也是高强度使用,这半年下来最大的感觉用了那么多手法,是“左移”才是最有效的 为什么 vibe coding 特别需要左移 软件工程里 shift left 是个老概念,把测试和质量挪到开发早期,比写完再抓有效得多。AI 时代这个套路收益更大,因为 agent 写代码飞快,但它对你想要什么的理解是无法保障的。 理想情况是你交代一个任务给 AI ,他 kuku 一顿操作就给你完成了,实际情况是这根本不可能,毕竟你这一句话里的信息量实在太少了,大部分要靠 AI 自己猜。我之前发了一个帖子调查大家理想的 Agent 交互方式 https://www.v2ex.com/t/1215829 大部分人都希望一句话直接撬动成果,但现阶段这么做估计会一地鸡毛 返工成本看着低,反正它写得快嘛。但人 review 的时间是真金白银,而且每改一轮上下文就乱一点,最后连最初想要什么都模糊了,最后就向着💩山一去不复返了。 让 agent 干活之前先完全搞清楚你脑子里是啥这一点远远胜过其他花里胡哨的技巧。我问了几个朋友,superpowers 插件里用的都是啥功能,结果绝大部分的人用一个 brainstorming 就结了,小部分人还会用 systematic-debugging, 这俩一个是左移一个是捅了篓子之后擦屁股 Chorus 里左移长什么样 我大概是这么搞的。 第一步是 Elaboration (细化)。粗糙的想法扔进来,Agent 主动追着问。"这个搜索是只搜标题还是带正文?""精确匹配还是模糊?""结果排序按什么?"几轮聊下来,需求就被拍扁成一份明确的描述。关键是 agent 在追问,不是人在写需求文档,门槛低很多。其实和 Branstorming 有点像但所有的决策都会记录在案,方便回看或者交接工作。有的时候想回忆起某个 Feature 做了啥,我去 Chorus 的 UI 上看一眼和 Agent 的问答记录一下就清晰了 第二步是 Proposal (提案)。Agent 基于敲定的需求出方案,包括接口怎么改、任务怎么拆、每个任务的验收标准是什么。这份方案先过一个独立的 reviewer agent 对抗检查,确认接口对得上、任务粒度合理、AC 可测,才递给用户拍板。从这个阶段开始用对抗的方式保证 Agent 写的东西真的方向对而且可以验收,而且这个单独的 Review Agent 也可以充分利用前面环节细化的记录,从第三方视角观察着一份提案有没有跑偏。 第三步是每个任务自带的验收标准 checklist 。Agent 写完代码不是说一句"我做完了"就完事,得逐条对着验收标准自检,再过一个 task-reviewer 对抗校验。这里的 Task Review Agent 又能充分利用前面细化和提案的记录来保证任务本身有没有执行歪。 这些步骤其实就为了一件事:对齐挪到前面、校验放到后面,中间写代码这段就基本能放手了。当然 Proposal 阶段偶尔也会跑偏,但概率比让 agent 直接动手低一个数量级,跑偏了 reviewer 也大概率能挡住,比撒开了写代码再改好多了。 顺便聊聊最近超火的 Claude Code 的 Workflow 最近 Claude Code 出了个 Workflow 功能,你说一句需求,主 agent 会动态写一段编排脚本,搞出几十上百个 subagent 并行跑不同维度的搜索、审查、合成,最后把结果收拢回来。 这玩意很牛,但解决的是另一个问题:在解空间不确定的时候,用 token 换覆盖面。单 agent 顾不过来 10 个维度,那就开 10 路并行各管一摊,再用一组对抗 agent 反驳每个发现,留下经得起怼的那批。 但 Workflow 不是左移。它是动手之后用更多 agent 探索更优解,重心在执行端的扩散和收敛。token 消耗是单 agent 的几十倍起步,而且 Workflow 本身的对齐环节相对轻,主要靠主 agent 一开始的理解,没有像左移那样反复跟用户确认。 我自己的体感是,绝大多数日常 coding 任务的瓶颈不在"探索得不够广",而在"开头没聊清楚"。开头方向歪了,扩散得再广也是在错的方向上扩散,最后还是要返工。 Workflow 适合那种你已经知道要什么、只是解空间太大、得靠对抗验证的活,解决方案探索啥的。日常开发主体还是要靠左移把对齐做扎实,我觉得目前 Harness 的最大作用不是搞出一大堆流程和 Agent 去干活,而是把你脑子里的东西对齐给 Agent 而且保证他按照这个思路执行到底 代码都在 Chorus 仓库 ,欢迎讨论。

v2ex · 2026-06-09 16:47:12+08:00 · tech

年初的时候 openclaw 刚火起来,我们惊讶于 Peter Steinberger 每天的开发效率,OpenClaw 峰值有 1 天 merge 600 commits 。我们便开始重新回顾和研究,开始一步步的向更高效率靠拢。 这小半年来我们从每天个位数的提交提升到数十次,巅峰期某天达到上百次,效率明显提升,所以我们把一点点的经验和使用的工具 Agentflow 和 it-runner 分享给大家。 (如下是 Agentflow 项目的最近提交截图) 先聊开发过程中的几个问题: 1 、手动操作和记忆消耗 AI 写代码的能力越来越强,但真正落到具体业务开发时,很多事情还是停留在“人肉调度”的阶段。 某个硬件或服务端项目,需要记住端口、环境变量、部署路径、上传方式、重启命令; 调试业务问题时,不只是跑单元测试,还要看日志、清缓存、重启服务、反复验证; 很多任务需要长期或重复运行,比如构建、部署、联调; AI 改完代码后,最好能自动执行固定流程,失败后继续让 AI 分析、修复、再验证, 避免开发者手动收集信息再转交。 这些事情单独看都不复杂,但每天重复很多次,就会非常消耗精力和考验记忆力 2 、并行开发和团队协作 我们经常同时跑多个项目、多个任务、多个 Agent 。以前用 tmux 、Cursor 、VSCode 也能跑,但时间一长会遇到几个问题: 不方便管理多个项目和多个任务; 不方便回看每个任务的历史记录; 不方便在手机或远程环境里查看进度、接手操作; 多个 Agent 同时改代码时,分支、目录、上下文容易混乱。 团队成员共同开发一个任务时,不方便共享上下文,也不容易看到其他人是怎么思考和推进任务的。 这一点在多人协作时尤其明显。 以前一个任务如果是多个人一起参与,很多上下文其实散落在微信群、飞书、终端记录、Git commit 、PR 描述里。别人要接手时,往往只能看到最终代码,很难知道前面是怎么思考的、试过哪些方案、为什么这么改。 在 AgentFlow 里,同一个任务可以由团队成员共享同一个面板。大家可以直接看到任务进度、Agent 的执行过程、其他成员写过的提示词、运行结果和后续处理思路。 这个体验对团队内部协作非常有帮助:新接手项目成员可以更快理解老成员是怎么拆解问题、怎么给 AI 下指令的;多人协作时,不需要反复同步“现在做到哪一步了”;接手任务的人也可以直接沿着前面的上下文继续推进。 成果分享 可以说 AgentFlow 不只是一个 AI 开发工具,也像是一个团队共同沉淀开发过程和业务理解的地方。 最终我们基于一些 kanban 类产品的使用体验,再结合内部孵化的 it-runner ,做出了 AgentFlow 。 官网地址: https://agentflow.geili.ai/ 简单来说,AgentFlow 想解决的是: 在浏览器里 ALL in One, 管理多个 AI 开发任务,让每个任务都可以独立运行、查看历史、执行固定流程,并且内置的 it-runner 完成测试、构建、部署、看日志、重启服务等动作。让开发者尽可能少的频繁切换终端或者 IDE. 以前很多任务需要人盯着终端一步一步操作,现在可以把流程固定下来,让 AI 改代码、跑命令、看结果、再继续修。我们团队现在每天 git commit 的次数明显变多,需求和修复都能更快推进,确实有点找到了点龙虾作者的感觉,当然还有非常大的距离。 我们也把 AgentFlow 推荐给了一些合作伙伴试用,反馈还不错。 当然,用下来也发现了一些问题。 在 AI 并行开发场景里,代码隔离非常重要。我们的体感是:一旦同时跑 2 ~ 3 个以上任务,git worktree 的收益就会非常明显。每个任务有独立目录,互相不影响,Agent 改坏了也比较好处理。 很多 kanban 类 AI 开发工具会强制使用 worktree 。 但我们发现,一部分开发者刚开始并不太习惯 worktree ,所以 AgentFlow 目前同时支持两种方式: 使用 git worktree ,适合多任务并行开发; 不使用 worktree ,适合刚开始体验或简单任务。 这样新手上手会更容易一些。等任务数量变多后,再逐步切换到 worktree 模式也可以。 免费及开源 目前 AgentFlow 还没有收费计划,先开放给大家体验,收集更多真实反馈。 https://agentflow.geili.ai/ it-runner 接下来也有开源的计划,可以先查看 https://agentflow.geili.ai/docs/it-runner/ 了解 我们也建了一个早期用户交流群,原因大家反馈问题、交流使用方式。后续如果有收费计划,早期用户会优先获得兑换码、优惠资格或较长时间的免费额度。 愿意支持顶贴的朋友,也可以留下邮箱,后续我们如上线兑换码时会统一发送 以下是 AgentFlow 的一些截图: 每个分支都可以单独运行相关 it-runner 任务 任务出错时,可以一键 ai 修复,并重启 每个分支独立的 git 、终端、文件等操作,不再需要打开 IDE 增加了新手引导,让上手更简单

V2EX - 技术 · 2026-06-09 16:06:00+08:00 · tech

我从年初开始,不管是自己的开源项目还是工作,99.9% 的代码已经是 CC 写的了,顺手做了一个开源的 harness 叫 Chorus 想把自己的一些实践写到里面去,整了很多功能比如细化需求啊,自动 review 啊等等 现在累计了一些用户,包括我自己每天也是高强度使用,这半年下来最大的感觉用了那么多手法,是“左移”才是最有效的 为什么 vibe coding 特别需要左移 软件工程里 shift left 是个老概念,把测试和质量挪到开发早期,比写完再抓有效得多。AI 时代这个套路收益更大,因为 agent 写代码飞快,但它对你想要什么的理解是无法保障的。 理想情况是你交代一个任务给 AI ,他 kuku 一顿操作就给你完成了,实际情况是这根本不可能,毕竟你这一句话里的信息量实在太少了,大部分要靠 AI 自己猜。我之前发了一个帖子调查大家理想的 Agent 交互方式 https://www.v2ex.com/t/1215829 大部分人都希望一句话直接撬动成果,但现阶段这么做估计会一地鸡毛 返工成本看着低,反正它写得快嘛。但人 review 的时间是真金白银,而且每改一轮上下文就乱一点,最后连最初想要什么都模糊了,最后就向着💩山一去不复返了。 让 agent 干活之前先完全搞清楚你脑子里是啥这一点远远胜过其他花里胡哨的技巧。我问了几个朋友,superpowers 插件里用的都是啥功能,结果绝大部分的人用一个 brainstorming 就结了,小部分人还会用 systematic-debugging, 这俩一个是左移一个是捅了篓子之后擦屁股 Chorus 里左移长什么样 我大概是这么搞的。 第一步是 Elaboration (细化)。粗糙的想法扔进来,Agent 主动追着问。"这个搜索是只搜标题还是带正文?""精确匹配还是模糊?""结果排序按什么?"几轮聊下来,需求就被拍扁成一份明确的描述。关键是 agent 在追问,不是人在写需求文档,门槛低很多。其实和 Branstorming 有点像但所有的决策都会记录在案,方便回看或者交接工作。有的时候想回忆起某个 Feature 做了啥,我去 Chorus 的 UI 上看一眼和 Agent 的问答记录一下就清晰了 第二步是 Proposal (提案)。Agent 基于敲定的需求出方案,包括接口怎么改、任务怎么拆、每个任务的验收标准是什么。这份方案先过一个独立的 reviewer agent 对抗检查,确认接口对得上、任务粒度合理、AC 可测,才递给用户拍板。从这个阶段开始用对抗的方式保证 Agent 写的东西真的方向对而且可以验收,而且这个单独的 Review Agent 也可以充分利用前面环节细化的记录,从第三方视角观察着一份提案有没有跑偏。 第三步是每个任务自带的验收标准 checklist 。Agent 写完代码不是说一句"我做完了"就完事,得逐条对着验收标准自检,再过一个 task-reviewer 对抗校验。这里的 Task Review Agent 又能充分利用前面细化和提案的记录来保证任务本身有没有执行歪。 这些步骤其实就为了一件事:对齐挪到前面、校验放到后面,中间写代码这段就基本能放手了。当然 Proposal 阶段偶尔也会跑偏,但概率比让 agent 直接动手低一个数量级,跑偏了 reviewer 也大概率能挡住,比撒开了写代码再改好多了。 顺便聊聊最近超火的 Claude Code 的 Workflow 最近 Claude Code 出了个 Workflow 功能,你说一句需求,主 agent 会动态写一段编排脚本,搞出几十上百个 subagent 并行跑不同维度的搜索、审查、合成,最后把结果收拢回来。 这玩意很牛,但解决的是另一个问题:在解空间不确定的时候,用 token 换覆盖面。单 agent 顾不过来 10 个维度,那就开 10 路并行各管一摊,再用一组对抗 agent 反驳每个发现,留下经得起怼的那批。 但 Workflow 不是左移。它是动手之后用更多 agent 探索更优解,重心在执行端的扩散和收敛。token 消耗是单 agent 的几十倍起步,而且 Workflow 本身的对齐环节相对轻,主要靠主 agent 一开始的理解,没有像左移那样反复跟用户确认。 我自己的体感是,绝大多数日常 coding 任务的瓶颈不在"探索得不够广",而在"开头没聊清楚"。开头方向歪了,扩散得再广也是在错的方向上扩散,最后还是要返工。 Workflow 适合那种你已经知道要什么、只是解空间太大、得靠对抗验证的活,解决方案探索啥的。日常开发主体还是要靠左移把对齐做扎实,我觉得目前 Harness 的最大作用不是搞出一大堆流程和 Agent 去干活,而是把你脑子里的东西对齐给 Agent 而且保证他按照这个思路执行到底 代码都在 Chorus 仓库 ,欢迎讨论。

V2EX - 技术 · 2026-06-09 16:06:00+08:00 · tech

我从年初开始,不管是自己的开源项目还是工作,99.9% 的代码已经是 CC 写的了,顺手做了一个开源的 harness 叫 Chorus 想把自己的一些实践写到里面去,整了很多功能比如细化需求啊,自动 review 啊等等 现在累计了一些用户,包括我自己每天也是高强度使用,这半年下来最大的感觉用了那么多手法,是“左移”才是最有效的 为什么 vibe coding 特别需要左移 软件工程里 shift left 是个老概念,把测试和质量挪到开发早期,比写完再抓有效得多。AI 时代这个套路收益更大,因为 agent 写代码飞快,但它对你想要什么的理解是无法保障的。 理想情况是你交代一个任务给 AI ,他 kuku 一顿操作就给你完成了,实际情况是这根本不可能,毕竟你这一句话里的信息量实在太少了,大部分要靠 AI 自己猜。我之前发了一个帖子调查大家理想的 Agent 交互方式 https://www.v2ex.com/t/1215829 大部分人都希望一句话直接撬动成果,但现阶段这么做估计会一地鸡毛 返工成本看着低,反正它写得快嘛。但人 review 的时间是真金白银,而且每改一轮上下文就乱一点,最后连最初想要什么都模糊了,最后就向着💩山一去不复返了。 让 agent 干活之前先完全搞清楚你脑子里是啥这一点远远胜过其他花里胡哨的技巧。我问了几个朋友,superpowers 插件里用的都是啥功能,结果绝大部分的人用一个 brainstorming 就结了,小部分人还会用 systematic-debugging, 这俩一个是左移一个是捅了篓子之后擦屁股 Chorus 里左移长什么样 我大概是这么搞的。 第一步是 Elaboration (细化)。粗糙的想法扔进来,Agent 主动追着问。"这个搜索是只搜标题还是带正文?""精确匹配还是模糊?""结果排序按什么?"几轮聊下来,需求就被拍扁成一份明确的描述。关键是 agent 在追问,不是人在写需求文档,门槛低很多。其实和 Branstorming 有点像但所有的决策都会记录在案,方便回看或者交接工作。有的时候想回忆起某个 Feature 做了啥,我去 Chorus 的 UI 上看一眼和 Agent 的问答记录一下就清晰了 第二步是 Proposal (提案)。Agent 基于敲定的需求出方案,包括接口怎么改、任务怎么拆、每个任务的验收标准是什么。这份方案先过一个独立的 reviewer agent 对抗检查,确认接口对得上、任务粒度合理、AC 可测,才递给用户拍板。从这个阶段开始用对抗的方式保证 Agent 写的东西真的方向对而且可以验收,而且这个单独的 Review Agent 也可以充分利用前面环节细化的记录,从第三方视角观察着一份提案有没有跑偏。 第三步是每个任务自带的验收标准 checklist 。Agent 写完代码不是说一句"我做完了"就完事,得逐条对着验收标准自检,再过一个 task-reviewer 对抗校验。这里的 Task Review Agent 又能充分利用前面细化和提案的记录来保证任务本身有没有执行歪。 这些步骤其实就为了一件事:对齐挪到前面、校验放到后面,中间写代码这段就基本能放手了。当然 Proposal 阶段偶尔也会跑偏,但概率比让 agent 直接动手低一个数量级,跑偏了 reviewer 也大概率能挡住,比撒开了写代码再改好多了。 顺便聊聊最近超火的 Claude Code 的 Workflow 最近 Claude Code 出了个 Workflow 功能,你说一句需求,主 agent 会动态写一段编排脚本,搞出几十上百个 subagent 并行跑不同维度的搜索、审查、合成,最后把结果收拢回来。 这玩意很牛,但解决的是另一个问题:在解空间不确定的时候,用 token 换覆盖面。单 agent 顾不过来 10 个维度,那就开 10 路并行各管一摊,再用一组对抗 agent 反驳每个发现,留下经得起怼的那批。 但 Workflow 不是左移。它是动手之后用更多 agent 探索更优解,重心在执行端的扩散和收敛。token 消耗是单 agent 的几十倍起步,而且 Workflow 本身的对齐环节相对轻,主要靠主 agent 一开始的理解,没有像左移那样反复跟用户确认。 我自己的体感是,绝大多数日常 coding 任务的瓶颈不在"探索得不够广",而在"开头没聊清楚"。开头方向歪了,扩散得再广也是在错的方向上扩散,最后还是要返工。 Workflow 适合那种你已经知道要什么、只是解空间太大、得靠对抗验证的活,解决方案探索啥的。日常开发主体还是要靠左移把对齐做扎实,我觉得目前 Harness 的最大作用不是搞出一大堆流程和 Agent 去干活,而是把你脑子里的东西对齐给 Agent 而且保证他按照这个思路执行到底 代码都在 Chorus 仓库 ,欢迎讨论。

V2EX - 技术 · 2026-06-09 16:06:00+08:00 · tech

我从年初开始,不管是自己的开源项目还是工作,99.9% 的代码已经是 CC 写的了,顺手做了一个开源的 harness 叫 Chorus 想把自己的一些实践写到里面去,整了很多功能比如细化需求啊,自动 review 啊等等 现在累计了一些用户,包括我自己每天也是高强度使用,这半年下来最大的感觉用了那么多手法,是“左移”才是最有效的 为什么 vibe coding 特别需要左移 软件工程里 shift left 是个老概念,把测试和质量挪到开发早期,比写完再抓有效得多。AI 时代这个套路收益更大,因为 agent 写代码飞快,但它对你想要什么的理解是无法保障的。 理想情况是你交代一个任务给 AI ,他 kuku 一顿操作就给你完成了,实际情况是这根本不可能,毕竟你这一句话里的信息量实在太少了,大部分要靠 AI 自己猜。我之前发了一个帖子调查大家理想的 Agent 交互方式 https://www.v2ex.com/t/1215829 大部分人都希望一句话直接撬动成果,但现阶段这么做估计会一地鸡毛 返工成本看着低,反正它写得快嘛。但人 review 的时间是真金白银,而且每改一轮上下文就乱一点,最后连最初想要什么都模糊了,最后就向着💩山一去不复返了。 让 agent 干活之前先完全搞清楚你脑子里是啥这一点远远胜过其他花里胡哨的技巧。我问了几个朋友,superpowers 插件里用的都是啥功能,结果绝大部分的人用一个 brainstorming 就结了,小部分人还会用 systematic-debugging, 这俩一个是左移一个是捅了篓子之后擦屁股 Chorus 里左移长什么样 我大概是这么搞的。 第一步是 Elaboration (细化)。粗糙的想法扔进来,Agent 主动追着问。"这个搜索是只搜标题还是带正文?""精确匹配还是模糊?""结果排序按什么?"几轮聊下来,需求就被拍扁成一份明确的描述。关键是 agent 在追问,不是人在写需求文档,门槛低很多。其实和 Branstorming 有点像但所有的决策都会记录在案,方便回看或者交接工作。有的时候想回忆起某个 Feature 做了啥,我去 Chorus 的 UI 上看一眼和 Agent 的问答记录一下就清晰了 第二步是 Proposal (提案)。Agent 基于敲定的需求出方案,包括接口怎么改、任务怎么拆、每个任务的验收标准是什么。这份方案先过一个独立的 reviewer agent 对抗检查,确认接口对得上、任务粒度合理、AC 可测,才递给用户拍板。从这个阶段开始用对抗的方式保证 Agent 写的东西真的方向对而且可以验收,而且这个单独的 Review Agent 也可以充分利用前面环节细化的记录,从第三方视角观察着一份提案有没有跑偏。 第三步是每个任务自带的验收标准 checklist 。Agent 写完代码不是说一句"我做完了"就完事,得逐条对着验收标准自检,再过一个 task-reviewer 对抗校验。这里的 Task Review Agent 又能充分利用前面细化和提案的记录来保证任务本身有没有执行歪。 这些步骤其实就为了一件事:对齐挪到前面、校验放到后面,中间写代码这段就基本能放手了。当然 Proposal 阶段偶尔也会跑偏,但概率比让 agent 直接动手低一个数量级,跑偏了 reviewer 也大概率能挡住,比撒开了写代码再改好多了。 顺便聊聊最近超火的 Claude Code 的 Workflow 最近 Claude Code 出了个 Workflow 功能,你说一句需求,主 agent 会动态写一段编排脚本,搞出几十上百个 subagent 并行跑不同维度的搜索、审查、合成,最后把结果收拢回来。 这玩意很牛,但解决的是另一个问题:在解空间不确定的时候,用 token 换覆盖面。单 agent 顾不过来 10 个维度,那就开 10 路并行各管一摊,再用一组对抗 agent 反驳每个发现,留下经得起怼的那批。 但 Workflow 不是左移。它是动手之后用更多 agent 探索更优解,重心在执行端的扩散和收敛。token 消耗是单 agent 的几十倍起步,而且 Workflow 本身的对齐环节相对轻,主要靠主 agent 一开始的理解,没有像左移那样反复跟用户确认。 我自己的体感是,绝大多数日常 coding 任务的瓶颈不在"探索得不够广",而在"开头没聊清楚"。开头方向歪了,扩散得再广也是在错的方向上扩散,最后还是要返工。 Workflow 适合那种你已经知道要什么、只是解空间太大、得靠对抗验证的活,解决方案探索啥的。日常开发主体还是要靠左移把对齐做扎实,我觉得目前 Harness 的最大作用不是搞出一大堆流程和 Agent 去干活,而是把你脑子里的东西对齐给 Agent 而且保证他按照这个思路执行到底 代码都在 Chorus 仓库 ,欢迎讨论。

V2EX - 技术 · 2026-06-09 16:03:32+08:00 · tech

我从年初开始,不管是自己的开源项目还是工作,99.9% 的代码已经是 CC 写的了,顺手做了一个开源的 harness 叫 Chorus 想把自己的一些实践写到里面去,整了很多功能比如细化需求啊,自动 review 啊等等 现在累计了一些用户,包括我自己每天也是高强度使用,这半年下来最大的感觉用了那么多手法,是“左移”才是最有效的 为什么 vibe coding 特别需要左移 软件工程里 shift left 是个老概念,把测试和质量挪到开发早期,比写完再抓有效得多。AI 时代这个套路收益更大,因为 agent 写代码飞快,但它对你想要什么的理解是无法保障的。 理想情况是你交代一个任务给 AI ,他 kuku 一顿操作就给你完成了,实际情况是这根本不可能,毕竟你这一句话里的信息量实在太少了,大部分要靠 AI 自己猜。我之前发了一个帖子调查大家理想的 Agent 交互方式 https://www.v2ex.com/t/1215829 大部分人都希望一句话直接撬动成果,但现阶段这么做估计会一地鸡毛 返工成本看着低,反正它写得快嘛。但人 review 的时间是真金白银,而且每改一轮上下文就乱一点,最后连最初想要什么都模糊了,最后就向着💩山一去不复返了。 让 agent 干活之前先完全搞清楚你脑子里是啥这一点远远胜过其他花里胡哨的技巧。我问了几个朋友,superpowers 插件里用的都是啥功能,结果绝大部分的人用一个 brainstorming 就结了,小部分人还会用 systematic-debugging, 这俩一个是左移一个是捅了篓子之后擦屁股 Chorus 里左移长什么样 我大概是这么搞的。 第一步是 Elaboration (细化)。粗糙的想法扔进来,Agent 主动追着问。"这个搜索是只搜标题还是带正文?""精确匹配还是模糊?""结果排序按什么?"几轮聊下来,需求就被拍扁成一份明确的描述。关键是 agent 在追问,不是人在写需求文档,门槛低很多。其实和 Branstorming 有点像但所有的决策都会记录在案,方便回看或者交接工作。有的时候想回忆起某个 Feature 做了啥,我去 Chorus 的 UI 上看一眼和 Agent 的问答记录一下就清晰了 第二步是 Proposal (提案)。Agent 基于敲定的需求出方案,包括接口怎么改、任务怎么拆、每个任务的验收标准是什么。这份方案先过一个独立的 reviewer agent 对抗检查,确认接口对得上、任务粒度合理、AC 可测,才递给用户拍板。从这个阶段开始用对抗的方式保证 Agent 写的东西真的方向对而且可以验收,而且这个单独的 Review Agent 也可以充分利用前面环节细化的记录,从第三方视角观察着一份提案有没有跑偏。 第三步是每个任务自带的验收标准 checklist 。Agent 写完代码不是说一句"我做完了"就完事,得逐条对着验收标准自检,再过一个 task-reviewer 对抗校验。这里的 Task Review Agent 又能充分利用前面细化和提案的记录来保证任务本身有没有执行歪。 这些步骤其实就为了一件事:对齐挪到前面、校验放到后面,中间写代码这段就基本能放手了。当然 Proposal 阶段偶尔也会跑偏,但概率比让 agent 直接动手低一个数量级,跑偏了 reviewer 也大概率能挡住,比撒开了写代码再改好多了。 顺便聊聊最近超火的 Claude Code 的 Workflow 最近 Claude Code 出了个 Workflow 功能,你说一句需求,主 agent 会动态写一段编排脚本,搞出几十上百个 subagent 并行跑不同维度的搜索、审查、合成,最后把结果收拢回来。 这玩意很牛,但解决的是另一个问题:在解空间不确定的时候,用 token 换覆盖面。单 agent 顾不过来 10 个维度,那就开 10 路并行各管一摊,再用一组对抗 agent 反驳每个发现,留下经得起怼的那批。 但 Workflow 不是左移。它是动手之后用更多 agent 探索更优解,重心在执行端的扩散和收敛。token 消耗是单 agent 的几十倍起步,而且 Workflow 本身的对齐环节相对轻,主要靠主 agent 一开始的理解,没有像左移那样反复跟用户确认。 我自己的体感是,绝大多数日常 coding 任务的瓶颈不在"探索得不够广",而在"开头没聊清楚"。开头方向歪了,扩散得再广也是在错的方向上扩散,最后还是要返工。 Workflow 适合那种你已经知道要什么、只是解空间太大、得靠对抗验证的活,解决方案探索啥的。日常开发主体还是要靠左移把对齐做扎实,我觉得目前 Harness 的最大作用不是搞出一大堆流程和 Agent 去干活,而是把你脑子里的东西对齐给 Agent 而且保证他按照这个思路执行到底 代码都在 Chorus 仓库 ,欢迎讨论。

V2EX - 技术 · 2026-06-09 14:52:45+08:00 · tech

我从年初开始,不管是自己的开源项目还是工作,99.9% 的代码已经是 CC 写的了,顺手做了一个开源的 harness 叫 Chorus 想把自己的一些实践写到里面去,整了很多功能比如细化需求啊,自动 review 啊等等 现在累计了一些用户,包括我自己每天也是高强度使用,这半年下来最大的感觉用了那么多手法,是“左移”才是最有效的 为什么 vibe coding 特别需要左移 软件工程里 shift left 是个老概念,把测试和质量挪到开发早期,比写完再抓有效得多。AI 时代这个套路收益更大,因为 agent 写代码飞快,但它对你想要什么的理解是无法保障的。 理想情况是你交代一个任务给 AI ,他 kuku 一顿操作就给你完成了,实际情况是这根本不可能,毕竟你这一句话里的信息量实在太少了,大部分要靠 AI 自己猜。我之前发了一个帖子调查大家理想的 Agent 交互方式 https://www.v2ex.com/t/1215829 大部分人都希望一句话直接撬动成果,但现阶段这么做估计会一地鸡毛 返工成本看着低,反正它写得快嘛。但人 review 的时间是真金白银,而且每改一轮上下文就乱一点,最后连最初想要什么都模糊了,最后就向着💩山一去不复返了。 让 agent 干活之前先完全搞清楚你脑子里是啥这一点远远胜过其他花里胡哨的技巧。我问了几个朋友,superpowers 插件里用的都是啥功能,结果绝大部分的人用一个 brainstorming 就结了,小部分人还会用 systematic-debugging, 这俩一个是左移一个是捅了篓子之后擦屁股 Chorus 里左移长什么样 我大概是这么搞的。 第一步是 Elaboration (细化)。粗糙的想法扔进来,Agent 主动追着问。"这个搜索是只搜标题还是带正文?""精确匹配还是模糊?""结果排序按什么?"几轮聊下来,需求就被拍扁成一份明确的描述。关键是 agent 在追问,不是人在写需求文档,门槛低很多。其实和 Branstorming 有点像但所有的决策都会记录在案,方便回看或者交接工作。有的时候想回忆起某个 Feature 做了啥,我去 Chorus 的 UI 上看一眼和 Agent 的问答记录一下就清晰了 第二步是 Proposal (提案)。Agent 基于敲定的需求出方案,包括接口怎么改、任务怎么拆、每个任务的验收标准是什么。这份方案先过一个独立的 reviewer agent 对抗检查,确认接口对得上、任务粒度合理、AC 可测,才递给用户拍板。从这个阶段开始用对抗的方式保证 Agent 写的东西真的方向对而且可以验收,而且这个单独的 Review Agent 也可以充分利用前面环节细化的记录,从第三方视角观察着一份提案有没有跑偏。 第三步是每个任务自带的验收标准 checklist 。Agent 写完代码不是说一句"我做完了"就完事,得逐条对着验收标准自检,再过一个 task-reviewer 对抗校验。这里的 Task Review Agent 又能充分利用前面细化和提案的记录来保证任务本身有没有执行歪。 这些步骤其实就为了一件事:对齐挪到前面、校验放到后面,中间写代码这段就基本能放手了。当然 Proposal 阶段偶尔也会跑偏,但概率比让 agent 直接动手低一个数量级,跑偏了 reviewer 也大概率能挡住,比撒开了写代码再改好多了。 顺便聊聊最近超火的 Claude Code 的 Workflow 最近 Claude Code 出了个 Workflow 功能,你说一句需求,主 agent 会动态写一段编排脚本,搞出几十上百个 subagent 并行跑不同维度的搜索、审查、合成,最后把结果收拢回来。 这玩意很牛,但解决的是另一个问题:在解空间不确定的时候,用 token 换覆盖面。单 agent 顾不过来 10 个维度,那就开 10 路并行各管一摊,再用一组对抗 agent 反驳每个发现,留下经得起怼的那批。 但 Workflow 不是左移。它是动手之后用更多 agent 探索更优解,重心在执行端的扩散和收敛。token 消耗是单 agent 的几十倍起步,而且 Workflow 本身的对齐环节相对轻,主要靠主 agent 一开始的理解,没有像左移那样反复跟用户确认。 我自己的体感是,绝大多数日常 coding 任务的瓶颈不在"探索得不够广",而在"开头没聊清楚"。开头方向歪了,扩散得再广也是在错的方向上扩散,最后还是要返工。 Workflow 适合那种你已经知道要什么、只是解空间太大、得靠对抗验证的活,解决方案探索啥的。日常开发主体还是要靠左移把对齐做扎实,我觉得目前 Harness 的最大作用不是搞出一大堆流程和 Agent 去干活,而是把你脑子里的东西对齐给 Agent 而且保证他按照这个思路执行到底 代码都在 Chorus 仓库 ,欢迎讨论。

V2EX - 技术 · 2026-06-09 14:46:23+08:00 · tech

我从年初开始,不管是自己的开源项目还是工作,99.9% 的代码已经是 CC 写的了,顺手做了一个开源的 harness 叫 Chorus 想把自己的一些实践写到里面去,整了很多功能比如细化需求啊,自动 review 啊等等 现在累计了一些用户,包括我自己每天也是高强度使用,这半年下来最大的感觉用了那么多手法,是“左移”才是最有效的 为什么 vibe coding 特别需要左移 软件工程里 shift left 是个老概念,把测试和质量挪到开发早期,比写完再抓有效得多。AI 时代这个套路收益更大,因为 agent 写代码飞快,但它对你想要什么的理解是无法保障的。 理想情况是你交代一个任务给 AI ,他 kuku 一顿操作就给你完成了,实际情况是这根本不可能,毕竟你这一句话里的信息量实在太少了,大部分要靠 AI 自己猜。我之前发了一个帖子调查大家理想的 Agent 交互方式 https://www.v2ex.com/t/1215829 大部分人都希望一句话直接撬动成果,但现阶段这么做估计会一地鸡毛 返工成本看着低,反正它写得快嘛。但人 review 的时间是真金白银,而且每改一轮上下文就乱一点,最后连最初想要什么都模糊了,最后就向着💩山一去不复返了。 让 agent 干活之前先完全搞清楚你脑子里是啥这一点远远胜过其他花里胡哨的技巧。我问了几个朋友,superpowers 插件里用的都是啥功能,结果绝大部分的人用一个 brainstorming 就结了,小部分人还会用 systematic-debugging, 这俩一个是左移一个是捅了篓子之后擦屁股 Chorus 里左移长什么样 我大概是这么搞的。 第一步是 Elaboration (细化)。粗糙的想法扔进来,Agent 主动追着问。"这个搜索是只搜标题还是带正文?""精确匹配还是模糊?""结果排序按什么?"几轮聊下来,需求就被拍扁成一份明确的描述。关键是 agent 在追问,不是人在写需求文档,门槛低很多。其实和 Branstorming 有点像但所有的决策都会记录在案,方便回看或者交接工作。有的时候想回忆起某个 Feature 做了啥,我去 Chorus 的 UI 上看一眼和 Agent 的问答记录一下就清晰了 第二步是 Proposal (提案)。Agent 基于敲定的需求出方案,包括接口怎么改、任务怎么拆、每个任务的验收标准是什么。这份方案先过一个独立的 reviewer agent 对抗检查,确认接口对得上、任务粒度合理、AC 可测,才递给用户拍板。从这个阶段开始用对抗的方式保证 Agent 写的东西真的方向对而且可以验收,而且这个单独的 Review Agent 也可以充分利用前面环节细化的记录,从第三方视角观察着一份提案有没有跑偏。 第三步是每个任务自带的验收标准 checklist 。Agent 写完代码不是说一句"我做完了"就完事,得逐条对着验收标准自检,再过一个 task-reviewer 对抗校验。这里的 Task Review Agent 又能充分利用前面细化和提案的记录来保证任务本身有没有执行歪。 这些步骤其实就为了一件事:对齐挪到前面、校验放到后面,中间写代码这段就基本能放手了。当然 Proposal 阶段偶尔也会跑偏,但概率比让 agent 直接动手低一个数量级,跑偏了 reviewer 也大概率能挡住,比撒开了写代码再改好多了。 顺便聊聊最近超火的 Claude Code 的 Workflow 最近 Claude Code 出了个 Workflow 功能,你说一句需求,主 agent 会动态写一段编排脚本,搞出几十上百个 subagent 并行跑不同维度的搜索、审查、合成,最后把结果收拢回来。 这玩意很牛,但解决的是另一个问题:在解空间不确定的时候,用 token 换覆盖面。单 agent 顾不过来 10 个维度,那就开 10 路并行各管一摊,再用一组对抗 agent 反驳每个发现,留下经得起怼的那批。 但 Workflow 不是左移。它是动手之后用更多 agent 探索更优解,重心在执行端的扩散和收敛。token 消耗是单 agent 的几十倍起步,而且 Workflow 本身的对齐环节相对轻,主要靠主 agent 一开始的理解,没有像左移那样反复跟用户确认。 我自己的体感是,绝大多数日常 coding 任务的瓶颈不在"探索得不够广",而在"开头没聊清楚"。开头方向歪了,扩散得再广也是在错的方向上扩散,最后还是要返工。 Workflow 适合那种你已经知道要什么、只是解空间太大、得靠对抗验证的活,解决方案探索啥的。日常开发主体还是要靠左移把对齐做扎实,我觉得目前 Harness 的最大作用不是搞出一大堆流程和 Agent 去干活,而是把你脑子里的东西对齐给 Agent 而且保证他按照这个思路执行到底 代码都在 Chorus 仓库 ,欢迎讨论。

V2EX - 技术 · 2026-06-09 14:12:49+08:00 · tech

我从年初开始,不管是自己的开源项目还是工作,99.9% 的代码已经是 CC 写的了,顺手做了一个开源的 harness 叫 Chorus 想把自己的一些实践写到里面去,整了很多功能比如细化需求啊,自动 review 啊等等 现在累计了一些用户,包括我自己每天也是高强度使用,这半年下来最大的感觉用了那么多手法,是“左移”才是最有效的 为什么 vibe coding 特别需要左移 软件工程里 shift left 是个老概念,把测试和质量挪到开发早期,比写完再抓有效得多。AI 时代这个套路收益更大,因为 agent 写代码飞快,但它对你想要什么的理解是无法保障的。 理想情况是你交代一个任务给 AI ,他 kuku 一顿操作就给你完成了,实际情况是这根本不可能,毕竟你这一句话里的信息量实在太少了,大部分要靠 AI 自己猜。我之前发了一个帖子调查大家理想的 Agent 交互方式 https://www.v2ex.com/t/1215829 大部分人都希望一句话直接撬动成果,但现阶段这么做估计会一地鸡毛 返工成本看着低,反正它写得快嘛。但人 review 的时间是真金白银,而且每改一轮上下文就乱一点,最后连最初想要什么都模糊了,最后就向着💩山一去不复返了。 让 agent 干活之前先完全搞清楚你脑子里是啥这一点远远胜过其他花里胡哨的技巧。我问了几个朋友,superpowers 插件里用的都是啥功能,结果绝大部分的人用一个 brainstorming 就结了,小部分人还会用 systematic-debugging, 这俩一个是左移一个是捅了篓子之后擦屁股 Chorus 里左移长什么样 我大概是这么搞的。 第一步是 Elaboration (细化)。粗糙的想法扔进来,Agent 主动追着问。"这个搜索是只搜标题还是带正文?""精确匹配还是模糊?""结果排序按什么?"几轮聊下来,需求就被拍扁成一份明确的描述。关键是 agent 在追问,不是人在写需求文档,门槛低很多。其实和 Branstorming 有点像但所有的决策都会记录在案,方便回看或者交接工作。有的时候想回忆起某个 Feature 做了啥,我去 Chorus 的 UI 上看一眼和 Agent 的问答记录一下就清晰了 第二步是 Proposal (提案)。Agent 基于敲定的需求出方案,包括接口怎么改、任务怎么拆、每个任务的验收标准是什么。这份方案先过一个独立的 reviewer agent 对抗检查,确认接口对得上、任务粒度合理、AC 可测,才递给用户拍板。从这个阶段开始用对抗的方式保证 Agent 写的东西真的方向对而且可以验收,而且这个单独的 Review Agent 也可以充分利用前面环节细化的记录,从第三方视角观察着一份提案有没有跑偏。 第三步是每个任务自带的验收标准 checklist 。Agent 写完代码不是说一句"我做完了"就完事,得逐条对着验收标准自检,再过一个 task-reviewer 对抗校验。这里的 Task Review Agent 又能充分利用前面细化和提案的记录来保证任务本身有没有执行歪。 这些步骤其实就为了一件事:对齐挪到前面、校验放到后面,中间写代码这段就基本能放手了。当然 Proposal 阶段偶尔也会跑偏,但概率比让 agent 直接动手低一个数量级,跑偏了 reviewer 也大概率能挡住,比撒开了写代码再改好多了。 顺便聊聊最近超火的 Claude Code 的 Workflow 最近 Claude Code 出了个 Workflow 功能,你说一句需求,主 agent 会动态写一段编排脚本,搞出几十上百个 subagent 并行跑不同维度的搜索、审查、合成,最后把结果收拢回来。 这玩意很牛,但解决的是另一个问题:在解空间不确定的时候,用 token 换覆盖面。单 agent 顾不过来 10 个维度,那就开 10 路并行各管一摊,再用一组对抗 agent 反驳每个发现,留下经得起怼的那批。 但 Workflow 不是左移。它是动手之后用更多 agent 探索更优解,重心在执行端的扩散和收敛。token 消耗是单 agent 的几十倍起步,而且 Workflow 本身的对齐环节相对轻,主要靠主 agent 一开始的理解,没有像左移那样反复跟用户确认。 我自己的体感是,绝大多数日常 coding 任务的瓶颈不在"探索得不够广",而在"开头没聊清楚"。开头方向歪了,扩散得再广也是在错的方向上扩散,最后还是要返工。 Workflow 适合那种你已经知道要什么、只是解空间太大、得靠对抗验证的活,解决方案探索啥的。日常开发主体还是要靠左移把对齐做扎实,我觉得目前 Harness 的最大作用不是搞出一大堆流程和 Agent 去干活,而是把你脑子里的东西对齐给 Agent 而且保证他按照这个思路执行到底 代码都在 Chorus 仓库 ,欢迎讨论。

V2EX - 技术 · 2026-06-09 14:12:49+08:00 · tech

我从年初开始,不管是自己的开源项目还是工作,99.9% 的代码已经是 CC 写的了,顺手做了一个开源的 harness 叫 Chorus 想把自己的一些实践写到里面去,整了很多功能比如细化需求啊,自动 review 啊等等 现在累计了一些用户,包括我自己每天也是高强度使用,这半年下来最大的感觉用了那么多手法,是“左移”才是最有效的 为什么 vibe coding 特别需要左移 软件工程里 shift left 是个老概念,把测试和质量挪到开发早期,比写完再抓有效得多。AI 时代这个套路收益更大,因为 agent 写代码飞快,但它对你想要什么的理解是无法保障的。 理想情况是你交代一个任务给 AI ,他 kuku 一顿操作就给你完成了,实际情况是这根本不可能,毕竟你这一句话里的信息量实在太少了,大部分要靠 AI 自己猜。我之前发了一个帖子调查大家理想的 Agent 交互方式 https://www.v2ex.com/t/1215829 大部分人都希望一句话直接撬动成果,但现阶段这么做估计会一地鸡毛 返工成本看着低,反正它写得快嘛。但人 review 的时间是真金白银,而且每改一轮上下文就乱一点,最后连最初想要什么都模糊了,最后就向着💩山一去不复返了。 让 agent 干活之前先完全搞清楚你脑子里是啥这一点远远胜过其他花里胡哨的技巧。我问了几个朋友,superpowers 插件里用的都是啥功能,结果绝大部分的人用一个 brainstorming 就结了,小部分人还会用 systematic-debugging, 这俩一个是左移一个是捅了篓子之后擦屁股 Chorus 里左移长什么样 我大概是这么搞的。 第一步是 Elaboration (细化)。粗糙的想法扔进来,Agent 主动追着问。"这个搜索是只搜标题还是带正文?""精确匹配还是模糊?""结果排序按什么?"几轮聊下来,需求就被拍扁成一份明确的描述。关键是 agent 在追问,不是人在写需求文档,门槛低很多。其实和 Branstorming 有点像但所有的决策都会记录在案,方便回看或者交接工作。有的时候想回忆起某个 Feature 做了啥,我去 Chorus 的 UI 上看一眼和 Agent 的问答记录一下就清晰了 第二步是 Proposal (提案)。Agent 基于敲定的需求出方案,包括接口怎么改、任务怎么拆、每个任务的验收标准是什么。这份方案先过一个独立的 reviewer agent 对抗检查,确认接口对得上、任务粒度合理、AC 可测,才递给用户拍板。从这个阶段开始用对抗的方式保证 Agent 写的东西真的方向对而且可以验收,而且这个单独的 Review Agent 也可以充分利用前面环节细化的记录,从第三方视角观察着一份提案有没有跑偏。 第三步是每个任务自带的验收标准 checklist 。Agent 写完代码不是说一句"我做完了"就完事,得逐条对着验收标准自检,再过一个 task-reviewer 对抗校验。这里的 Task Review Agent 又能充分利用前面细化和提案的记录来保证任务本身有没有执行歪。 这些步骤其实就为了一件事:对齐挪到前面、校验放到后面,中间写代码这段就基本能放手了。当然 Proposal 阶段偶尔也会跑偏,但概率比让 agent 直接动手低一个数量级,跑偏了 reviewer 也大概率能挡住,比撒开了写代码再改好多了。 顺便聊聊最近超火的 Claude Code 的 Workflow 最近 Claude Code 出了个 Workflow 功能,你说一句需求,主 agent 会动态写一段编排脚本,搞出几十上百个 subagent 并行跑不同维度的搜索、审查、合成,最后把结果收拢回来。 这玩意很牛,但解决的是另一个问题:在解空间不确定的时候,用 token 换覆盖面。单 agent 顾不过来 10 个维度,那就开 10 路并行各管一摊,再用一组对抗 agent 反驳每个发现,留下经得起怼的那批。 但 Workflow 不是左移。它是动手之后用更多 agent 探索更优解,重心在执行端的扩散和收敛。token 消耗是单 agent 的几十倍起步,而且 Workflow 本身的对齐环节相对轻,主要靠主 agent 一开始的理解,没有像左移那样反复跟用户确认。 我自己的体感是,绝大多数日常 coding 任务的瓶颈不在"探索得不够广",而在"开头没聊清楚"。开头方向歪了,扩散得再广也是在错的方向上扩散,最后还是要返工。 Workflow 适合那种你已经知道要什么、只是解空间太大、得靠对抗验证的活,解决方案探索啥的。日常开发主体还是要靠左移把对齐做扎实,我觉得目前 Harness 的最大作用不是搞出一大堆流程和 Agent 去干活,而是把你脑子里的东西对齐给 Agent 而且保证他按照这个思路执行到底 代码都在 Chorus 仓库 ,欢迎讨论。

V2EX - 技术 · 2026-06-09 10:53:16+08:00 · tech

我从年初开始,不管是自己的开源项目还是工作,99.9% 的代码已经是 CC 写的了,顺手做了一个开源的 harness 叫 Chorus 想把自己的一些实践写到里面去,整了很多功能比如细化需求啊,自动 review 啊等等 现在累计了一些用户,包括我自己每天也是高强度使用,这半年下来最大的感觉用了那么多手法,是“左移”才是最有效的 为什么 vibe coding 特别需要左移 软件工程里 shift left 是个老概念,把测试和质量挪到开发早期,比写完再抓有效得多。AI 时代这个套路收益更大,因为 agent 写代码飞快,但它对你想要什么的理解是无法保障的。 理想情况是你交代一个任务给 AI ,他 kuku 一顿操作就给你完成了,实际情况是这根本不可能,毕竟你这一句话里的信息量实在太少了,大部分要靠 AI 自己猜。我之前发了一个帖子调查大家理想的 Agent 交互方式 https://www.v2ex.com/t/1215829 大部分人都希望一句话直接撬动成果,但现阶段这么做估计会一地鸡毛 返工成本看着低,反正它写得快嘛。但人 review 的时间是真金白银,而且每改一轮上下文就乱一点,最后连最初想要什么都模糊了,最后就向着💩山一去不复返了。 让 agent 干活之前先完全搞清楚你脑子里是啥这一点远远胜过其他花里胡哨的技巧。我问了几个朋友,superpowers 插件里用的都是啥功能,结果绝大部分的人用一个 brainstorming 就结了,小部分人还会用 systematic-debugging, 这俩一个是左移一个是捅了篓子之后擦屁股 Chorus 里左移长什么样 我大概是这么搞的。 第一步是 Elaboration (细化)。粗糙的想法扔进来,Agent 主动追着问。"这个搜索是只搜标题还是带正文?""精确匹配还是模糊?""结果排序按什么?"几轮聊下来,需求就被拍扁成一份明确的描述。关键是 agent 在追问,不是人在写需求文档,门槛低很多。其实和 Branstorming 有点像但所有的决策都会记录在案,方便回看或者交接工作。有的时候想回忆起某个 Feature 做了啥,我去 Chorus 的 UI 上看一眼和 Agent 的问答记录一下就清晰了 第二步是 Proposal (提案)。Agent 基于敲定的需求出方案,包括接口怎么改、任务怎么拆、每个任务的验收标准是什么。这份方案先过一个独立的 reviewer agent 对抗检查,确认接口对得上、任务粒度合理、AC 可测,才递给用户拍板。从这个阶段开始用对抗的方式保证 Agent 写的东西真的方向对而且可以验收,而且这个单独的 Review Agent 也可以充分利用前面环节细化的记录,从第三方视角观察着一份提案有没有跑偏。 第三步是每个任务自带的验收标准 checklist 。Agent 写完代码不是说一句"我做完了"就完事,得逐条对着验收标准自检,再过一个 task-reviewer 对抗校验。这里的 Task Review Agent 又能充分利用前面细化和提案的记录来保证任务本身有没有执行歪。 这些步骤其实就为了一件事:对齐挪到前面、校验放到后面,中间写代码这段就基本能放手了。当然 Proposal 阶段偶尔也会跑偏,但概率比让 agent 直接动手低一个数量级,跑偏了 reviewer 也大概率能挡住,比撒开了写代码再改好多了。 顺便聊聊最近超火的 Claude Code 的 Workflow 最近 Claude Code 出了个 Workflow 功能,你说一句需求,主 agent 会动态写一段编排脚本,搞出几十上百个 subagent 并行跑不同维度的搜索、审查、合成,最后把结果收拢回来。 这玩意很牛,但解决的是另一个问题:在解空间不确定的时候,用 token 换覆盖面。单 agent 顾不过来 10 个维度,那就开 10 路并行各管一摊,再用一组对抗 agent 反驳每个发现,留下经得起怼的那批。 但 Workflow 不是左移。它是动手之后用更多 agent 探索更优解,重心在执行端的扩散和收敛。token 消耗是单 agent 的几十倍起步,而且 Workflow 本身的对齐环节相对轻,主要靠主 agent 一开始的理解,没有像左移那样反复跟用户确认。 我自己的体感是,绝大多数日常 coding 任务的瓶颈不在"探索得不够广",而在"开头没聊清楚"。开头方向歪了,扩散得再广也是在错的方向上扩散,最后还是要返工。 Workflow 适合那种你已经知道要什么、只是解空间太大、得靠对抗验证的活,解决方案探索啥的。日常开发主体还是要靠左移把对齐做扎实,我觉得目前 Harness 的最大作用不是搞出一大堆流程和 Agent 去干活,而是把你脑子里的东西对齐给 Agent 而且保证他按照这个思路执行到底 代码都在 Chorus 仓库 ,欢迎讨论。

LinuxDo 最新话题 · 2026-06-09 10:49:19+08:00 · tech

今年36岁,年初发现血糖高,空腹12-16,血红糖化蛋白9.5.中期脂肪肝。医院确认二型,然后住院治疗一周,血糖降下去了,后面开始节食,锻炼,每天一片安达唐达格列净,一天三餐,每餐5-7成饱,每天5-7公里快走加慢跑,目前三个月瘦了25斤,医院复查,空腹血糖6.12,血红糖化蛋白5.5,脂肪肝消失,想问下有没有佬友逆转过得,逆转的条件是什么。我又没有可能逆转。 18 个帖子 - 10 位参与者 阅读完整话题

V2EX - 技术 · 2026-06-09 10:43:55+08:00 · tech

我从年初开始,不管是自己的开源项目还是工作,99.9% 的代码已经是 CC 写的了,顺手做了一个开源的 harness 叫 Chorus 想把自己的一些实践写到里面去,整了很多功能比如细化需求啊,自动 review 啊等等 现在累计了一些用户,包括我自己每天也是高强度使用,这半年下来最大的感觉用了那么多手法,是“左移”才是最有效的 为什么 vibe coding 特别需要左移 软件工程里 shift left 是个老概念,把测试和质量挪到开发早期,比写完再抓有效得多。AI 时代这个套路收益更大,因为 agent 写代码飞快,但它对你想要什么的理解是无法保障的。 理想情况是你交代一个任务给 AI ,他 kuku 一顿操作就给你完成了,实际情况是这根本不可能,毕竟你这一句话里的信息量实在太少了,大部分要靠 AI 自己猜。我之前发了一个帖子调查大家理想的 Agent 交互方式 https://www.v2ex.com/t/1215829 大部分人都希望一句话直接撬动成果,但现阶段这么做估计会一地鸡毛 返工成本看着低,反正它写得快嘛。但人 review 的时间是真金白银,而且每改一轮上下文就乱一点,最后连最初想要什么都模糊了,最后就向着💩山一去不复返了。 让 agent 干活之前先完全搞清楚你脑子里是啥这一点远远胜过其他花里胡哨的技巧。我问了几个朋友,superpowers 插件里用的都是啥功能,结果绝大部分的人用一个 brainstorming 就结了,小部分人还会用 systematic-debugging, 这俩一个是左移一个是捅了篓子之后擦屁股 Chorus 里左移长什么样 我大概是这么搞的。 第一步是 Elaboration (细化)。粗糙的想法扔进来,Agent 主动追着问。"这个搜索是只搜标题还是带正文?""精确匹配还是模糊?""结果排序按什么?"几轮聊下来,需求就被拍扁成一份明确的描述。关键是 agent 在追问,不是人在写需求文档,门槛低很多。其实和 Branstorming 有点像但所有的决策都会记录在案,方便回看或者交接工作。有的时候想回忆起某个 Feature 做了啥,我去 Chorus 的 UI 上看一眼和 Agent 的问答记录一下就清晰了 第二步是 Proposal (提案)。Agent 基于敲定的需求出方案,包括接口怎么改、任务怎么拆、每个任务的验收标准是什么。这份方案先过一个独立的 reviewer agent 对抗检查,确认接口对得上、任务粒度合理、AC 可测,才递给用户拍板。从这个阶段开始用对抗的方式保证 Agent 写的东西真的方向对而且可以验收,而且这个单独的 Review Agent 也可以充分利用前面环节细化的记录,从第三方视角观察着一份提案有没有跑偏。 第三步是每个任务自带的验收标准 checklist 。Agent 写完代码不是说一句"我做完了"就完事,得逐条对着验收标准自检,再过一个 task-reviewer 对抗校验。这里的 Task Review Agent 又能充分利用前面细化和提案的记录来保证任务本身有没有执行歪。 这些步骤其实就为了一件事:对齐挪到前面、校验放到后面,中间写代码这段就基本能放手了。当然 Proposal 阶段偶尔也会跑偏,但概率比让 agent 直接动手低一个数量级,跑偏了 reviewer 也大概率能挡住,比撒开了写代码再改好多了。 顺便聊聊最近超火的 Claude Code 的 Workflow 最近 Claude Code 出了个 Workflow 功能,你说一句需求,主 agent 会动态写一段编排脚本,搞出几十上百个 subagent 并行跑不同维度的搜索、审查、合成,最后把结果收拢回来。 这玩意很牛,但解决的是另一个问题:在解空间不确定的时候,用 token 换覆盖面。单 agent 顾不过来 10 个维度,那就开 10 路并行各管一摊,再用一组对抗 agent 反驳每个发现,留下经得起怼的那批。 但 Workflow 不是左移。它是动手之后用更多 agent 探索更优解,重心在执行端的扩散和收敛。token 消耗是单 agent 的几十倍起步,而且 Workflow 本身的对齐环节相对轻,主要靠主 agent 一开始的理解,没有像左移那样反复跟用户确认。 我自己的体感是,绝大多数日常 coding 任务的瓶颈不在"探索得不够广",而在"开头没聊清楚"。开头方向歪了,扩散得再广也是在错的方向上扩散,最后还是要返工。 Workflow 适合那种你已经知道要什么、只是解空间太大、得靠对抗验证的活,解决方案探索啥的。日常开发主体还是要靠左移把对齐做扎实,我觉得目前 Harness 的最大作用不是搞出一大堆流程和 Agent 去干活,而是把你脑子里的东西对齐给 Agent 而且保证他按照这个思路执行到底 代码都在 Chorus 仓库 ,欢迎讨论。