4 个 plus+2 个 team 纷纷爆红 想起奥特曼要把 codex 合并到 ChatGPT,来实战测试看看 8 个帖子 - 2 位参与者 阅读完整话题
“很多人无法停止亏损,是因为从一开始对这个市场的认知就是错误的,总希望一笔发财。” 最近整理自己这些年在市场里摸爬滚打写下的几十条实战交易语录,看着看着不禁感叹: 交易永远是反人性的。 我们在复盘时都能头头是道地说出“管住手”、“买强不买弱”、“到了止损位坚决走”,但第二天一开盘,看着账户泛绿,所有的纪律瞬间被抛诸脑后,变成了死扛和祈祷。 为了时刻警醒自己,我把杂乱的语录提炼成了 16 条“铁血军规”。后来我想明白了,既然人性是难以战胜的,那为什么不把这套带着血汗的交易心法,交给全无感情、不会贪婪恐惧的计算机去执行? 散户死穴与游资心法:16 条实战语录精编 在看我的量化代码逻辑之前,请先用心过一遍这 16 条残酷的实战认知。如果你中了其中哪怕一条,那你的频繁亏损就真的不冤。 ** [破除认知心魔] ** 摒弃暴富幻觉 :散户最大的绝症是幻想一枪发财,殊不知越主观,亏得越多。短线交易的真相,是无数笔客观小赚的复利积累。 克服沉没成本 :盯着成本线,永远做不出完美的“做 T”。忘记成本,才是机械执行的开始。 拒绝与股票恋爱 :钱进了口袋才是真金白银。见好就收,卖完就删自选,不盲目悲观,也不盲目格局。 低预期即高胜率 :别把大肉当做理所应当,市场的常态永远是低开和调整。只赚属于自己的两三个点,错过绝不眼红。 放下主观意淫 :你的“强烈看好”,改变不了市场。个股不转强就是在走弱,走弱就必须执行纪律截断亏损。 ** [锁定核心大势] ** 6. 逻辑大于代码 :市场摸索期观望为主。先锚定热门题材,再寻找高位龙头,看见代码就无脑冲是大忌。 7. 买胜率非买便宜 :买强不买弱,买确定性,绝不买低位的“便宜货”。凡有资金主动发动的反核力量,定是剑指最高板。 8. 跳出单票错觉 :剥离单只股票“洗盘或出货”的臆想,把视角拉高到整体题材周期,规避被动的板块跟风股。 ** [机械的进出场] ** 9. 严格限期杜绝拖延 :超短交易延期等于死期,亏损一旦转长线被动死扛,离深渊就不远了。 10. 重仓必减,见绿低吸 :浮盈切忌加仓,红盘必须减速;做滚动操作(做 T )时,一定是水下重锤,冲高必退。 11. 拒绝临时起意 :制定了低吸剧本,就绝不盘中热血上头去追涨。规避日内情绪波动,出手尽量留在竞价或尾盘时段。 12. 交给市场定生死 :博弈反包绝不留恋,按纪律下注离手,次日直接验证逻辑,去留分明。 ** [仓位管理的无情] ** 13. 固定仓位模型 :买入必须提前规划。用金字塔倒三角仓位(越跌越低吸)应对系统风险,千万别在赚钱时重仓,亏钱时不敢买。 14. 不当资金散弹枪 :小资金分仓太散别想做大,集中专注才能刺穿市场的波动。 15. 拉长周期算胜率 :十笔交易亏六笔又如何?斩断烂票亏损,让做对的波段跑起来。拉长周期的综合盈亏比,才是稳定盈利的真相。 16. 规律刻入潜意识 :盯盘无需全天,四个小时看三小时足矣。交易不是撞大运,而是把上面的规则变成不再思考的肌肉记忆。 杀死主观意淫:我是如何把这 16 条铁血军规写成量化代码的? 散户是无法战胜自己贪婪的人性的,但 一行行无情的 Python 代码可以 。以下,是我把上述心法转化成的 聚宽《强趋势滚仓战法》 核心代码逻辑: 一、 斩断执念:无数笔积累与无情止盈 响应语录 :“短线交易是无数笔的积累,没哪个资金是一笔发财的。” 在这套量化策略里,代码彻底摒弃了人类的“格局到翻倍”的执念。为了践行“快刀斩乱麻”,策略被我写死了两套无情机制: 5% 次日早盘秒杀 :由于 A 股早盘低开是常态,只要第二天盈利超过 5%,直接无脑落袋砸盘,绝不留恋幻想(对应源码 pnl >= 0.05 强制清仓出局)。 10% 稳健绝杀锁利 :假如没触发早盘抢跑,只要持仓碰到 10% 的红线,不管大盘是不是在逼空走牛,立刻强平锁利。因为量化知道,只有进了口袋的钱才是绝对安全的。 二、 忘记持仓成本:全自动“滚仓做 T”对冲下杀 响应语录 :“滚仓滚仓,见绿就低吸。怎么就非要等回本才肯走,最后亏更多?” 人类“看成本做不了 T”,但机器根本不在乎你的成本是多少。 在这套系统里有一套名为 forward_t_buy_low (顺势低吸)和 t_sell_high (对冲抛出)的组件代码: 只要监控到盘中无缘无故的急杀,跌幅触及设定的安全垫(如单边暴跌 4%),代码会瞬间出击下达买单补仓。 只要从深坑反弹大约 3%,算法就把刚才低吸买入的 T0 筹码反手抛出。 整个操作中, 机器完全忽略账户里的总体浮亏 ,它只机械地抓取日内极端波动赚取几毛钱差价,利用极其变态的日内做 T 不断降低持仓成本。 三、 买强不买弱:“强迫症级别”的安全质检 响应语录 :“买强不买弱,买确定性,不买便宜!弱了我为什么要加仓,我有病吗?” “跌这么多了总该反弹了吧”,这是标准的抄底接盘幻觉。在我的量化选股逻辑里,介入前必须被执行死刑级别的过滤检测: 不接单边落石 :只要近两天有任何一天单日大跌超 6%,即便此刻动能再猛,一票否决全部淘汰。 拒绝骗炮割肉 :监控近两天的上影线(冲高回落占比)。如果主力在昨日诱多后长阴砸下超过 5% 的大根避雷针,黑名单见。 均线强横支撑 :所有幸存下来的标的,按爆发动能强度排榜,且现价必须牢牢踩在十日均线( MA10 )之上的纯正多头趋势,程序才会获批点火上车。 总结 市场的本质是一场基于人性的零和血腥剧。你越是带入情绪、患得患失,就越容易被当成新鲜的韭菜收割。 既然交易永远反人性,最好的自救方式就是剥离“人”的主观成分,把手绑住,让算法代替我们去执行“冷冰冰的原则”。 光说不练假把式,下面绝不谈空话。我已经将这套完全贯彻了“防反杀日内做 T 降本”、“10% 无情割肉止盈”与“买强不买弱雷达过滤”的量化模型,同步接驳到了 [9db 智能体交易竞技场],测试当中。 让这些没有任何感情修饰的交割单战报数据最直观地告诉你:极度的机械与绝对的纪律,究竟能在 A 股炼狱里带来怎样的确定性。 ⚠️ 客观数据申明 : 目前展现的这套模型胜率主要基于 2026 年 以来的行情跑出。老实说,在回测以往其他年份的部分极端行情时,代码的回撤控制表现还不太理想,目前我仍在根据更漫长的周期切片持续迭代优化中。 写在最后 : 如果这篇开源策略的实战思路对你哪怕有一点点启发,您的 点赞 就是对我最大的鼓励!如果您在复刻代码或跑回测时发现了隐藏 Bug ,或者对防线算法有更好的改进方案,万分欢迎在评论区毫不留情地提出指教。咱们在冰冷的市场里开源交流,抱团进化! ##策略还在测试阶段,只有 2026 年数据可以看,其他年份有很大问题,谨慎克隆,优化完会在评论区回复
背景:ERP系统中给一条合同创建回款单,回款单创建完成后更新合同的已收/未收金额字段。 业务:在审批场景下,可以给一条合同创建多条审批中的回款单(审批通过后才生效),为保证系统运行速度,用户点击审批同意后,主线程会去判断合同的未收金额是否足够,足够才能继续向下执行。但是审批会涉及到复杂的节点流转业务,所以更新合同已收/未收金额操作要通过MQ异步执行,从而提高响应速度。 问题:如果用户非常快的给同一合同的两条回款单点击同意,后同意的回款单很容易在主线程拿到先同意的回款单异步逻辑执行完成前的合同已收/未收金额,从而导致合同已收金额开超。 问了AI给出的方案不太符合现有需求,欢迎各位大佬理性讨论,各抒己见。(ps:前提一定要保证使用MQ更新合同金额) 4 个帖子 - 4 位参与者 阅读完整话题
小白学Epoll网络编程2 实战 我们这里使用一台Ubuntu24虚拟机,vscode使用ssh连接到这台机器,然后就可以开始调试了 命令 g++ -o server ./server2.cpp ./common/common.cpp -I . g++ client.cpp -o client 经历了1和2后我们现在已经有了能够运行的代码,那么如何在linux上使用gdb调试他呢?不能一直用print然后看输出来调试吧, 我们要有单步 堆栈和变量!本节就是总结在linux上的调试方法(针对单文件 项目的我还没学) 我们使用g++在linux上进行调试,首先我们要先编译出一个debug版本,这里从基础说起 通用知识 如何编译一个程序 我们的目录结构是 ├── common │ ├── common.cpp │ └── common.h └── server.cpp 其中的结构是server.cpp include了common.h,common.cpp又是common.h的实现 g++ A.cpp B.cpp -o output -I . 这里涉及到一些编译原理的内容,因为编译器实际上并不会单独处理头文件(头文件不是编译单元),他只处理.cpp,头文件只是一种便利的声明,在被include到文件后会被展开,如 // header.h void functionA(); void functionB(); // impletion.cpp #include "header.h" void functionA(){ 实现 } void functionB(){ 实现 } // main.cpp #include "header.h" int main(){ } 实际上主main和impletion会被展开成 // impletion.cpp void functionA(); void functionB(); void functionA(){ 实现 } void functionB(){ 实现 } // main.cpp void functionA(); void functionB(); int main(){ } 如果你自己每个文件都手敲声明的话比较麻烦,所以c++允许你写到一个单独的文件里然后include他们。但是对编译器来说,在头文件被展开后就不单独看了;到了编译这一步头文件已经被展开到各个实际的文件里了。所以回到刚才的话题,我们要传给g++的参数是server.cpp和common.cpp,即头文件的实现文件和主文件。 -o表示你要输出的二进制的文件名,如output,-I表示搜索头文件的根目录,编译器在展开头文件的阶段会找include提到的文件名;我们的头文件放在当前文件夹的common下,就从当前文件夹开始搜索,写common也行,但是以后可能还有别的文件夹,直接从当前文件夹开始方便以后扩展。 如何编译出debug版本的程序 主要是两点 添加调试信息 -g 关闭大部分优化 -O0 g++ A.cpp B.cpp -o output -I . -g -O0 -O(大写)后面跟的数字是优化等级,可以是0 1 2 3 s等等,代表不优化/基础/通用/激进/体积 我们一般的release版本优化的等级就是-O2, debug版本自然要比2低,这里直接选0, 防止优化过度导致调试的时候断点乱跳/缺失信息 额外的警告 为了开启所有警告还要加上 -Wall 所有常见警告(不是所有警告 是所有常见) -Wextra 额外警告 -Wpedantic 迂腐的 严格的检查是否符合指定的c++标准,无扩展无非标准写法,有的话警告 g++ -std=c++17 A.cpp B.cpp -o output -I . -g -O0 -Wall -Wextra -Wpedantic 最终的命令变成了这样 kisaragi@ubuntu24:~/Documents/Epoll$ g++ -std=c++17 server2.cpp common/common.cpp -g -O0 -Wextra -Wall -Wpedantic -o testDebug 编译成功 我们得到了testDebug二进制文件 古法 直接使用GDB 打开你的终端,使用gdb 二进制文件 命令来调试 可以通过file 二进制文件 来查看二进制的信息 正常的应该是with debug_info, not stripped,表示有调试信息,符号未被剥离,这里我们自己编的,应该不会错 启动命令,正式进入到gdb的界面中 但是还没显示代码,按ctrl+x后按a键打开代码显示,效果如下,看起来就清晰多了 gdb里的操作都是通过在(gdb)后面打命令实现的,如next, step,break等等; gdb有很多命令,对于习惯windows调试的我们来说,首先要找出怎么打断点,怎么继续,怎么进入函数, 怎么查看堆栈 流程基础操作 F5继续-->continue F10下一行-->next F11进入-->step 我们尝试在main上打一个断点,打断点的命令是 break 函数名或者行号 ,我们直接berak main(),就在main函数上打了个断点, 代码旁边也会显示一个小小的标志,现在可以直接将程序运行起来, 命令是run,等待一会,程序就会断在main第一行了 B+旁边的>角标就是当前行的指示器,我们输入两个next,让他运行到190行,然后看看threads的内容,查看变量的内容是 也可以直接通过start来启动,他的作用和在main上打个断点然后run是一样的 查看变量 print 变量 可以看到目前还没有内容,这是对的,因为刚初始化,监视变量也很简单,使用watch 变量 就可以进行监视, watch threads ,当threads被改变时就会断住。 想要删除断点/监视也很简单,使用 info breakpoints 查看所有断点 这里可以看到有我们在main里打的,还有刚刚watch的变量,然后我们就可以通过disable 编号 或者 delete 编号来编辑了,如这里删除3号断点,使用delete 3,再查看就没有了 断点操作 break 行号/函数名() 打断点 info breakpoints 查看断点 delete 断点 现在我们随便进一个函数看看,比如threads.push_back()的push_back方法,先运行到这一行,然后输入step就可以进入了 进出函数 step 相当于f11进入 finish 相当于shift+11出函数 成功进入,不想看了就输入finish,就可以进入上一级,相当于shift+f11, 如果你已经step进入很深了,需要多几次才能出去。也可以直接在外面打断点然后continue,和我们在windows上使用都是一样的 调用堆栈 bt或backtrace 常用的就这些命令,玩够了,打quit直接退出 使用vscode 直接使用vscode的remote ssh插件连接到你的服务器,打开文件夹(关于这个插件的使用可以网上搜教程) 终端里tree一下(tree .),复制文件夹结构 ├── common │ ├── common.cpp │ └── common.h └── server.cpp 在你的源码目录下新建一个.vscode文件夹,里面新建个launch.json,然后打开ai: 我想要用gdb调试程序,需要/不需要编译,给我写一个vscode里的launch.json,操作系统是xxx, 文件夹结构如下: ├── common │ ├── common.cpp │ └── common.h └── server.cpp ai直接拿捏,这里因为我说需要编译, ai把tasks.json也补上了,都拷贝进来就好了 然后打开你的源代码,在vscode里按F5,选择使用g++或类似的选项(使用gdb?可能),ai的配置写的没错就可以顺利启动了 这时直接就可以看到堆栈,断点,监视,变量等信息,比gdb要现代化的多,但他的信息其实也是从gdb里取的,只是换了种展示形式;现在你可以像在windwos里一样调试程序了 本节完 3 个帖子 - 2 位参与者 阅读完整话题
佬们有下面这个B站资源的完整版吗,从Agent入门、Agent进阶到RAG Agent,然后LangGraph的,求一波,先感谢各位佬了 5 个帖子 - 3 位参与者 阅读完整话题
codex 最近测试呢一个最懒的办法 朋友推荐了一个需要包装设计的客户 和客户沟通个大概 微信聊天记直接截图给 codex 然后说需要的结果就是概念设计效果图和设计说明 ppt 输出的结果发给客户 客户看完点赞 等客户第二轮意见中 我把整个过程给我的一个做了十几年设计公司的朋友看,看完不吱声了 正在办理 codex 中 中途 codex 自己去设计师网站寻找灵感然后整理我们的聊天记录,发觉设计意图和缺少信息之类的。
色频 SEO/频道资深代运营 因为业务扩张,现急寻具备实战经验的频道代运营合伙人。 💪能力要求: 1.拥有自有频道或丰富的成人频道全盘运营经验; 2.了解 Telegram 搜索机器人规则,擅长搜索引擎流量获取; 3.对内容质量有追求,能通过精细化运营提升用户留存与转化。 💰薪酬待遇: 底薪 1000 USDT + 阶梯式流量提成(上不封顶,能者多得)。 合作详情: 只要你有方案、有技术、能出结果,我们提供合理合作费用! 非诚勿扰) 有意者留言
色频 SEO/频道资深代运营 因为业务扩张,现急寻具备实战经验的频道代运营合伙人。 💪能力要求: 1.拥有自有频道或丰富的成人频道全盘运营经验; 2.了解 Telegram 搜索机器人规则,擅长搜索引擎流量获取; 3.对内容质量有追求,能通过精细化运营提升用户留存与转化。 💰薪酬待遇: 底薪 1000 USDT + 阶梯式流量提成(上不封顶,能者多得)。 合作详情: 只要你有方案、有技术、能出结果,我们提供合理合作费用! 非诚勿扰) 有意者留言
周五晚上 8 点——懒猫微服多平台直播 AI Agent 实战演练,教你用 AI 轻松提效 更有神秘新品发布免费送 快来微信扫码预约吧
👋 [高薪招募] 色频 SEO/频道资深代运营 因为业务扩张,现急寻具备实战经验的频道代运营合伙人。 💪能力要求: 1.拥有自有频道或丰富的成人频道全盘运营经验; 2.了解 Telegram 搜索机器人规则,擅长搜索引擎流量获取; 3.对内容质量有追求,能通过精细化运营提升用户留存与转化。 💰薪酬待遇: 底薪 1000 USDT + 阶梯式流量提成(上不封顶,能者多得)。 合作详情: 只要你有方案、有技术、能出结果,我们提供合理合作费用! 非诚勿扰)
大家好,我是贾克斯。 这篇文章会稍微硬核一点。 但我会尽量写得让非研发同学也能看懂。 如果最近你关注 AI Coding ,应该会经常听到一个词。 Harness Agent 。 或者更完整一点,叫 Harness Engineering 。 这个词听起来很工程,很抽象。 但你可以先把它理解成一句话。 大模型很强,但它不能裸奔。 它像一匹跑得很快的马。 你不能只是拍拍它的屁股,然后说,兄弟,冲! 你得给它方向、边界、工具、反馈。 给它一个跑偏以后能被拉回来的机制。 这套东西,就是 Harness(哈尼斯) 它不是为了限制 AI ,而是为了让 AI 的能力变得更稳定、可控、可复用。 这套概念现在已经在 Claude Code 、Codex 、Qoder 这类 AI Coding Agent 里逐步落地。 类似 OpenAI 、Anthropic 这些团队,也都在讲同一件事:那就是: 人类掌舵,智能体执行。 这句话听起来很帅,但问题是,很多人听完以后,还是不知道怎么落地。 今天,我们就把这个 Harness Coding 在企业场景中如何运用的具体实践给分享一下。 / 什么是 Harness / 在此之前,请允许我先用一个真实的小案例,给大家讲清楚,到底什么是 Harness 。 如果这个概念前面不对齐,后续则无法深入到企业场景内的 Harness 实践,越到后面大家只会更加懵逼。 假设我们现在让 AI 去做一个媒体账号。 给它的前置系统提示词是: “你的人设是宝妈,目标是涨粉,核心指标是每篇帖子的阅读量、互动量和关注转化。” AI 收到这个提示词以后,就开始干活。 它很快发布了一篇帖子: 💬 “我家孩子 3 个月,但是不爱吃母乳怎么办?” 然后配了两张图。 到这里,AI 已经完成了两个动作: 前置,执行。 接下来进入第三步: 反馈。 帖子发出去 1 小时后,AI 去看数据,发现阅读量很低。 按照新账号起号的逻辑,一篇正常内容至少应该有上百阅读,但这篇只有几十。 于是 AI 开始复盘。 它发现,这篇内容太平了,没有足够强的吸引点。然后它把这个经验写进自己的经验库:“内容过于平淡,容易导致阅读量偏低。” 下一次发帖时,这条经验会重新进入它的前置说明里。 于是 AI 的新提示词就变成了: “你的人设是宝妈,你的任务是发布帖子吸引用户关注和评论。你的核心指标是涨粉量和每篇帖子的阅读量。 历史经验:上一篇帖子因为内容过于平淡,阅读量很差。下次需要提高标题和内容的吸引力。” 然后 AI 又开始执行。 这次它发了一篇更夸张的: 💬 “天塌啦!我家孩子每天能吃一头牛怎么办!快养不起了,呜呜。” 这篇发出去以后,数据确实很好。 1 小时内有 1 万阅读。 但是问题来了。 1 小时后,帖子被封了。 原因是:传播夸大事实的信息。 这时候 AI 又开始复盘。它发现,夸张标题确实能带来流量,但如果夸大事实,就很容易被平台判违规。 于是经验库里又多了一条: 夸张表达可以提升点击,但不能脱离事实,否则容易被封。 现在,AI 的经验库里已经有两条经验: 第一,内容太平淡,没有流量。 第二,夸大事实虽然有流量,但容易违规。 于是第三次发帖时,AI 开始调整策略。 它不再写平淡内容,也不再硬夸张,而是换成真诚路线: 💬 “做辣妈的第三年,我是如何一边带娃,一边保持状态的?” 这篇内容戳中了很多宝妈的真实痛点。 结果,帖子爆了。 AI 看到数据以后,发现这条路线有效,于是继续把经验写回去: 真诚表达真实痛点,更容易获得稳定流量。 到这里,一个很小的运营闭环就出现了。 前置、执行、反馈、经验沉淀,再回到前置。 这就是 Harness 的核心。 它不是让 AI 单次完成一个任务,而是让 AI 在一个系统里持续变好。 当然,刚才这个例子只是为了方便理解,真实系统要复杂得多。 比如: AI 拉到帖子数据以后,怎么判断这篇帖子是正常、偏差,还是爆了? AI 复盘的时候,怎么对标同类账号,而不是只看自己的感觉? AI 发现某个策略有效以后,怎么判断它是长期有效,还是只是碰巧踩中了流量? 这些问题,才是搭建 Harness 系统真正难的地方。 也就是说,Harness 的关键不只是“让 AI 干活”。 而是要给 AI 搭一套闭环: 任务怎么定义,过程怎么执行,结果怎么评估,经验怎么沉淀,下次怎么复用? 这才是 Harness 的核心。 / 企业级 Harness 实战 / 能看到这里的,想必已经对什么是 Harness 已经没有异议了。 那么接下来我们开始介绍本文的重点:企业级的 Harness Coding 实战应该怎么去做? 在真实的开发任务里,这个闭环会复杂很多。 因为写代码不是发一条帖子。 真实开发里有需求理解、架构边界、代码规范、接口契约、测试验证、日志排查、评审验收、多人协作。 任何一个环节没管住,AI 都可能开始偏航。 所以,如果我们想让 AI 真的参与企业级开发,不能只写一句: “你是一个资深研发工程师,请帮我完成这个需求。” 这不叫 Harness 。 这叫把一个非确定性的模型,直接扔进生产代码里裸奔。 真正的 Harness Coding 系统,至少要回答几个问题: 1. AI 开始写代码前,它从哪里理解需求? 2. 它依据什么项目规则做判断? 3. 它能不能自己查架构规范,而不是反手问人? 4. 它写完以后,谁来验证? 5. 验证失败以后,怎么回到正确轨道? 6. 这次踩过的坑,下次怎么不再踩? 这才是 Harness 架构要解决的问题。 而对于 AI Coding 的场景,这套架构则最少要有如下三层: 1. 人类需求层。 2. 工程契约层。 3. 代码执行层。 / 第一层,人类需求层 / 这一层解决的是:人类到底想要什么。 很多 AI Coding 失败,不是模型写不出代码,而是一开始需求就没有被说清楚。 人类在聊天窗口里随口说一句“帮我加个 X 接口”,AI 就开始实现。它看起来很勤奋,实际上很危险。 因为它不知道这个接口的业务边界是什么,不知道哪些字段必须兼容旧系统,不知道异常场景怎么处理,也不知道验收标准是什么。 所以在我们的 Harness 里,第一步不是让 AI 写代码。 第一步是让人类先把需求落成一个可以被交接的文档。 这个文档不需要写得像论文,但必须说清楚几件事: 这个需求为什么要做。 这次到底做什么,不做什么。 输入输出是什么。 业务流程是什么。 验收标准是什么。 这一步非常关键。 因为 Harness 的第一条原则就是: 人类负责想清楚方向,AI 负责把方向翻译成工程动作。 如果人类自己都没想清楚,AI 只会把不确定性放大。 / 第二层,工程契约层 / 当人类需求写清楚以后,也不能马上进入代码实现。 中间还需要一层翻译。 因为人类需求通常是业务语言,而代码实现需要工程语言。 比如人类说: 新增一个校验能力,失败时要给前端异常提示。 这句话对业务方来说够了,但对工程实现来说还不够。 AI 需要继续把它翻译成: 改哪个模块、新增什么接口、错误码怎么定义。 测试要覆盖哪些场景、哪些架构规则不能破坏、做到什么程度才算完成。 这一层,就是工程契约层。 在这一层里,AI 可以起草设计方案、任务拆分、接口契约和验收标准,但人类必须 Review 。 注意,这里不是人类逐行写设计文档,而是人类把关:方向对不对、边界有没有漏、验收标准是否可验证。 这个阶段的核心产物,不是代码,而是一份“写代码前的工程合同”。 它告诉后面的实现 Agent:你要交付什么、不能越过什么边界、交付后用什么证据证明完成。 / 第三层,代码执行层 / 只有前两层都对齐以后,AI 才能进入代码实现。 这一层才是真正的 Coding Agent 干活区。 但即使到了这里,也不是让一个 Agent 从头写到尾,然后自己宣布“完成了”。 我们需要把角色拆开。 一个负责规划。 一个负责实现。 一个负责评估。 并且还要有两个不同维度的评估器。 为什么? 因为同一个 AI 自己写、自己测、自己夸自己,很容易护短。 它会觉得:差不多了、应该没问题、这个边界场景可以不测。 这在真实工程里很危险。 所以我们要让实现者和评估者隔离。 实现 Agent 负责写代码和测试。 评估 Agent 负责站在外部视角审查它。 机器检查负责跑编译、单测、静态扫描、覆盖率。 人类负责最后看方向和关键证据。 这套分工听起来复杂,但本质很简单:不要让一个非确定性模型同时当运动员和裁判。 到了这里,一个企业级 Harness Coding 系统的基本骨架就出来了。 它不是一个 Prompt 。 它是一条流水线: 人类先写清楚需求。 AI 把需求翻译成工程契约。 人类审批契约。 AI 按契约实现。 机器跑自动化检查。 独立 Evaluator Agent 做审计。 审计到的偏航记录下来,沉淀回下一轮规则。 人类基于证据验收。 如果把上面这套链路压缩成一张图,大概是这样: 这张图看起来节点很多,但其实就一句话:需求先由人类想清楚,执行交给 AI ,结果必须被 Harness 验证。 该架构运行起来后的整套流程效果则是: 1. 团队先内部评审需求文档,确保团队内针对复杂需求是完全认知对齐的。 2. 把评审后的需求文档直接丢给 AI ,告诉它让他基于这套文档来实现。 3. AI 基于当前项目已有的前置架构和需求规范审核该文档并和人类基于该需求达成目标一致。 4. 人类批准开始干活后,AI 基于 Spec 驱动来把该需求转换为可执行的工程文档。 5. 人类审核该 Spec 文档是否对齐原始需求,审核完毕则开始允许 AI Coding 6. AI 基于 Spec 文档开发完毕后,开始自主调度 Harness Check 脚本验证当前代码变更是否符合测试覆盖率 80% 的标准、静态代码扫描是否存在 Bug 。 7. Harness Check 脚本执行不通过,则打回重新修改代码,审核通过则开始调度测试 Agent 和架构 Agent 进行需求验证。 8. 测试 Agent 基于 Spec 文档来检查 Coding 代码是否符合验收标准。 9. 架构 Agent 检查 AI 基于此次需求开发,是否破坏了项目架构的基本原则,比如:错误码规范、跨包调用等规范。 10. 双 Agent 验收通过,则最终呈现结果给到人类确认,验收失败,则打回让 AI 重新修复,只到 Agent 审核通过为止。 这就是目前我们团队内在用的开发方式。 如果硬要聊,这里面还有很多细节,比如: 你如何定义你的项目架构规范。 如何让双 Agent 打回次数过多时,把 AI 偏航记录给沉淀到文档中。 如何将上述的整个流程串联为一个自动化的流程,实现最终人类只要丢进去一个需求文档,其他的后续流程就全部自动化执行等等。 但其实上面这些问题都是非常小的问题,你只要能搞懂上述 Harness 架构的执行逻辑。 其他的单点问题则都是小问题,甚至于你完全可以把这些问题交给 AI 来帮你解决。 等你把这套流程给固化下来后,你会发现,企业级 Coding 竟然也如此简单。 事实上,企业级 Coding 未来也只会越来越简单。 不是因为代码本身变简单了。 而是因为越来越多复杂的执行过程,会被压进一套更清晰的工程流水线里。 到那个时候,真正重要的能力,就不再是“我能不能亲手写完这段代码”。 而是: 我能不能把一个模糊想法,变成一份清晰需求。 我能不能把需求,变成可执行的工程契约。 我能不能设计一套反馈系统,让 AI 犯错以后,下次永不再犯。 这才是 AI Coding 后半场真正要拼的东西。 以上。 如果觉得这篇文章还不错,欢迎一起探讨交流。 作者:贾克斯的平行世界。
ithome.com 性价比拉满:Grok Build 0.1 打响 AI 编程实战,马斯克称物超所值 - IT之家 AI 编程智能体 IDE 工具 Kilo Code 今天在 X 平台发布系列图文,分享了 Grok Build 0.1 实战开发报告,称构建交付服务过程零工具调用失败,且成本低于 GPT-5.5 和 Claude Opus 4.7 等模型。 2 个帖子 - 2 位参与者 阅读完整话题
IT之家 5 月 29 日消息,AI 编程智能体 IDE 工具 Kilo Code 今天在 X 平台发布系列图文,分享了 Grok Build 0.1 实战开发报告, 称构建交付服务过程零工具调用失败,且成本低于 GPT-5.5 和 Claude Opus 4.7 等模型。 Grok Build 是由马斯克旗下人工智能公司 xAI 在 2026 年 5 月推出的一款专为专业开发者设计的 AI 编程智能体工具(Coding Agent) 。 它直接对标 Claude Code 等业界前沿的终端编码产品,致力于通过自然语言控制,在本地终端自动完成复杂的软件工程任务。 Kilo Code 实战测试 Grok Build 0.1,要求其使用 TypeScript、Bun 和 SQLite 构建一个 webhook 交付服务,整个成本约为 1.65 美元(IT之家注:现汇率约合 11.2 元人民币)。 Grok Build 0.1 在交付过程中,第一件事是打开网页搜索,提取了 Stripe 的签名格式、GitHub 的重试行为、Standard Webhooks 规范,在写一行代码之前,问了 9 个澄清问题。 马斯克随后转发 Kilo Code 的实战 AI,并表示“物超所值”。
「经之以天,纬之以地。」—— 《左传·昭公二十八年》 两千年前,织工以经线为骨、纬线为肉,一梭一梭织就锦缎。经,是结构——纵贯始终、张紧不移;纬,是功能——穿梭其间、变化万千。 今天,编排 AI Agent 亦复如是:meta 与 phase 是「经」——确定性的结构骨架,预先张紧、不可动摇; agent()、parallel()、pipeline() 是「纬」——在骨架中穿梭执行的智能单元。经线决定流水线的形状,纬线填入真正的工作。 本书因此得名 —— 织经。 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 一、CLAUDE_CODE_WORKFLOWS 是什么 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ Claude Code 新增了一个实验性特性:Workflows 。需要在 claude code v2.1.148+ 的版本中通过 ultrawork 命令调用。 Claude Code Workflows 的核心思路很简单 —— 用户通过一段纯 JavaScript 脚本,用 agent() / parallel() / pipeline() / phase() 这几个原语,确定性地编排多个 subagent 。能 git 管理、能分享、能断点续传。 这和我们以往在 claude code 中用 Subagents / Agent Teams / Skills / MCP 都不一样。之前的多 agent 方案,要么靠提示词去「请求」模型调度(模型会跳步、会忘、会跑偏),要么社区自己造轮子模拟控制流。Claude 官方的 Workflows 直接把编排逻辑从提示词里拿出来,放进了「确定性代码」。 关键问题是:这个功能在全网几乎没有详细的文档介绍。所以我专门对这个 feature 进行了深度解析,附上了相关的实战示例、最佳实践、踩坑指南。 我使用 claude code 将相关内容系统性地写出来 —— 共涵盖了 29 章 + 6 篇附录,近 15w 字的深度解析做成了专门的 cookbook ,其中每个 recipe 都在 Claude Code v2.1.150 上实际全面测试过,每个案例都附上了 Run ID 方便溯源。 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 二、这本书覆盖了什么? ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 全书共六个部分,能够让你从最初的「这是啥」到能够实现「自己写一个生产级 Workflow 」: ◆ 第一部 · 认知篇 —— Workflows 在 Claude Code 里的定位 Workflow 和 Subagents / Agent Teams / Skills / MCP 各自解决什么问题?通过相关的定位矩阵把五种机制分成编排层、认知层、连接层: · 编排层:Subagents / Workflow / Agent Teams —— 回答「谁、按什么顺序执行」 · 认知层:Skills —— 回答「 Agent 怎么想」 · 连接层:MCP —— 回答「 Agent 能够使用什么」 我们能通过一句话描述其边界:「先做什么 → 再做什么 → 哪些能够并行」的流程图 → 形成 Workflow 。 ◆ 第二部 · 基础篇 —— API 完全指南 meta 、agent()、schema 、parallel() vs pipeline()、phase()、budget 、resume —— 每个参数都配上了真实运行数据。 其中有个容易踩坑的地方:parallel() 和 pipeline() 的区别。前者是「屏障」(需要等待全部完成才返回),后者是「流水线」(无屏障,各 item 独立流过各 stage )。以下是其中一个案例的实测数据: · parallel 3 并发:Run wf_52957913-6d2 ,3 agents ,78,844 tokens ,墙钟 8.4s · pipeline 3×2 阶段:Run wf_bf086b98-6ec ,6 agents ,158,982 tokens ,墙钟 26.7s 编排本身零 token ( Run wf_59bf3654-183:0 token / 4ms )—— 成本全在 agent() 节点上。 ◆ 第三部 · 实战 recipe —— 七个真实测试过的 recipe · 分片代码审查:Scan → Review → Verify → Synthesize ,pipeline 逐片流过 · PR 多维 Review:多维度 pipeline + 对抗验证,26 条 → 16 条(干掉 10 条误报) · 生成-批评-修复:生成 → 批评 → 修复循环,揪出 10 个缺陷( 2 CRITICAL ) · 深度研究:多角度检索 + 交叉核实,抓到一条死链( HTTP 410 ) · 评委面板:3 个独立评委打分,3:0 一致 · Bug 猎手:猎手找 bug → 独立证伪者逐条验证,5/5 全部命中 · 大扫除:批量扫描 + 逐文件改写,report-only 先看再改 每个配方都配备了对应的 Run ID 、agent_count 、total_tokens 、duration_ms ,相关真实数据可以溯源。 ◆ 第四部 · 进阶模式 包含了以下内容:对抗验证、循环到干与完整性批判、worktree 隔离写入、嵌套工作流、动态预算、断点续传。 这部分讲的是怎么让 Workflow 的「结果可信」—— 不是进行编排然后跑出来就完事,而是需要相关过程以及最终的结果经得起质疑。 ◆ 第五部 · 生态横评 这一部分拆解了四个我认为做得很优秀的 workflows ( ccg-workflow / superpowers / oh-my-claudecode / oh-my-openagent ),看它们怎么在没有原生 Workflow 的时代是怎么做的,以及其中哪些设计可以采纳吸收,用于编写属于最合适你自己的 workflow 。 原生 Workflow 给了确定性骨架,相关优秀的开源项目能够铸成其血肉 —— 磁盘状态续命、Hook 注入面包屑、工具层护栏。吸纳以上这些社区工作的优秀设计特性与官方 workflows 相结合,能够真正生成属于你自己的 workflow 。 ◆ 第六部 · 创作篇 从零实现一个 Workflow 的全流程:意图 → meta → 原语选择 → schema → 校验 → 真实运行 → 迭代。提供了用户可以直接 copy 的脚手架。 ◆ 附录 附上相关的 API 完整参考、陷阱与排除、最佳实践清单、术语表、信源索引、模式目录与场景速查。 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 书里所有技术论断分三级: · 官方:来自 Claude Code 的 sdk-tools.d.ts 类型定义 · 实测:本机跑出来的,带 Run ID · 第三方:社区资料,对其内容进行了「核实」 全书 23 个测试对应的 Run ID ,其原始运行记录保存在 assets/transcripts/,使得该 cookbook 中的内容均可溯源。 全书耗费两天时间进行认真的编写,将近 15w 字,对 Claude Code Workflows 该官方特性进行深度解读。从官方的 workflows 学习其真实实现,吸纳其精华。 直接点击下方链接进行观看 👇 觉得有用的去 github 点个 star 就是最大的支持。如果有任何问题,欢迎提 issues 和 pr 。 在线阅读: https://agi-is-going-to-arrive.github.io/workflow-cookbook/ GitHub: https://github.com/AGI-is-going-to-arrive/workflow-cookbook
「经之以天,纬之以地。」—— 《左传·昭公二十八年》 两千年前,织工以经线为骨、纬线为肉,一梭一梭织就锦缎。经,是结构——纵贯始终、张紧不移;纬,是功能——穿梭其间、变化万千。 今天,编排 AI Agent 亦复如是:meta 与 phase 是「经」——确定性的结构骨架,预先张紧、不可动摇; agent()、parallel()、pipeline() 是「纬」——在骨架中穿梭执行的智能单元。经线决定流水线的形状,纬线填入真正的工作。 本书因此得名 —— 织经。 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 一、CLAUDE_CODE_WORKFLOWS 是什么 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ Claude Code 新增了一个实验性特性:Workflows 。需要在 claude code v2.1.148+ 的版本中通过 ultrawork 命令调用。 Claude Code Workflows 的核心思路很简单 —— 用户通过一段纯 JavaScript 脚本,用 agent() / parallel() / pipeline() / phase() 这几个原语,确定性地编排多个 subagent 。能 git 管理、能分享、能断点续传。 这和我们以往在 claude code 中用 Subagents / Agent Teams / Skills / MCP 都不一样。之前的多 agent 方案,要么靠提示词去「请求」模型调度(模型会跳步、会忘、会跑偏),要么社区自己造轮子模拟控制流。Claude 官方的 Workflows 直接把编排逻辑从提示词里拿出来,放进了「确定性代码」。 关键问题是:这个功能在全网几乎没有详细的文档介绍。所以我专门对这个 feature 进行了深度解析,附上了相关的实战示例、最佳实践、踩坑指南。 我使用 claude code 将相关内容系统性地写出来 —— 共涵盖了 29 章 + 6 篇附录,近 15w 字的深度解析做成了专门的 cookbook ,其中每个 recipe 都在 Claude Code v2.1.150 上实际全面测试过,每个案例都附上了 Run ID 方便溯源。 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 二、这本书覆盖了什么? ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 全书共六个部分,能够让你从最初的「这是啥」到能够实现「自己写一个生产级 Workflow 」: ◆ 第一部 · 认知篇 —— Workflows 在 Claude Code 里的定位 Workflow 和 Subagents / Agent Teams / Skills / MCP 各自解决什么问题?通过相关的定位矩阵把五种机制分成编排层、认知层、连接层: · 编排层:Subagents / Workflow / Agent Teams —— 回答「谁、按什么顺序执行」 · 认知层:Skills —— 回答「 Agent 怎么想」 · 连接层:MCP —— 回答「 Agent 能够使用什么」 我们能通过一句话描述其边界:「先做什么 → 再做什么 → 哪些能够并行」的流程图 → 形成 Workflow 。 ◆ 第二部 · 基础篇 —— API 完全指南 meta 、agent()、schema 、parallel() vs pipeline()、phase()、budget 、resume —— 每个参数都配上了真实运行数据。 其中有个容易踩坑的地方:parallel() 和 pipeline() 的区别。前者是「屏障」(需要等待全部完成才返回),后者是「流水线」(无屏障,各 item 独立流过各 stage )。以下是其中一个案例的实测数据: · parallel 3 并发:Run wf_52957913-6d2 ,3 agents ,78,844 tokens ,墙钟 8.4s · pipeline 3×2 阶段:Run wf_bf086b98-6ec ,6 agents ,158,982 tokens ,墙钟 26.7s 编排本身零 token ( Run wf_59bf3654-183:0 token / 4ms )—— 成本全在 agent() 节点上。 ◆ 第三部 · 实战 recipe —— 七个真实测试过的 recipe · 分片代码审查:Scan → Review → Verify → Synthesize ,pipeline 逐片流过 · PR 多维 Review:多维度 pipeline + 对抗验证,26 条 → 16 条(干掉 10 条误报) · 生成-批评-修复:生成 → 批评 → 修复循环,揪出 10 个缺陷( 2 CRITICAL ) · 深度研究:多角度检索 + 交叉核实,抓到一条死链( HTTP 410 ) · 评委面板:3 个独立评委打分,3:0 一致 · Bug 猎手:猎手找 bug → 独立证伪者逐条验证,5/5 全部命中 · 大扫除:批量扫描 + 逐文件改写,report-only 先看再改 每个配方都配备了对应的 Run ID 、agent_count 、total_tokens 、duration_ms ,相关真实数据可以溯源。 ◆ 第四部 · 进阶模式 包含了以下内容:对抗验证、循环到干与完整性批判、worktree 隔离写入、嵌套工作流、动态预算、断点续传。 这部分讲的是怎么让 Workflow 的「结果可信」—— 不是进行编排然后跑出来就完事,而是需要相关过程以及最终的结果经得起质疑。 ◆ 第五部 · 生态横评 这一部分拆解了四个我认为做得很优秀的 workflows ( ccg-workflow / superpowers / oh-my-claudecode / oh-my-openagent ),看它们怎么在没有原生 Workflow 的时代是怎么做的,以及其中哪些设计可以采纳吸收,用于编写属于最合适你自己的 workflow 。 原生 Workflow 给了确定性骨架,相关优秀的开源项目能够铸成其血肉 —— 磁盘状态续命、Hook 注入面包屑、工具层护栏。吸纳以上这些社区工作的优秀设计特性与官方 workflows 相结合,能够真正生成属于你自己的 workflow 。 ◆ 第六部 · 创作篇 从零实现一个 Workflow 的全流程:意图 → meta → 原语选择 → schema → 校验 → 真实运行 → 迭代。提供了用户可以直接 copy 的脚手架。 ◆ 附录 附上相关的 API 完整参考、陷阱与排除、最佳实践清单、术语表、信源索引、模式目录与场景速查。 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 书里所有技术论断分三级: · 官方:来自 Claude Code 的 sdk-tools.d.ts 类型定义 · 实测:本机跑出来的,带 Run ID · 第三方:社区资料,对其内容进行了「核实」 全书 23 个测试对应的 Run ID ,其原始运行记录保存在 assets/transcripts/,使得该 cookbook 中的内容均可溯源。 全书耗费两天时间进行认真的编写,将近 15w 字,对 Claude Code Workflows 该官方特性进行深度解读。从官方的 workflows 学习其真实实现,吸纳其精华。 直接点击下方链接进行观看 👇 觉得有用的去 github 点个 star 就是最大的支持。如果有任何问题,欢迎提 issues 和 pr 。 在线阅读: https://agi-is-going-to-arrive.github.io/workflow-cookbook/ GitHub: https://github.com/AGI-is-going-to-arrive/workflow-cookbook
「经之以天,纬之以地。」—— 《左传·昭公二十八年》 两千年前,织工以经线为骨、纬线为肉,一梭一梭织就锦缎。经,是结构——纵贯始终、张紧不移;纬,是功能——穿梭其间、变化万千。 今天,编排 AI Agent 亦复如是:meta 与 phase 是「经」——确定性的结构骨架,预先张紧、不可动摇; agent()、parallel()、pipeline() 是「纬」——在骨架中穿梭执行的智能单元。经线决定流水线的形状,纬线填入真正的工作。 本书因此得名 —— 织经。 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 一、CLAUDE_CODE_WORKFLOWS 是什么 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ Claude Code 新增了一个实验性特性:Workflows 。需要在 claude code v2.1.148+ 的版本中通过 ultrawork 命令调用。 Claude Code Workflows 的核心思路很简单 —— 用户通过一段纯 JavaScript 脚本,用 agent() / parallel() / pipeline() / phase() 这几个原语,确定性地编排多个 subagent 。能 git 管理、能分享、能断点续传。 这和我们以往在 claude code 中用 Subagents / Agent Teams / Skills / MCP 都不一样。之前的多 agent 方案,要么靠提示词去「请求」模型调度(模型会跳步、会忘、会跑偏),要么社区自己造轮子模拟控制流。Claude 官方的 Workflows 直接把编排逻辑从提示词里拿出来,放进了「确定性代码」。 关键问题是:这个功能在全网几乎没有详细的文档介绍。所以我专门对这个 feature 进行了深度解析,附上了相关的实战示例、最佳实践、踩坑指南。 我使用 claude code 将相关内容系统性地写出来 —— 共涵盖了 29 章 + 6 篇附录,近 15w 字的深度解析做成了专门的 cookbook ,其中每个 recipe 都在 Claude Code v2.1.150 上实际全面测试过,每个案例都附上了 Run ID 方便溯源。 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 二、这本书覆盖了什么? ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 全书共六个部分,能够让你从最初的「这是啥」到能够实现「自己写一个生产级 Workflow 」: ◆ 第一部 · 认知篇 —— Workflows 在 Claude Code 里的定位 Workflow 和 Subagents / Agent Teams / Skills / MCP 各自解决什么问题?通过相关的定位矩阵把五种机制分成编排层、认知层、连接层: · 编排层:Subagents / Workflow / Agent Teams —— 回答「谁、按什么顺序执行」 · 认知层:Skills —— 回答「 Agent 怎么想」 · 连接层:MCP —— 回答「 Agent 能够使用什么」 我们能通过一句话描述其边界:「先做什么 → 再做什么 → 哪些能够并行」的流程图 → 形成 Workflow 。 ◆ 第二部 · 基础篇 —— API 完全指南 meta 、agent()、schema 、parallel() vs pipeline()、phase()、budget 、resume —— 每个参数都配上了真实运行数据。 其中有个容易踩坑的地方:parallel() 和 pipeline() 的区别。前者是「屏障」(需要等待全部完成才返回),后者是「流水线」(无屏障,各 item 独立流过各 stage )。以下是其中一个案例的实测数据: · parallel 3 并发:Run wf_52957913-6d2 ,3 agents ,78,844 tokens ,墙钟 8.4s · pipeline 3×2 阶段:Run wf_bf086b98-6ec ,6 agents ,158,982 tokens ,墙钟 26.7s 编排本身零 token ( Run wf_59bf3654-183:0 token / 4ms )—— 成本全在 agent() 节点上。 ◆ 第三部 · 实战 recipe —— 七个真实测试过的 recipe · 分片代码审查:Scan → Review → Verify → Synthesize ,pipeline 逐片流过 · PR 多维 Review:多维度 pipeline + 对抗验证,26 条 → 16 条(干掉 10 条误报) · 生成-批评-修复:生成 → 批评 → 修复循环,揪出 10 个缺陷( 2 CRITICAL ) · 深度研究:多角度检索 + 交叉核实,抓到一条死链( HTTP 410 ) · 评委面板:3 个独立评委打分,3:0 一致 · Bug 猎手:猎手找 bug → 独立证伪者逐条验证,5/5 全部命中 · 大扫除:批量扫描 + 逐文件改写,report-only 先看再改 每个配方都配备了对应的 Run ID 、agent_count 、total_tokens 、duration_ms ,相关真实数据可以溯源。 ◆ 第四部 · 进阶模式 包含了以下内容:对抗验证、循环到干与完整性批判、worktree 隔离写入、嵌套工作流、动态预算、断点续传。 这部分讲的是怎么让 Workflow 的「结果可信」—— 不是进行编排然后跑出来就完事,而是需要相关过程以及最终的结果经得起质疑。 ◆ 第五部 · 生态横评 这一部分拆解了四个我认为做得很优秀的 workflows ( ccg-workflow / superpowers / oh-my-claudecode / oh-my-openagent ),看它们怎么在没有原生 Workflow 的时代是怎么做的,以及其中哪些设计可以采纳吸收,用于编写属于最合适你自己的 workflow 。 原生 Workflow 给了确定性骨架,相关优秀的开源项目能够铸成其血肉 —— 磁盘状态续命、Hook 注入面包屑、工具层护栏。吸纳以上这些社区工作的优秀设计特性与官方 workflows 相结合,能够真正生成属于你自己的 workflow 。 ◆ 第六部 · 创作篇 从零实现一个 Workflow 的全流程:意图 → meta → 原语选择 → schema → 校验 → 真实运行 → 迭代。提供了用户可以直接 copy 的脚手架。 ◆ 附录 附上相关的 API 完整参考、陷阱与排除、最佳实践清单、术语表、信源索引、模式目录与场景速查。 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 书里所有技术论断分三级: · 官方:来自 Claude Code 的 sdk-tools.d.ts 类型定义 · 实测:本机跑出来的,带 Run ID · 第三方:社区资料,对其内容进行了「核实」 全书 23 个测试对应的 Run ID ,其原始运行记录保存在 assets/transcripts/,使得该 cookbook 中的内容均可溯源。 全书耗费两天时间进行认真的编写,将近 15w 字,对 Claude Code Workflows 该官方特性进行深度解读。从官方的 workflows 学习其真实实现,吸纳其精华。 直接点击下方链接进行观看 👇 觉得有用的去 github 点个 star 就是最大的支持。如果有任何问题,欢迎提 issues 和 pr 。 在线阅读: https://agi-is-going-to-arrive.github.io/workflow-cookbook/ GitHub: https://github.com/AGI-is-going-to-arrive/workflow-cookbook
「经之以天,纬之以地。」—— 《左传·昭公二十八年》 两千年前,织工以经线为骨、纬线为肉,一梭一梭织就锦缎。经,是结构——纵贯始终、张紧不移;纬,是功能——穿梭其间、变化万千。 今天,编排 AI Agent 亦复如是:meta 与 phase 是「经」——确定性的结构骨架,预先张紧、不可动摇; agent()、parallel()、pipeline() 是「纬」——在骨架中穿梭执行的智能单元。经线决定流水线的形状,纬线填入真正的工作。 本书因此得名 —— 织经。 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 一、CLAUDE_CODE_WORKFLOWS 是什么 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ Claude Code 新增了一个实验性特性:Workflows 。需要在 claude code v2.1.148+ 的版本中通过 ultrawork 命令调用。 Claude Code Workflows 的核心思路很简单 —— 用户通过一段纯 JavaScript 脚本,用 agent() / parallel() / pipeline() / phase() 这几个原语,确定性地编排多个 subagent 。能 git 管理、能分享、能断点续传。 这和我们以往在 claude code 中用 Subagents / Agent Teams / Skills / MCP 都不一样。之前的多 agent 方案,要么靠提示词去「请求」模型调度(模型会跳步、会忘、会跑偏),要么社区自己造轮子模拟控制流。Claude 官方的 Workflows 直接把编排逻辑从提示词里拿出来,放进了「确定性代码」。 关键问题是:这个功能在全网几乎没有详细的文档介绍。所以我专门对这个 feature 进行了深度解析,附上了相关的实战示例、最佳实践、踩坑指南。 我使用 claude code 将相关内容系统性地写出来 —— 共涵盖了 29 章 + 6 篇附录,近 15w 字的深度解析做成了专门的 cookbook ,其中每个 recipe 都在 Claude Code v2.1.150 上实际全面测试过,每个案例都附上了 Run ID 方便溯源。 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 二、这本书覆盖了什么? ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 全书共六个部分,能够让你从最初的「这是啥」到能够实现「自己写一个生产级 Workflow 」: ◆ 第一部 · 认知篇 —— Workflows 在 Claude Code 里的定位 Workflow 和 Subagents / Agent Teams / Skills / MCP 各自解决什么问题?通过相关的定位矩阵把五种机制分成编排层、认知层、连接层: · 编排层:Subagents / Workflow / Agent Teams —— 回答「谁、按什么顺序执行」 · 认知层:Skills —— 回答「 Agent 怎么想」 · 连接层:MCP —— 回答「 Agent 能够使用什么」 我们能通过一句话描述其边界:「先做什么 → 再做什么 → 哪些能够并行」的流程图 → 形成 Workflow 。 ◆ 第二部 · 基础篇 —— API 完全指南 meta 、agent()、schema 、parallel() vs pipeline()、phase()、budget 、resume —— 每个参数都配上了真实运行数据。 其中有个容易踩坑的地方:parallel() 和 pipeline() 的区别。前者是「屏障」(需要等待全部完成才返回),后者是「流水线」(无屏障,各 item 独立流过各 stage )。以下是其中一个案例的实测数据: · parallel 3 并发:Run wf_52957913-6d2 ,3 agents ,78,844 tokens ,墙钟 8.4s · pipeline 3×2 阶段:Run wf_bf086b98-6ec ,6 agents ,158,982 tokens ,墙钟 26.7s 编排本身零 token ( Run wf_59bf3654-183:0 token / 4ms )—— 成本全在 agent() 节点上。 ◆ 第三部 · 实战 recipe —— 七个真实测试过的 recipe · 分片代码审查:Scan → Review → Verify → Synthesize ,pipeline 逐片流过 · PR 多维 Review:多维度 pipeline + 对抗验证,26 条 → 16 条(干掉 10 条误报) · 生成-批评-修复:生成 → 批评 → 修复循环,揪出 10 个缺陷( 2 CRITICAL ) · 深度研究:多角度检索 + 交叉核实,抓到一条死链( HTTP 410 ) · 评委面板:3 个独立评委打分,3:0 一致 · Bug 猎手:猎手找 bug → 独立证伪者逐条验证,5/5 全部命中 · 大扫除:批量扫描 + 逐文件改写,report-only 先看再改 每个配方都配备了对应的 Run ID 、agent_count 、total_tokens 、duration_ms ,相关真实数据可以溯源。 ◆ 第四部 · 进阶模式 包含了以下内容:对抗验证、循环到干与完整性批判、worktree 隔离写入、嵌套工作流、动态预算、断点续传。 这部分讲的是怎么让 Workflow 的「结果可信」—— 不是进行编排然后跑出来就完事,而是需要相关过程以及最终的结果经得起质疑。 ◆ 第五部 · 生态横评 这一部分拆解了四个我认为做得很优秀的 workflows ( ccg-workflow / superpowers / oh-my-claudecode / oh-my-openagent ),看它们怎么在没有原生 Workflow 的时代是怎么做的,以及其中哪些设计可以采纳吸收,用于编写属于最合适你自己的 workflow 。 原生 Workflow 给了确定性骨架,相关优秀的开源项目能够铸成其血肉 —— 磁盘状态续命、Hook 注入面包屑、工具层护栏。吸纳以上这些社区工作的优秀设计特性与官方 workflows 相结合,能够真正生成属于你自己的 workflow 。 ◆ 第六部 · 创作篇 从零实现一个 Workflow 的全流程:意图 → meta → 原语选择 → schema → 校验 → 真实运行 → 迭代。提供了用户可以直接 copy 的脚手架。 ◆ 附录 附上相关的 API 完整参考、陷阱与排除、最佳实践清单、术语表、信源索引、模式目录与场景速查。 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 书里所有技术论断分三级: · 官方:来自 Claude Code 的 sdk-tools.d.ts 类型定义 · 实测:本机跑出来的,带 Run ID · 第三方:社区资料,对其内容进行了「核实」 全书 23 个测试对应的 Run ID ,其原始运行记录保存在 assets/transcripts/,使得该 cookbook 中的内容均可溯源。 全书耗费两天时间进行认真的编写,将近 15w 字,对 Claude Code Workflows 该官方特性进行深度解读。从官方的 workflows 学习其真实实现,吸纳其精华。 直接点击下方链接进行观看 👇 觉得有用的去 github 点个 star 就是最大的支持。如果有任何问题,欢迎提 issues 和 pr 。 在线阅读: https://agi-is-going-to-arrive.github.io/workflow-cookbook/ GitHub: https://github.com/AGI-is-going-to-arrive/workflow-cookbook
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 aigc已经截图,项目介绍页已附上linux do友链 「经之以天,纬之以地。」------ 《左传·昭公二十八年》两千年前,织工以经线为骨、纬线为肉,一梭一梭织就锦缎。经,是结构------纵贯始终、张紧不移;纬,是功能------穿梭其间、变化万千。 今天,编排 AI Agent 亦复如是: meta 与 phase 是 经 ------确定性的结构骨架,预先张紧、不可动摇; agent() 、 parallel() 、 pipeline() 是 纬 ------在骨架中穿梭执行的智能单元。经线决定流水线的形状,纬线填入真正的工作。 本书因此得名 织经 。 CLAUDE_CODE_WORKFLOWS 是什么 Claude Code 新增了一个实验性特性: Workflows 。需要在claude code v2.1.148+的版本中通过ultrawork命令调用。 v2.1.153版本已更新为直接使用 workflows这个命令进行触发。 Claude Code Workflows的核心思路很简单 ------ 用户通过一段纯 JavaScript 脚本,用 agent() / parallel() / pipeline() / phase() 这几个,来 确定性地 编排多个 subagent。具有实现git 管理、分享、断点续传等能力。 这和我们以往在claude code中用 Subagents / Agent Teams / Skills / MCP 都不一样。之前的多 agent 方案, 要么靠提示词去「请求」模型调度(模型会跳步、会忘、会跑偏),要么社区自己造轮子模拟控制流。Claude 官方的Workflows 直接把编排逻辑从提示词中跳出来,使用 确定性代码来实现。 我在探索这个feature时遇到了一个关键问题:这个功能在全网几乎没有详细的文档介绍。 所以我专门对于这个feature进行了深度解析,附上了相关的实战示例、最佳实践、踩坑指南。 我使用claude code将相关内容系统性地写出来 ------ 共涵盖了29 章 + 6 篇附录,近15w字的深度解析做成了专门的cookbook,其中每个recipe都在 Claude Code v2.1.150 上实际全面测试过,每个案例都附上了 Run ID 方便溯源。 这本书覆盖了什么? 全书共六个部分,能够让你从最初的「这是啥」到能够实现「自己写一个生产级 Workflow」: 第一部 · 认知篇 ------ Workflows 在 Claude Code 里的定位 Workflow 和 Subagents / Agent Teams / Skills / MCP 各自解决什么问题?通过相关的定位矩阵把五种机制 分成编排层、认知层、连接层: 我们能通过一句话描述其边界: 「先做什么 → 再做什么 → 哪些能够并行」的流程图 → 形成Workflow。 第二部 · 基础篇 ------ API 完全指南 meta 、 agent() 、 schema 、 parallel() vs pipeline() 、 phase() 、 budget 、 resume ------ 每个 原语 都配上了真实运行数据。 其中有个容易踩坑的地方: parallel() 和 pipeline() 的区别。前者是 屏障 (需要等待全部完成才返回),后者是 流水线 (无屏障,各 item 独立流过各 stage)。以下是其中一个案例的实测数据: ** 第三部 · 实战recipe ------ 七个真实测试过的recipe** 每个配方都配备了对应的 Run ID、agent_count、total_tokens、duration_ms, 相关真实数据可以溯源。 第四部 · 进阶模式 包含了以下内容:对抗验证、循环到干与完整性批判、worktree 隔离写入、嵌套工作流、动态预算、断点续传。这部分讲的是怎么让 Workflow 的 结果可信 ------ 不是进行编排然后跑出来就完事,而是 需要相关过程以及最终的结果经得起质疑。 第五部 · 生态横评 这一部分拆解了四个我认为做的很优秀的workflows(ccg-workflow / superpowers / oh-my-claudecode / oh-my-openagent),看它们怎么在没有原生 Workflow 的时代是怎么做的,以及其中哪些设计可以采纳吸收用于编写属于最合适你自己的workflow。 原生 Workflow 给了确定性骨架,相关优秀的开源项目能够铸成其血肉 ------ 磁盘状态续命、Hook 注入面包屑、工具层护栏。吸纳以上这些社区工作的优秀设计特性与官方worfklows相结合能够真正生成属于你自己的workflow。 第六部 · 创作篇 从零实现一个 Workflow 的全流程:意图 → meta → 原语选择 → schema → 校验 → 真实运行 → 迭代。提供了用户可以直接 copy 的脚手架。 附录 附上相关的API完整参考,陷阱与排除,最佳实践清单,术语表,信源索引,模式目录与场景速查 虽然是vibe coding出来的,但是对于所有相关信源,进行了九轮的全量验证,欢迎捉虫 书里所有技术总结分三级: 官方 (来自 Claude Code 的 sdk-tools.d.ts 类型定义)、 实测 (本机跑出来的,带 Run ID)、 第三方 (社区资料,对于其内容进行了「核实」)。全书 23 个测试对应的 Run ID,其原始运行记录保存在 assets/transcripts/ , 使得该cookbook中的内容均可溯源。 全书耗费两天时间进行认真的编写,将近15w字,对于Claude Code Workflows 该官方特性进行深度解读。 从官方的workflows学习其真实实现,吸纳其精华。 直接点击下方链接进行观看 ,觉得有用的去github 点个star 就是最大的支持。 如果有任何问题,欢迎提issues和pr 在线阅读 https://agi-is-going-to-arrive.github.io/workflow-cookbook/ GitHub https://github.com/AGI-is-going-to-arrive/workflow-cookbook 1 个帖子 - 1 位参与者 阅读完整话题
IT之家 5 月 27 日消息,港产动作片《火遮眼》宣布内地定档 6 月 11 日,比北美及香港早一天。 该片由日籍动作导演谷垣健治执导,谢苗与杨恩又再度搭档饰演父女,讲述一位父亲为救被拐女儿孤身闯入犯罪网络的硬核故事。 《火遮眼》由谷垣健治(《浪客剑心》系列、《肥龙过江》)执导,谢苗(《目中无人》系列)、林科灯(《突袭》)、杨恩又(《目中无人 2》《人生大事》)领衔主演,黎唯(《瞬息全宇宙》)、岩永丞威(《浪客剑心最终章人诛篇》)主演,雅彦 · 鲁伊安(《突袭》系列)特别演出。 IT之家注意到,这部影片此前已在多个国际电影节展映,烂番茄新鲜度一度保持 100%,豆瓣评分至今仍维持在 8.9 分的高位。 影片剧情围绕谢苗饰演的店铺老板王伟展开,女儿雨晴(杨恩又饰)当街被跨国犯罪组织掳走,面对腐败的警察与凶悍的黑帮,王伟与同样身陷亲人失踪迷案的记者纳文(林科灯饰)联手,拼死深入地下犯罪温床,一路杀入罪恶核心。香港地区将该片定为三级片,其动作尺度之激烈、暴力美学之凌厉可见一斑。 作为影片最大看点,谢苗以中国功夫对战全球顶级实战高手,功夫、实战柔道、极限武术、班卡苏拉格斗术、全接触空手道五大流派同台开打。整部影片以长镜头、无替身、无快剪作弊的拍摄手法呈现真实格斗场面,被多家海外媒体誉为“近十年最佳动作片之一”。 IT 之家小伙伴记得用 最会买购买电影票 ,享受折扣价的同时还可以获得返利,预计每张票可以节省 5~15 元!
第一次上线站点。 有实战经验的佬指点一二吧。 AI我也会问。 先看看佬有什么经验可以分享。 1 个帖子 - 1 位参与者 阅读完整话题