阿里巴巴合伙人委员会在公司内网发布帖文《有情有义有成长,才是阿里文化》,对近日钉钉前产品经理离职长文《置身钉内》引发的讨论表达了清晰的态度。帖文以严厉的措辞批评了钉钉团队的管理方式,直接指出这“不是阿里文化该有的样子”。 在批评之外,合伙人委员会的帖文阐述了阿里文化应当坚持的方向。“相互尊重,视人为人,有情有义”是阿里的文化底色,“无论时代如何改变,技术如何发展”,底色都一定不能改变。 此前,钉钉的管理风格曾多次引发外部讨论。合伙人组织进行了认真讨论并形成一致判断,强调“无论什么情况下,无论任务多么紧迫”都不应该出现这种管理,“这不是阿里文化倡导的方向”。 帖文指出,AI时代创新依靠的不是“高压和机械执行”,而是员工的热爱和创造力,只有充分尊重员工个体价值,才能真正创造客户价值。管理者的职责是“远见、主动担当、团结和激励团队”,“培养人激发人是每个leader的责任”。AI 时代,人是最宝贵的财富,更需要坚持有情有义,培育开放、包容、多元的工作文化。 附:阿里内网帖原文 《有情有义有成长,才是阿里文化》 各位同学: 这几天,公司合伙人组织关注到内网《置身钉内》在内外部引发的讨论,合伙人也就钉钉目前团队文化做了认真讨论。大家一致认为,无论什么情况下,无论任务多么紧迫,都不应该出现帖子中所提到的钉钉团队这种管理方式。这种方式从来都不是阿里文化倡导的方向,不是阿里文化该有的样子。 阿里人聚在一起,是因为彼此信任,一起做成一些有意义有价值的事。相互尊重、视人为人、有情有义,是我们的文化底色。无论时代如何改变,技术如何发展,这些底色阿里巴巴一定不能改变。 阿里的未来在于创新,但是创新依靠的从来不是高压和机械执行,AI时代更是如此。阿里的创新依靠的一定是每位同学的热爱和创造力,我们坚定的相信,只有充分尊重每位同学的个体价值,才能真正创造客户价值,走向未来。 团队氛围如何,各级管理者是第一责任人。Leader的责任是远见,是主动担当,是团结和激励团队。人是阿里最宝贵的财富,培养人、激发人是每个Leader的责任。AI 时代,当机器可以代替很多人可以做的事,人成为了我们最宝贵的财富。AI 时代,我们更需要坚持有情有义,需要共同培育一个开放、包容、多元的工作文化。 合伙人委员会 2026年6月10日 责任编辑:杨赐 查看评论
成长体系是怎么样的,在哪里可以看到成长进度 7 个帖子 - 5 位参与者 阅读完整话题
佬友们,闺女刚出生,我想给闺女搭一个记录成长的网站。想以她 的名字申请个域名,开发个网站连我一个本地的服务,存闺女的成长照片视频啥的,有什么合适的方案吗,跪求指导 33 个帖子 - 19 位参与者 阅读完整话题
下午注册GPT的时候尝试使用手机号注册,发现无法生成长链接,但使用邮箱注册却可以正常生成,可能是对手机号注册用户的一种风控? 2 个帖子 - 2 位参与者 阅读完整话题
现在使用之前的代码好像无法正常生成长订阅链接了 2 个帖子 - 2 位参与者 阅读完整话题
这是一本关于“个人成长”“开悟”等主题的书籍。全书的内容都与书名密切相关。少部分则是探讨了与书名有着弱联系的话题:例如“慈悲的本质”、“寂静”、“空间”、“时间”等。 关于此书,若你对该主题不感兴趣,我可能不那么推荐你去阅读,因为本书的大部分内容都是与【当下】有关的。 你可能会有疑问,【当下】需要一本书来解释说明,这水分会不会有点大?这只有阅读了之后才能作评判了。在我看来,作者他可能真的希望我们能够领悟【当下】。 如果你认为这本书比较难以阅读,建议你放一放,等有了其他的阅读经验或者有了更多的生活经历后,再拿出来看看,说不定就能更顺畅地阅读,并从中有所领悟。 本篇文章依旧分为两部分,第一部分是我与此书认识的故事以及书籍概述;第二部分是自己阅读后的一些思考。 一、故事与概述: 我结交这本书是在2021年,当时处于阅读的高涨期——在有了十几到上百书籍的阅读经验后,我开始接触一些论述类书籍,只要是与学习/心智成长/心理学等相关的书籍我都尝试进行了阅读,期间也算小有收获,直到一次检索,发现了一本书《你的误区》,在阅读完这本书后,感觉意犹未尽,于是再次检索,后发现了《当下的力量》这本书。 回顾我的个人阅读经历,在数百本书籍中我总会遇到一些书籍:读完后让我有种说不出来的感受,震撼之余又感觉自己没有完全读懂,想完全吸收但又感觉需要时间的沉淀,而《当下的力量》则是那种感受,至少我的回忆里在2021年阅读时是这样的感受。 回到此书,我阅读的版本是《当下的力量-白金版》,出版年是2016-6月;原作的名字叫做:The Power of Now:A Guide to Spiritual Enlightenment 在goodreads上检索会发现:最早的版本是January 1, 1997,距现在也有将近30年的时间了,看副标题我们可以发现,这本书主要想带给我们一些“灵性启发”,the power of now也很容易能看出来这本书到底想说什么。 打开豆瓣评书网站看书籍简介得知 :【本书作者指出了我们日常痛苦的主要来源——被大脑思维所控制、焦虑过去和未来而非活在当下。本书将让我们认清时间的幻象,发现平和与宁静的入口】 光看上述的书评简介,其实挺无语的,就这?好在我在今年5月份又二刷了一遍,借鉴于书籍前言,这本书的内容其实并没有那么的不堪。 在前言里,我们会得知,本书代表了作者的数年工作核心,其讲述的是作者在29岁那年突然开悟:像是重获新生一般开始 沉浸在一种深深的宁静与极乐的状态之中 ,并且保持了很久。在这之后作者开始着手思考自己身上究竟发生了什么,当他人问起:作者所拥有的状态能否传授时, 这本书就是关于如何进入上述状态的答案 。 此外,本书内容起源于研讨会、冥想课程和私人咨询会谈,所以我们有时候会看到一些问题+解答的内容形式,这跟《被讨厌的勇气》又有些相似。 二、阅读后的一点思考 根据本书的章节划分,我会从其中选几个关键词来浅谈一下自己的阅读思考,还是老样子,原文的地方我会大致【标注】 1、思维/意识/大脑 第一章作者屡次提及了思维/大脑等关键词,并强调,我们利用思维的方式若是不对,则会对我们产生消极的影响:【你认为你就是你的思维、你的大脑,你就是思考问题的实体(思考者)】。 同时,作者还描述了一种场景:我们的思维一直在叫我们去回忆,去幻想未来发生的事,或是以过去的事情经历来模拟未来,或是想象不好的未来,借此引出本书的一个重点: 【 从思维中解放出来 】 到底怎么才能解放?——第一个步骤也是比较关键的是: 【 倾听自己大脑中的声音,关注重复性的思维模式 】 当我们尝试倾听,我们就能 意识 到思维,并 意识 到自己在 观察思维 。 当进入到这样的状态下,某种意义上我们也会产生一种有意识的 临在 (更深的自我) 之后,我们可能会体验到【思维空白】,当空白出现,我们的内心会感受到一种静止和宁静的状态。 【在这种空白中,你高度警惕,注意力高度集中,但是你没有在思考,这就是冥想的本质】 作者表示这样的深度会随着练习逐渐加深,并且无止境,你会感受到来自你内心深处的喜悦。紧接着,作者介绍了一些日常活动来练习以及衡量练习是否成功的标准: 练习方法 ①:每次你在家中或办公室上下楼梯时,你每一步、每一刻,甚至每一次呼吸时都全神贯注,完全集中你的注意力; ②当你洗手时,关注与洗手有关的所有感觉:水的声音和感觉、手的运动、肥皂的香味等; ③在你上车时,关闭车门后,停顿几秒钟并观察你的呼吸。觉察到那个宁静且强而有力的临在; 标准:你内在所感觉到的平和的程度 作者接着对思维进行了更细致的介绍:引入了“情绪”,思维与情绪反应模式有着密切的联系,作者认为情绪是思维在身体上的反映,我们意识的能力越弱,情绪能力的负荷会越强。 作者对于积极的情绪(爱和喜悦)是什么的表述我十分喜欢:【 对于大部分来说,只有当感受到极大的美感、极度恐惧、体力受到极度挑战时,才能引起思维的暂时失语,当这种思维空白产生时,突然,你就会感受到你的内心的宁静,在这种宁静状态中,有一种微妙却很热烈的喜悦、爱与平和,他们处在一个比情绪更深的层面,你需要完全意识到你的情绪,才能感受到他们 】 作者简单介绍了情绪上的痛苦:怨憎、仇恨、自卑、内疚、愤怒、抑郁、嫉妒、轻微的不快,随之介绍了痛苦的两个层次,并引出关键词:“意识”,在第二章开始论述:摆脱痛苦的途径并作出总结。 2、临在状态 在前面作者也提及了一些,在第五章则是进行了更细致的解释: 当你处于临在状态时,会怎么样:【没有紧张、恐惧,只有警觉的临在,而你整个存在,你体内的每一个细胞,所有的注意都会集中在当下】 在此期间,【拥有过去和未来的“你”很难在那里生存。然而任何有价值的东西都不会丢失】 3、未显化状态 【指的是你身体内部的能量场(气)的 来源 ,他是绝对的静止状态,当你进入深层的无梦睡眠时,你就进入了这种未显化的状态】 如何进入未显化状态,作者介绍了几个方法,并将之称为大门,通过这扇大门进入到未显化状态,意味着你时刻与 源头 保持联系。 方法①: 感受自己的内在身体 ,把之作为大门。【当你与人交往或当你与大自然接触时,请去感受你的内在身体,去感受你体内深处的宁静,将你体内的大门打开】 方法② 保持高度临在时刻的觉知 ,瓦解心理时间(在第三章有介绍该概念) 方法③ 停止思维活动 可以从一次有意识的深呼吸,或是专心地观赏一朵花开始练习,思维属于显化状态的一部分 方法④ 臣服 4、臣服与抗拒 由于前文多次提及臣服,但未多作解释,所以在最后一章作者专门介绍了对臣服与抗拒的理解。 【臣服就是无条件、无保留地接受当下时刻;是放弃对当下的内心抗拒,听任事态发展不是臣服。】 【内心抗拒就是通过心理批判和消极的情绪,对当下时刻说“不”;】 作者同样也介绍了进入到臣服状态时,会发生什么? 【我们会清楚地看到自己需要做什么,然后采取行动,一次只做一件事,一种完全不同的能量会流入你所做的事情之中,如果你所做的事是与本体相联结的,那么它将会变成你生命能量的一场庆典,并将带你更深入当下】 此外,作者还分享了怎样通过臣服来放下抗拒的方法论。 5、一些思考与分享 我在初次阅读的时候,更多的是在感悟这些文字带给我的力量——当下的力量,而并没有过多关注书中不同的表述。 当我重新阅读与审视这本书的时候,发现全书涉及的核心概念好像是相互联系的,且多次重复出现。 我看到书评网站对本书的评价褒贬不一,分数并不高。可能是与其不断地重复有关系,对于此,我更倾向理解为这是作者希望我们能够有所“悟”,所做出的良苦用心。 在阅读的过程中,我时常会提醒自己:要察觉自己的内在,感受此时此刻自己在想什么,自己的内在身体在给我什么信号,此时自己的情绪是怎么样的,自己是否有消极的心态(P118有一个方法可以摆脱消极心态)等等。 在我完成第二遍阅读后,我想记录些什么,关于此书,关于此时此刻我正在执笔的状态,我不知道自己究竟是否达到了书中所提及的状态。但完笔的当下,我能依稀感受到一丝宁静。 最后祝大家也能从本书当中悟到一些内容!我们下一本书籍见! 3 个帖子 - 3 位参与者 阅读完整话题
我在 gpt 网页,开通 plus,用 paypal 付款一致提示我有问题 生成长链接用 paypal 付也不行,这么恶心吗 5 个帖子 - 4 位参与者 阅读完整话题
加入L站一月有余,最近在工作的闲暇摸鱼之际,用hermes创建了一个小小的公众号玩,今天发布了一篇小文章就收获了将近100的浏览量,马上就和女朋友分享了自己的快乐。与此同时突然对L站有了更具象的感悟,这些天在这里每天都刷了很多佬友发的帖子,也让我从最开始的AI小白成长到现在可以熟练的运用AI来实现自己的一些idea,心里满是对佬友们的感激。感觉在L站发帖子心里都毫无负担(本人朋友圈已经两年没更新了),在这里真的很舒服和安心。希望以后可以继续与佬友们共同学习、继续成长。 1 个帖子 - 1 位参与者 阅读完整话题
IT之家 5 月 31 日消息,据钛媒体报道,华为副董事长、轮值董事长徐直军近日在接受采访时,针对公司最新发布的“韬定律”以及逻辑折叠芯片架构作出回应,直言美国的制裁压力反而促成了中国半导体产业链的快速成长。 徐直军坦言:“如果不是美国逼我们国家、我们公司、我们产业界,不可能要干一件这样的事, 但是也感谢美国,使得我们国家的半导体产业链能够真正的成长起来,现在势头好得很 ,大家都认可了,都很支持。” 据IT之家此前报道,在 5 月 25 日的 2026 国际电路与系统研讨会上,华为公司董事、半导体业务部总裁何庭波时隔 7 年再次回到公众视野,并在主旨演讲中首次提出半导体全新演进路径 ——“韬(τ)定律”。 这是中国在全球半导体领域首次提出指导产业发展的新原则 。 徐直军还首次披露华为芯片六年突围全过程。他表示:“海思在华为是成本中心,不要挣钱,只要华为活得下来,海思就会活得下来。”而在华为内部,“韬定律”也被称为“何式定律”。徐直军表示, 华为所有产品都能基于大陆设计、制造并规模供应,真正实现彻底不依赖 。
最近有个账号在各种 harness 相关的评论里推广他的 skill ,recursive-mode ,做法主要是上下文持久化,流水线,闭环验证。前天还有篇论文方案类似,更系统些。AI 模型能写一次性软件了,但 AI 写不好需要长期持续运行与运维的软件基础设施。论文提出了 meta-engineering harness ,是个七层架构: 层级 (Layer) 核心模块 (Core Module) 包含内容与机制 (Components & Mechanisms) Layer 7 (第 7 层) Calibration (校准) 回顾、回归升级、契约模板更新 Layer 6 (第 6 层) Verification (验证) 对抗性测试、审查网关、QA 、CI Layer 5 (第 5 层) Execution (执行) coding agents, migration agents, UI agents Layer 4 (第 4 层) Context / memory (上下文/记忆) AGENTS.md , markdown brain, spec 记录 Layer 3 (第 3 层) Contract (契约) two-pass compilation, invariants (两遍编译、不变量) Layer 2 (第 2 层) Role / orchestration (角色/编排) builder, verifier, reviewer, arbiter Layer 1 (第 1 层) Model (模型) Claude, Codex, Gemini 第三层契约 Contract ,代码质量取决于契约的完备性。论文里给了契约的例子. { "module": "NGPayments", "version": "1.0.0", "api": { "base_path": "/ng/payments", "auth": "Supabase Bearer token; JWT identity authoritative", "endpoints": [ { "method": "POST", "path": "/ng/payments/intent/:invoiceId", "returns": [ "client_secret", "payment_intent_id", "payment_type", "amount_cents" ], "side_effects": [ "store payment_intent_id on invoice", "set invoice.payment_status = processing" ], "errors": [ "403", "404", "409", "422", "502" ] }, { "method": "POST", "path": "/ng/payments/confirm/:invoiceId", "stripe_verification": "retrieve PaymentIntent and assert status == succeeded before DB write", "side_effects_on_success": [ "set invoice payment status", "set service request status", "set paid_at", "clear payment_intent_id" ], "side_effects_on_failure": [ "reset invoice.payment_status to unpaid", "clear payment_intent_id" ] }, { "method": "GET", "path": "/ng/payments/status/:invoiceId", "returns": [ "payment_status", "payment_type", "amount_cents", "currency", "paid_at" ] } ] }, "invariants": [ "PaymentIntent uses transfer_data.destination", "no platform fee", "server verifies Stripe success before DB write", "paid is terminal", "processing blocks duplicate intents", "amount derived from quote_data.total" ], "known_gap_identified_after_deployment": [ "final invoice calculation omitted offline deposits", "discount calculation not encoded in original contract" ] } 第二层不同的角色: 构建器 (Builder / Implementation Agent): 负责干活的 AI 。它拿到编译好的契约后,负责编写实际的业务代码。它无权干涉测试。 验证器 (Verifier / Test Agent): 负责挑刺的 AI 。它拿到同一份契约后,独立编写对抗性测试用例。为了保证客观,它被物理隔离,完全看不到构建器写的代码,只针对契约写测试。 审查员 (Reviewer): 负责多维度走查的 AI 。它可以分身为“产品审查员”、“安全审查员”、“架构审查员”等,从不同专业视角静态检查系统是否存在漏洞或体验问题。 仲裁器 (Arbiter): 负责定责的 AI 。当测试不通过(即 CI 报错)时,仲裁器负责判定这是谁的责任:是构建器写了 Bug ?是契约遗漏了规范?是测试环境的噪音?还是契约本身有歧义? 另外有个回顾代理( Retro agent )在第七层,不负责执行单次编程任务,是审查历史失败记录(回顾,retros )来进行系统级的反馈与改进。人类工程师负责最终审批与治理。 核心的流水线( Pipeline )有 7 个环节: 接收契约(实现端): 实现代理( Implementation agent )接收通过预流水线阶段编译好的结构化契约 。 接收契约(测试端): 测试代理( Test agent )同步接收同一份编译好的结构化契约 。 编写代码: 实现代理根据契约规范开始编写具体的业务代码 。 编写测试: 测试代理根据契约规范独立编写对抗性测试用例 。 CI: 系统运行上述对抗性测试,对实现代理编写的代码进行行为检验 。 失败路由: 测试未通过,相关的失败结果会被自动路由至仲裁器( Arbiter ) 。 分类与决策: 仲裁器将收集到的失败结果分类为代码漏洞( Bug )、规范缺失( Spec gap )、环境噪音( Noise )或契约歧义( Contract ambiguity ),并由该分类结果直接决定下一步采取何种纠正措施 。 提到 Over-specification (过度规定)可能导致下游的 AI 代理(实现代理和验证代理)会将契约中所有的需求视为强制性( mandatory )命令 。如果契约中包含了系统环境不支持、或者业务根本不需要的复杂需求,AI 代理会强行尝试实现和测试这些幻觉需求,导致开发周期浪费、代码冗余,或由于无法通过自动化测试而陷入死循环。还举了失败例子,代码完全符合契约,也不代表代码满足了真实的业务需求。 高质量的 AI 代码是一个不断自我完善的闭环。AI 代码质量的保障已经从模型层面的能力问题,演变为系统工程层面的验证与治理问题。人类工程师的角色也从编写代码转为“设计契约、处理异常、并监督/改进这个自动编写和测试代码的生产系统”。 论文总结的缺陷和现在 AI vibe coding 遇到的问题类似: 契约不完整( Contract Incompleteness ):表现完全取决于契约的好坏。契约完备性是系统内杠杆率最高、尚未解决的问题。将“编写完美代码”的难题转移成了“编写完美需求规范”。 共享的模型盲点( Shared Model Blind Spots ):独立的代理可能仍然具有共同的偏见,如果构建代理和验证代理底层都调用相同的大语言模型,可能在面对同样的逻辑漏洞时产生相同的幻觉或盲区。 人力瓶颈( Human Bottlenecks ):某些决策需要人工判断,包括产品意图、信任边界、模棱两可的权衡取舍以及故障分类。在大规模运作时,人工干预必须变为仅基于异常情况的处理。这表明该系统目前无法实现完全的自治,其扩展性受限于高级工程师或产品经理的人力投入。 上下文与记忆漂移( Context Drift ): 记忆可能会变得陈旧、臃肿或相互矛盾。压缩降低了这种风险,但并未消除它。当软件系统长期演进,早期的架构决策或记忆文件如果不被彻底清理,会导致 AI 提取到冲突的上下文,进而产生执行混乱。 验证覆盖范围的局限( Verification Coverage )和 成本、延迟与安全性( Cost, Latency, and Security )。
最近有个账号在各种 harness 相关的评论里推广他的 skill ,recursive-mode ,做法主要是上下文持久化,流水线,闭环验证。前天还有篇论文方案类似,更系统些。AI 模型能写一次性软件了,但 AI 写不好需要长期持续运行与运维的软件基础设施。论文提出了 meta-engineering harness ,是个七层架构: 层级 (Layer) 核心模块 (Core Module) 包含内容与机制 (Components & Mechanisms) Layer 7 (第 7 层) Calibration (校准) 回顾、回归升级、契约模板更新 Layer 6 (第 6 层) Verification (验证) 对抗性测试、审查网关、QA 、CI Layer 5 (第 5 层) Execution (执行) coding agents, migration agents, UI agents Layer 4 (第 4 层) Context / memory (上下文/记忆) AGENTS.md , markdown brain, spec 记录 Layer 3 (第 3 层) Contract (契约) two-pass compilation, invariants (两遍编译、不变量) Layer 2 (第 2 层) Role / orchestration (角色/编排) builder, verifier, reviewer, arbiter Layer 1 (第 1 层) Model (模型) Claude, Codex, Gemini 第三层契约 Contract ,代码质量取决于契约的完备性。论文里给了契约的例子. { "module": "NGPayments", "version": "1.0.0", "api": { "base_path": "/ng/payments", "auth": "Supabase Bearer token; JWT identity authoritative", "endpoints": [ { "method": "POST", "path": "/ng/payments/intent/:invoiceId", "returns": [ "client_secret", "payment_intent_id", "payment_type", "amount_cents" ], "side_effects": [ "store payment_intent_id on invoice", "set invoice.payment_status = processing" ], "errors": [ "403", "404", "409", "422", "502" ] }, { "method": "POST", "path": "/ng/payments/confirm/:invoiceId", "stripe_verification": "retrieve PaymentIntent and assert status == succeeded before DB write", "side_effects_on_success": [ "set invoice payment status", "set service request status", "set paid_at", "clear payment_intent_id" ], "side_effects_on_failure": [ "reset invoice.payment_status to unpaid", "clear payment_intent_id" ] }, { "method": "GET", "path": "/ng/payments/status/:invoiceId", "returns": [ "payment_status", "payment_type", "amount_cents", "currency", "paid_at" ] } ] }, "invariants": [ "PaymentIntent uses transfer_data.destination", "no platform fee", "server verifies Stripe success before DB write", "paid is terminal", "processing blocks duplicate intents", "amount derived from quote_data.total" ], "known_gap_identified_after_deployment": [ "final invoice calculation omitted offline deposits", "discount calculation not encoded in original contract" ] } 第二层不同的角色: 构建器 (Builder / Implementation Agent): 负责干活的 AI 。它拿到编译好的契约后,负责编写实际的业务代码。它无权干涉测试。 验证器 (Verifier / Test Agent): 负责挑刺的 AI 。它拿到同一份契约后,独立编写对抗性测试用例。为了保证客观,它被物理隔离,完全看不到构建器写的代码,只针对契约写测试。 审查员 (Reviewer): 负责多维度走查的 AI 。它可以分身为“产品审查员”、“安全审查员”、“架构审查员”等,从不同专业视角静态检查系统是否存在漏洞或体验问题。 仲裁器 (Arbiter): 负责定责的 AI 。当测试不通过(即 CI 报错)时,仲裁器负责判定这是谁的责任:是构建器写了 Bug ?是契约遗漏了规范?是测试环境的噪音?还是契约本身有歧义? 另外有个回顾代理( Retro agent )在第七层,不负责执行单次编程任务,是审查历史失败记录(回顾,retros )来进行系统级的反馈与改进。人类工程师负责最终审批与治理。 核心的流水线( Pipeline )有 7 个环节: 接收契约(实现端): 实现代理( Implementation agent )接收通过预流水线阶段编译好的结构化契约 。 接收契约(测试端): 测试代理( Test agent )同步接收同一份编译好的结构化契约 。 编写代码: 实现代理根据契约规范开始编写具体的业务代码 。 编写测试: 测试代理根据契约规范独立编写对抗性测试用例 。 CI: 系统运行上述对抗性测试,对实现代理编写的代码进行行为检验 。 失败路由: 测试未通过,相关的失败结果会被自动路由至仲裁器( Arbiter ) 。 分类与决策: 仲裁器将收集到的失败结果分类为代码漏洞( Bug )、规范缺失( Spec gap )、环境噪音( Noise )或契约歧义( Contract ambiguity ),并由该分类结果直接决定下一步采取何种纠正措施 。 提到 Over-specification (过度规定)可能导致下游的 AI 代理(实现代理和验证代理)会将契约中所有的需求视为强制性( mandatory )命令 。如果契约中包含了系统环境不支持、或者业务根本不需要的复杂需求,AI 代理会强行尝试实现和测试这些幻觉需求,导致开发周期浪费、代码冗余,或由于无法通过自动化测试而陷入死循环。还举了失败例子,代码完全符合契约,也不代表代码满足了真实的业务需求。 高质量的 AI 代码是一个不断自我完善的闭环。AI 代码质量的保障已经从模型层面的能力问题,演变为系统工程层面的验证与治理问题。人类工程师的角色也从编写代码转为“设计契约、处理异常、并监督/改进这个自动编写和测试代码的生产系统”。 论文总结的缺陷和现在 AI vibe coding 遇到的问题类似: 契约不完整( Contract Incompleteness ):表现完全取决于契约的好坏。契约完备性是系统内杠杆率最高、尚未解决的问题。将“编写完美代码”的难题转移成了“编写完美需求规范”。 共享的模型盲点( Shared Model Blind Spots ):独立的代理可能仍然具有共同的偏见,如果构建代理和验证代理底层都调用相同的大语言模型,可能在面对同样的逻辑漏洞时产生相同的幻觉或盲区。 人力瓶颈( Human Bottlenecks ):某些决策需要人工判断,包括产品意图、信任边界、模棱两可的权衡取舍以及故障分类。在大规模运作时,人工干预必须变为仅基于异常情况的处理。这表明该系统目前无法实现完全的自治,其扩展性受限于高级工程师或产品经理的人力投入。 上下文与记忆漂移( Context Drift ): 记忆可能会变得陈旧、臃肿或相互矛盾。压缩降低了这种风险,但并未消除它。当软件系统长期演进,早期的架构决策或记忆文件如果不被彻底清理,会导致 AI 提取到冲突的上下文,进而产生执行混乱。 验证覆盖范围的局限( Verification Coverage )和 成本、延迟与安全性( Cost, Latency, and Security )。
最近有个账号在各种 harness 相关的评论里推广他的 skill ,recursive-mode ,做法主要是上下文持久化,流水线,闭环验证。前天还有篇论文方案类似,更系统些。AI 模型能写一次性软件了,但 AI 写不好需要长期持续运行与运维的软件基础设施。论文提出了 meta-engineering harness ,是个七层架构: 层级 (Layer) 核心模块 (Core Module) 包含内容与机制 (Components & Mechanisms) Layer 7 (第 7 层) Calibration (校准) 回顾、回归升级、契约模板更新 Layer 6 (第 6 层) Verification (验证) 对抗性测试、审查网关、QA 、CI Layer 5 (第 5 层) Execution (执行) coding agents, migration agents, UI agents Layer 4 (第 4 层) Context / memory (上下文/记忆) AGENTS.md , markdown brain, spec 记录 Layer 3 (第 3 层) Contract (契约) two-pass compilation, invariants (两遍编译、不变量) Layer 2 (第 2 层) Role / orchestration (角色/编排) builder, verifier, reviewer, arbiter Layer 1 (第 1 层) Model (模型) Claude, Codex, Gemini 第三层契约 Contract ,代码质量取决于契约的完备性。论文里给了契约的例子. { "module": "NGPayments", "version": "1.0.0", "api": { "base_path": "/ng/payments", "auth": "Supabase Bearer token; JWT identity authoritative", "endpoints": [ { "method": "POST", "path": "/ng/payments/intent/:invoiceId", "returns": [ "client_secret", "payment_intent_id", "payment_type", "amount_cents" ], "side_effects": [ "store payment_intent_id on invoice", "set invoice.payment_status = processing" ], "errors": [ "403", "404", "409", "422", "502" ] }, { "method": "POST", "path": "/ng/payments/confirm/:invoiceId", "stripe_verification": "retrieve PaymentIntent and assert status == succeeded before DB write", "side_effects_on_success": [ "set invoice payment status", "set service request status", "set paid_at", "clear payment_intent_id" ], "side_effects_on_failure": [ "reset invoice.payment_status to unpaid", "clear payment_intent_id" ] }, { "method": "GET", "path": "/ng/payments/status/:invoiceId", "returns": [ "payment_status", "payment_type", "amount_cents", "currency", "paid_at" ] } ] }, "invariants": [ "PaymentIntent uses transfer_data.destination", "no platform fee", "server verifies Stripe success before DB write", "paid is terminal", "processing blocks duplicate intents", "amount derived from quote_data.total" ], "known_gap_identified_after_deployment": [ "final invoice calculation omitted offline deposits", "discount calculation not encoded in original contract" ] } 第二层不同的角色: 构建器 (Builder / Implementation Agent): 负责干活的 AI 。它拿到编译好的契约后,负责编写实际的业务代码。它无权干涉测试。 验证器 (Verifier / Test Agent): 负责挑刺的 AI 。它拿到同一份契约后,独立编写对抗性测试用例。为了保证客观,它被物理隔离,完全看不到构建器写的代码,只针对契约写测试。 审查员 (Reviewer): 负责多维度走查的 AI 。它可以分身为“产品审查员”、“安全审查员”、“架构审查员”等,从不同专业视角静态检查系统是否存在漏洞或体验问题。 仲裁器 (Arbiter): 负责定责的 AI 。当测试不通过(即 CI 报错)时,仲裁器负责判定这是谁的责任:是构建器写了 Bug ?是契约遗漏了规范?是测试环境的噪音?还是契约本身有歧义? 另外有个回顾代理( Retro agent )在第七层,不负责执行单次编程任务,是审查历史失败记录(回顾,retros )来进行系统级的反馈与改进。人类工程师负责最终审批与治理。 核心的流水线( Pipeline )有 7 个环节: 接收契约(实现端): 实现代理( Implementation agent )接收通过预流水线阶段编译好的结构化契约 。 接收契约(测试端): 测试代理( Test agent )同步接收同一份编译好的结构化契约 。 编写代码: 实现代理根据契约规范开始编写具体的业务代码 。 编写测试: 测试代理根据契约规范独立编写对抗性测试用例 。 CI: 系统运行上述对抗性测试,对实现代理编写的代码进行行为检验 。 失败路由: 测试未通过,相关的失败结果会被自动路由至仲裁器( Arbiter ) 。 分类与决策: 仲裁器将收集到的失败结果分类为代码漏洞( Bug )、规范缺失( Spec gap )、环境噪音( Noise )或契约歧义( Contract ambiguity ),并由该分类结果直接决定下一步采取何种纠正措施 。 提到 Over-specification (过度规定)可能导致下游的 AI 代理(实现代理和验证代理)会将契约中所有的需求视为强制性( mandatory )命令 。如果契约中包含了系统环境不支持、或者业务根本不需要的复杂需求,AI 代理会强行尝试实现和测试这些幻觉需求,导致开发周期浪费、代码冗余,或由于无法通过自动化测试而陷入死循环。还举了失败例子,代码完全符合契约,也不代表代码满足了真实的业务需求。 高质量的 AI 代码是一个不断自我完善的闭环。AI 代码质量的保障已经从模型层面的能力问题,演变为系统工程层面的验证与治理问题。人类工程师的角色也从编写代码转为“设计契约、处理异常、并监督/改进这个自动编写和测试代码的生产系统”。 论文总结的缺陷和现在 AI vibe coding 遇到的问题类似: 契约不完整( Contract Incompleteness ):表现完全取决于契约的好坏。契约完备性是系统内杠杆率最高、尚未解决的问题。将“编写完美代码”的难题转移成了“编写完美需求规范”。 共享的模型盲点( Shared Model Blind Spots ):独立的代理可能仍然具有共同的偏见,如果构建代理和验证代理底层都调用相同的大语言模型,可能在面对同样的逻辑漏洞时产生相同的幻觉或盲区。 人力瓶颈( Human Bottlenecks ):某些决策需要人工判断,包括产品意图、信任边界、模棱两可的权衡取舍以及故障分类。在大规模运作时,人工干预必须变为仅基于异常情况的处理。这表明该系统目前无法实现完全的自治,其扩展性受限于高级工程师或产品经理的人力投入。 上下文与记忆漂移( Context Drift ): 记忆可能会变得陈旧、臃肿或相互矛盾。压缩降低了这种风险,但并未消除它。当软件系统长期演进,早期的架构决策或记忆文件如果不被彻底清理,会导致 AI 提取到冲突的上下文,进而产生执行混乱。 验证覆盖范围的局限( Verification Coverage )和 成本、延迟与安全性( Cost, Latency, and Security )。
想买个相机记录女儿的成长,女人马上 3 个月了?大家有推荐的嘛?
想买个相机记录女儿的成长,女人马上 3 个月了?大家有推荐的嘛?
想买个相机记录女儿的成长,女人马上 3 个月了?大家有推荐的嘛?
想买个相机记录女儿的成长,女人马上 3 个月了?大家有推荐的嘛?
想买个相机记录女儿的成长,女人马上 3 个月了?大家有推荐的嘛?
想买个相机记录女儿的成长,女人马上 3 个月了?大家有推荐的嘛?
想买个相机记录女儿的成长,女人马上 3 个月了?大家有推荐的嘛?
想买个相机记录女儿的成长,女人马上 3 个月了?大家有推荐的嘛?