Engineer - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-06-11 09:46:22+08:00 · tech

REQUEST_BLOCKED Category: REVERSE_ENGINEERING Reason: Restricted technical activity detected. 这个报错大家有遇到的吗？很奇怪最近两天才遇到，之前是没有的？是模型优化的问题？ 1 个帖子 - 1 位参与者阅读完整话题

[分享创造] 基于 Claude Code Workflow 的 Loop Engineering 流水线 - Claude-lights-out

v2ex · 2026-06-10 23:05:16+08:00 · tech

分享个自己做的东西。问题用 AI 写代码越来越爽，但也越来越烦。主要几个痛点： 1. 你变成了人肉 QA Claude 说"搞定了"，你一跑全是 bug 。然后进入死循环：测→报→修→测→报→修…… 明明是让它帮你省时间的，结果你的时间全花在当测试员上了。 2. 完全黑盒让它搞个复杂点的东西，跑了 20 分钟，你完全不知道它到哪了、在干什么、卡住了没有。 3. 失忆换个 session 、compact 一下、context 太长被截断——它就忘了项目是什么、之前做了什么决定、代码为什么这么写。下次对话从零开始解释。 4. 偷工减料你让它写个完整功能，它可能跳过测试、不做错误处理、架构随便搞。你不盯着它就不老实。我的方案拿 Claude Code 的 dynamic workflow 做了个强制流水线。你给一句话需求，它必须走完 9 个阶段才交付： /lightsout 用 Express + SQLite + React 做个看板应用，支持拖拽、标签、到期提醒然后它自动跑：需求编写 → 独立 agent 审查（不过就打回重写）交互设计 → 独立 agent 审查技术架构 → 独立 agent 审查一致性检查 → 三份文档互相对不上的地方找出来修掉测试用例设计 → 写代码之前先把测试想清楚写代码 → 自主决定要不要拆分并行（全栈项目自动拆前后端） QA → 跑测试，没过就自己修，最多 5 轮 E2E 验证 → 真的把应用跑起来试最终检查 → 需求文档 vs 实际代码逐条对比，有遗漏就补全程你不需要介入。跑完之后你拿到的是： src/ # 能跑的代码 tests/ # 测试全过 docs/ spec.md # 产品需求（每个功能的场景、错误处理都写了） design.md # 交互设计 architecture.md # 技术架构（ ADR 、模块划分、技术选型理由） test-cases.md # 测试设计这些文档是项目的"记忆"——下次开新 session ，agent 读一遍 docs/ 就知道项目全貌，不用你重新解释。核心设计写的人和审的人必须是不同 agent 。自己审自己肯定放水。拆开之后质量真的不一样——reviewer 会挑出 writer 自己看不到的问题。文档先行，代码最后。不是先写代码再补文档，而是需求、设计、架构全部写完审完了再动手。这样写出来的代码有据可依，测试有的放矢。代码阶段自己决定策略。简单项目（比如命令行工具）一个 agent 自己 TDD 搞定。复杂项目（全栈应用）它会自动拆分模块，先搞 shared types ，然后前后端并行开发，最后自己跑集成测试。每个环节自带修复循环。审查没过？打回重写。测试挂了？自己修。最多 5 轮。不需要你介入指挥。实测数据跑了 4 个全新项目：项目类型测试数结果批量文件重命名工具 Python CLI 67 个测试一次通过实时 Markdown 编辑器 Express + React + WebSocket 66 个测试 1 轮修复后通过个人记账 API + Dashboard FastAPI + React 50 个测试一次通过看板应用 Express + React + 拖拽 — 一次通过每个项目都手动验证过——真的能跑，功能正常。代价本质上这东西是拿 token 换你的时间和精力。每次跑 30-50 个 agent call ，45 分钟到 2 小时不等。如果这个 token 开销让你肉疼，那可能不适合你。但如果你有公司报销，或者你觉得自己的注意力比 token 值钱——与其花一小时盯着它干活、测 bug 、来回沟通，不如让它自己跑完所有环节，你回来看成品——那这个 trade-off 就很值。 Repo GitHub: https://github.com/DreamChaserEric/claude-lights-out 一行安装： curl -fsSL https://raw.githubusercontent.com/DreamChaserEric/claude-lights-out/main/install.sh | bash 需要 Claude Code 且支持 workflow 功能。欢迎反馈。

[分享创造] 基于 Claude Code Workflow 的 Loop Engineering 流水线 - Claude-lights-out

v2ex · 2026-06-10 22:39:40+08:00 · tech

分享个自己做的东西。问题用 AI 写代码越来越爽，但也越来越烦。主要几个痛点： 1. 你变成了人肉 QA Claude 说"搞定了"，你一跑全是 bug 。然后进入死循环：测→报→修→测→报→修…… 明明是让它帮你省时间的，结果你的时间全花在当测试员上了。 2. 完全黑盒让它搞个复杂点的东西，跑了 20 分钟，你完全不知道它到哪了、在干什么、卡住了没有。 3. 失忆换个 session 、compact 一下、context 太长被截断——它就忘了项目是什么、之前做了什么决定、代码为什么这么写。下次对话从零开始解释。 4. 偷工减料你让它写个完整功能，它可能跳过测试、不做错误处理、架构随便搞。你不盯着它就不老实。我的方案拿 Claude Code 的 dynamic workflow 做了个强制流水线。你给一句话需求，它必须走完 9 个阶段才交付： /lightsout 用 Express + SQLite + React 做个看板应用，支持拖拽、标签、到期提醒然后它自动跑：需求编写 → 独立 agent 审查（不过就打回重写）交互设计 → 独立 agent 审查技术架构 → 独立 agent 审查一致性检查 → 三份文档互相对不上的地方找出来修掉测试用例设计 → 写代码之前先把测试想清楚写代码 → 自主决定要不要拆分并行（全栈项目自动拆前后端） QA → 跑测试，没过就自己修，最多 5 轮 E2E 验证 → 真的把应用跑起来试最终检查 → 需求文档 vs 实际代码逐条对比，有遗漏就补全程你不需要介入。跑完之后你拿到的是： src/ # 能跑的代码 tests/ # 测试全过 docs/ spec.md # 产品需求（每个功能的场景、错误处理都写了） design.md # 交互设计 architecture.md # 技术架构（ ADR 、模块划分、技术选型理由） test-cases.md # 测试设计这些文档是项目的"记忆"——下次开新 session ，agent 读一遍 docs/ 就知道项目全貌，不用你重新解释。核心设计写的人和审的人必须是不同 agent 。自己审自己肯定放水。拆开之后质量真的不一样——reviewer 会挑出 writer 自己看不到的问题。文档先行，代码最后。不是先写代码再补文档，而是需求、设计、架构全部写完审完了再动手。这样写出来的代码有据可依，测试有的放矢。代码阶段自己决定策略。简单项目（比如命令行工具）一个 agent 自己 TDD 搞定。复杂项目（全栈应用）它会自动拆分模块，先搞 shared types ，然后前后端并行开发，最后自己跑集成测试。每个环节自带修复循环。审查没过？打回重写。测试挂了？自己修。最多 5 轮。不需要你介入指挥。实测数据跑了 4 个全新项目：项目类型测试数结果批量文件重命名工具 Python CLI 67 个测试一次通过实时 Markdown 编辑器 Express + React + WebSocket 66 个测试 1 轮修复后通过个人记账 API + Dashboard FastAPI + React 50 个测试一次通过看板应用 Express + React + 拖拽 — 一次通过每个项目都手动验证过——真的能跑，功能正常。代价本质上这东西是拿 token 换你的时间和精力。每次跑 30-50 个 agent call ，45 分钟到 2 小时不等。如果这个 token 开销让你肉疼，那可能不适合你。但如果你有公司报销，或者你觉得自己的注意力比 token 值钱——与其花一小时盯着它干活、测 bug 、来回沟通，不如让它自己跑完所有环节，你回来看成品——那这个 trade-off 就很值。 Repo GitHub: https://github.com/DreamChaserEric/claude-lights-out 一行安装： curl -fsSL https://raw.githubusercontent.com/DreamChaserEric/claude-lights-out/main/install.sh | bash 需要 Claude Code 且支持 workflow 功能。欢迎反馈。

[分享创造] 基于 Claude Code Workflow 的 Loop Engineering 流水线 - Claude-lights-out

v2ex · 2026-06-10 21:05:38+08:00 · tech

分享个自己做的东西。问题用 AI 写代码越来越爽，但也越来越烦。主要几个痛点： 1. 你变成了人肉 QA Claude 说"搞定了"，你一跑全是 bug 。然后进入死循环：测→报→修→测→报→修…… 明明是让它帮你省时间的，结果你的时间全花在当测试员上了。 2. 完全黑盒让它搞个复杂点的东西，跑了 20 分钟，你完全不知道它到哪了、在干什么、卡住了没有。 3. 失忆换个 session 、compact 一下、context 太长被截断——它就忘了项目是什么、之前做了什么决定、代码为什么这么写。下次对话从零开始解释。 4. 偷工减料你让它写个完整功能，它可能跳过测试、不做错误处理、架构随便搞。你不盯着它就不老实。我的方案拿 Claude Code 的 dynamic workflow 做了个强制流水线。你给一句话需求，它必须走完 9 个阶段才交付： /lightsout 用 Express + SQLite + React 做个看板应用，支持拖拽、标签、到期提醒然后它自动跑：需求编写 → 独立 agent 审查（不过就打回重写）交互设计 → 独立 agent 审查技术架构 → 独立 agent 审查一致性检查 → 三份文档互相对不上的地方找出来修掉测试用例设计 → 写代码之前先把测试想清楚写代码 → 自主决定要不要拆分并行（全栈项目自动拆前后端） QA → 跑测试，没过就自己修，最多 5 轮 E2E 验证 → 真的把应用跑起来试最终检查 → 需求文档 vs 实际代码逐条对比，有遗漏就补全程你不需要介入。跑完之后你拿到的是： src/ # 能跑的代码 tests/ # 测试全过 docs/ spec.md # 产品需求（每个功能的场景、错误处理都写了） design.md # 交互设计 architecture.md # 技术架构（ ADR 、模块划分、技术选型理由） test-cases.md # 测试设计这些文档是项目的"记忆"——下次开新 session ，agent 读一遍 docs/ 就知道项目全貌，不用你重新解释。核心设计写的人和审的人必须是不同 agent 。自己审自己肯定放水。拆开之后质量真的不一样——reviewer 会挑出 writer 自己看不到的问题。文档先行，代码最后。不是先写代码再补文档，而是需求、设计、架构全部写完审完了再动手。这样写出来的代码有据可依，测试有的放矢。代码阶段自己决定策略。简单项目（比如命令行工具）一个 agent 自己 TDD 搞定。复杂项目（全栈应用）它会自动拆分模块，先搞 shared types ，然后前后端并行开发，最后自己跑集成测试。每个环节自带修复循环。审查没过？打回重写。测试挂了？自己修。最多 5 轮。不需要你介入指挥。实测数据跑了 4 个全新项目：项目类型测试数结果批量文件重命名工具 Python CLI 67 个测试一次通过实时 Markdown 编辑器 Express + React + WebSocket 66 个测试 1 轮修复后通过个人记账 API + Dashboard FastAPI + React 50 个测试一次通过看板应用 Express + React + 拖拽 — 一次通过每个项目都手动验证过——真的能跑，功能正常。代价本质上这东西是拿 token 换你的时间和精力。每次跑 30-50 个 agent call ，45 分钟到 2 小时不等。如果这个 token 开销让你肉疼，那可能不适合你。但如果你有公司报销，或者你觉得自己的注意力比 token 值钱——与其花一小时盯着它干活、测 bug 、来回沟通，不如让它自己跑完所有环节，你回来看成品——那这个 trade-off 就很值。 Repo GitHub: https://github.com/DreamChaserEric/claude-lights-out 一行安装： curl -fsSL https://raw.githubusercontent.com/DreamChaserEric/claude-lights-out/main/install.sh | bash 需要 Claude Code 且支持 workflow 功能。欢迎反馈。

[分享创造] 基于 Claude Code Workflow 的 Loop Engineering 流水线 - Claude-lights-out

v2ex · 2026-06-10 21:05:38+08:00 · tech

分享个自己做的东西。问题用 AI 写代码越来越爽，但也越来越烦。主要几个痛点： 1. 你变成了人肉 QA Claude 说"搞定了"，你一跑全是 bug 。然后进入死循环：测→报→修→测→报→修…… 明明是让它帮你省时间的，结果你的时间全花在当测试员上了。 2. 完全黑盒让它搞个复杂点的东西，跑了 20 分钟，你完全不知道它到哪了、在干什么、卡住了没有。 3. 失忆换个 session 、compact 一下、context 太长被截断——它就忘了项目是什么、之前做了什么决定、代码为什么这么写。下次对话从零开始解释。 4. 偷工减料你让它写个完整功能，它可能跳过测试、不做错误处理、架构随便搞。你不盯着它就不老实。我的方案拿 Claude Code 的 dynamic workflow 做了个强制流水线。你给一句话需求，它必须走完 9 个阶段才交付： /lightsout 用 Express + SQLite + React 做个看板应用，支持拖拽、标签、到期提醒然后它自动跑：需求编写 → 独立 agent 审查（不过就打回重写）交互设计 → 独立 agent 审查技术架构 → 独立 agent 审查一致性检查 → 三份文档互相对不上的地方找出来修掉测试用例设计 → 写代码之前先把测试想清楚写代码 → 自主决定要不要拆分并行（全栈项目自动拆前后端） QA → 跑测试，没过就自己修，最多 5 轮 E2E 验证 → 真的把应用跑起来试最终检查 → 需求文档 vs 实际代码逐条对比，有遗漏就补全程你不需要介入。跑完之后你拿到的是： src/ # 能跑的代码 tests/ # 测试全过 docs/ spec.md # 产品需求（每个功能的场景、错误处理都写了） design.md # 交互设计 architecture.md # 技术架构（ ADR 、模块划分、技术选型理由） test-cases.md # 测试设计这些文档是项目的"记忆"——下次开新 session ，agent 读一遍 docs/ 就知道项目全貌，不用你重新解释。核心设计写的人和审的人必须是不同 agent 。自己审自己肯定放水。拆开之后质量真的不一样——reviewer 会挑出 writer 自己看不到的问题。文档先行，代码最后。不是先写代码再补文档，而是需求、设计、架构全部写完审完了再动手。这样写出来的代码有据可依，测试有的放矢。代码阶段自己决定策略。简单项目（比如命令行工具）一个 agent 自己 TDD 搞定。复杂项目（全栈应用）它会自动拆分模块，先搞 shared types ，然后前后端并行开发，最后自己跑集成测试。每个环节自带修复循环。审查没过？打回重写。测试挂了？自己修。最多 5 轮。不需要你介入指挥。实测数据跑了 4 个全新项目：项目类型测试数结果批量文件重命名工具 Python CLI 67 个测试一次通过实时 Markdown 编辑器 Express + React + WebSocket 66 个测试 1 轮修复后通过个人记账 API + Dashboard FastAPI + React 50 个测试一次通过看板应用 Express + React + 拖拽 — 一次通过每个项目都手动验证过——真的能跑，功能正常。代价本质上这东西是拿 token 换你的时间和精力。每次跑 30-50 个 agent call ，45 分钟到 2 小时不等。如果这个 token 开销让你肉疼，那可能不适合你。但如果你有公司报销，或者你觉得自己的注意力比 token 值钱——与其花一小时盯着它干活、测 bug 、来回沟通，不如让它自己跑完所有环节，你回来看成品——那这个 trade-off 就很值。 Repo GitHub: https://github.com/DreamChaserEric/claude-lights-out 一行安装： curl -fsSL https://raw.githubusercontent.com/DreamChaserEric/claude-lights-out/main/install.sh | bash 需要 Claude Code 且支持 workflow 功能。欢迎反馈。

[分享创造] 基于 Claude Code Workflow 的 Loop Engineering 流水线 - Claude-lights-out

v2ex · 2026-06-10 19:26:12+08:00 · tech

分享个自己做的东西。问题用 AI 写代码越来越爽，但也越来越烦。主要几个痛点： 1. 你变成了人肉 QA Claude 说"搞定了"，你一跑全是 bug 。然后进入死循环：测→报→修→测→报→修…… 明明是让它帮你省时间的，结果你的时间全花在当测试员上了。 2. 完全黑盒让它搞个复杂点的东西，跑了 20 分钟，你完全不知道它到哪了、在干什么、卡住了没有。 3. 失忆换个 session 、compact 一下、context 太长被截断——它就忘了项目是什么、之前做了什么决定、代码为什么这么写。下次对话从零开始解释。 4. 偷工减料你让它写个完整功能，它可能跳过测试、不做错误处理、架构随便搞。你不盯着它就不老实。我的方案拿 Claude Code 的 dynamic workflow 做了个强制流水线。你给一句话需求，它必须走完 9 个阶段才交付： /lightsout 用 Express + SQLite + React 做个看板应用，支持拖拽、标签、到期提醒然后它自动跑：需求编写 → 独立 agent 审查（不过就打回重写）交互设计 → 独立 agent 审查技术架构 → 独立 agent 审查一致性检查 → 三份文档互相对不上的地方找出来修掉测试用例设计 → 写代码之前先把测试想清楚写代码 → 自主决定要不要拆分并行（全栈项目自动拆前后端） QA → 跑测试，没过就自己修，最多 5 轮 E2E 验证 → 真的把应用跑起来试最终检查 → 需求文档 vs 实际代码逐条对比，有遗漏就补全程你不需要介入。跑完之后你拿到的是： src/ # 能跑的代码 tests/ # 测试全过 docs/ spec.md # 产品需求（每个功能的场景、错误处理都写了） design.md # 交互设计 architecture.md # 技术架构（ ADR 、模块划分、技术选型理由） test-cases.md # 测试设计这些文档是项目的"记忆"——下次开新 session ，agent 读一遍 docs/ 就知道项目全貌，不用你重新解释。核心设计写的人和审的人必须是不同 agent 。自己审自己肯定放水。拆开之后质量真的不一样——reviewer 会挑出 writer 自己看不到的问题。文档先行，代码最后。不是先写代码再补文档，而是需求、设计、架构全部写完审完了再动手。这样写出来的代码有据可依，测试有的放矢。代码阶段自己决定策略。简单项目（比如命令行工具）一个 agent 自己 TDD 搞定。复杂项目（全栈应用）它会自动拆分模块，先搞 shared types ，然后前后端并行开发，最后自己跑集成测试。每个环节自带修复循环。审查没过？打回重写。测试挂了？自己修。最多 5 轮。不需要你介入指挥。实测数据跑了 4 个全新项目：项目类型测试数结果批量文件重命名工具 Python CLI 67 个测试一次通过实时 Markdown 编辑器 Express + React + WebSocket 66 个测试 1 轮修复后通过个人记账 API + Dashboard FastAPI + React 50 个测试一次通过看板应用 Express + React + 拖拽 — 一次通过每个项目都手动验证过——真的能跑，功能正常。代价本质上这东西是拿 token 换你的时间和精力。每次跑 30-50 个 agent call ，45 分钟到 2 小时不等。如果这个 token 开销让你肉疼，那可能不适合你。但如果你有公司报销，或者你觉得自己的注意力比 token 值钱——与其花一小时盯着它干活、测 bug 、来回沟通，不如让它自己跑完所有环节，你回来看成品——那这个 trade-off 就很值。 Repo GitHub: https://github.com/DreamChaserEric/claude-lights-out 一行安装： curl -fsSL https://raw.githubusercontent.com/DreamChaserEric/claude-lights-out/main/install.sh | bash 需要 Claude Code 且支持 workflow 功能。欢迎反馈。

[分享创造] 基于 Claude Code Workflow 的 Loop Engineering 流水线 - Claude-lights-out

v2ex · 2026-06-10 19:15:21+08:00 · tech

分享个自己做的东西。问题用 AI 写代码越来越爽，但也越来越烦。主要几个痛点： 1. 你变成了人肉 QA Claude 说"搞定了"，你一跑全是 bug 。然后进入死循环：测→报→修→测→报→修…… 明明是让它帮你省时间的，结果你的时间全花在当测试员上了。 2. 完全黑盒让它搞个复杂点的东西，跑了 20 分钟，你完全不知道它到哪了、在干什么、卡住了没有。 3. 失忆换个 session 、compact 一下、context 太长被截断——它就忘了项目是什么、之前做了什么决定、代码为什么这么写。下次对话从零开始解释。 4. 偷工减料你让它写个完整功能，它可能跳过测试、不做错误处理、架构随便搞。你不盯着它就不老实。我的方案拿 Claude Code 的 dynamic workflow 做了个强制流水线。你给一句话需求，它必须走完 9 个阶段才交付： /lightsout 用 Express + SQLite + React 做个看板应用，支持拖拽、标签、到期提醒然后它自动跑：需求编写 → 独立 agent 审查（不过就打回重写）交互设计 → 独立 agent 审查技术架构 → 独立 agent 审查一致性检查 → 三份文档互相对不上的地方找出来修掉测试用例设计 → 写代码之前先把测试想清楚写代码 → 自主决定要不要拆分并行（全栈项目自动拆前后端） QA → 跑测试，没过就自己修，最多 5 轮 E2E 验证 → 真的把应用跑起来试最终检查 → 需求文档 vs 实际代码逐条对比，有遗漏就补全程你不需要介入。跑完之后你拿到的是： src/ # 能跑的代码 tests/ # 测试全过 docs/ spec.md # 产品需求（每个功能的场景、错误处理都写了） design.md # 交互设计 architecture.md # 技术架构（ ADR 、模块划分、技术选型理由） test-cases.md # 测试设计这些文档是项目的"记忆"——下次开新 session ，agent 读一遍 docs/ 就知道项目全貌，不用你重新解释。核心设计写的人和审的人必须是不同 agent 。自己审自己肯定放水。拆开之后质量真的不一样——reviewer 会挑出 writer 自己看不到的问题。文档先行，代码最后。不是先写代码再补文档，而是需求、设计、架构全部写完审完了再动手。这样写出来的代码有据可依，测试有的放矢。代码阶段自己决定策略。简单项目（比如命令行工具）一个 agent 自己 TDD 搞定。复杂项目（全栈应用）它会自动拆分模块，先搞 shared types ，然后前后端并行开发，最后自己跑集成测试。每个环节自带修复循环。审查没过？打回重写。测试挂了？自己修。最多 5 轮。不需要你介入指挥。实测数据跑了 4 个全新项目：项目类型测试数结果批量文件重命名工具 Python CLI 67 个测试一次通过实时 Markdown 编辑器 Express + React + WebSocket 66 个测试 1 轮修复后通过个人记账 API + Dashboard FastAPI + React 50 个测试一次通过看板应用 Express + React + 拖拽 — 一次通过每个项目都手动验证过——真的能跑，功能正常。代价本质上这东西是拿 token 换你的时间和精力。每次跑 30-50 个 agent call ，45 分钟到 2 小时不等。如果这个 token 开销让你肉疼，那可能不适合你。但如果你有公司报销，或者你觉得自己的注意力比 token 值钱——与其花一小时盯着它干活、测 bug 、来回沟通，不如让它自己跑完所有环节，你回来看成品——那这个 trade-off 就很值。 Repo GitHub: https://github.com/DreamChaserEric/claude-lights-out 一行安装： curl -fsSL https://raw.githubusercontent.com/DreamChaserEric/claude-lights-out/main/install.sh | bash 需要 Claude Code 且支持 workflow 功能。欢迎反馈。

[分享创造] 基于 Claude Code Workflow 的 Loop Engineering 流水线 - Claude-lights-out

v2ex · 2026-06-10 18:44:07+08:00 · tech

分享个自己做的东西。问题用 AI 写代码越来越爽，但也越来越烦。主要几个痛点： 1. 你变成了人肉 QA Claude 说"搞定了"，你一跑全是 bug 。然后进入死循环：测→报→修→测→报→修…… 明明是让它帮你省时间的，结果你的时间全花在当测试员上了。 2. 完全黑盒让它搞个复杂点的东西，跑了 20 分钟，你完全不知道它到哪了、在干什么、卡住了没有。 3. 失忆换个 session 、compact 一下、context 太长被截断——它就忘了项目是什么、之前做了什么决定、代码为什么这么写。下次对话从零开始解释。 4. 偷工减料你让它写个完整功能，它可能跳过测试、不做错误处理、架构随便搞。你不盯着它就不老实。我的方案拿 Claude Code 的 dynamic workflow 做了个强制流水线。你给一句话需求，它必须走完 9 个阶段才交付： /lightsout 用 Express + SQLite + React 做个看板应用，支持拖拽、标签、到期提醒然后它自动跑：需求编写 → 独立 agent 审查（不过就打回重写）交互设计 → 独立 agent 审查技术架构 → 独立 agent 审查一致性检查 → 三份文档互相对不上的地方找出来修掉测试用例设计 → 写代码之前先把测试想清楚写代码 → 自主决定要不要拆分并行（全栈项目自动拆前后端） QA → 跑测试，没过就自己修，最多 5 轮 E2E 验证 → 真的把应用跑起来试最终检查 → 需求文档 vs 实际代码逐条对比，有遗漏就补全程你不需要介入。跑完之后你拿到的是： src/ # 能跑的代码 tests/ # 测试全过 docs/ spec.md # 产品需求（每个功能的场景、错误处理都写了） design.md # 交互设计 architecture.md # 技术架构（ ADR 、模块划分、技术选型理由） test-cases.md # 测试设计这些文档是项目的"记忆"——下次开新 session ，agent 读一遍 docs/ 就知道项目全貌，不用你重新解释。核心设计写的人和审的人必须是不同 agent 。自己审自己肯定放水。拆开之后质量真的不一样——reviewer 会挑出 writer 自己看不到的问题。文档先行，代码最后。不是先写代码再补文档，而是需求、设计、架构全部写完审完了再动手。这样写出来的代码有据可依，测试有的放矢。代码阶段自己决定策略。简单项目（比如命令行工具）一个 agent 自己 TDD 搞定。复杂项目（全栈应用）它会自动拆分模块，先搞 shared types ，然后前后端并行开发，最后自己跑集成测试。每个环节自带修复循环。审查没过？打回重写。测试挂了？自己修。最多 5 轮。不需要你介入指挥。实测数据跑了 4 个全新项目：项目类型测试数结果批量文件重命名工具 Python CLI 67 个测试一次通过实时 Markdown 编辑器 Express + React + WebSocket 66 个测试 1 轮修复后通过个人记账 API + Dashboard FastAPI + React 50 个测试一次通过看板应用 Express + React + 拖拽 — 一次通过每个项目都手动验证过——真的能跑，功能正常。代价本质上这东西是拿 token 换你的时间和精力。每次跑 30-50 个 agent call ，45 分钟到 2 小时不等。如果这个 token 开销让你肉疼，那可能不适合你。但如果你有公司报销，或者你觉得自己的注意力比 token 值钱——与其花一小时盯着它干活、测 bug 、来回沟通，不如让它自己跑完所有环节，你回来看成品——那这个 trade-off 就很值。 Repo GitHub: https://github.com/DreamChaserEric/claude-lights-out 一行安装： curl -fsSL https://raw.githubusercontent.com/DreamChaserEric/claude-lights-out/main/install.sh | bash 需要 Claude Code 且支持 workflow 功能。欢迎反馈。

Loop Engineering 正在取代“你亲自给 agent 写 prompt”这件事。

LinuxDo 最新话题 · 2026-06-10 15:21:41+08:00 · tech

一天一个概念，学不完根本学不完 5 个帖子 - 5 位参与者阅读完整话题

[酷工作] NVIDIA | AI Developer Technology Engineer 热招中！

v2ex · 2026-06-08 17:11:21+08:00 · tech

🔥 NVIDIA | AI Developer Technology Engineer 热招中！大家好，目前英伟达 Developer Technology （ DevTech ）团队在中国上海 / 北京 / 深圳均有招聘需求，正在寻找对 AI 和 GPU 计算充满热情的工程师加入我们！ 📌 岗位亮点与顶级应用开发者深度合作，解决 AI workload 在 GPU 上的性能瓶颈研发并优化并行算法与数据结构，直接贡献 reference code 及应用优化深度参与 next-gen GPU 架构设计，影响 NVIDIA 下一代软件平台方向聚焦前沿 AI 方向：多模态模型训练/推理、LLM 的 Reinforcement Learning 等 📌 我们在找硕士/博士，AI 、系统优化或相关方向，或同等经验 + 3 年以上相关工作经历扎实的 C++ 功底，熟悉 AI 算法与软件开发在多模态模型（训练/推理）或 LLM RL 方向有深入的领域积累逻辑清晰，沟通表达能力强 📌 面试流程线上视频面试为主，3 ～ 4 轮与技术面试官一对一 Teams 视频面试，全部通过后进入 Offer 流程，高效透明。感兴趣的同学欢迎将最新中文简历发送至我的邮箱：[[email protected]]，我会第一时间转给 Hiring Manager 跟进。也欢迎私信我了解更多详情！ #NVIDIA 招聘 #AI 工程师 #GPU 计算 #DevTech #CUDA #多模态 #深度学习 #社招

v2ex · 2026-06-08 16:09:10+08:00 · tech

🔥 NVIDIA | AI Developer Technology Engineer 热招中！大家好，目前英伟达 Developer Technology （ DevTech ）团队在中国上海 / 北京 / 深圳均有招聘需求，正在寻找对 AI 和 GPU 计算充满热情的工程师加入我们！ 📌 岗位亮点与顶级应用开发者深度合作，解决 AI workload 在 GPU 上的性能瓶颈研发并优化并行算法与数据结构，直接贡献 reference code 及应用优化深度参与 next-gen GPU 架构设计，影响 NVIDIA 下一代软件平台方向聚焦前沿 AI 方向：多模态模型训练/推理、LLM 的 Reinforcement Learning 等 📌 我们在找硕士/博士，AI 、系统优化或相关方向，或同等经验 + 3 年以上相关工作经历扎实的 C++ 功底，熟悉 AI 算法与软件开发在多模态模型（训练/推理）或 LLM RL 方向有深入的领域积累逻辑清晰，沟通表达能力强 📌 面试流程线上视频面试为主，3 ～ 4 轮与技术面试官一对一 Teams 视频面试，全部通过后进入 Offer 流程，高效透明。感兴趣的同学欢迎将最新中文简历发送至我的邮箱：[[email protected]]，我会第一时间转给 Hiring Manager 跟进。也欢迎私信我了解更多详情！ #NVIDIA 招聘 #AI 工程师 #GPU 计算 #DevTech #CUDA #多模态 #深度学习 #社招

gpt plus -> gpt 免费版 / gemini pro，prompt engineering的需求直线飙升

LinuxDo 最新话题 · 2026-06-05 21:48:17+08:00 · tech

背景：初始prompt一样的“agent学习”对话 gptplus凭借其内置的memory能在几轮对话后和我开始契合，学习流固化且对阶段性信息抗干扰能力强（例如我中途突然问一个偏细或者和主线相关度不高的问题后，可以主动返回学习主线），无需我进行额外的修正和prompt engineering。 gpt 免费版和gemini pro，共同的槽点是记忆很差，容易在主线学着学着开始钻牛角尖，再结合他们的高服从度：“你希望我下一步…吗” ，将学习流切得很碎；目前的解决方法: a. 在一开始就把学习实践路线和它确认（学习路线->学习模块->更细的知识点->更细的checkpoints) b. 把它当傻子，后面各轮的prompt不能出现和主线无关的语义（骂完他还要多写一句让它继续）最终解决方案：周末把plus搞回来 1 个帖子 - 1 位参与者阅读完整话题

[AI Agent 智能体] Agent Engineer

v2ex · 2026-06-03 06:56:47+08:00 · tech

以下内容是我写在简历上的部分内容，想找个 Agent 研发的工作。持续关注 AI 与 Agent 前沿技术，长期投入大模型应用架构、Agent Runtime 、RAG 与 Context Engineering 等方向的研究与实践，具备较强的自主学习与技术探索能力。具备从 0-1 独立设计与实现 AI 系统的能力，能够快速完成技术调研、架构设计、原型验证与工程落地。深度使用 Claude Code 、Cursor 等 AI Coding 工具辅助研发，具备 AI Native 开发思维，能够结合 Prompt Engineering 与自动化工作流提升研发效率。熟悉 Agent 、RAG 、多模型调度、向量检索、MCP （ Model Context Protocol ）等 AI 应用核心技术，具备完整 AI 应用系统实践经验。对新技术保持持续学习热情，长期关注 OpenAI 、Anthropic 、DeepSeek 、LangChain 、Dify 、n8n 等 AI 生态发展与工程实践。

现在 harness engineering 最佳实践是什么？

V2EX - 技术 · 2026-06-01 17:12:28+08:00 · tech

有 2 个问题想请教下问题 1. codex 对于稍有规模的工程开发现在还是 subagents 吗？平时用 codex 多一些，但对于研发来讲，agent 还是 cc 更先进一些，cc 之前有 agent teams ，大家所熟悉的三省六部制多 agent 合作来做项目，有 PM/架构师/Engineer/QA 等不同角色配合，而现在 cc 又出现 dynamic workflows ，对于大型工程，AI 先编写脚本，用脚本去派生子 agent 做项目的维护推进。对于 codex 来讲，现在还是只有 subagents 吧？平时虽然没有那么多新项目的需求，基本上都是对老项目修修补补，开一个 codex ，不相关的小修补都是新开 session 来让 AI 解决，一个 AGENTS.md 足以。问题 2. 对于前端/客户端来讲，AI 如何做 UI 测试/验收？就像 claude 把 bun 从 zig 移植到 rust ，不说它 RIIR 方面，但开发的闭环这一块就值得我们学习，前段时间还看到有人用 cc 把 go mihomo 移植到 rust ，这也是依赖 agent teams 的闭环合作。但对于这些项目，都是比较容易测试的(对 AI 来讲)。那对于前端/客户端来讲呢？ codex 写网页我看它还会开 server 打开浏览器来控制操作下，实际上它的审美也是不足的（先不用说什么 fronted-design skills)，最终还是要靠人来反复比对调整，对于客户端项目（虽然很久前 codex 就支持内置 iOS 模拟器了），这种更依赖人去运行到真机测试，复杂交互逻辑它还是不太 work 。所以说，对于前端/客户端开发来讲，如何完成 agent teams 的合作闭环？

[酷工作] [Remote] Senior Backend Engineer / Frontend Engineer / Product Leader

v2ex · 2026-06-01 15:02:39+08:00 · tech

最近整理了一批支持 Remote 的技术岗位。主要集中在：全球化互联网平台 FinTech AI 产品 Web3 基础设施数据平台然后写：目前开放岗位 Senior Backend Engineer Remote or 日本新加坡 60-120w Frontend Engineer Remote or 日本新加坡 React / Next.js 50-100w Product Lead Remote 英文岗位 200-300w AI Engineer Remote 英文岗位 Agent / LLM 80-150w 部分岗位来自交易平台及 Web3 企业。出于企业要求，暂不公开公司名称。对具体岗位感兴趣可 email： [email protected] 匹配岗位。

[酷工作] AI 多智能体平台核心团队招募｜ Senior Multi-Agent Engineer｜全栈 AI 工程师｜北京/可远程

v2ex · 2026-05-31 10:23:13+08:00 · tech

🚀 招贤纳士｜ AI 多智能体平台核心团队招聘我们正在为某 AI 公司多智能体（ Multi-Agent ）平台招募核心研发人才，欢迎优秀工程师加入！ 📌 招聘岗位 1️⃣ 资深 Multi-Agent 平台开发工程师（ Senior Multi-Agent Platform Engineer ） 2️⃣ 全栈 AI 开发工程师偏后端方向偏前端方向前后端均精通的全栈专家 ⭐ 加分项有 Agent 、LLM 、多智能体相关项目经验在 AI / Agent 领域顶会、顶刊发表过论文熟悉大模型应用开发、Agent Framework 、RAG 、Workflow 、Tool Calling 等技术体系 📍 工作地点北京特别优秀者可考虑远程办公入职前 1 ～ 2 个月可能需要到北京现场协作 💰 薪资待遇 40K ～ 65K / 月 15 薪具体根据技术匹配度、项目经验及综合能力评估 📮 简历投递邮箱： [email protected] ⏰ 简历反馈收到简历后，原则上 12 小时内回复。欢迎转发推荐，也欢迎优秀工程师直接联系！

[酷工作] AI 多智能体平台核心团队招募｜ Senior Multi-Agent Engineer｜全栈 AI 工程师｜北京/可远程

v2ex · 2026-05-31 10:23:13+08:00 · tech

🚀 招贤纳士｜ AI 多智能体平台核心团队招聘我们正在为某 AI 公司多智能体（ Multi-Agent ）平台招募核心研发人才，欢迎优秀工程师加入！ 📌 招聘岗位 1️⃣ 资深 Multi-Agent 平台开发工程师（ Senior Multi-Agent Platform Engineer ） 2️⃣ 全栈 AI 开发工程师偏后端方向偏前端方向前后端均精通的全栈专家 ⭐ 加分项有 Agent 、LLM 、多智能体相关项目经验在 AI / Agent 领域顶会、顶刊发表过论文熟悉大模型应用开发、Agent Framework 、RAG 、Workflow 、Tool Calling 等技术体系 📍 工作地点北京特别优秀者可考虑远程办公入职前 1 ～ 2 个月可能需要到北京现场协作 💰 薪资待遇 40K ～ 65K / 月 15 薪具体根据技术匹配度、项目经验及综合能力评估 📮 简历投递邮箱： [email protected] ⏰ 简历反馈收到简历后，原则上 12 小时内回复。欢迎转发推荐，也欢迎优秀工程师直接联系！

[酷工作] AI 多智能体平台核心团队招募｜ Senior Multi-Agent Engineer｜全栈 AI 工程师｜北京/可远程

v2ex · 2026-05-31 10:15:13+08:00 · tech

🚀 招贤纳士｜ AI 多智能体平台核心团队招聘我们正在为某 AI 公司多智能体（ Multi-Agent ）平台招募核心研发人才，欢迎优秀工程师加入！ 📌 招聘岗位 1️⃣ 资深 Multi-Agent 平台开发工程师（ Senior Multi-Agent Platform Engineer ） 2️⃣ 全栈 AI 开发工程师偏后端方向偏前端方向前后端均精通的全栈专家 ⭐ 加分项有 Agent 、LLM 、多智能体相关项目经验在 AI / Agent 领域顶会、顶刊发表过论文熟悉大模型应用开发、Agent Framework 、RAG 、Workflow 、Tool Calling 等技术体系 📍 工作地点北京特别优秀者可考虑远程办公入职前 1 ～ 2 个月可能需要到北京现场协作 💰 薪资待遇 40K ～ 65K / 月 15 薪具体根据技术匹配度、项目经验及综合能力评估 📮 简历投递邮箱： [email protected] ⏰ 简历反馈收到简历后，原则上 12 小时内回复。欢迎转发推荐，也欢迎优秀工程师直接联系！

佬友们是如何熬过 Agent 思考时间的

LinuxDo 最新话题 · 2026-05-29 14:30:58+08:00 · tech

rt，严肃学习 Harness Engineering 中，但是等输出好难熬 10 个帖子 - 9 位参与者阅读完整话题

GPT-5.5在 DeepSWE 上远超 Claude Opus

LinuxDo 最新话题 · 2026-05-28 14:38:59+08:00 · tech

DeepSWE DeepSWE DeepSWE measures frontier coding agents on original, long-horizon software engineering tasks. 跑分也就图一乐，真要比较还得自己亲自用过 AI 生成内容已用截图发出 DeepSWE 的介绍： 3 个帖子 - 3 位参与者阅读完整话题

/tag/Engineer