WWW.YOUINFO.SITE
标签聚合 agentic

/tag/agentic

IT之家 · 2026-06-07 22:37:32+08:00 · tech

IT之家 6 月 7 日消息,华为云现已针对 Agentic AI 时代发布全新云入口“智果园”,新产品支持云码道 CodeArts 代码智能体、华为云 OfficeAce 办公智能体和 WorkAgent 文档智能体。 据介绍,智果园拥有开发、办公等多种关键行业的智能体,可通过智果 AgentArts 平台打造更加实用的智能体,并通过 Skills、AI Shell 自定义,快速使用华为云能力。 IT之家注意到,智果园支持一键调用 DeepSeek-V4-Pro、智谱 GLM-5.1、月之暗面 Kimi-K2.6 和千问 Qwen-Image 等主流大模型。拥有全新 Token Plan 订阅计划,覆盖主流模型和 AI 工具,可提供稳定的开发体验。 此外,智果园还带有智慧医疗、具身智能、科学计算等 AI 梦工厂,适配更多行业应用场景。

cnBeta全文版 · 2026-06-07 16:05:18+08:00 · tech

在新一轮以 “Agentic AI” 为代表的人工智能浪潮中,统一内存架构(UMA,Unified Memory Architecture)正在 PC 与计算领域快速升温,AMD 认为这不仅是重要机会,也是未来产品架构与路线图的关键方向。 所谓统一内存架构,是指将 CPU、GPU 与内存紧密耦合在同一系统芯片(SoC)上,形成一个共享的大内存池,由系统按负载动态在 CPU 与 GPU 之间分配,而不是传统的“系统内存 + 独立显存”分离模式。在 AI 工作负载尤其是大模型推理中,这样的设计可以大幅减少数据拷贝与带宽瓶颈,因此正逐步成为 AI 终端与新形态 PC 的主流方案之一。 随着 AMD Ryzen AI MAX 系列的推出,以及英伟达 RTX Spark 等产品加入,统一内存架构已经成为 AI 终端平台的共同技术基石。AMD 表示,他们的首代 Ryzen AI MAX 方案可提供最高 128GB 内存,其中最多可为 GPU 划分 112GB 系统内存;英伟达 RTX Spark 也采用类似思路,根据工作负载动态在 CPU 与 GPU 之间分配内存,使得统一内存架构能够覆盖从通用计算到 AI 推理的广泛应用场景。 在接受媒体采访时,AMD 副总裁 David McAfee 被问到未来是否会有更多产品采用 UMA 方案,他回应称,围绕统一内存系统的关注会持续提升,业界将围绕这类系统探索“合适的架构形态”,并在现有平台的基础上不断迭代增强。他强调,这是一类全新的工作负载与计算空间,将为 AMD 在产品选型、路线规划以及部署形态上打开“一整个世界的可能性”。 AMD 已经把统一内存思路延伸到下一代产品——Ryzen AI MAX 400 系列。根据官方介绍,这一代产品最高可支持 192GB 统一内存,最多可为 GPU 划分 160GB,用于本地运行参数规模超过 3000 亿级别的大型语言模型(LLM),以满足复杂 AI 工作流以及高端创意工作负载对内存容量与带宽的极端需求。 在媒体圆桌中,有记者进一步追问,未来是否可能看到面向游戏的 UMA Ryzen 处理器,或者类似 “Strix Halo + 3D V-Cache / 封装级高带宽内存” 的设计,以通过更紧密整合和更低延迟的封装内存进一步强化 UMA 能力。McAfee 表示自己目前“没有具体答案”,但重申 Strix Halo 之类平台与英伟达进入同一赛道,意味着围绕 UMA 的系统设计将在未来几年获得更多资源投入与架构探索。 值得注意的是,McAfee 在谈到 UMA 时,不仅提到了移动与 AI 终端,也提及了高性能桌面系统。他认为,统一内存架构的支持能力不断提升,以及更多生态参与者采纳这一架构,将推动高性能桌面和统一系统形态的整体演进,重塑业界对“高性能 PC + 统一内存”的认知。在他看来,Halo 这类平台所采用的统一架构仍然是这类系统的“正确形态”,而英伟达近期的相关发布则可以视作对这一架构路径的“背书”。 McAfee 还强调,随着 Agentic Compute 的兴起,通过统一内存池在终端上运行“超大模型”成为这些系统独特的价值主张之一。对于 AMD 来说,这类统一系统在整体产品组合中扮演双重角色:一方面支撑前沿 AI 与大模型工作负载,另一方面也可能成为高性能桌面与高级创意工作站的基础平台形态。 从行业视角看,统一内存架构已经不再是小众实验,而是在新一代计算平台中快速演变为基础支柱。随着 Agentic AI 对大容量共享内存池的需求不断提升,AMD 与英伟达等厂商共同押注 UMA,也意味着这一架构路线获得了强烈的产业级背书。AMD 对 Ryzen AI MAX 400 等新平台的积极规划,以及对 Strix Halo 等高性能平台未来形态的开放态度,显示目前仍只是统一内存架构发展的起点。 在 CPU、GPU 与内存边界逐渐模糊的统一系统中,新一代平台有望在性能、能效与能力边界上实现同步跃升,这不仅适用于 AI 与大模型工作负载,也有可能扩展到游戏与高端桌面领域。对于 AMD 而言,统一内存架构正成为其下一代产品架构设计与中长期路线规划中的核心基础之一,而整个生态系统也才刚刚进入这条路径的起跑阶段。 查看评论

v2ex · 2026-06-04 09:13:37+08:00 · tech

我在德州西南医学中心从去年开始开的一门课就是如何利用 Agentic AI 来编写 Harness 为不同的专门领域来服务。 当前随着各大 AI 公司比如 OpenAI Google Anthropic 大幅提高 Token 价格,使用云端的大模型的花费越来越高。但是同时很多用户使用 ChatGPT 这样的工具只是把它当成 Google 一样来用,用来查询信息。完全没有必要花费巨额的 Token 量和花费来使用顶级的 GPT 5.5 或者 Opus 4.8 这样的模型。 鉴于此,我决定使用高效的本地模型结合 Harness 来设定工具和 Memory 来解决这个问题。 (取名 Bonsai 的原因,一部分是因为我和 Stanford 出身的 Prism 实验室有过一些交集 https://prismml.com/ ) 虽然 Anthropic 从来没有公布具体的 Claude Sonnet 的参数量,不过从网上的信息以及我的个人分析推断,这个模型是一个 MoE (Mix of Expert) 模型,它的有效参数 (Active Parameter) 应该在数十 B 左右,总参数在几百 B 左右。 MoE 模型的有效参数是真实的模型推理过程中使用的参数量,总参数量则是这个模型所储备的知识量 (Knowlege)。我的想法是如果是这样,那么使用一款带有 Thinking 能力的 Dense 模型,虽然只有数十 B 的参数量,但如果可以结合 Harness Engineering, 利用针对性的高效工具来弥补模型知识能力的不足,这样的工具如果写成了应该可以在本地替代大部分的 ChatGPT 对于大多数用户的需求。 做为这个想法的第一个专门项目,我决定先公布一个测试版本 Bonsai, 这个 Harness 采用了底层和本机的 Google Chrome 交流,通过编写的多个浏览器交流工具让本地 LLM 使用 Agentic 模式来访问网络, 默认使用的大模型是 Google Gemma 4B, 当然也可以换成 QWen 模型。 (使用 Gemma 模型的原因是在德州的政府部门包括学校中不能使用中国的开源模型) 下载地址: https://drive.google.com/drive/folders/1YUQ3tmcBSLEyBKLi5JdJgmod9mqXFTgl?usp=sharing 截图: https://i.imgur.com/9MacuXk.png 左边是输入对话框,右边是 Agent 在操作浏览器 这个 Harness 采用了很多专门针对浏览器交互的工具,包括可以 InjectJS 等 JS 注入工具,来方便 Agnet 来查找网页元素和点击按钮等等 这个当前的版本是在 Windows 上编译的,需要 Nvidia CUDA 的支持 我会随后更新还在测试中的 M 系列的 Mac 版本 当前使用 4B thinking 模型作为默认模型的目的是可以在本地上跑到快速的 token / s 方便使用 Agentic workflow. 我测试使用的 Win11+Nvidia 4090 可以跑到大概 140 tps. 在 M4 mac 上使用 Metal 后段大概在 50 tps 左右

v2ex · 2026-06-04 09:13:37+08:00 · tech

我在德州西南医学中心从去年开始开的一门课就是如何利用 Agentic AI 来编写 Harness 为不同的专门领域来服务。 当前随着各大 AI 公司比如 OpenAI Google Anthropic 大幅提高 Token 价格,使用云端的大模型的花费越来越高。但是同时很多用户使用 ChatGPT 这样的工具只是把它当成 Google 一样来用,用来查询信息。完全没有必要花费巨额的 Token 量和花费来使用顶级的 GPT 5.5 或者 Opus 4.8 这样的模型。 鉴于此,我决定使用高效的本地模型结合 Harness 来设定工具和 Memory 来解决这个问题。 (取名 Bonsai 的原因,一部分是因为我和 Stanford 出身的 Prism 实验室有过一些交集 https://prismml.com/ ) 虽然 Anthropic 从来没有公布具体的 Claude Sonnet 的参数量,不过从网上的信息以及我的个人分析推断,这个模型是一个 MoE (Mix of Expert) 模型,它的有效参数 (Active Parameter) 应该在数十 B 左右,总参数在几百 B 左右。 MoE 模型的有效参数是真实的模型推理过程中使用的参数量,总参数量则是这个模型所储备的知识量 (Knowlege)。我的想法是如果是这样,那么使用一款带有 Thinking 能力的 Dense 模型,虽然只有数十 B 的参数量,但如果可以结合 Harness Engineering, 利用针对性的高效工具来弥补模型知识能力的不足,这样的工具如果写成了应该可以在本地替代大部分的 ChatGPT 对于大多数用户的需求。 做为这个想法的第一个专门项目,我决定先公布一个测试版本 Bonsai, 这个 Harness 采用了底层和本机的 Google Chrome 交流,通过编写的多个浏览器交流工具让本地 LLM 使用 Agentic 模式来访问网络, 默认使用的大模型是 Google Gemma 4B, 当然也可以换成 QWen 模型。 (使用 Gemma 模型的原因是在德州的政府部门包括学校中不能使用中国的开源模型) 下载地址: https://drive.google.com/drive/folders/1YUQ3tmcBSLEyBKLi5JdJgmod9mqXFTgl?usp=sharing 截图: https://i.imgur.com/9MacuXk.png 左边是输入对话框,右边是 Agent 在操作浏览器 这个 Harness 采用了很多专门针对浏览器交互的工具,包括可以 InjectJS 等 JS 注入工具,来方便 Agnet 来查找网页元素和点击按钮等等 这个当前的版本是在 Windows 上编译的,需要 Nvidia CUDA 的支持 我会随后更新还在测试中的 M 系列的 Mac 版本 当前使用 4B thinking 模型作为默认模型的目的是可以在本地上跑到快速的 token / s 方便使用 Agentic workflow. 我测试使用的 Win11+Nvidia 4090 可以跑到大概 140 tps. 在 M4 mac 上使用 Metal 后段大概在 50 tps 左右

v2ex · 2026-06-04 08:50:09+08:00 · tech

我在德州西南医学中心从去年开始开的一门课就是如何利用 Agentic AI 来编写 Harness 为不同的专门领域来服务。 当前随着各大 AI 公司比如 OpenAI Google Anthropic 大幅提高 Token 价格,使用云端的大模型的花费越来越高。但是同时很多用户使用 ChatGPT 这样的工具只是把它当成 Google 一样来用,用来查询信息。完全没有必要花费巨额的 Token 量和花费来使用顶级的 GPT 5.5 或者 Opus 4.8 这样的模型。 鉴于此,我决定使用高效的本地模型结合 Harness 来设定工具和 Memory 来解决这个问题。 (取名 Bonsai 的原因,一部分是因为我和 Stanford 出身的 Prism 实验室有过一些交集 https://prismml.com/ ) 虽然 Anthropic 从来没有公布具体的 Claude Sonnet 的参数量,不过从网上的信息以及我的个人分析推断,这个模型是一个 MoE (Mix of Expert) 模型,它的有效参数 (Active Parameter) 应该在数十 B 左右,总参数在几百 B 左右。 MoE 模型的有效参数是真实的模型推理过程中使用的参数量,总参数量则是这个模型所储备的知识量 (Knowlege)。我的想法是如果是这样,那么使用一款带有 Thinking 能力的 Dense 模型,虽然只有数十 B 的参数量,但如果可以结合 Harness Engineering, 利用针对性的高效工具来弥补模型知识能力的不足,这样的工具如果写成了应该可以在本地替代大部分的 ChatGPT 对于大多数用户的需求。 做为这个想法的第一个专门项目,我决定先公布一个测试版本 Bonsai, 这个 Harness 采用了底层和本机的 Google Chrome 交流,通过编写的多个浏览器交流工具让本地 LLM 使用 Agentic 模式来访问网络, 默认使用的大模型是 Google Gemma 4B, 当然也可以换成 QWen 模型。 (使用 Gemma 模型的原因是在德州的政府部门包括学校中不能使用中国的开源模型) 下载地址: https://drive.google.com/drive/folders/1YUQ3tmcBSLEyBKLi5JdJgmod9mqXFTgl?usp=sharing 截图: https://i.imgur.com/9MacuXk.png 左边是输入对话框,右边是 Agent 在操作浏览器 这个 Harness 采用了很多专门针对浏览器交互的工具,包括可以 InjectJS 等 JS 注入工具,来方便 Agnet 来查找网页元素和点击按钮等等 这个当前的版本是在 Windows 上编译的,需要 Nvidia CUDA 的支持 我会随后更新还在测试中的 M 系列的 Mac 版本 当前使用 4B thinking 模型作为默认模型的目的是可以在本地上跑到快速的 token / s 方便使用 Agentic workflow. 我测试使用的 Win11+Nvidia 4090 可以跑到大概 140 tps. 在 M4 mac 上使用 Metal 后段大概在 50 tps 左右

v2ex · 2026-06-04 08:50:09+08:00 · tech

我在德州西南医学中心从去年开始开的一门课就是如何利用 Agentic AI 来编写 Harness 为不同的专门领域来服务。 当前随着各大 AI 公司比如 OpenAI Google Anthropic 大幅提高 Token 价格,使用云端的大模型的花费越来越高。但是同时很多用户使用 ChatGPT 这样的工具只是把它当成 Google 一样来用,用来查询信息。完全没有必要花费巨额的 Token 量和花费来使用顶级的 GPT 5.5 或者 Opus 4.8 这样的模型。 鉴于此,我决定使用高效的本地模型结合 Harness 来设定工具和 Memory 来解决这个问题。 (取名 Bonsai 的原因,一部分是因为我和 Stanford 出身的 Prism 实验室有过一些交集 https://prismml.com/ ) 虽然 Anthropic 从来没有公布具体的 Claude Sonnet 的参数量,不过从网上的信息以及我的个人分析推断,这个模型是一个 MoE (Mix of Expert) 模型,它的有效参数 (Active Parameter) 应该在数十 B 左右,总参数在几百 B 左右。 MoE 模型的有效参数是真实的模型推理过程中使用的参数量,总参数量则是这个模型所储备的知识量 (Knowlege)。我的想法是如果是这样,那么使用一款带有 Thinking 能力的 Dense 模型,虽然只有数十 B 的参数量,但如果可以结合 Harness Engineering, 利用针对性的高效工具来弥补模型知识能力的不足,这样的工具如果写成了应该可以在本地替代大部分的 ChatGPT 对于大多数用户的需求。 做为这个想法的第一个专门项目,我决定先公布一个测试版本 Bonsai, 这个 Harness 采用了底层和本机的 Google Chrome 交流,通过编写的多个浏览器交流工具让本地 LLM 使用 Agentic 模式来访问网络, 默认使用的大模型是 Google Gemma 4B, 当然也可以换成 QWen 模型。 (使用 Gemma 模型的原因是在德州的政府部门包括学校中不能使用中国的开源模型) 下载地址: https://drive.google.com/drive/folders/1YUQ3tmcBSLEyBKLi5JdJgmod9mqXFTgl?usp=sharing 截图: https://i.imgur.com/9MacuXk.png 左边是输入对话框,右边是 Agent 在操作浏览器 这个 Harness 采用了很多专门针对浏览器交互的工具,包括可以 InjectJS 等 JS 注入工具,来方便 Agnet 来查找网页元素和点击按钮等等 这个当前的版本是在 Windows 上编译的,需要 Nvidia CUDA 的支持 我会随后更新还在测试中的 M 系列的 Mac 版本 当前使用 4B thinking 模型作为默认模型的目的是可以在本地上跑到快速的 token / s 方便使用 Agentic workflow. 我测试使用的 Win11+Nvidia 4090 可以跑到大概 140 tps. 在 M4 mac 上使用 Metal 后段大概在 50 tps 左右

v2ex · 2026-06-04 08:35:51+08:00 · tech

我在德州西南医学中心从去年开始开的一门课就是如何利用 Agentic AI 来编写 Harness 为不同的专门领域来服务。 当前随着各大 AI 公司比如 OpenAI Google Anthropic 大幅提高 Token 价格,使用云端的大模型的花费越来越高。但是同时很多用户使用 ChatGPT 这样的工具只是把它当成 Google 一样来用,用来查询信息。完全没有必要花费巨额的 Token 量和花费来使用顶级的 GPT 5.5 或者 Opus 4.8 这样的模型。 鉴于此,我决定使用高效的本地模型结合 Harness 来设定工具和 Memory 来解决这个问题。 (取名 Bonsai 的原因,一部分是因为我和 Stanford 出身的 Prism 实验室有过一些交集 https://prismml.com/ ) 虽然 Anthropic 从来没有公布具体的 Claude Sonnet 的参数量,不过从网上的信息以及我的个人分析推断,这个模型是一个 MoE (Mix of Expert) 模型,它的有效参数 (Active Parameter) 应该在数十 B 左右,总参数在几百 B 左右。 MoE 模型的有效参数是真实的模型推理过程中使用的参数量,总参数量则是这个模型所储备的知识量 (Knowlege)。我的想法是如果是这样,那么使用一款带有 Thinking 能力的 Dense 模型,虽然只有数十 B 的参数量,但如果可以结合 Harness Engineering, 利用针对性的高效工具来弥补模型知识能力的不足,这样的工具如果写成了应该可以在本地替代大部分的 ChatGPT 对于大多数用户的需求。 做为这个想法的第一个专门项目,我决定先公布一个测试版本 Bonsai, 这个 Harness 采用了底层和本机的 Google Chrome 交流,通过编写的多个浏览器交流工具让本地 LLM 使用 Agentic 模式来访问网络, 默认使用的大模型是 Google Gemma 4B, 当然也可以换成 QWen 模型。 (使用 Gemma 模型的原因是在德州的政府部门包括学校中不能使用中国的开源模型) 下载地址: https://drive.google.com/drive/folders/1YUQ3tmcBSLEyBKLi5JdJgmod9mqXFTgl?usp=sharing 截图: https://i.imgur.com/9MacuXk.png 左边是输入对话框,右边是 Agent 在操作浏览器 这个 Harness 采用了很多专门针对浏览器交互的工具,包括可以 InjectJS 等 JS 注入工具,来方便 Agnet 来查找网页元素和点击按钮等等 这个当前的版本是在 Windows 上编译的,需要 Nvidia CUDA 的支持 我会随后更新还在测试中的 M 系列的 Mac 版本 当前使用 4B thinking 模型作为默认模型的目的是可以在本地上跑到快速的 token / s 方便使用 Agentic workflow. 我测试使用的 Win11+Nvidia 4090 可以跑到大概 140 tps. 在 M4 mac 上使用 Metal 后段大概在 50 tps 左右

IT之家 · 2026-05-31 23:09:52+08:00 · tech

IT之家 5 月 31 日消息,微星今天宣布推出 MEG Vision X2 AI+ 台式整机, 号称是“全球首款自带 Agentic AI 伴侣的游戏台式机” 。 IT之家在此援引官方新闻稿,MEG Vision X2 AI+ 引入了微星自研 Agentic AI(代理式人工智能)助手“LuckyClaw”,让用户能够通过自然语言语音指令,完成切换性能模式、调整显示器设置、控制 RGB 灯效等操作。官方将在未来不断更新 Skill,提供更加丰富的体验。 同时, 这款台式机的正面还带有 AI Holostage 全息显示器 , 可将数字助理 、 桌宠和第三方 AI 虚拟形象 , 以更具沉浸感的形式跃然眼前 。让 AI 不只是屏幕上的软件,而是成为“突破次元壁”的互动伙伴。该机出厂时已预装 LuckyClaw,用户完成初始设置后可立即开始互动。 从官方的宣传图来看,这款台式机将配备英特尔酷睿 Ultra 处理器、英伟达 RTX 显卡,不过具体配置暂未公开。

LinuxDo 最新话题 · 2026-05-27 18:56:56+08:00 · tech

Claude code似乎更强调专门优化的agentic coding能力,一些其他模型不需要系统提示词也能很好地完成工作,但记忆力这一块仍旧拉。 也有一些很好的项目,比如snow Cli、vcptoolbox(解决记忆力的痛点)。但感觉还是依赖底层模型能力,走的还是“模型+提示词工程”的路线,虽然有些项目在试图把“依赖模型能力”这个天花板尽量往上顶,但架不住一些模型实在太拉了,不太遵循指令 纯路边一条人的见解[狗头保命.png] 2 个帖子 - 2 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-25 17:11:00+08:00 · tech

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 项目地址: GitHub - Fioooooooo/FylloCode: A desktop app that turns Coding Agents into reliable teammates — by splitting every change into Task → Proposal → Apply → Archive, with you reviewing the plan before any code is written. · GitHub 为什么要做 FylloCode? 我从去年春天开始逐渐放弃古法编程,尝试拥抱新的变化 —— Vibe Coding。确实,Vibe 起来很令人着迷,它大大降低了行业门槛,能让这项专业技术变得唾手可得。但是作为企业级应用的开发,它还远远不够。最近一段时间,我一直在考虑我们这个行业的未来,以及我们这群从业者作为漩涡正中心未来该何去何从。 我们是不是要被 LLM 替代了?我们这么多年积攒的工作经验难道全部白费了么?Coding Agent 真的接手现实中的 Coding 工作后,行业是否会因为没有新生代血液的注入发生断档?后来我突然想明白了这件事,我们目前所经历的时代,就像前些年由移动互联网推动的新媒体时代,人人都是自媒体,但是专业的记者依然有更大的舞台。岗位不会消失,只是入行门槛变得更低。而我们作为专业从业者,其实没有被替代,只是在新技术的推动下,给我们提出了更高的要求。‍ 就像摄影师,我们每个人都有手机,各厂商号称几亿像素,加上各种修图软件,人人都是摄影师。但是摄影也有技术好坏,当我们需要专业场景的拍摄需求时,还是会主动去找专业的摄影师。 所以新的时代下,对我们的要求也更高了,真正需要我们处理的不再是重复的 Coding 工作,而是更高层级的业务理解、架构设计。行业也不会断档,虽然入行门槛低了,但是未来对于成为专业程序员的要求也会更高,要有更好的大局观和架构理念。新生代的程序员们想要变得专业,依然要通过一步一步的学习、摸索,掌握各种设计模式,才能成长为专业的程序员。 所以针对这些考虑,我开发了 FylloCode,把 Vibe Coding 变成 Agentic Coding。 未来我们的工作,更多的是接触业务,考虑架构设计,做好 Proposal 后,审查 Proposal,一边自动编码实现,一边考虑下一个 Proposal。 FylloCode 有哪些功能? FylloCode 不是"又一个 Coding Agent",它是对 Coding Agent 的增强。为了方便跟当前的 Coding Agent 做集成,采用 ACP 协议对接,所以只要你电脑上安装着 Coding Agent,并且它支持 ACP,就可以直接使用。 回顾了我的日常工作之后,发现一般可以分为三个大的阶段: 任务规划 → 任务实现 → 任务总结 。在调研了市面上诸多工作流后,我发现 OpenSpec 很符合这个想法,而且它还提供了很多扩展点。因此 FylloCode 直接内置 OpenSpec 作为基础工作流。 总的来讲,FylloCode 有以下几个核心功能: 基于 OpenSpec 的三阶段流程(Proposal - Apply - Archive),且支持扩展 Proposal 阶段中,FylloCode 会引导你把不清晰的需求逐步收拢为一份合理的 Proposal(比原版 OpenSpec 的 artifacts 更加清晰) Apply 阶段,按照 Proposal artifacts 落地开发 Archive 阶段,归档、提交,并合并回 main worktree 默认在 linked worktree 中进行工作,支持多个 linked worktree 并行开发 支持多聊天消息并行、多 Proposal 的 Apply 并行 受够了每天打开多个 terminal,一个跑 Claude Code,一个跑 Codex,还有 Kimi 和 Qoder,所以希望有一个统一的界面来驱动这些 Agent。后来发现了 ACP 协议,于是 FylloCode 以 ACP 协议驱动本地 Coding Agent。目前 ACP Registry 中已经支持了 35 款 Agent 支持自定义 workflow,可以通过多 stage 的工程化 workflow 驱动多个单 Agent。企业级应用开发不应该是黑盒。其实在 Workflow 的选择上,我还考虑了挺久,大体上有三个方向: 主 Agent 驱动多个子 Agent:考虑到 FylloCode 目前通过 ACP 与本地 Agent 通信,目前还不支持这种方式。而且现在市面上的子 Agent 一般还是负责单一的任务,比如代码库探索,用完即销毁。如果有问题的话,没办法第二次与子 Agent 通信。 Agent Teams:我觉得目前阶段看起来,Teams 更适合完全没有头绪的时候,给 Teams 一个命题,让它们直接产出一个结果。但是企业应用不应该是黑盒,每一个功能我们都需要仔细考虑之后再做实现 工程化方式以Workflow驱动多个单 Agent:这个是 FylloCode 最终选择的方案,它有几个好处 避免共享上下文,导致任务偏移,一错再错。因为每一个 Proposal 都是我们与 Agent 沟通后确定好的方案,所有 Agent 应该以 Proposal 为准 避免单一 Agent 同质化偏差,可以在 workflow 中每个 stage 使用不用的 Agent,避免 Agent 的 Harness 约束问题导致错误 避免单一模型同质化偏差,可以在 workflow 中每个 stage 使用不同的模型,避免由于模型训练预料的问题导致错误 多系统任务集成,目前已经支持本地任务和云效任务,未来会逐步集成更多任务平台。读取任务后,可以直接发起聊天,直到它成为合格的 Proposal 可能有佬友会对这种 API 方式集成有疑问,为什么不提供 skill,让 Agent 自动读取、自动执行。我的想法是我们穷哥们的 token 真的耗不起,API 集成速度快,而且不耗 token,好 token 要用在刀刃上 任务看板目前已经集成云效 定时任务即将上线 将工程规范沉淀为 guidelines,并在工作流中自动持续维护,无需人工干预 guidelines 是软约束,Agent 不一定完全遵守,所以 FylloCode 的健康检查会建立工程层面的硬约束(lint、test runner、git hooks、CI) 内置两个 MCP Server(由于 ACP 当前只有 MCP 形成了通用标准,所以 ACP 目前只提供了这种稳定增强的实现) fyllo-specs:内置 OpenSpec,结合 linked worktree 管理 fyllo-skills:内置 guidelines tool 未来的规划 FylloCode 的目标是提供一款专业的、适合企业应用的 Coding 工具,未来有以下一些方向的考虑 更多的 ACP Agent 控制,以及资源管理 集成更多企业内部工作流程 多人协作流程 数据多端同步 ACP 驱动云端 Agent,不依赖本地 放一些截图 7 个帖子 - 3 位参与者 阅读完整话题

V2EX - 技术 · 2026-05-23 18:13:54+08:00 · tech

3 个月前从 Antigravity 入坑 agentic 开发,后来转 claude code + codex ,一点踩过的坑和心得分享。 核心原则 约束优先 :剪枝,永远遵守 design → spec → plan → impl 的流程,要求提得越清楚,spec 越详细,后续越不容易上梁不正。 代码为王 :源码是给 agent 最好的说明书,不要迷信 JSON 、HTML 那些"代码可视化",agent 读代码比你强多了,为了让人类懂而把代码压缩成人类可读格式反而会误导 agent 。 仓库管理 :Git Repo 就是最好的记忆+上下文库,commit + PR 的设计不但有利于人类团队干活,也能很好地组织 agents 团队。想同步 memory 也是在 repo 根目录建一个 .memory/ 再加上 post-hook 就搞定的事,根本不需要额外的记忆管理。 菜就多练 :语言选择( Python, TS, Golang, Rust )、架构选择( Vue 、Flutter )、部署流( Docker 、K8S )、设计规范、迭代原则、工作流(需求 → schema → 接口约定 → 后端 → 前端 → E2E MVP )、网络排障、命令行指令、外语阅读能力这些“判断”并不能被 AI 取代(但可以让 AI 教你),老老实实学习, 不要迷信那些減少信息熵的花拳绣腿 。 踩过的一些坑、一些建议 权威文档只要存一份,並且写记忆和 agent 说要去哪读。一开始我建了文档 repo ,里面把 spec 、plan 、milestone 、schema 、api 全放进去,后来发现字段定义东一块西一块:有的在文档库,有的在代码,有的在项目 repo 自己的 docs/。后来我约定: 文档库只放项目全局的 overall spec 和给人类看的东西(例如我让 agent 给我整理 rust 名词对照表,方便我读懂 agent 写 rust 时做了啥」、spec 放项目自己的 docs/superpowers/、schema 定义只认 migration/*.sql ,接口定义只认代码。 cli 之间可以互相呼叫,例如 claude code 主驾可以 call gh 来管 PR 和 merge , codex 来审代码, supabase db query --linked 来查改数据库, fly 看服务器 log 等。 claude code 有时会不小心创造接口,除了写记忆让它记得复用接口以外,也要自己多留心眼,尤其是项目变大了,有些逻辑要用前端中间件查、有些逻辑要用后端接口时,cc 不一定能猜得准你的意图。 除了 superpowers 和 gstack 等 skill 之外,如果不确定自己的需求怎么实现,可以先和网页 LLM (例如 ChatGPT 、Grok )讨论,让它生成 prompt 丢给 cc 跑 brainstorming ,会比直接大白话咏唱强。