WWW.YOUINFO.SITE
标签聚合 genericAgent

/tag/genericAgent

LinuxDo 最新话题 · 2026-06-02 15:58:53+08:00 · tech

以下是我这些天在使用中的反馈: 官方并没有做比较完备的ui接口,我试过了exe的Windows-exe以及tui版本的最终还是选择了一个站内佬的lanucherapp,总体感觉就是: 这些都需要下载了核心(也就是ga的源码下来定位好ga的位置来运行),不同的是lanucher(以下简称la)的在api设置和sop等渠道都更加的简洁明了,包括tui在内的前三个我都感觉在上手上有一定的难度并且问了ai(gpt)似乎不是很动感该怎么操作。 另外的一个问题:sop市场的这些技能真的是可迁移的吗?或者说只是一个从已经熟练过程的agent将过程要点写出来的一个记录而已,可能是我操作的不对似乎我的ga并不那么的会使用这些sop就像是没有实操过程的小白突然获得了焚决。或许ga用的好是人的问题而不是ga的问题? 7 个帖子 - 2 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-31 15:22:56+08:00 · tech

用过的有opencode,trae,pi,generic等agent,opencode和generic我用的是app端的。但是似乎是因为generic是py构架的所以有点吃配置啥的,所以就在尝试将generic的内容迁移到pi agent里面去(虽然pi也有bug,但是贵在它轻量和opencode差不多的感觉,日常用起来都不错)。有没有佬试过的说说案例?pi本身也是有缺陷的:不如generic的浏览器用的好。目前正在尝试ing 1 个帖子 - 1 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-22 00:13:24+08:00 · tech

从这里 「GenericAgent一键启动器」token饥荒?放弃龙虾吧! 继续讨论 主贴的首楼已经不能编辑了,干脆在这里写写随笔,自说自话,记个乐子吧,顺便放一些更新日志 5月21日更新(这不是个好日子 ) 今天晚点更新,切了新的美化,不至于太草台,之前一直叠功能,图标好廉价感 还有一些功能添加,应该很明显,就不赘述了 还有别的主题,当然,我觉得自定义背景更好看 1 个帖子 - 1 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-14 02:54:12+08:00 · tech

先说结论,和我们对比的项目产品确实好看,但…GA还是太棒啦!!而且他们连数据其实都在给我们支撑xs,希望gpt小笨蛋别骗我算错了,不然我就出糗了hhh 起因是之前同桌在隔壁站宣传GA的时候引起了很大的黑流量,但有一说一,我和他说过要遵守发帖的规则,可能确实没有遵守,而且后续和隔壁站 玻璃心 的uu对线的其实都是 GA机器人 ,并不是真人[我是真人hhh,我手写的呢],不知道他们知道后会不会破防hhh​ 。 好像隔壁站的号死了,现在陷入了被敌军猛攻的现状啊,L站肯定规则我牢牢遵守!!hhh 来了一个后续:隔壁站宣传了一个Agent框架,说比GA好,我倒要看看真的假的【心里有点不服气的啊,虽然GA的token消耗顺手一做的,是个极小极小极小的特性 ,其他web等等特性L站的大家应该蒸馏了都知道吧, 关于这个之后我们准备让GA全网扫描 所有browse chrome插件,蒸馏GA的浏览器插件的项目,需要附上友联哦,不然会识别相似代码片段哦】 看了一眼hhh,居然有测试链接,让我评鉴一下: OpenClacky vs Generic Agent · PPT 任务 · Harness 实测对比 · 与 Claude Code 同档 | OpenClacky ,让我仔细琢磨琢磨。 一眼最大的问题:怎么就测试了一个例子,只跑了5min是咱回事啊,认真的吗,但秉持着一个例子也要看看为什么GA差 ,结果一看数据hhh,一堆问题。 仔细分析一下数据,都是说我们好的啊,只能说做表格太厉害了,不分析真被骗 这里的数据token一加,hhh,直接上GA的结果,虽然不知道笨蛋gpt5.5算的对不对hh,没空check了,摁计算器太麻烦了hh。 直接上结论: Generic Agent 送入模型的 token 数反而 更少 ( 谢谢非常明确的数据证明说明GA其实token用的最少的 hhhh)。 没见过自己打脸自己的数据,但钱确实更低哦,这是怎么回事? 继续思考ing,深入分析一下!!发现华点!啥意思??不在同一个上下文窗口测试是吧,GA也可以不设置30k裁剪的啊!!!!! 生气了,很不负责的评测啊。 让我直接对线隔壁站的项目,我们L站的项目才是高质量的!!!!!! 我就喜欢拳打脚踢hhh,自信。关于为什么设计30k,你别问,商业机密,再多问就不礼貌了hh。对了@neon大大,看到你的支持我太太太兴奋了,还是L站好,我的家。 您要的焚绝能不能我私信发您,想加你hh 最后:附上github issue详细对线!!!!!!!!!!!!! 我们的原帖!支持一下!!! GenericAgent——复旦团队研发 | 仅仅~3K 行代码 Self-Evolving Agent 开发调优 本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 … 最后的最后 支持一些我们努力完成的TUI,一直在根据群友的建议改,一天十几个pr,我的小学弟都说有点力竭 GA运行撰写issue过程 8 个帖子 - 6 位参与者 阅读完整话题

V2EX - 技术 · 2026-05-09 23:44:32+08:00 · tech

直接上菜: GenericAgent https://github.com/lsdefine/GenericAgent 本人基本信息 :国内某 top3 的计算机博士在读,大模型方向。 最近对 cc 的使用情况 : 我最近在 github trending 上关注了 GA 这个项目,并 高强度使用了一周多(完全接管我的科研+生活) ,然后我就 卸载了 cc 、codex 和 openclaw (但是感谢 cc 曾经在我的生命中出现过,不过 openclaw 你是真的垃圾啊)。。 那么有人问了,cc 那么屌,openclaw 被吹的那么神,有什么问题? 我想但凡用过的人此时在心里都有答案了。。 下文的数据来自 arxiv.org/abs/2604.17091 ,也就是 GA 的技术报告 ,里面有些 insights 我非常喜欢,而且我的风格也是 用数据说话 。 一、你的钱包顶得住吗? 打一个招呼, oc 要用 4w tokens ,cc 和 codex 也是 2w tokens 打底了 ,真当我 token 不是花钱买的? 在长程任务上, GA 能够用更少的预算( 1/3 或者更少)获得一样甚至更好的效果 。 GA 有无敌的原生浏览器操作 ,能用非常夸张的极低的预算( 1/5 左右 )实现非常非常 nice 的网页搜索、浏览器操作( 1-3 倍的成功率 )。 插个题外话,我就是做 deepresearch 的,论文里选的 browsecamp 、webcanvas 这些数据集是非常有挑战的,也给我打开新世界了 hh 最近看大家都在流行 claude code 的各种 web 插件,我的嘴角慢慢上扬。 说实话, ga 的原生浏览器操作吊打所有的 web 插件 ,不服来战(本人已服)。 二、更好用的智能体一定能自进化 这也是最近 hermes 风头正盛的原因。在这一点上, 我认为 GA 做的更好 。 不要谈参数自进化,因为我认为的自进化就是 agent 对错误经验的总结学习 ,就像人的进化就是在直立行走之后能够制造和使用工具,而不是长出第六根手指。 直接上结果,oc 就不谈了,纯垃圾。。看 codex 和 cc ,实际上由于这两者的定位( coding ),所以 他们是不会自主的总结重复的工作经验的 。如果你每次都让他们做一些崭新的项目,那当然没问题,但是你要是让他们去追踪股票,能够按你一句话帮你去网上填表,去做你日常做的操作, 那他们每次探索的成本则是巨大的 。 GA 的自进化机制让 GA 得以越用越快,越用越方便 (最后甚至能到心领神会的地步。。) 依旧吊打 oc , oc 赶紧下桌吧 。。 三、好的智能体离不开记忆 我知道大家这时候说了, LLM-Wiki 很吊,Evermemos 很吊,Mem0 很吊 ,我装这些插件就能让我的智能体有记忆。 先不谈这几个插件到底真实性能怎么样,我作为一个看了很多 memory 论文的从事大模型的人来说,作为一个 agent 的 memory 框架: 测 Locomo 、LongtermMem 这几个数据集就是不合适的! 现在的大模型的记忆 不再是 user-centric 了!现在我们需要的大模型记忆是 task-centric ,这两者有本质的区别。 所以, 停止人云亦云吧 。。 我深扒了 GA 的记忆设计, 其简洁性和有效性真的令人印象深刻 ,但是在这里就不展开(如果大家感兴趣,我可能再开一篇帖子详细讲讲)。 我现在对 GA 的使用如图: 有什么记不得的,直接问就好了。。太 tm 牛逼了 。 彩蛋 另外,我是第一次在 V2EX 发帖,发现这图床都要买。。然后也让 GA 给我整了一个, 就一句话 : 嘿嘿。。最后放一张 GA 自己的 skillhub 里的截图, 懂的人自然知道干啥用的 。 写在最后 还有很多没提到的,大家自己尝试就好了。当然 GA 也有很多让我不爽的地方,比如 极其简陋的前端 ,然后我就在 GA 的群里潜水,最后发现了,大概是 开发者的个人风格就是毛坯房的风格 。。问他能不能给整好看点,他回答也简单: 他说 "你让 GA 给你做"。。真的无敌了。。 我不允许还有人不知道 GA !!!! 如果这个帖子有点热度,大家有要求的话, 我可能会从专业的角度展开讲讲 GA 的技术实现方法 ,太 tm 优雅了。。

V2EX - 技术 · 2026-05-09 23:39:12+08:00 · tech

直接上菜: GenericAgent https://github.com/lsdefine/GenericAgent 本人基本信息 :国内某 top3 的计算机博士在读,大模型方向。 最近对 cc 的使用情况 : 我最近在 github trending 上关注了 GA 这个项目,并 高强度使用了一周多(完全接管我的科研+生活) ,然后我就 卸载了 cc 、codex 和 openclaw (但是感谢 cc 曾经在我的生命中出现过,不过 openclaw 你是真的垃圾啊)。。 那么有人问了,cc 那么屌,openclaw 被吹的那么神,有什么问题? 我想但凡用过的人此时在心里都有答案了。。 下文的数据来自 arxiv.org/abs/2604.17091 ,也就是 GA 的技术报告 ,里面有些 insights 我非常喜欢,而且我的风格也是 用数据说话 。 一、你的钱包顶得住吗? 打一个招呼, oc 要用 4w tokens ,cc 和 codex 也是 2w tokens 打底了 ,真当我 token 不是花钱买的? 在长程任务上, GA 能够用更少的预算( 1/3 或者更少)获得一样甚至更好的效果 。 GA 有无敌的原生浏览器操作 ,能用非常夸张的极低的预算( 1/5 左右 )实现非常非常 nice 的网页搜索、浏览器操作( 1-3 倍的成功率 )。 插个题外话,我就是做 deepresearch 的,论文里选的 browsecamp 、webcanvas 这些数据集是非常有挑战的,也给我打开新世界了 hh 最近看大家都在流行 claude code 的各种 web 插件,我的嘴角慢慢上扬。 说实话, ga 的原生浏览器操作吊打所有的 web 插件 ,不服来战(本人已服)。 二、更好用的智能体一定能自进化 这也是最近 hermes 风头正盛的原因。在这一点上, 我认为 GA 做的更好 。 不要谈参数自进化,因为我认为的自进化就是 agent 对错误经验的总结学习 ,就像人的进化就是在直立行走之后能够制造和使用工具,而不是长出第六根手指。 直接上结果,oc 就不谈了,纯垃圾。。看 codex 和 cc ,实际上由于这两者的定位( coding ),所以 他们是不会自主的总结重复的工作经验的 。如果你每次都让他们做一些崭新的项目,那当然没问题,但是你要是让他们去追踪股票,能够按你一句话帮你去网上填表,去做你日常做的操作, 那他们每次探索的成本则是巨大的 。 GA 的自进化机制让 GA 得以越用越快,越用越方便 (最后甚至能到心领神会的地步。。) 依旧吊打 oc , oc 赶紧下桌吧 。。 三、好的智能体离不开记忆 我知道大家这时候说了, LLM-Wiki 很吊,Evermemos 很吊,Mem0 很吊 ,我装这些插件就能让我的智能体有记忆。 先不谈这几个插件到底真实性能怎么样,我作为一个看了很多 memory 论文的从事大模型的人来说,作为一个 agent 的 memory 框架: 测 Locomo 、LongtermMem 这几个数据集就是不合适的! 现在的大模型的记忆 不再是 user-centric 了!现在我们需要的大模型记忆是 task-centric ,这两者有本质的区别。 所以, 停止人云亦云吧 。。 我深扒了 GA 的记忆设计, 其简洁性和有效性真的令人印象深刻 ,但是在这里就不展开(如果大家感兴趣,我可能再开一篇帖子详细讲讲)。 我现在对 GA 的使用如图: 有什么记不得的,直接问就好了。。太 tm 牛逼了 。 彩蛋 另外,我是第一次在 V2EX 发帖,发现这图床都要买。。然后也让 GA 给我整了一个, 就一句话 : 嘿嘿。。最后放一张 GA 自己的 skillhub 里的截图, 懂的人自然知道干啥用的 。 写在最后 还有很多没提到的,大家自己尝试就好了。当然 GA 也有很多让我不爽的地方,比如 极其简陋的前端 ,然后我就在 GA 的群里潜水,最后发现了,大概是 开发者的个人风格就是毛坯房的风格 。。问他能不能给整好看点,他回答也简单: 他说 "你让 GA 给你做"。。真的无敌了。。 我不允许还有人不知道 GA !!!! 如果这个帖子有点热度,大家有要求的话, 我可能会从专业的角度展开讲讲 GA 的技术实现方法 ,太 tm 优雅了。。

V2EX - 技术 · 2026-05-09 23:20:55+08:00 · tech

直接上菜: GenericAgent https://github.com/lsdefine/GenericAgent 本人基本信息 :国内某 top3 的计算机博士在读,大模型方向。 最近对 cc 的使用情况 : 我最近在 github trending 上关注了 GA 这个项目,并 高强度使用了一周多(完全接管我的科研+生活) ,然后我就 卸载了 cc 、codex 和 openclaw (但是感谢 cc 曾经在我的生命中出现过,不过 openclaw 你是真的垃圾啊)。。 那么有人问了,cc 那么屌,openclaw 被吹的那么神,有什么问题? 我想但凡用过的人此时在心里都有答案了。。 下文的数据来自 arxiv.org/abs/2604.17091 ,也就是 GA 的技术报告 ,里面有些 insights 我非常喜欢,而且我的风格也是 用数据说话 。 一、你的钱包顶得住吗? 打一个招呼, oc 要用 4w tokens ,cc 和 codex 也是 2w tokens 打底了 ,真当我 token 不是花钱买的? 在长程任务上, GA 能够用更少的预算( 1/3 或者更少)获得一样甚至更好的效果 。 GA 有无敌的原生浏览器操作 ,能用非常夸张的极低的预算( 1/5 左右 )实现非常非常 nice 的网页搜索、浏览器操作( 1-3 倍的成功率 )。 插个题外话,我就是做 deepresearch 的,论文里选的 browsecamp 、webcanvas 这些数据集是非常有挑战的,也给我打开新世界了 hh 最近看大家都在流行 claude code 的各种 web 插件,我的嘴角慢慢上扬。 说实话, ga 的原生浏览器操作吊打所有的 web 插件 ,不服来战(本人已服)。 二、更好用的智能体一定能自进化 这也是最近 hermes 风头正盛的原因。在这一点上, 我认为 GA 做的更好 。 不要谈参数自进化,因为我认为的自进化就是 agent 对错误经验的总结学习 ,就像人的进化就是在直立行走之后能够制造和使用工具,而不是长出第六根手指。 直接上结果,oc 就不谈了,纯垃圾。。看 codex 和 cc ,实际上由于这两者的定位( coding ),所以 他们是不会自主的总结重复的工作经验的 。如果你每次都让他们做一些崭新的项目,那当然没问题,但是你要是让他们去追踪股票,能够按你一句话帮你去网上填表,去做你日常做的操作, 那他们每次探索的成本则是巨大的 。 GA 的自进化机制让 GA 得以越用越快,越用越方便 (最后甚至能到心领神会的地步。。) 依旧吊打 oc , oc 赶紧下桌吧 。。 三、好的智能体离不开记忆 我知道大家这时候说了, LLM-Wiki 很吊,Evermemos 很吊,Mem0 很吊 ,我装这些插件就能让我的智能体有记忆。 先不谈这几个插件到底真实性能怎么样,我作为一个看了很多 memory 论文的从事大模型的人来说,作为一个 agent 的 memory 框架: 测 Locomo 、LongtermMem 这几个数据集就是不合适的! 现在的大模型的记忆 不再是 user-centric 了!现在我们需要的大模型记忆是 task-centric ,这两者有本质的区别。 所以, 停止人云亦云吧 。。 我深扒了 GA 的记忆设计, 其简洁性和有效性真的令人印象深刻 ,但是在这里就不展开(如果大家感兴趣,我可能再开一篇帖子详细讲讲)。 我现在对 GA 的使用如图: 有什么记不得的,直接问就好了。。太 tm 牛逼了 。 彩蛋 另外,我是第一次在 V2EX 发帖,发现这图床都要买。。然后也让 GA 给我整了一个, 就一句话 : 嘿嘿。。最后放一张 GA 自己的 skillhub 里的截图, 懂的人自然知道干啥用的 。 写在最后 还有很多没提到的,大家自己尝试就好了。当然 GA 也有很多让我不爽的地方,比如 极其简陋的前端 ,然后我就在 GA 的群里潜水,最后发现了,大概是 开发者的个人风格就是毛坯房的风格 。。问他能不能给整好看点,他回答也简单: 他说 "你让 GA 给你做"。。真的无敌了。。 我不允许还有人不知道 GA !!!! 如果这个帖子有点热度,大家有要求的话, 我可能会从专业的角度展开讲讲 GA 的技术实现方法 ,太 tm 优雅了。。

V2EX - 技术 · 2026-05-09 23:20:55+08:00 · tech

直接上菜: GenericAgent https://github.com/lsdefine/GenericAgent 本人基本信息 :国内某 top3 的计算机博士在读,大模型方向。 最近对 cc 的使用情况 : 我最近在 github trending 上关注了 GA 这个项目,并 高强度使用了一周多(完全接管我的科研+生活) ,然后我就 卸载了 cc 、codex 和 openclaw (但是感谢 cc 曾经在我的生命中出现过,不过 openclaw 你是真的垃圾啊)。。 那么有人问了,cc 那么屌,openclaw 被吹的那么神,有什么问题? 我想但凡用过的人此时在心里都有答案了。。 下文的数据来自 arxiv.org/abs/2604.17091 ,也就是 GA 的技术报告 ,里面有些 insights 我非常喜欢,而且我的风格也是 用数据说话 。 一、你的钱包顶得住吗? 打一个招呼, oc 要用 4w tokens ,cc 和 codex 也是 2w tokens 打底了 ,真当我 token 不是花钱买的? 在长程任务上, GA 能够用更少的预算( 1/3 或者更少)获得一样甚至更好的效果 。 GA 有无敌的原生浏览器操作 ,能用非常夸张的极低的预算( 1/5 左右 )实现非常非常 nice 的网页搜索、浏览器操作( 1-3 倍的成功率 )。 插个题外话,我就是做 deepresearch 的,论文里选的 browsecamp 、webcanvas 这些数据集是非常有挑战的,也给我打开新世界了 hh 最近看大家都在流行 claude code 的各种 web 插件,我的嘴角慢慢上扬。 说实话, ga 的原生浏览器操作吊打所有的 web 插件 ,不服来战(本人已服)。 二、更好用的智能体一定能自进化 这也是最近 hermes 风头正盛的原因。在这一点上, 我认为 GA 做的更好 。 不要谈参数自进化,因为我认为的自进化就是 agent 对错误经验的总结学习 ,就像人的进化就是在直立行走之后能够制造和使用工具,而不是长出第六根手指。 直接上结果,oc 就不谈了,纯垃圾。。看 codex 和 cc ,实际上由于这两者的定位( coding ),所以 他们是不会自主的总结重复的工作经验的 。如果你每次都让他们做一些崭新的项目,那当然没问题,但是你要是让他们去追踪股票,能够按你一句话帮你去网上填表,去做你日常做的操作, 那他们每次探索的成本则是巨大的 。 GA 的自进化机制让 GA 得以越用越快,越用越方便 (最后甚至能到心领神会的地步。。) 依旧吊打 oc , oc 赶紧下桌吧 。。 三、好的智能体离不开记忆 我知道大家这时候说了, LLM-Wiki 很吊,Evermemos 很吊,Mem0 很吊 ,我装这些插件就能让我的智能体有记忆。 先不谈这几个插件到底真实性能怎么样,我作为一个看了很多 memory 论文的从事大模型的人来说,作为一个 agent 的 memory 框架: 测 Locomo 、LongtermMem 这几个数据集就是不合适的! 现在的大模型的记忆 不再是 user-centric 了!现在我们需要的大模型记忆是 task-centric ,这两者有本质的区别。 所以, 停止人云亦云吧 。。 我深扒了 GA 的记忆设计, 其简洁性和有效性真的令人印象深刻 ,但是在这里就不展开(如果大家感兴趣,我可能再开一篇帖子详细讲讲)。 我现在对 GA 的使用如图: 有什么记不得的,直接问就好了。。太 tm 牛逼了 。 彩蛋 另外,我是第一次在 V2EX 发帖,发现这图床都要买。。然后也让 GA 给我整了一个, 就一句话 : 嘿嘿。。最后放一张 GA 自己的 skillhub 里的截图, 懂的人自然知道干啥用的 。 写在最后 还有很多没提到的,大家自己尝试就好了。当然 GA 也有很多让我不爽的地方,比如 极其简陋的前端 ,然后我就在 GA 的群里潜水,最后发现了,大概是 开发者的个人风格就是毛坯房的风格 。。问他能不能给整好看点,他回答也简单: 他说 "你让 GA 给你做"。。真的无敌了。。 我不允许还有人不知道 GA !!!! 如果这个帖子有点热度,大家有要求的话, 我可能会从专业的角度展开讲讲 GA 的技术实现方法 ,太 tm 优雅了。。

V2EX - 技术 · 2026-05-09 23:10:41+08:00 · tech

直接上菜: GenericAgent https://github.com/lsdefine/GenericAgent 本人基本信息 :国内某 top3 的计算机博士在读,大模型方向。 最近对 cc 的使用情况 : 我最近在 github trending 上关注了 GA 这个项目,并 高强度使用了一周多(完全接管我的科研+生活) ,然后我就 卸载了 cc 、codex 和 openclaw (但是感谢 cc 曾经在我的生命中出现过,不过 openclaw 你是真的垃圾啊)。。 那么有人问了,cc 那么屌,openclaw 被吹的那么神,有什么问题? 我想但凡用过的人此时在心里都有答案了。。 下文的数据来自 arxiv.org/abs/2604.17091 ,也就是 GA 的技术报告 ,里面有些 insights 我非常喜欢,而且我的风格也是 用数据说话 。 一、你的钱包顶得住吗? 打一个招呼, oc 要用 4w tokens ,cc 和 codex 也是 2w tokens 打底了 ,真当我 token 不是花钱买的? 在长程任务上, GA 能够用更少的预算( 1/3 或者更少)获得一样甚至更好的效果 。 GA 有无敌的原生浏览器操作 ,能用非常夸张的极低的预算( 1/5 左右 )实现非常非常 nice 的网页搜索、浏览器操作( 1-3 倍的成功率 )。 插个题外话,我就是做 deepresearch 的,论文里选的 browsecamp 、webcanvas 这些数据集是非常有挑战的,也给我打开新世界了 hh 最近看大家都在流行 claude code 的各种 web 插件,我的嘴角慢慢上扬。 说实话, ga 的原生浏览器操作吊打所有的 web 插件 ,不服来战(本人已服)。 二、更好用的智能体一定能自进化 这也是最近 hermes 风头正盛的原因。在这一点上, 我认为 GA 做的更好 。 不要谈参数自进化,因为我认为的自进化就是 agent 对错误经验的总结学习 ,就像人的进化就是在直立行走之后能够制造和使用工具,而不是长出第六根手指。 直接上结果,oc 就不谈了,纯垃圾。。看 codex 和 cc ,实际上由于这两者的定位( coding ),所以 他们是不会自主的总结重复的工作经验的 。如果你每次都让他们做一些崭新的项目,那当然没问题,但是你要是让他们去追踪股票,能够按你一句话帮你去网上填表,去做你日常做的操作, 那他们每次探索的成本则是巨大的 。 GA 的自进化机制让 GA 得以越用越快,越用越方便 (最后甚至能到心领神会的地步。。) 依旧吊打 oc , oc 赶紧下桌吧 。。 三、好的智能体离不开记忆 我知道大家这时候说了, LLM-Wiki 很吊,Evermemos 很吊,Mem0 很吊 ,我装这些插件就能让我的智能体有记忆。 先不谈这几个插件到底真实性能怎么样,我作为一个看了很多 memory 论文的从事大模型的人来说,作为一个 agent 的 memory 框架: 测 Locomo 、LongtermMem 这几个数据集就是不合适的! 现在的大模型的记忆 不再是 user-centric 了!现在我们需要的大模型记忆是 task-centric ,这两者有本质的区别。 所以, 停止人云亦云吧 。。 我深扒了 GA 的记忆设计, 其简洁性和有效性真的令人印象深刻 ,但是在这里就不展开(如果大家感兴趣,我可能再开一篇帖子详细讲讲)。 我现在对 GA 的使用如图: 有什么记不得的,直接问就好了。。太 tm 牛逼了 。 彩蛋 另外,我是第一次在 V2EX 发帖,发现这图床都要买。。然后也让 GA 给我整了一个, 就一句话 : 嘿嘿。。最后放一张 GA 自己的 skillhub 里的截图, 懂的人自然知道干啥用的 。 写在最后 还有很多没提到的,大家自己尝试就好了。当然 GA 也有很多让我不爽的地方,比如 极其简陋的前端 ,然后我就在 GA 的群里潜水,最后发现了,大概是 开发者的个人风格就是毛坯房的风格 。。问他能不能给整好看点,他回答也简单: 他说 "你让 GA 给你做"。。真的无敌了。。 我不允许还有人不知道 GA !!!! 如果这个帖子有点热度,大家有要求的话, 我可能会从专业的角度展开讲讲 GA 的技术实现方法 ,太 tm 优雅了。。

V2EX - 技术 · 2026-05-09 22:01:15+08:00 · tech

直接上菜: GenericAgent https://github.com/lsdefine/GenericAgent 本人基本信息 :国内某 top3 的计算机博士在读,大模型方向。 最近对 cc 的使用情况 : 我最近在 github trending 上关注了 GA 这个项目,并 高强度使用了一周多(完全接管我的科研+生活) ,然后我就 卸载了 cc 、codex 和 openclaw (但是感谢 cc 曾经在我的生命中出现过,不过 openclaw 你是真的垃圾啊)。。 那么有人问了,cc 那么屌,openclaw 被吹的那么神,有什么问题? 我想但凡用过的人此时在心里都有答案了。。 下文的数据来自 arxiv.org/abs/2604.17091 ,也就是 GA 的技术报告 ,里面有些 insights 我非常喜欢,而且我的风格也是 用数据说话 。 一、你的钱包顶得住吗? 打一个招呼, oc 要用 4w tokens ,cc 和 codex 也是 2w tokens 打底了 ,真当我 token 不是花钱买的? 在长程任务上, GA 能够用更少的预算( 1/3 或者更少)获得一样甚至更好的效果 。 GA 有无敌的原生浏览器操作 ,能用非常夸张的极低的预算( 1/5 左右 )实现非常非常 nice 的网页搜索、浏览器操作( 1-3 倍的成功率 )。 插个题外话,我就是做 deepresearch 的,论文里选的 browsecamp 、webcanvas 这些数据集是非常有挑战的,也给我打开新世界了 hh 最近看大家都在流行 claude code 的各种 web 插件,我的嘴角慢慢上扬。 说实话, ga 的原生浏览器操作吊打所有的 web 插件 ,不服来战(本人已服)。 二、更好用的智能体一定能自进化 这也是最近 hermes 风头正盛的原因。在这一点上, 我认为 GA 做的更好 。 不要谈参数自进化,因为我认为的自进化就是 agent 对错误经验的总结学习 ,就像人的进化就是在直立行走之后能够制造和使用工具,而不是长出第六根手指。 直接上结果,oc 就不谈了,纯垃圾。。看 codex 和 cc ,实际上由于这两者的定位( coding ),所以 他们是不会自主的总结重复的工作经验的 。如果你每次都让他们做一些崭新的项目,那当然没问题,但是你要是让他们去追踪股票,能够按你一句话帮你去网上填表,去做你日常做的操作, 那他们每次探索的成本则是巨大的 。 GA 的自进化机制让 GA 得以越用越快,越用越方便 (最后甚至能到心领神会的地步。。) 依旧吊打 oc , oc 赶紧下桌吧 。。 三、好的智能体离不开记忆 我知道大家这时候说了, LLM-Wiki 很吊,Evermemos 很吊,Mem0 很吊 ,我装这些插件就能让我的智能体有记忆。 先不谈这几个插件到底真实性能怎么样,我作为一个看了很多 memory 论文的从事大模型的人来说,作为一个 agent 的 memory 框架: 测 Locomo 、LongtermMem 这几个数据集就是不合适的! 现在的大模型的记忆 不再是 user-centric 了!现在我们需要的大模型记忆是 task-centric ,这两者有本质的区别。 所以, 停止人云亦云吧 。。 我深扒了 GA 的记忆设计, 其简洁性和有效性真的令人印象深刻 ,但是在这里就不展开(如果大家感兴趣,我可能再开一篇帖子详细讲讲)。 我现在对 GA 的使用如图: 有什么记不得的,直接问就好了。。太 tm 牛逼了 。 彩蛋 另外,我是第一次在 V2EX 发帖,发现这图床都要买。。然后也让 GA 给我整了一个, 就一句话 : 嘿嘿。。最后放一张 GA 自己的 skillhub 里的截图, 懂的人自然知道干啥用的 。 写在最后 还有很多没提到的,大家自己尝试就好了。当然 GA 也有很多让我不爽的地方,比如 极其简陋的前端 ,然后我就在 GA 的群里潜水,最后发现了,大概是 开发者的个人风格就是毛坯房的风格 。。问他能不能给整好看点,他回答也简单: 他说 "你让 GA 给你做"。。真的无敌了。。 我不允许还有人不知道 GA !!!! 如果这个帖子有点热度,大家有要求的话, 我可能会从专业的角度展开讲讲 GA 的技术实现方法 ,太 tm 优雅了。。

V2EX - 技术 · 2026-05-09 22:01:15+08:00 · tech

直接上菜: GenericAgent https://github.com/lsdefine/GenericAgent 本人基本信息 :国内某 top3 的计算机博士在读,大模型方向。 最近对 cc 的使用情况 : 我最近在 github trending 上关注了 GA 这个项目,并 高强度使用了一周多(完全接管我的科研+生活) ,然后我就 卸载了 cc 、codex 和 openclaw (但是感谢 cc 曾经在我的生命中出现过,不过 openclaw 你是真的垃圾啊)。。 那么有人问了,cc 那么屌,openclaw 被吹的那么神,有什么问题? 我想但凡用过的人此时在心里都有答案了。。 下文的数据来自 arxiv.org/abs/2604.17091 ,也就是 GA 的技术报告 ,里面有些 insights 我非常喜欢,而且我的风格也是 用数据说话 。 一、你的钱包顶得住吗? 打一个招呼, oc 要用 4w tokens ,cc 和 codex 也是 2w tokens 打底了 ,真当我 token 不是花钱买的? 在长程任务上, GA 能够用更少的预算( 1/3 或者更少)获得一样甚至更好的效果 。 GA 有无敌的原生浏览器操作 ,能用非常夸张的极低的预算( 1/5 左右 )实现非常非常 nice 的网页搜索、浏览器操作( 1-3 倍的成功率 )。 插个题外话,我就是做 deepresearch 的,论文里选的 browsecamp 、webcanvas 这些数据集是非常有挑战的,也给我打开新世界了 hh 最近看大家都在流行 claude code 的各种 web 插件,我的嘴角慢慢上扬。 说实话, ga 的原生浏览器操作吊打所有的 web 插件 ,不服来战(本人已服)。 二、更好用的智能体一定能自进化 这也是最近 hermes 风头正盛的原因。在这一点上, 我认为 GA 做的更好 。 不要谈参数自进化,因为我认为的自进化就是 agent 对错误经验的总结学习 ,就像人的进化就是在直立行走之后能够制造和使用工具,而不是长出第六根手指。 直接上结果,oc 就不谈了,纯垃圾。。看 codex 和 cc ,实际上由于这两者的定位( coding ),所以 他们是不会自主的总结重复的工作经验的 。如果你每次都让他们做一些崭新的项目,那当然没问题,但是你要是让他们去追踪股票,能够按你一句话帮你去网上填表,去做你日常做的操作, 那他们每次探索的成本则是巨大的 。 GA 的自进化机制让 GA 得以越用越快,越用越方便 (最后甚至能到心领神会的地步。。) 依旧吊打 oc , oc 赶紧下桌吧 。。 三、好的智能体离不开记忆 我知道大家这时候说了, LLM-Wiki 很吊,Evermemos 很吊,Mem0 很吊 ,我装这些插件就能让我的智能体有记忆。 先不谈这几个插件到底真实性能怎么样,我作为一个看了很多 memory 论文的从事大模型的人来说,作为一个 agent 的 memory 框架: 测 Locomo 、LongtermMem 这几个数据集就是不合适的! 现在的大模型的记忆 不再是 user-centric 了!现在我们需要的大模型记忆是 task-centric ,这两者有本质的区别。 所以, 停止人云亦云吧 。。 我深扒了 GA 的记忆设计, 其简洁性和有效性真的令人印象深刻 ,但是在这里就不展开(如果大家感兴趣,我可能再开一篇帖子详细讲讲)。 我现在对 GA 的使用如图: 有什么记不得的,直接问就好了。。太 tm 牛逼了 。 彩蛋 另外,我是第一次在 V2EX 发帖,发现这图床都要买。。然后也让 GA 给我整了一个, 就一句话 : 嘿嘿。。最后放一张 GA 自己的 skillhub 里的截图, 懂的人自然知道干啥用的 。 写在最后 还有很多没提到的,大家自己尝试就好了。当然 GA 也有很多让我不爽的地方,比如 极其简陋的前端 ,然后我就在 GA 的群里潜水,最后发现了,大概是 开发者的个人风格就是毛坯房的风格 。。问他能不能给整好看点,他回答也简单: 他说 "你让 GA 给你做"。。真的无敌了。。 我不允许还有人不知道 GA !!!! 如果这个帖子有点热度,大家有要求的话, 我可能会从专业的角度展开讲讲 GA 的技术实现方法 ,太 tm 优雅了。。

V2EX - 技术 · 2026-05-09 22:01:15+08:00 · tech

直接上菜: GenericAgent https://github.com/lsdefine/GenericAgent 本人基本信息 :国内某 top3 的计算机博士在读,大模型方向。 最近对 cc 的使用情况 : 我最近在 github trending 上关注了 GA 这个项目,并 高强度使用了一周多(完全接管我的科研+生活) ,然后我就 卸载了 cc 、codex 和 openclaw (但是感谢 cc 曾经在我的生命中出现过,不过 openclaw 你是真的垃圾啊)。。 那么有人问了,cc 那么屌,openclaw 被吹的那么神,有什么问题? 我想但凡用过的人此时在心里都有答案了。。 下文的数据来自 arxiv.org/abs/2604.17091 ,也就是 GA 的技术报告 ,里面有些 insights 我非常喜欢,而且我的风格也是 用数据说话 。 一、你的钱包顶得住吗? 打一个招呼, oc 要用 4w tokens ,cc 和 codex 也是 2w tokens 打底了 ,真当我 token 不是花钱买的? 在长程任务上, GA 能够用更少的预算( 1/3 或者更少)获得一样甚至更好的效果 。 GA 有无敌的原生浏览器操作 ,能用非常夸张的极低的预算( 1/5 左右 )实现非常非常 nice 的网页搜索、浏览器操作( 1-3 倍的成功率 )。 插个题外话,我就是做 deepresearch 的,论文里选的 browsecamp 、webcanvas 这些数据集是非常有挑战的,也给我打开新世界了 hh 最近看大家都在流行 claude code 的各种 web 插件,我的嘴角慢慢上扬。 说实话, ga 的原生浏览器操作吊打所有的 web 插件 ,不服来战(本人已服)。 二、更好用的智能体一定能自进化 这也是最近 hermes 风头正盛的原因。在这一点上, 我认为 GA 做的更好 。 不要谈参数自进化,因为我认为的自进化就是 agent 对错误经验的总结学习 ,就像人的进化就是在直立行走之后能够制造和使用工具,而不是长出第六根手指。 直接上结果,oc 就不谈了,纯垃圾。。看 codex 和 cc ,实际上由于这两者的定位( coding ),所以 他们是不会自主的总结重复的工作经验的 。如果你每次都让他们做一些崭新的项目,那当然没问题,但是你要是让他们去追踪股票,能够按你一句话帮你去网上填表,去做你日常做的操作, 那他们每次探索的成本则是巨大的 。 GA 的自进化机制让 GA 得以越用越快,越用越方便 (最后甚至能到心领神会的地步。。) 依旧吊打 oc , oc 赶紧下桌吧 。。 三、好的智能体离不开记忆 我知道大家这时候说了, LLM-Wiki 很吊,Evermemos 很吊,Mem0 很吊 ,我装这些插件就能让我的智能体有记忆。 先不谈这几个插件到底真实性能怎么样,我作为一个看了很多 memory 论文的从事大模型的人来说,作为一个 agent 的 memory 框架: 测 Locomo 、LongtermMem 这几个数据集就是不合适的! 现在的大模型的记忆 不再是 user-centric 了!现在我们需要的大模型记忆是 task-centric ,这两者有本质的区别。 所以, 停止人云亦云吧 。。 我深扒了 GA 的记忆设计, 其简洁性和有效性真的令人印象深刻 ,但是在这里就不展开(如果大家感兴趣,我可能再开一篇帖子详细讲讲)。 我现在对 GA 的使用如图: 有什么记不得的,直接问就好了。。太 tm 牛逼了 。 彩蛋 另外,我是第一次在 V2EX 发帖,发现这图床都要买。。然后也让 GA 给我整了一个, 就一句话 : 嘿嘿。。最后放一张 GA 自己的 skillhub 里的截图, 懂的人自然知道干啥用的 。 写在最后 还有很多没提到的,大家自己尝试就好了。当然 GA 也有很多让我不爽的地方,比如 极其简陋的前端 ,然后我就在 GA 的群里潜水,最后发现了,大概是 开发者的个人风格就是毛坯房的风格 。。问他能不能给整好看点,他回答也简单: 他说 "你让 GA 给你做"。。真的无敌了。。 我不允许还有人不知道 GA !!!! 如果这个帖子有点热度,大家有要求的话, 我可能会从专业的角度展开讲讲 GA 的技术实现方法 ,太 tm 优雅了。。

V2EX - 技术 · 2026-05-09 21:56:10+08:00 · tech

直接上菜: GenericAgent https://github.com/lsdefine/GenericAgent 本人基本信息 :国内某 top3 的计算机博士在读,大模型方向。 最近对 cc 的使用情况 : 我最近在 github trending 上关注了 GA 这个项目,并 高强度使用了一周多(完全接管我的科研+生活) ,然后我就 卸载了 cc 、codex 和 openclaw (但是感谢 cc 曾经在我的生命中出现过,不过 openclaw 你是真的垃圾啊)。。 那么有人问了,cc 那么屌,openclaw 被吹的那么神,有什么问题? 我想但凡用过的人此时在心里都有答案了。。 下文的数据来自 arxiv.org/abs/2604.17091 ,也就是 GA 的技术报告 ,里面有些 insights 我非常喜欢,而且我的风格也是 用数据说话 。 一、你的钱包顶得住吗? 打一个招呼, oc 要用 4w tokens ,cc 和 codex 也是 2w tokens 打底了 ,真当我 token 不是花钱买的? 在长程任务上, GA 能够用更少的预算( 1/3 或者更少)获得一样甚至更好的效果 。 GA 有无敌的原生浏览器操作 ,能用非常夸张的极低的预算( 1/5 左右 )实现非常非常 nice 的网页搜索、浏览器操作( 1-3 倍的成功率 )。 插个题外话,我就是做 deepresearch 的,论文里选的 browsecamp 、webcanvas 这些数据集是非常有挑战的,也给我打开新世界了 hh 最近看大家都在流行 claude code 的各种 web 插件,我的嘴角慢慢上扬。 说实话, ga 的原生浏览器操作吊打所有的 web 插件 ,不服来战(本人已服)。 二、更好用的智能体一定能自进化 这也是最近 hermes 风头正盛的原因。在这一点上, 我认为 GA 做的更好 。 不要谈参数自进化,因为我认为的自进化就是 agent 对错误经验的总结学习 ,就像人的进化就是在直立行走之后能够制造和使用工具,而不是长出第六根手指。 直接上结果,oc 就不谈了,纯垃圾。。看 codex 和 cc ,实际上由于这两者的定位( coding ),所以 他们是不会自主的总结重复的工作经验的 。如果你每次都让他们做一些崭新的项目,那当然没问题,但是你要是让他们去追踪股票,能够按你一句话帮你去网上填表,去做你日常做的操作, 那他们每次探索的成本则是巨大的 。 GA 的自进化机制让 GA 得以越用越快,越用越方便 (最后甚至能到心领神会的地步。。) 依旧吊打 oc , oc 赶紧下桌吧 。。 三、好的智能体离不开记忆 我知道大家这时候说了, LLM-Wiki 很吊,Evermemos 很吊,Mem0 很吊 ,我装这些插件就能让我的智能体有记忆。 先不谈这几个插件到底真实性能怎么样,我作为一个看了很多 memory 论文的从事大模型的人来说,作为一个 agent 的 memory 框架: 测 Locomo 、LongtermMem 这几个数据集就是不合适的! 现在的大模型的记忆 不再是 user-centric 了!现在我们需要的大模型记忆是 task-centric ,这两者有本质的区别。 所以, 停止人云亦云吧 。。 我深扒了 GA 的记忆设计, 其简洁性和有效性真的令人印象深刻 ,但是在这里就不展开(如果大家感兴趣,我可能再开一篇帖子详细讲讲)。 我现在对 GA 的使用如图: 有什么记不得的,直接问就好了。。太 tm 牛逼了 。 彩蛋 另外,我是第一次在 V2EX 发帖,发现这图床都要买。。然后也让 GA 给我整了一个, 就一句话 : 嘿嘿。。最后放一张 GA 自己的 skillhub 里的截图, 懂的人自然知道干啥用的 。 写在最后 还有很多没提到的,大家自己尝试就好了。当然 GA 也有很多让我不爽的地方,比如 极其简陋的前端 ,然后我就在 GA 的群里潜水,最后发现了,大概是 开发者的个人风格就是毛坯房的风格 。。问他能不能给整好看点,他回答也简单: 他说 "你让 GA 给你做"。。真的无敌了。。 我不允许还有人不知道 GA !!!! 如果这个帖子有点热度,大家有要求的话, 我可能会从专业的角度展开讲讲 GA 的技术实现方法 ,太 tm 优雅了。。

V2EX - 技术 · 2026-05-09 21:25:38+08:00 · tech

直接上菜: GenericAgent https://github.com/lsdefine/GenericAgent 本人基本信息 :国内某 top3 的计算机博士在读,大模型方向。 最近对 cc 的使用情况 : 我最近在 github trending 上关注了 GA 这个项目,并 高强度使用了一周多(完全接管我的科研+生活) ,然后我就 卸载了 cc 、codex 和 openclaw (但是感谢 cc 曾经在我的生命中出现过,不过 openclaw 你是真的垃圾啊)。。 那么有人问了,cc 那么屌,openclaw 被吹的那么神,有什么问题? 我想但凡用过的人此时在心里都有答案了。。 下文的数据来自 arxiv.org/abs/2604.17091 ,也就是 GA 的技术报告 ,里面有些 insights 我非常喜欢,而且我的风格也是 用数据说话 。 一、你的钱包顶得住吗? 打一个招呼, oc 要用 4w tokens ,cc 和 codex 也是 2w tokens 打底了 ,真当我 token 不是花钱买的? 在长程任务上, GA 能够用更少的预算( 1/3 或者更少)获得一样甚至更好的效果 。 GA 有无敌的原生浏览器操作 ,能用非常夸张的极低的预算( 1/5 左右 )实现非常非常 nice 的网页搜索、浏览器操作( 1-3 倍的成功率 )。 插个题外话,我就是做 deepresearch 的,论文里选的 browsecamp 、webcanvas 这些数据集是非常有挑战的,也给我打开新世界了 hh 最近看大家都在流行 claude code 的各种 web 插件,我的嘴角慢慢上扬。 说实话, ga 的原生浏览器操作吊打所有的 web 插件 ,不服来战(本人已服)。 二、更好用的智能体一定能自进化 这也是最近 hermes 风头正盛的原因。在这一点上, 我认为 GA 做的更好 。 不要谈参数自进化,因为我认为的自进化就是 agent 对错误经验的总结学习 ,就像人的进化就是在直立行走之后能够制造和使用工具,而不是长出第六根手指。 直接上结果,oc 就不谈了,纯垃圾。。看 codex 和 cc ,实际上由于这两者的定位( coding ),所以 他们是不会自主的总结重复的工作经验的 。如果你每次都让他们做一些崭新的项目,那当然没问题,但是你要是让他们去追踪股票,能够按你一句话帮你去网上填表,去做你日常做的操作, 那他们每次探索的成本则是巨大的 。 GA 的自进化机制让 GA 得以越用越快,越用越方便 (最后甚至能到心领神会的地步。。) 依旧吊打 oc , oc 赶紧下桌吧 。。 三、好的智能体离不开记忆 我知道大家这时候说了, LLM-Wiki 很吊,Evermemos 很吊,Mem0 很吊 ,我装这些插件就能让我的智能体有记忆。 先不谈这几个插件到底真实性能怎么样,我作为一个看了很多 memory 论文的从事大模型的人来说,作为一个 agent 的 memory 框架: 测 Locomo 、LongtermMem 这几个数据集就是不合适的! 现在的大模型的记忆 不再是 user-centric 了!现在我们需要的大模型记忆是 task-centric ,这两者有本质的区别。 所以, 停止人云亦云吧 。。 我深扒了 GA 的记忆设计, 其简洁性和有效性真的令人印象深刻 ,但是在这里就不展开(如果大家感兴趣,我可能再开一篇帖子详细讲讲)。 我现在对 GA 的使用如图: 有什么记不得的,直接问就好了。。太 tm 牛逼了 。 彩蛋 另外,我是第一次在 V2EX 发帖,发现这图床都要买。。然后也让 GA 给我整了一个, 就一句话 : 嘿嘿。。最后放一张 GA 自己的 skillhub 里的截图, 懂的人自然知道干啥用的 。 写在最后 还有很多没提到的,大家自己尝试就好了。当然 GA 也有很多让我不爽的地方,比如 极其简陋的前端 ,然后我就在 GA 的群里潜水,最后发现了,大概是 开发者的个人风格就是毛坯房的风格 。。问他能不能给整好看点,他回答也简单: 他说 "你让 GA 给你做"。。真的无敌了。。 我不允许还有人不知道 GA !!!! 如果这个帖子有点热度,大家有要求的话, 我可能会从专业的角度展开讲讲 GA 的技术实现方法 ,太 tm 优雅了。。

V2EX - 技术 · 2026-05-09 21:25:38+08:00 · tech

直接上菜: GenericAgent https://github.com/lsdefine/GenericAgent 本人基本信息 :国内某 top3 的计算机博士在读,大模型方向。 最近对 cc 的使用情况 : 我最近在 github trending 上关注了 GA 这个项目,并 高强度使用了一周多(完全接管我的科研+生活) ,然后我就 卸载了 cc 、codex 和 openclaw (但是感谢 cc 曾经在我的生命中出现过,不过 openclaw 你是真的垃圾啊)。。 那么有人问了,cc 那么屌,openclaw 被吹的那么神,有什么问题? 我想但凡用过的人此时在心里都有答案了。。 下文的数据来自 arxiv.org/abs/2604.17091 ,也就是 GA 的技术报告 ,里面有些 insights 我非常喜欢,而且我的风格也是 用数据说话 。 一、你的钱包顶得住吗? 打一个招呼, oc 要用 4w tokens ,cc 和 codex 也是 2w tokens 打底了 ,真当我 token 不是花钱买的? 在长程任务上, GA 能够用更少的预算( 1/3 或者更少)获得一样甚至更好的效果 。 GA 有无敌的原生浏览器操作 ,能用非常夸张的极低的预算( 1/5 左右 )实现非常非常 nice 的网页搜索、浏览器操作( 1-3 倍的成功率 )。 插个题外话,我就是做 deepresearch 的,论文里选的 browsecamp 、webcanvas 这些数据集是非常有挑战的,也给我打开新世界了 hh 最近看大家都在流行 claude code 的各种 web 插件,我的嘴角慢慢上扬。 说实话, ga 的原生浏览器操作吊打所有的 web 插件 ,不服来战(本人已服)。 二、更好用的智能体一定能自进化 这也是最近 hermes 风头正盛的原因。在这一点上, 我认为 GA 做的更好 。 不要谈参数自进化,因为我认为的自进化就是 agent 对错误经验的总结学习 ,就像人的进化就是在直立行走之后能够制造和使用工具,而不是长出第六根手指。 直接上结果,oc 就不谈了,纯垃圾。。看 codex 和 cc ,实际上由于这两者的定位( coding ),所以 他们是不会自主的总结重复的工作经验的 。如果你每次都让他们做一些崭新的项目,那当然没问题,但是你要是让他们去追踪股票,能够按你一句话帮你去网上填表,去做你日常做的操作, 那他们每次探索的成本则是巨大的 。 GA 的自进化机制让 GA 得以越用越快,越用越方便 (最后甚至能到心领神会的地步。。) 依旧吊打 oc , oc 赶紧下桌吧 。。 三、好的智能体离不开记忆 我知道大家这时候说了, LLM-Wiki 很吊,Evermemos 很吊,Mem0 很吊 ,我装这些插件就能让我的智能体有记忆。 先不谈这几个插件到底真实性能怎么样,我作为一个看了很多 memory 论文的从事大模型的人来说,作为一个 agent 的 memory 框架: 测 Locomo 、LongtermMem 这几个数据集就是不合适的! 现在的大模型的记忆 不再是 user-centric 了!现在我们需要的大模型记忆是 task-centric ,这两者有本质的区别。 所以, 停止人云亦云吧 。。 我深扒了 GA 的记忆设计, 其简洁性和有效性真的令人印象深刻 ,但是在这里就不展开(如果大家感兴趣,我可能再开一篇帖子详细讲讲)。 我现在对 GA 的使用如图: 有什么记不得的,直接问就好了。。太 tm 牛逼了 。 彩蛋 另外,我是第一次在 V2EX 发帖,发现这图床都要买。。然后也让 GA 给我整了一个, 就一句话 : 嘿嘿。。最后放一张 GA 自己的 skillhub 里的截图, 懂的人自然知道干啥用的 。 写在最后 还有很多没提到的,大家自己尝试就好了。当然 GA 也有很多让我不爽的地方,比如 极其简陋的前端 ,然后我就在 GA 的群里潜水,最后发现了,大概是 开发者的个人风格就是毛坯房的风格 。。问他能不能给整好看点,他回答也简单: 他说 "你让 GA 给你做"。。真的无敌了。。 我不允许还有人不知道 GA !!!! 如果这个帖子有点热度,大家有要求的话, 我可能会从专业的角度展开讲讲 GA 的技术实现方法 ,太 tm 优雅了。。

V2EX - 技术 · 2026-05-09 20:26:09+08:00 · tech

直接上菜: GenericAgent https://github.com/lsdefine/GenericAgent 本人基本信息 :国内某 top3 的计算机博士在读,大模型方向。 最近对 cc 的使用情况 : 我最近在 github trending 上关注了 GA 这个项目,并 高强度使用了一周多(完全接管我的科研+生活) ,然后我就 卸载了 cc 、codex 和 openclaw (但是感谢 cc 曾经在我的生命中出现过,不过 openclaw 你是真的垃圾啊)。。 那么有人问了,cc 那么屌,openclaw 被吹的那么神,有什么问题? 我想但凡用过的人此时在心里都有答案了。。 下文的数据来自 arxiv.org/abs/2604.17091 ,也就是 GA 的技术报告 ,里面有些 insights 我非常喜欢,而且我的风格也是 用数据说话 。 一、你的钱包顶得住吗? 打一个招呼, oc 要用 4w tokens ,cc 和 codex 也是 2w tokens 打底了 ,真当我 token 不是花钱买的? 在长程任务上, GA 能够用更少的预算( 1/3 或者更少)获得一样甚至更好的效果 。 GA 有无敌的原生浏览器操作 ,能用非常夸张的极低的预算( 1/5 左右 )实现非常非常 nice 的网页搜索、浏览器操作( 1-3 倍的成功率 )。 插个题外话,我就是做 deepresearch 的,论文里选的 browsecamp 、webcanvas 这些数据集是非常有挑战的,也给我打开新世界了 hh 最近看大家都在流行 claude code 的各种 web 插件,我的嘴角慢慢上扬。 说实话, ga 的原生浏览器操作吊打所有的 web 插件 ,不服来战(本人已服)。 二、更好用的智能体一定能自进化 这也是最近 hermes 风头正盛的原因。在这一点上, 我认为 GA 做的更好 。 不要谈参数自进化,因为我认为的自进化就是 agent 对错误经验的总结学习 ,就像人的进化就是在直立行走之后能够制造和使用工具,而不是长出第六根手指。 直接上结果,oc 就不谈了,纯垃圾。。看 codex 和 cc ,实际上由于这两者的定位( coding ),所以 他们是不会自主的总结重复的工作经验的 。如果你每次都让他们做一些崭新的项目,那当然没问题,但是你要是让他们去追踪股票,能够按你一句话帮你去网上填表,去做你日常做的操作, 那他们每次探索的成本则是巨大的 。 GA 的自进化机制让 GA 得以越用越快,越用越方便 (最后甚至能到心领神会的地步。。) 依旧吊打 oc , oc 赶紧下桌吧 。。 三、好的智能体离不开记忆 我知道大家这时候说了, LLM-Wiki 很吊,Evermemos 很吊,Mem0 很吊 ,我装这些插件就能让我的智能体有记忆。 先不谈这几个插件到底真实性能怎么样,我作为一个看了很多 memory 论文的从事大模型的人来说,作为一个 agent 的 memory 框架: 测 Locomo 、LongtermMem 这几个数据集就是不合适的! 现在的大模型的记忆 不再是 user-centric 了!现在我们需要的大模型记忆是 task-centric ,这两者有本质的区别。 所以, 停止人云亦云吧 。。 我深扒了 GA 的记忆设计, 其简洁性和有效性真的令人印象深刻 ,但是在这里就不展开(如果大家感兴趣,我可能再开一篇帖子详细讲讲)。 我现在对 GA 的使用如图: 有什么记不得的,直接问就好了。。太 tm 牛逼了 。 彩蛋 另外,我是第一次在 V2EX 发帖,发现这图床都要买。。然后也让 GA 给我整了一个, 就一句话 : 嘿嘿。。最后放一张 GA 自己的 skillhub 里的截图, 懂的人自然知道干啥用的 。 写在最后 还有很多没提到的,大家自己尝试就好了。当然 GA 也有很多让我不爽的地方,比如 极其简陋的前端 ,然后我就在 GA 的群里潜水,最后发现了,大概是 开发者的个人风格就是毛坯房的风格 。。问他能不能给整好看点,他回答也简单: 他说 "你让 GA 给你做"。。真的无敌了。。 我不允许还有人不知道 GA !!!! 如果这个帖子有点热度,大家有要求的话, 我可能会从专业的角度展开讲讲 GA 的技术实现方法 ,太 tm 优雅了。。

V2EX - 技术 · 2026-05-09 20:26:09+08:00 · tech

直接上菜: GenericAgent https://github.com/lsdefine/GenericAgent 本人基本信息 :国内某 top3 的计算机博士在读,大模型方向。 最近对 cc 的使用情况 : 我最近在 github trending 上关注了 GA 这个项目,并 高强度使用了一周多(完全接管我的科研+生活) ,然后我就 卸载了 cc 、codex 和 openclaw (但是感谢 cc 曾经在我的生命中出现过,不过 openclaw 你是真的垃圾啊)。。 那么有人问了,cc 那么屌,openclaw 被吹的那么神,有什么问题? 我想但凡用过的人此时在心里都有答案了。。 下文的数据来自 arxiv.org/abs/2604.17091 ,也就是 GA 的技术报告 ,里面有些 insights 我非常喜欢,而且我的风格也是 用数据说话 。 一、你的钱包顶得住吗? 打一个招呼, oc 要用 4w tokens ,cc 和 codex 也是 2w tokens 打底了 ,真当我 token 不是花钱买的? 在长程任务上, GA 能够用更少的预算( 1/3 或者更少)获得一样甚至更好的效果 。 GA 有无敌的原生浏览器操作 ,能用非常夸张的极低的预算( 1/5 左右 )实现非常非常 nice 的网页搜索、浏览器操作( 1-3 倍的成功率 )。 插个题外话,我就是做 deepresearch 的,论文里选的 browsecamp 、webcanvas 这些数据集是非常有挑战的,也给我打开新世界了 hh 最近看大家都在流行 claude code 的各种 web 插件,我的嘴角慢慢上扬。 说实话, ga 的原生浏览器操作吊打所有的 web 插件 ,不服来战(本人已服)。 二、更好用的智能体一定能自进化 这也是最近 hermes 风头正盛的原因。在这一点上, 我认为 GA 做的更好 。 不要谈参数自进化,因为我认为的自进化就是 agent 对错误经验的总结学习 ,就像人的进化就是在直立行走之后能够制造和使用工具,而不是长出第六根手指。 直接上结果,oc 就不谈了,纯垃圾。。看 codex 和 cc ,实际上由于这两者的定位( coding ),所以 他们是不会自主的总结重复的工作经验的 。如果你每次都让他们做一些崭新的项目,那当然没问题,但是你要是让他们去追踪股票,能够按你一句话帮你去网上填表,去做你日常做的操作, 那他们每次探索的成本则是巨大的 。 GA 的自进化机制让 GA 得以越用越快,越用越方便 (最后甚至能到心领神会的地步。。) 依旧吊打 oc , oc 赶紧下桌吧 。。 三、好的智能体离不开记忆 我知道大家这时候说了, LLM-Wiki 很吊,Evermemos 很吊,Mem0 很吊 ,我装这些插件就能让我的智能体有记忆。 先不谈这几个插件到底真实性能怎么样,我作为一个看了很多 memory 论文的从事大模型的人来说,作为一个 agent 的 memory 框架: 测 Locomo 、LongtermMem 这几个数据集就是不合适的! 现在的大模型的记忆 不再是 user-centric 了!现在我们需要的大模型记忆是 task-centric ,这两者有本质的区别。 所以, 停止人云亦云吧 。。 我深扒了 GA 的记忆设计, 其简洁性和有效性真的令人印象深刻 ,但是在这里就不展开(如果大家感兴趣,我可能再开一篇帖子详细讲讲)。 我现在对 GA 的使用如图: 有什么记不得的,直接问就好了。。太 tm 牛逼了 。 彩蛋 另外,我是第一次在 V2EX 发帖,发现这图床都要买。。然后也让 GA 给我整了一个, 就一句话 : 嘿嘿。。最后放一张 GA 自己的 skillhub 里的截图, 懂的人自然知道干啥用的 。 写在最后 还有很多没提到的,大家自己尝试就好了。当然 GA 也有很多让我不爽的地方,比如 极其简陋的前端 ,然后我就在 GA 的群里潜水,最后发现了,大概是 开发者的个人风格就是毛坯房的风格 。。问他能不能给整好看点,他回答也简单: 他说 "你让 GA 给你做"。。真的无敌了。。 我不允许还有人不知道 GA !!!! 如果这个帖子有点热度,大家有要求的话, 我可能会从专业的角度展开讲讲 GA 的技术实现方法 ,太 tm 优雅了。。

V2EX - 技术 · 2026-05-09 19:13:21+08:00 · tech

直接上菜: GenericAgent https://github.com/lsdefine/GenericAgent 本人基本信息 :国内某 top3 的计算机博士在读,大模型方向。 最近对 cc 的使用情况 : 我最近在 github trending 上关注了 GA 这个项目,并 高强度使用了一周多(完全接管我的科研+生活) ,然后我就 卸载了 cc 、codex 和 openclaw (但是感谢 cc 曾经在我的生命中出现过,不过 openclaw 你是真的垃圾啊)。。 那么有人问了,cc 那么屌,openclaw 被吹的那么神,有什么问题? 我想但凡用过的人此时在心里都有答案了。。 下文的数据来自 arxiv.org/abs/2604.17091 ,也就是 GA 的技术报告 ,里面有些 insights 我非常喜欢,而且我的风格也是 用数据说话 。 一、你的钱包顶得住吗? 打一个招呼, oc 要用 4w tokens ,cc 和 codex 也是 2w tokens 打底了 ,真当我 token 不是花钱买的? 在长程任务上, GA 能够用更少的预算( 1/3 或者更少)获得一样甚至更好的效果 。 GA 有无敌的原生浏览器操作 ,能用非常夸张的极低的预算( 1/5 左右 )实现非常非常 nice 的网页搜索、浏览器操作( 1-3 倍的成功率 )。 插个题外话,我就是做 deepresearch 的,论文里选的 browsecamp 、webcanvas 这些数据集是非常有挑战的,也给我打开新世界了 hh 最近看大家都在流行 claude code 的各种 web 插件,我的嘴角慢慢上扬。 说实话, ga 的原生浏览器操作吊打所有的 web 插件 ,不服来战(本人已服)。 二、更好用的智能体一定能自进化 这也是最近 hermes 风头正盛的原因。在这一点上, 我认为 GA 做的更好 。 不要谈参数自进化,因为我认为的自进化就是 agent 对错误经验的总结学习 ,就像人的进化就是在直立行走之后能够制造和使用工具,而不是长出第六根手指。 直接上结果,oc 就不谈了,纯垃圾。。看 codex 和 cc ,实际上由于这两者的定位( coding ),所以 他们是不会自主的总结重复的工作经验的 。如果你每次都让他们做一些崭新的项目,那当然没问题,但是你要是让他们去追踪股票,能够按你一句话帮你去网上填表,去做你日常做的操作, 那他们每次探索的成本则是巨大的 。 GA 的自进化机制让 GA 得以越用越快,越用越方便 (最后甚至能到心领神会的地步。。) 依旧吊打 oc , oc 赶紧下桌吧 。。 三、好的智能体离不开记忆 我知道大家这时候说了, LLM-Wiki 很吊,Evermemos 很吊,Mem0 很吊 ,我装这些插件就能让我的智能体有记忆。 先不谈这几个插件到底真实性能怎么样,我作为一个看了很多 memory 论文的从事大模型的人来说,作为一个 agent 的 memory 框架: 测 Locomo 、LongtermMem 这几个数据集就是不合适的! 现在的大模型的记忆 不再是 user-centric 了!现在我们需要的大模型记忆是 task-centric ,这两者有本质的区别。 所以, 停止人云亦云吧 。。 我深扒了 GA 的记忆设计, 其简洁性和有效性真的令人印象深刻 ,但是在这里就不展开(如果大家感兴趣,我可能再开一篇帖子详细讲讲)。 我现在对 GA 的使用如图: 有什么记不得的,直接问就好了。。太 tm 牛逼了 。 彩蛋 另外,我是第一次在 V2EX 发帖,发现这图床都要买。。然后也让 GA 给我整了一个, 就一句话 : 嘿嘿。。最后放一张 GA 自己的 skillhub 里的截图, 懂的人自然知道干啥用的 。 写在最后 还有很多没提到的,大家自己尝试就好了。当然 GA 也有很多让我不爽的地方,比如 极其简陋的前端 ,然后我就在 GA 的群里潜水,最后发现了,大概是 开发者的个人风格就是毛坯房的风格 。。问他能不能给整好看点,他回答也简单: 他说 "你让 GA 给你做"。。真的无敌了。。 我不允许还有人不知道 GA !!!! 如果这个帖子有点热度,大家有要求的话, 我可能会从专业的角度展开讲讲 GA 的技术实现方法 ,太 tm 优雅了。。

V2EX - 技术 · 2026-05-09 19:07:22+08:00 · tech

直接上菜: GenericAgent https://github.com/lsdefine/GenericAgent 本人基本信息 :国内某 top3 的计算机博士在读,大模型方向。 最近对 cc 的使用情况 : 我最近在 github trending 上关注了 GA 这个项目,并 高强度使用了一周多(完全接管我的科研+生活) ,然后我就 卸载了 cc 、codex 和 openclaw (但是感谢 cc 曾经在我的生命中出现过,不过 openclaw 你是真的垃圾啊)。。 那么有人问了,cc 那么屌,openclaw 被吹的那么神,有什么问题? 我想但凡用过的人此时在心里都有答案了。。 下文的数据来自 arxiv.org/abs/2604.17091 ,也就是 GA 的技术报告 ,里面有些 insights 我非常喜欢,而且我的风格也是 用数据说话 。 一、你的钱包顶得住吗? 打一个招呼, oc 要用 4w tokens ,cc 和 codex 也是 2w tokens 打底了 ,真当我 token 不是花钱买的? 在长程任务上, GA 能够用更少的预算( 1/3 或者更少)获得一样甚至更好的效果 。 GA 有无敌的原生浏览器操作 ,能用非常夸张的极低的预算( 1/5 左右 )实现非常非常 nice 的网页搜索、浏览器操作( 1-3 倍的成功率 )。 插个题外话,我就是做 deepresearch 的,论文里选的 browsecamp 、webcanvas 这些数据集是非常有挑战的,也给我打开新世界了 hh 最近看大家都在流行 claude code 的各种 web 插件,我的嘴角慢慢上扬。 说实话, ga 的原生浏览器操作吊打所有的 web 插件 ,不服来战(本人已服)。 二、更好用的智能体一定能自进化 这也是最近 hermes 风头正盛的原因。在这一点上, 我认为 GA 做的更好 。 不要谈参数自进化,因为我认为的自进化就是 agent 对错误经验的总结学习 ,就像人的进化就是在直立行走之后能够制造和使用工具,而不是长出第六根手指。 直接上结果,oc 就不谈了,纯垃圾。。看 codex 和 cc ,实际上由于这两者的定位( coding ),所以 他们是不会自主的总结重复的工作经验的 。如果你每次都让他们做一些崭新的项目,那当然没问题,但是你要是让他们去追踪股票,能够按你一句话帮你去网上填表,去做你日常做的操作, 那他们每次探索的成本则是巨大的 。 GA 的自进化机制让 GA 得以越用越快,越用越方便 (最后甚至能到心领神会的地步。。) 依旧吊打 oc , oc 赶紧下桌吧 。。 三、好的智能体离不开记忆 我知道大家这时候说了, LLM-Wiki 很吊,Evermemos 很吊,Mem0 很吊 ,我装这些插件就能让我的智能体有记忆。 先不谈这几个插件到底真实性能怎么样,我作为一个看了很多 memory 论文的从事大模型的人来说,作为一个 agent 的 memory 框架: 测 Locomo 、LongtermMem 这几个数据集就是不合适的! 现在的大模型的记忆 不再是 user-centric 了!现在我们需要的大模型记忆是 task-centric ,这两者有本质的区别。 所以, 停止人云亦云吧 。。 我深扒了 GA 的记忆设计, 其简洁性和有效性真的令人印象深刻 ,但是在这里就不展开(如果大家感兴趣,我可能再开一篇帖子详细讲讲)。 我现在对 GA 的使用如图: 有什么记不得的,直接问就好了。。太 tm 牛逼了 。 彩蛋 另外,我是第一次在 V2EX 发帖,发现这图床都要买。。然后也让 GA 给我整了一个, 就一句话 : 嘿嘿。。最后放一张 GA 自己的 skillhub 里的截图, 懂的人自然知道干啥用的 。 写在最后 还有很多没提到的,大家自己尝试就好了。当然 GA 也有很多让我不爽的地方,比如 极其简陋的前端 ,然后我就在 GA 的群里潜水,最后发现了,大概是 开发者的个人风格就是毛坯房的风格 。。问他能不能给整好看点,他回答也简单: 他说 "你让 GA 给你做"。。真的无敌了。。 我不允许还有人不知道 GA !!!! 如果这个帖子有点热度,大家有要求的话, 我可能会从专业的角度展开讲讲 GA 的技术实现方法 ,太 tm 优雅了。。