WWW.YOUINFO.SITE
标签聚合 无法忍受

/tag/无法忍受

LinuxDo 最新话题 · 2026-06-07 22:49:20+08:00 · tech

有时候找资源还有一些插件会上dc,PC版就不说了,虽然依旧难用但是至少能用,而Discord的手机APP简直是连半成品都算不上的东西,每次打开这个软件都让我痛不欲生 2026年了,点进频道的某个帖子里显示的不是帖子正文,而是随机给你跳转到这个帖子的既不上也不下的某一个楼层,没有回到顶部的按钮,想要回到顶部你得先在这个帖子里评论一句,然后再用/回顶 的指令,甚至这个指令回顶还是第三方的bot实现的。 为什么会有这么多人用,我实在是不明白 6 个帖子 - 5 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-24 19:37:35+08:00 · tech

ai时代实在是无法忍受windows割裂的感觉了 想换macbook了,预计使用5年+ 平时强度基本是Java大型项目+node大型项目,少量剪视频需求,现在windows 32+1T,内存勉勉强强够用 目前看中了macbook air m5 32+512 但是朋友给我建议,air没必要上32g,24g够用;且如果m4,m5能差2k左右,也没必要上m5,m4对于air来说够用了 各位佬,我实在是不懂macbook,求各位佬给选购建议,预算1w以内,但是还是希望能省则省吧 感谢各位佬!!! 10 个帖子 - 6 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-15 22:41:54+08:00 · tech

开头先说主题 追觅扫地机器人质量真的是巨巨巨巨差 售后真是巨巨巨巨巨恶心人 真是没见过这么离谱的厂家 事情经过 2024年10月份国补购入的追觅S30ProUltra超薄上下水 当时买这个就是看了同价位配置确实没有对手性价比还行再加上国补确实便宜就入手了 本来当时家里刚装修好买来放了一段时间 本来一切安好,最初是年初的时候扫地机器人基站漏水,整的满屋子都是水问了一下客服,客服说没事,有时候拖地就这样(明显的敷衍)当时没有多想看着不算太严重就没有管 然后来到了三月份,手机app报故障说扫地机器人上下水异常,问客服说需要返厂维修,以为没有什么大事,但是这个是这个售后真的巨麻烦,得先来师傅给拆了,然后叫顺丰,顺丰发到厂家再去维修检测然后顺风在发回来,师傅在上门安装,到是因为在质保期内不收费,但是这个机器人采用了一年多上下水就堵了,我当时就去问客服有没有什么维护的视频自己清理上下水模块啥的,本来就是怕出了质保期再坏了,看他这样折腾估计都能买个新的了,然后客服开始展现他那听不懂人话的气质了,我问他怎么维护上下水模块,他给我发了个清洗底盘的视频,我在问他说他也不清楚,就是无法维护的意思,我说我问他你们这个那么容易堵,能给延保吗,当然是让他们给拒绝了 本以为没什么事了,想着凑活用了,我扫地机器人都是出门上班自己去扫地,我自己在家里的时候不开,然后过了一段时间我发现地面越来越脏根本没有打扫的痕迹,然后我就打开app查看说是离线,结果发现是没进去基站(在基站里他没对接上)(app就从来没有给过通知),然后我就拔出来重新装回去了,情况是扫地机器人回不去基站,对接不上就造成无法链接触点充不进去电,过了几天时候机器就彻底开不开机了,强制开机和强制重启也不行,然后联系客服,客服说让寄回检测点维修给做一个全面的检查,然后还是那一套流程,还是把基站拆了,但是这次维修当前下午就给我发回来了(我严重怀疑他根本没有给我全面检测),这次我就已经很烦了,我去找他们要说法,他们还是那一套,不支持延保不支持换新,最开始说只有相同问题三次修不好才能走三包,然后我投诉12315之后改口说三次故障没修好就可以不限制是不是同一个故障,最搞笑的事这次回来还没有一个星期,机器人依然进不去基站,伴随着基站会自行断电(合着根本就没有维修),这下又好了,我又去找客服了,客服就跟那种听不懂话的一样说没问题,不支持退货,具体我怎么交流的我已经让他们气疯了,上报京东京东说让厂家检测,如果还是质量问题走三包 前两天检测完了,工程师给我打电话说确实是质量问题,他已经把报告上传到追觅的后台了,让我去联系客服就行了,然后我去找他们客服说工程师给我打电话了,报告也上传系统了,他说他没查到,让我提供证明或者图片,我说你听不懂人话吗,上传到你们追觅的系统了我上哪去找你们的报告,这他又在去查了一遍说看到报告了(真是他们到底能敷衍到什么程序),然后就是天天打电话天天找他们,还想让我换新,就这个质量换新只会更糟心,前天给我打电话说可以折旧退款,打电话说去计算一下,然后算了一下午没给我回电话,我又找他们客服说算出来了800多免100我不同意有谁最高申请免500是300多,我说你线给我挂着我要去找京东(京东官方给我联系的说如果200以内答应他们就行剩下的京东平台给补偿)然后昨天他们又有个给我打电话说计算的折旧是900多折500要400多,我一下子火气上来了我说昨天800多你今天900多到底是多少钱,我说昨天那个我录音了,然后说去给我核实六点前回复,我等到了七点也没给我回,我给他们官方打电话,官方说两波人不是同一拨人,说一个是官方客服,一个是店铺客服,我真无语了(店铺是京东追觅官方自营旗舰店)搞得我烦的要命,然后我去找京东,京东说平台会补200多块钱,到时候你要能接受跟他协商就行 事情还没结束 我真是这家的质量,客服是不是有点过于离谱了 左右脑天天互搏,京东还跟着躺枪 最开始好好维修一下皆大欢喜也没那么多事 现在是售后敷衍,维修敷衍,客服也敷衍,这是从头到尾都在敷衍,真是把钱全用来打广告了吧 就这还上月球呢 1 个帖子 - 1 位参与者 阅读完整话题

V2EX - 技术 · 2026-05-09 23:44:32+08:00 · tech

直接上菜: GenericAgent https://github.com/lsdefine/GenericAgent 本人基本信息 :国内某 top3 的计算机博士在读,大模型方向。 最近对 cc 的使用情况 : 我最近在 github trending 上关注了 GA 这个项目,并 高强度使用了一周多(完全接管我的科研+生活) ,然后我就 卸载了 cc 、codex 和 openclaw (但是感谢 cc 曾经在我的生命中出现过,不过 openclaw 你是真的垃圾啊)。。 那么有人问了,cc 那么屌,openclaw 被吹的那么神,有什么问题? 我想但凡用过的人此时在心里都有答案了。。 下文的数据来自 arxiv.org/abs/2604.17091 ,也就是 GA 的技术报告 ,里面有些 insights 我非常喜欢,而且我的风格也是 用数据说话 。 一、你的钱包顶得住吗? 打一个招呼, oc 要用 4w tokens ,cc 和 codex 也是 2w tokens 打底了 ,真当我 token 不是花钱买的? 在长程任务上, GA 能够用更少的预算( 1/3 或者更少)获得一样甚至更好的效果 。 GA 有无敌的原生浏览器操作 ,能用非常夸张的极低的预算( 1/5 左右 )实现非常非常 nice 的网页搜索、浏览器操作( 1-3 倍的成功率 )。 插个题外话,我就是做 deepresearch 的,论文里选的 browsecamp 、webcanvas 这些数据集是非常有挑战的,也给我打开新世界了 hh 最近看大家都在流行 claude code 的各种 web 插件,我的嘴角慢慢上扬。 说实话, ga 的原生浏览器操作吊打所有的 web 插件 ,不服来战(本人已服)。 二、更好用的智能体一定能自进化 这也是最近 hermes 风头正盛的原因。在这一点上, 我认为 GA 做的更好 。 不要谈参数自进化,因为我认为的自进化就是 agent 对错误经验的总结学习 ,就像人的进化就是在直立行走之后能够制造和使用工具,而不是长出第六根手指。 直接上结果,oc 就不谈了,纯垃圾。。看 codex 和 cc ,实际上由于这两者的定位( coding ),所以 他们是不会自主的总结重复的工作经验的 。如果你每次都让他们做一些崭新的项目,那当然没问题,但是你要是让他们去追踪股票,能够按你一句话帮你去网上填表,去做你日常做的操作, 那他们每次探索的成本则是巨大的 。 GA 的自进化机制让 GA 得以越用越快,越用越方便 (最后甚至能到心领神会的地步。。) 依旧吊打 oc , oc 赶紧下桌吧 。。 三、好的智能体离不开记忆 我知道大家这时候说了, LLM-Wiki 很吊,Evermemos 很吊,Mem0 很吊 ,我装这些插件就能让我的智能体有记忆。 先不谈这几个插件到底真实性能怎么样,我作为一个看了很多 memory 论文的从事大模型的人来说,作为一个 agent 的 memory 框架: 测 Locomo 、LongtermMem 这几个数据集就是不合适的! 现在的大模型的记忆 不再是 user-centric 了!现在我们需要的大模型记忆是 task-centric ,这两者有本质的区别。 所以, 停止人云亦云吧 。。 我深扒了 GA 的记忆设计, 其简洁性和有效性真的令人印象深刻 ,但是在这里就不展开(如果大家感兴趣,我可能再开一篇帖子详细讲讲)。 我现在对 GA 的使用如图: 有什么记不得的,直接问就好了。。太 tm 牛逼了 。 彩蛋 另外,我是第一次在 V2EX 发帖,发现这图床都要买。。然后也让 GA 给我整了一个, 就一句话 : 嘿嘿。。最后放一张 GA 自己的 skillhub 里的截图, 懂的人自然知道干啥用的 。 写在最后 还有很多没提到的,大家自己尝试就好了。当然 GA 也有很多让我不爽的地方,比如 极其简陋的前端 ,然后我就在 GA 的群里潜水,最后发现了,大概是 开发者的个人风格就是毛坯房的风格 。。问他能不能给整好看点,他回答也简单: 他说 "你让 GA 给你做"。。真的无敌了。。 我不允许还有人不知道 GA !!!! 如果这个帖子有点热度,大家有要求的话, 我可能会从专业的角度展开讲讲 GA 的技术实现方法 ,太 tm 优雅了。。

V2EX - 技术 · 2026-05-09 23:39:12+08:00 · tech

直接上菜: GenericAgent https://github.com/lsdefine/GenericAgent 本人基本信息 :国内某 top3 的计算机博士在读,大模型方向。 最近对 cc 的使用情况 : 我最近在 github trending 上关注了 GA 这个项目,并 高强度使用了一周多(完全接管我的科研+生活) ,然后我就 卸载了 cc 、codex 和 openclaw (但是感谢 cc 曾经在我的生命中出现过,不过 openclaw 你是真的垃圾啊)。。 那么有人问了,cc 那么屌,openclaw 被吹的那么神,有什么问题? 我想但凡用过的人此时在心里都有答案了。。 下文的数据来自 arxiv.org/abs/2604.17091 ,也就是 GA 的技术报告 ,里面有些 insights 我非常喜欢,而且我的风格也是 用数据说话 。 一、你的钱包顶得住吗? 打一个招呼, oc 要用 4w tokens ,cc 和 codex 也是 2w tokens 打底了 ,真当我 token 不是花钱买的? 在长程任务上, GA 能够用更少的预算( 1/3 或者更少)获得一样甚至更好的效果 。 GA 有无敌的原生浏览器操作 ,能用非常夸张的极低的预算( 1/5 左右 )实现非常非常 nice 的网页搜索、浏览器操作( 1-3 倍的成功率 )。 插个题外话,我就是做 deepresearch 的,论文里选的 browsecamp 、webcanvas 这些数据集是非常有挑战的,也给我打开新世界了 hh 最近看大家都在流行 claude code 的各种 web 插件,我的嘴角慢慢上扬。 说实话, ga 的原生浏览器操作吊打所有的 web 插件 ,不服来战(本人已服)。 二、更好用的智能体一定能自进化 这也是最近 hermes 风头正盛的原因。在这一点上, 我认为 GA 做的更好 。 不要谈参数自进化,因为我认为的自进化就是 agent 对错误经验的总结学习 ,就像人的进化就是在直立行走之后能够制造和使用工具,而不是长出第六根手指。 直接上结果,oc 就不谈了,纯垃圾。。看 codex 和 cc ,实际上由于这两者的定位( coding ),所以 他们是不会自主的总结重复的工作经验的 。如果你每次都让他们做一些崭新的项目,那当然没问题,但是你要是让他们去追踪股票,能够按你一句话帮你去网上填表,去做你日常做的操作, 那他们每次探索的成本则是巨大的 。 GA 的自进化机制让 GA 得以越用越快,越用越方便 (最后甚至能到心领神会的地步。。) 依旧吊打 oc , oc 赶紧下桌吧 。。 三、好的智能体离不开记忆 我知道大家这时候说了, LLM-Wiki 很吊,Evermemos 很吊,Mem0 很吊 ,我装这些插件就能让我的智能体有记忆。 先不谈这几个插件到底真实性能怎么样,我作为一个看了很多 memory 论文的从事大模型的人来说,作为一个 agent 的 memory 框架: 测 Locomo 、LongtermMem 这几个数据集就是不合适的! 现在的大模型的记忆 不再是 user-centric 了!现在我们需要的大模型记忆是 task-centric ,这两者有本质的区别。 所以, 停止人云亦云吧 。。 我深扒了 GA 的记忆设计, 其简洁性和有效性真的令人印象深刻 ,但是在这里就不展开(如果大家感兴趣,我可能再开一篇帖子详细讲讲)。 我现在对 GA 的使用如图: 有什么记不得的,直接问就好了。。太 tm 牛逼了 。 彩蛋 另外,我是第一次在 V2EX 发帖,发现这图床都要买。。然后也让 GA 给我整了一个, 就一句话 : 嘿嘿。。最后放一张 GA 自己的 skillhub 里的截图, 懂的人自然知道干啥用的 。 写在最后 还有很多没提到的,大家自己尝试就好了。当然 GA 也有很多让我不爽的地方,比如 极其简陋的前端 ,然后我就在 GA 的群里潜水,最后发现了,大概是 开发者的个人风格就是毛坯房的风格 。。问他能不能给整好看点,他回答也简单: 他说 "你让 GA 给你做"。。真的无敌了。。 我不允许还有人不知道 GA !!!! 如果这个帖子有点热度,大家有要求的话, 我可能会从专业的角度展开讲讲 GA 的技术实现方法 ,太 tm 优雅了。。

V2EX - 技术 · 2026-05-09 23:20:55+08:00 · tech

直接上菜: GenericAgent https://github.com/lsdefine/GenericAgent 本人基本信息 :国内某 top3 的计算机博士在读,大模型方向。 最近对 cc 的使用情况 : 我最近在 github trending 上关注了 GA 这个项目,并 高强度使用了一周多(完全接管我的科研+生活) ,然后我就 卸载了 cc 、codex 和 openclaw (但是感谢 cc 曾经在我的生命中出现过,不过 openclaw 你是真的垃圾啊)。。 那么有人问了,cc 那么屌,openclaw 被吹的那么神,有什么问题? 我想但凡用过的人此时在心里都有答案了。。 下文的数据来自 arxiv.org/abs/2604.17091 ,也就是 GA 的技术报告 ,里面有些 insights 我非常喜欢,而且我的风格也是 用数据说话 。 一、你的钱包顶得住吗? 打一个招呼, oc 要用 4w tokens ,cc 和 codex 也是 2w tokens 打底了 ,真当我 token 不是花钱买的? 在长程任务上, GA 能够用更少的预算( 1/3 或者更少)获得一样甚至更好的效果 。 GA 有无敌的原生浏览器操作 ,能用非常夸张的极低的预算( 1/5 左右 )实现非常非常 nice 的网页搜索、浏览器操作( 1-3 倍的成功率 )。 插个题外话,我就是做 deepresearch 的,论文里选的 browsecamp 、webcanvas 这些数据集是非常有挑战的,也给我打开新世界了 hh 最近看大家都在流行 claude code 的各种 web 插件,我的嘴角慢慢上扬。 说实话, ga 的原生浏览器操作吊打所有的 web 插件 ,不服来战(本人已服)。 二、更好用的智能体一定能自进化 这也是最近 hermes 风头正盛的原因。在这一点上, 我认为 GA 做的更好 。 不要谈参数自进化,因为我认为的自进化就是 agent 对错误经验的总结学习 ,就像人的进化就是在直立行走之后能够制造和使用工具,而不是长出第六根手指。 直接上结果,oc 就不谈了,纯垃圾。。看 codex 和 cc ,实际上由于这两者的定位( coding ),所以 他们是不会自主的总结重复的工作经验的 。如果你每次都让他们做一些崭新的项目,那当然没问题,但是你要是让他们去追踪股票,能够按你一句话帮你去网上填表,去做你日常做的操作, 那他们每次探索的成本则是巨大的 。 GA 的自进化机制让 GA 得以越用越快,越用越方便 (最后甚至能到心领神会的地步。。) 依旧吊打 oc , oc 赶紧下桌吧 。。 三、好的智能体离不开记忆 我知道大家这时候说了, LLM-Wiki 很吊,Evermemos 很吊,Mem0 很吊 ,我装这些插件就能让我的智能体有记忆。 先不谈这几个插件到底真实性能怎么样,我作为一个看了很多 memory 论文的从事大模型的人来说,作为一个 agent 的 memory 框架: 测 Locomo 、LongtermMem 这几个数据集就是不合适的! 现在的大模型的记忆 不再是 user-centric 了!现在我们需要的大模型记忆是 task-centric ,这两者有本质的区别。 所以, 停止人云亦云吧 。。 我深扒了 GA 的记忆设计, 其简洁性和有效性真的令人印象深刻 ,但是在这里就不展开(如果大家感兴趣,我可能再开一篇帖子详细讲讲)。 我现在对 GA 的使用如图: 有什么记不得的,直接问就好了。。太 tm 牛逼了 。 彩蛋 另外,我是第一次在 V2EX 发帖,发现这图床都要买。。然后也让 GA 给我整了一个, 就一句话 : 嘿嘿。。最后放一张 GA 自己的 skillhub 里的截图, 懂的人自然知道干啥用的 。 写在最后 还有很多没提到的,大家自己尝试就好了。当然 GA 也有很多让我不爽的地方,比如 极其简陋的前端 ,然后我就在 GA 的群里潜水,最后发现了,大概是 开发者的个人风格就是毛坯房的风格 。。问他能不能给整好看点,他回答也简单: 他说 "你让 GA 给你做"。。真的无敌了。。 我不允许还有人不知道 GA !!!! 如果这个帖子有点热度,大家有要求的话, 我可能会从专业的角度展开讲讲 GA 的技术实现方法 ,太 tm 优雅了。。

V2EX - 技术 · 2026-05-09 23:20:55+08:00 · tech

直接上菜: GenericAgent https://github.com/lsdefine/GenericAgent 本人基本信息 :国内某 top3 的计算机博士在读,大模型方向。 最近对 cc 的使用情况 : 我最近在 github trending 上关注了 GA 这个项目,并 高强度使用了一周多(完全接管我的科研+生活) ,然后我就 卸载了 cc 、codex 和 openclaw (但是感谢 cc 曾经在我的生命中出现过,不过 openclaw 你是真的垃圾啊)。。 那么有人问了,cc 那么屌,openclaw 被吹的那么神,有什么问题? 我想但凡用过的人此时在心里都有答案了。。 下文的数据来自 arxiv.org/abs/2604.17091 ,也就是 GA 的技术报告 ,里面有些 insights 我非常喜欢,而且我的风格也是 用数据说话 。 一、你的钱包顶得住吗? 打一个招呼, oc 要用 4w tokens ,cc 和 codex 也是 2w tokens 打底了 ,真当我 token 不是花钱买的? 在长程任务上, GA 能够用更少的预算( 1/3 或者更少)获得一样甚至更好的效果 。 GA 有无敌的原生浏览器操作 ,能用非常夸张的极低的预算( 1/5 左右 )实现非常非常 nice 的网页搜索、浏览器操作( 1-3 倍的成功率 )。 插个题外话,我就是做 deepresearch 的,论文里选的 browsecamp 、webcanvas 这些数据集是非常有挑战的,也给我打开新世界了 hh 最近看大家都在流行 claude code 的各种 web 插件,我的嘴角慢慢上扬。 说实话, ga 的原生浏览器操作吊打所有的 web 插件 ,不服来战(本人已服)。 二、更好用的智能体一定能自进化 这也是最近 hermes 风头正盛的原因。在这一点上, 我认为 GA 做的更好 。 不要谈参数自进化,因为我认为的自进化就是 agent 对错误经验的总结学习 ,就像人的进化就是在直立行走之后能够制造和使用工具,而不是长出第六根手指。 直接上结果,oc 就不谈了,纯垃圾。。看 codex 和 cc ,实际上由于这两者的定位( coding ),所以 他们是不会自主的总结重复的工作经验的 。如果你每次都让他们做一些崭新的项目,那当然没问题,但是你要是让他们去追踪股票,能够按你一句话帮你去网上填表,去做你日常做的操作, 那他们每次探索的成本则是巨大的 。 GA 的自进化机制让 GA 得以越用越快,越用越方便 (最后甚至能到心领神会的地步。。) 依旧吊打 oc , oc 赶紧下桌吧 。。 三、好的智能体离不开记忆 我知道大家这时候说了, LLM-Wiki 很吊,Evermemos 很吊,Mem0 很吊 ,我装这些插件就能让我的智能体有记忆。 先不谈这几个插件到底真实性能怎么样,我作为一个看了很多 memory 论文的从事大模型的人来说,作为一个 agent 的 memory 框架: 测 Locomo 、LongtermMem 这几个数据集就是不合适的! 现在的大模型的记忆 不再是 user-centric 了!现在我们需要的大模型记忆是 task-centric ,这两者有本质的区别。 所以, 停止人云亦云吧 。。 我深扒了 GA 的记忆设计, 其简洁性和有效性真的令人印象深刻 ,但是在这里就不展开(如果大家感兴趣,我可能再开一篇帖子详细讲讲)。 我现在对 GA 的使用如图: 有什么记不得的,直接问就好了。。太 tm 牛逼了 。 彩蛋 另外,我是第一次在 V2EX 发帖,发现这图床都要买。。然后也让 GA 给我整了一个, 就一句话 : 嘿嘿。。最后放一张 GA 自己的 skillhub 里的截图, 懂的人自然知道干啥用的 。 写在最后 还有很多没提到的,大家自己尝试就好了。当然 GA 也有很多让我不爽的地方,比如 极其简陋的前端 ,然后我就在 GA 的群里潜水,最后发现了,大概是 开发者的个人风格就是毛坯房的风格 。。问他能不能给整好看点,他回答也简单: 他说 "你让 GA 给你做"。。真的无敌了。。 我不允许还有人不知道 GA !!!! 如果这个帖子有点热度,大家有要求的话, 我可能会从专业的角度展开讲讲 GA 的技术实现方法 ,太 tm 优雅了。。

V2EX - 技术 · 2026-05-09 23:10:41+08:00 · tech

直接上菜: GenericAgent https://github.com/lsdefine/GenericAgent 本人基本信息 :国内某 top3 的计算机博士在读,大模型方向。 最近对 cc 的使用情况 : 我最近在 github trending 上关注了 GA 这个项目,并 高强度使用了一周多(完全接管我的科研+生活) ,然后我就 卸载了 cc 、codex 和 openclaw (但是感谢 cc 曾经在我的生命中出现过,不过 openclaw 你是真的垃圾啊)。。 那么有人问了,cc 那么屌,openclaw 被吹的那么神,有什么问题? 我想但凡用过的人此时在心里都有答案了。。 下文的数据来自 arxiv.org/abs/2604.17091 ,也就是 GA 的技术报告 ,里面有些 insights 我非常喜欢,而且我的风格也是 用数据说话 。 一、你的钱包顶得住吗? 打一个招呼, oc 要用 4w tokens ,cc 和 codex 也是 2w tokens 打底了 ,真当我 token 不是花钱买的? 在长程任务上, GA 能够用更少的预算( 1/3 或者更少)获得一样甚至更好的效果 。 GA 有无敌的原生浏览器操作 ,能用非常夸张的极低的预算( 1/5 左右 )实现非常非常 nice 的网页搜索、浏览器操作( 1-3 倍的成功率 )。 插个题外话,我就是做 deepresearch 的,论文里选的 browsecamp 、webcanvas 这些数据集是非常有挑战的,也给我打开新世界了 hh 最近看大家都在流行 claude code 的各种 web 插件,我的嘴角慢慢上扬。 说实话, ga 的原生浏览器操作吊打所有的 web 插件 ,不服来战(本人已服)。 二、更好用的智能体一定能自进化 这也是最近 hermes 风头正盛的原因。在这一点上, 我认为 GA 做的更好 。 不要谈参数自进化,因为我认为的自进化就是 agent 对错误经验的总结学习 ,就像人的进化就是在直立行走之后能够制造和使用工具,而不是长出第六根手指。 直接上结果,oc 就不谈了,纯垃圾。。看 codex 和 cc ,实际上由于这两者的定位( coding ),所以 他们是不会自主的总结重复的工作经验的 。如果你每次都让他们做一些崭新的项目,那当然没问题,但是你要是让他们去追踪股票,能够按你一句话帮你去网上填表,去做你日常做的操作, 那他们每次探索的成本则是巨大的 。 GA 的自进化机制让 GA 得以越用越快,越用越方便 (最后甚至能到心领神会的地步。。) 依旧吊打 oc , oc 赶紧下桌吧 。。 三、好的智能体离不开记忆 我知道大家这时候说了, LLM-Wiki 很吊,Evermemos 很吊,Mem0 很吊 ,我装这些插件就能让我的智能体有记忆。 先不谈这几个插件到底真实性能怎么样,我作为一个看了很多 memory 论文的从事大模型的人来说,作为一个 agent 的 memory 框架: 测 Locomo 、LongtermMem 这几个数据集就是不合适的! 现在的大模型的记忆 不再是 user-centric 了!现在我们需要的大模型记忆是 task-centric ,这两者有本质的区别。 所以, 停止人云亦云吧 。。 我深扒了 GA 的记忆设计, 其简洁性和有效性真的令人印象深刻 ,但是在这里就不展开(如果大家感兴趣,我可能再开一篇帖子详细讲讲)。 我现在对 GA 的使用如图: 有什么记不得的,直接问就好了。。太 tm 牛逼了 。 彩蛋 另外,我是第一次在 V2EX 发帖,发现这图床都要买。。然后也让 GA 给我整了一个, 就一句话 : 嘿嘿。。最后放一张 GA 自己的 skillhub 里的截图, 懂的人自然知道干啥用的 。 写在最后 还有很多没提到的,大家自己尝试就好了。当然 GA 也有很多让我不爽的地方,比如 极其简陋的前端 ,然后我就在 GA 的群里潜水,最后发现了,大概是 开发者的个人风格就是毛坯房的风格 。。问他能不能给整好看点,他回答也简单: 他说 "你让 GA 给你做"。。真的无敌了。。 我不允许还有人不知道 GA !!!! 如果这个帖子有点热度,大家有要求的话, 我可能会从专业的角度展开讲讲 GA 的技术实现方法 ,太 tm 优雅了。。

V2EX - 技术 · 2026-05-09 22:01:15+08:00 · tech

直接上菜: GenericAgent https://github.com/lsdefine/GenericAgent 本人基本信息 :国内某 top3 的计算机博士在读,大模型方向。 最近对 cc 的使用情况 : 我最近在 github trending 上关注了 GA 这个项目,并 高强度使用了一周多(完全接管我的科研+生活) ,然后我就 卸载了 cc 、codex 和 openclaw (但是感谢 cc 曾经在我的生命中出现过,不过 openclaw 你是真的垃圾啊)。。 那么有人问了,cc 那么屌,openclaw 被吹的那么神,有什么问题? 我想但凡用过的人此时在心里都有答案了。。 下文的数据来自 arxiv.org/abs/2604.17091 ,也就是 GA 的技术报告 ,里面有些 insights 我非常喜欢,而且我的风格也是 用数据说话 。 一、你的钱包顶得住吗? 打一个招呼, oc 要用 4w tokens ,cc 和 codex 也是 2w tokens 打底了 ,真当我 token 不是花钱买的? 在长程任务上, GA 能够用更少的预算( 1/3 或者更少)获得一样甚至更好的效果 。 GA 有无敌的原生浏览器操作 ,能用非常夸张的极低的预算( 1/5 左右 )实现非常非常 nice 的网页搜索、浏览器操作( 1-3 倍的成功率 )。 插个题外话,我就是做 deepresearch 的,论文里选的 browsecamp 、webcanvas 这些数据集是非常有挑战的,也给我打开新世界了 hh 最近看大家都在流行 claude code 的各种 web 插件,我的嘴角慢慢上扬。 说实话, ga 的原生浏览器操作吊打所有的 web 插件 ,不服来战(本人已服)。 二、更好用的智能体一定能自进化 这也是最近 hermes 风头正盛的原因。在这一点上, 我认为 GA 做的更好 。 不要谈参数自进化,因为我认为的自进化就是 agent 对错误经验的总结学习 ,就像人的进化就是在直立行走之后能够制造和使用工具,而不是长出第六根手指。 直接上结果,oc 就不谈了,纯垃圾。。看 codex 和 cc ,实际上由于这两者的定位( coding ),所以 他们是不会自主的总结重复的工作经验的 。如果你每次都让他们做一些崭新的项目,那当然没问题,但是你要是让他们去追踪股票,能够按你一句话帮你去网上填表,去做你日常做的操作, 那他们每次探索的成本则是巨大的 。 GA 的自进化机制让 GA 得以越用越快,越用越方便 (最后甚至能到心领神会的地步。。) 依旧吊打 oc , oc 赶紧下桌吧 。。 三、好的智能体离不开记忆 我知道大家这时候说了, LLM-Wiki 很吊,Evermemos 很吊,Mem0 很吊 ,我装这些插件就能让我的智能体有记忆。 先不谈这几个插件到底真实性能怎么样,我作为一个看了很多 memory 论文的从事大模型的人来说,作为一个 agent 的 memory 框架: 测 Locomo 、LongtermMem 这几个数据集就是不合适的! 现在的大模型的记忆 不再是 user-centric 了!现在我们需要的大模型记忆是 task-centric ,这两者有本质的区别。 所以, 停止人云亦云吧 。。 我深扒了 GA 的记忆设计, 其简洁性和有效性真的令人印象深刻 ,但是在这里就不展开(如果大家感兴趣,我可能再开一篇帖子详细讲讲)。 我现在对 GA 的使用如图: 有什么记不得的,直接问就好了。。太 tm 牛逼了 。 彩蛋 另外,我是第一次在 V2EX 发帖,发现这图床都要买。。然后也让 GA 给我整了一个, 就一句话 : 嘿嘿。。最后放一张 GA 自己的 skillhub 里的截图, 懂的人自然知道干啥用的 。 写在最后 还有很多没提到的,大家自己尝试就好了。当然 GA 也有很多让我不爽的地方,比如 极其简陋的前端 ,然后我就在 GA 的群里潜水,最后发现了,大概是 开发者的个人风格就是毛坯房的风格 。。问他能不能给整好看点,他回答也简单: 他说 "你让 GA 给你做"。。真的无敌了。。 我不允许还有人不知道 GA !!!! 如果这个帖子有点热度,大家有要求的话, 我可能会从专业的角度展开讲讲 GA 的技术实现方法 ,太 tm 优雅了。。