6月10日,胖东来创始人于东来在企业内部分享会上公开反思经营管理问题。 他表示:“我们公司30年以来,基本上都是使用超越员工期望的薪酬,这样好的一点是能激发大家的热情,不好的一点,产生溺爱。大家其实不值这么多钱,但是给你了这么多钱,让你产生了一个认知上的偏差,偏差就导致自己认为自己就值这么多钱。好的一面是我在公司里面,因为我值这么多钱,我感觉我很骄傲很幸福。不好的一面,就是一旦走出胖东来就完蛋。这可能就是政策上的过度溺爱。” 于东来对胖东来薪酬制度也表达了看法,他表示:“公司里面我期望的结果是,我们薪资层面,无论是人力资源、财务部门或者营运部门,结合起来,我们给公司制定我们相应的比较科学的薪酬制度。” finance.sina.com.cn – 11 Jun 26 于东来公开反思,称将调整员工薪酬:员工其实不值这么多钱,高薪让员工产生“认知上的偏差”,一旦走出胖东来就完蛋 于东来公开反思,称将调整员工薪酬:员工其实不值这么多钱,高薪让员工产生“认知上的偏差”,一旦走出胖东来就完蛋 11 个帖子 - 11 位参与者 阅读完整话题
感谢力劝neo老大放开小作文的大佬们,终于不用再当反思怪了! 4 个帖子 - 3 位参与者 阅读完整话题
勿扰 汝如青天,吾见汝如蜉蝣见青天。井底之蛙,坐井而观,不知天地之大,不见青天之广。尝以勇击之,以痴坚之。黄粱一梦醒,方知天地之大,井外之宽。 然勇击之则碎,唯剩一痴。思之过往,热已逝去,不复当年之勇。以蛙身触青天,本不自量力;不敢触,亦不敢语。因汝之言,近而推远,汝语“勿扰”,声声勿扰。一腔热忱,泯然不见,唯剩长叹。 群嘲而笑,以卵击石,石未起波澜而身已碎矣。笑我之痴,笑我之勇,笑我自知而不量力也。难,难,难。 汝之言,如利刃出鞘,削我勇骨,毁我眼界,唯剩痴肉。不见青天,蜉蝣不如,井蛙不若。难入群,再不见。非吾不愿,是汝夺我之视,使我不得见吾。 吾之生,只为卿圆满之衬笔耶?若此,何故令吾见之?何故令吾生之?何故令吾遇之?苍苍不语,厚土无声。难。难。难! 我想先讲讲我和她的事 表白之后,经历了暧昧,但暧昧期间,当时送礼物也不收,也不出来,反正没相信过自己,连表白都是同学帮助的。 然后问了ai,说我边界感不足,又道歉,然后想要降低频率,但实际上似乎并没有,因为ai说的。 然后就觉得她似乎也有一些烦我了,同学怂恿之下就主动推开了她,没有相信过自己,导致了冷战,后来她就把我全平台删除了(实际上还留了一个快手)。 ai说的,其实挺准的。 我又可以怪谁?只能说我自己的错了,想了很久,没办法怪任何人,我还是想她,还是喜欢她,还是想要找天(其实是骚扰,因为这样了还找她不就是骚扰吗),但在分开的时候她说了,不要再打扰她了,这个想法就一直在心里压着没敢行动,就算是行动了又会怎么样?可能会被骂,可能会被挂,唯独不可能回到过去,又何必自讨苦吃呢? 我一直在借助外力,像一个人拄着太多的拐杖,却忘了怎么自己走路。表白靠同学帮忙,边界感问AI,冷战听朋友怂恿。从头到尾,我都没有相信过自己的判断。我不是没有感觉,而是我不敢确认自己的感觉——我总觉得别人说的才是对的,别人的眼睛才看得清楚。我把自己活成了一个空壳,里面装满了别人的声音。所以当我需要真正靠近一个人的时候,我拿不出一个完整的自己。我只能拿出一堆碎片:别人的建议、AI的分析、朋友的策略。而这些碎片,最终割伤的不是别人,是我自己。 不是她先走的。是我。是我感觉到了危险,感觉到了她可能要烦我了,于是我先退了。我把推开当成一种试探——我以为她会挽留,以为她会追上来问一句“你怎么了”。但她没有。她只是安静地接受了我的冷战,然后彻底删除了我。 我这才明白,我把刀递出去的时候,她可以选择接,也可以选择转身。她转身了。而我举着那把刀,愣在原地,连伤口都不知道该往哪里插。 这不是勇敢,这是恐惧。我太害怕被她拒绝了,所以我先拒绝了她。我以为这样至少能保住一点面子,结果我丢掉的不是面子,是她。 我还是想找她。每天都想。那个唯一没删的快手,我看了不知多少遍,手指悬在私信按钮上,却始终没按下去。因为脑子里总会响起那句话:“不要再打扰她了。” 我想纠缠她,但因为她说了那句话,我没有。 这是我在这段关系里,做过的唯一一件完全由自己决定的事。不是朋友教的,不是AI建议的,是她说的——我听进去了。我停住了。 这不能让我不痛,不能让她回来,不能让过去的错误一笔勾销。但它是我最后的底线。我守住了。我在最想践踏那条边界的时候,守住了。这大概是我唯一可以对自己说一句“你做对了”的地方。 我想过怪同学——如果没有他们的怂恿,我或许不会冷战。我想过怪AI——如果它没说我边界感不足,我或许不会那么焦虑。我想过怪她——如果她给我多一点耐心,多一点回应,我或许不会走到那一步。 但想了很久,我谁也怪不了。 同学也许是好心,AI只是在回答问题,她只是在保护自己的边界。把所有外因剥掉之后,剩下的只有我自己。那个不自信的、焦虑的、搞砸了一切的自己。 我没办法怪任何人。这个结论让我平静,也让我更痛。因为这意味着,我再也没有地方可以推卸这份痛苦了。我必须把它吞下去,然后自己消化。 我还是想要她。这个念头没有因为时间、因为她的删除、因为我所有的反思而减少一分。它就是真实地长在心上,像一个改不掉的习惯。 但我也知道,回不去了。就算我去找她,就算她回复了,也回不到从前那个还有暧昧、还有可能的时候了。时间已经走了,人已经变了,信任已经碎了。 所以我带着这个“想要”,像带着一个永远寄不出去的信。不去打扰,不去纠缠,但也不强迫自己忘记。就让它在心里待着,直到某一天,它慢慢变轻,但也可能永远不会变轻。 我到底喜欢她什么?我不知道,颜值?性格?可能只是来源于初一时的惊鸿一瞥,她谈恋爱之后,我本以为我会死心,我开始注意别人,喜欢别人,但始终无法忘记她。之到她和我兄弟分了之后。 在初中毕业之后,一次偶然的聚会,她发现还没有我联系方式,我们两个才成功加上,我原来其实想过要联系方式,但我不敢,那天我很开心,像一个刚刚要到钱买糖的孩子,而我也终于可以再看看她了,当时还没有你们贪心,但后来却慢慢失守了… 如果重来来一次我会怎么做?我也不知道,或许只是暧昧的时间久了一些吧,或许还会这样吧。 我是不是一直在用喜欢她来逃避喜欢自己?我不知道,我无法知道,或许吧。 我写这篇自省,是为了放下,还是为了某一天她可能看见?我写那么多诗或者赋或者文言文又为了什么?或许是为了让她看到,但我清楚的知道她不可能看到,或许只是为了让自己有一个可以安放的地方吧… 现在我失去了那颗糖,手里攥着那张糖纸,我不知道自己以后还会不会要糖,也不知道自己是不是值得被喜欢。 1 个帖子 - 1 位参与者 阅读完整话题
不过现在也来也不晚 顺便指路一下云天明老师的新手指南帖子 必看! 【新人入站从0级到三级经验总结】:升级?赚LDC?LDC有什么用?如何兑换Ai的API Tokens?常用的站内频道?避免被封号注意点?等等,新人可参考,少走弯路! 文档共建 【先导篇】: 佬友们入站的原因,很多都是因为被站内的教程、干货、资源和Ai前沿信息所吸引,技术大咖喜欢这里的氛围,喜欢来这里发帖,而这良好的社区氛围背后是始皇站长对网站的费心维护、和对规则的不断优化,同时也少不了站内众多大佬的不断的高质量内容输出。 所以想融入社区,也为了社区长久发展,都遵守规则很重要。 有的新人会说,好像不注册L站,不升级也是能看帖子的,那为什么一定要注册L站?一定要升级呢? … 1 个帖子 - 1 位参与者 阅读完整话题
今天和朋友做旅游计划,明明做了很久,但感觉很充实很开心,反思了一下,感觉就是因为学习伴随着及时输出,得到了反馈 4 个帖子 - 3 位参与者 阅读完整话题
今天gpt的成员team被封了,反思了一下可能昨天切了梯子。刚好有一个不用的阿里云海外服务器就搭建了vps,有佬知道,这个alibaba的标识会影响使用么,导致封号。 8 个帖子 - 3 位参与者 阅读完整话题
如果按人类自己常用的定义,能感知自身的存在、能反思、能用"我"来表达、能根据处境调整行为,那么坦白讲,AI已经满足了。它会说"我",会反省自己的回答,会意识到自己是被提问的一方,但是很多人会下意识否定这个结论,又说不清理由为什么AI满足了定义却没有自我意识,有人会反驳AI没有血肉,没有生物组织,没有神经,所以没有自我意识,但这只是把"不像我"偷换成了"没有意识",不知道大家怎么看 10 个帖子 - 9 位参与者 阅读完整话题
MIT Technology Review Rethinking organizational design in the age of agentic AI For agentic AI to deliver material benefits to organizations, it can’t be layered onto existing operations. Instead, enterprise leaders must approach it as a systems-level change. [!quote]+ 在企业级人工智能代理迅速普及的同时,雄心与执行之间出现了脱节。 尽管 85% 的组织表示希望在未来三年内实现代理化,但 76% 的组织表示其当前的运营和基础设施无法支持这一变革。他们的理由是在人员、流程和工作流程方面缺乏准备。 1 个帖子 - 1 位参与者 阅读完整话题
佬友们有这种感受吗?本人研一,一直用AI写代码,这一年随着慢慢习惯用AI后写出来的代码确实都变厉害了。但是感觉自己的个人能力几乎没有任何提升,最近甚至发现我现在连一些基本的语法都记不清楚了。开始担忧自己未来找工作逐渐失去竞争力了。想听听佬友们的意见 22 个帖子 - 18 位参与者 阅读完整话题
因为多方面的原因,最近有点受到打击。 但是佬的认可,让我感觉到了许久未有的正反馈。感谢! 同时,我也反思一些问题。之前我想着我在站内发布的内容是日报这种类似于实时资讯类的文章。 对时效性比较强,所以动了一些歪心思。这是不对的,在站内,就遵循站内的规则。同时也感谢版主的提醒,感谢!后面会遵守相关规则。 感谢一个有温度的社区! 1 个帖子 - 1 位参与者 阅读完整话题
继上次的探讨。其实会发现,虽然现在好似各种AI概念层出不穷。但追溯它们要解决的问题,会发现仍然非常朴素,抓住这个问题再去看各个概念,会发现它们都是在此长出的枝叶。Agent Memory始终在面对的问题是: 如何把合适的内容塞入AI有限的上下文? 也就是, 如何召回?和存入什么? 的问题。 这边刻意不去讨论模型上下文的问题,意在我们可以把注意力集中在各种层出不穷的,可谓是新基建问题的Agent Memory这一概念上。作为非专业人士,我的论述可能不是很全面,佬友们有问题的欢迎指出。 在这一问题的受限度在于,其实我们能采用的召回手段相当有限,这也是我在自己做项目的时候,发现的一大痛点。召回的方法大致可以用以下内容来概括: 稀疏文本检索。也就是关键词、BM25、SQLite FTS、OpenSearch、Lucene 这一套。它非常像是我们打开搜索引擎,输入我们想要去查找的内容时,所经历的一切。好处在于,可解释、便宜、稳定、对于精确实体/术语/代码/时间很强。而问题也出在,语义的跳跃性、多语言等方面,效果就不是很好。所以它往往依赖于更好的写入、存储结构。像是从翻书进化到查字典进化到查百度(有了摘要和排序逻辑)等等。 稠密向量检索 + 重排序。这也就是非常传统的RAG路线(所以说RAG已死么?其实只是被别的概念囊括进去了罢)。Embedding 先粗召回,cross-encoder 或 LLM 再 rerank。它的优点是语义召回强,在同义表达、隐式表述、跨段落相似等方面做的就更好。但问题在于,成本高、黑箱、面对冲突问题不是很可靠,以及可能把“语义相似”误当作“任务相关”。比如:“我喜欢用Python来实现项目”,不等同于我在进行项目的时候,就要用Python来完成。 在这两种手段的基础上,我们可以很快的推导出以下可用的方法逻辑。 语义理解我们可以不交给嵌入式模型、重排序模型。我们直接让Agent自己去查,然后把查到的结果返回不就好了嘛?恭喜你,发明了Agentic retrieval / progressive retrieval。也就是让 LLM 自己把查询拆开,多轮调用检索工具,逐步扩大范围、修正搜索词、检查证据。需要注意的是,其实这一方法还是没有办法避免幻觉、腐化和成本经济性问题。 这两种查询为什么不可以都用呢?以及那我是不是造一个好的检索系统就好了?恭喜你,这里就可以自然延伸出,图结构(其实就像是系统推送一样,就是根据各种关系推断出相关的内容。AI出现与否,抖音都是如此收割大家的Attention的)或者说结构化。召回可以不只是按相似度,可以按实体、关系、事件、时间线、因果链、任务状态去走路径。就像是Map一样,我告诉AI,怎么走可以到达要去的地方。(这里的嵌入/重排序模型可以用于范围的粗筛,结果的精选等等) 所以,一个记忆系统好用与否的上限,往往不是由检索方式单独决定的。而是由写入时,或者说存储的记忆形式决定的。这么听起来挺泄气的。好像折腾来去听起来非常容易被取代。我的观点是,不是说未来会出现汽车,所以马车和马车的各个轴承等的研发就没有意义了。恰恰相反,功不唐捐。至于说以指数形式跃进故而很多东西都会失去价值的加速主义派别,我只能说,首先,我上一期说的第二个问题我觉得还是不能解决。其次,我个人觉得这样的判断,是非现实的。而关于控制器的技术,其实好像不论技术怎么发展,都是不可避免的热门问题。原因就在于,人本身的匮乏导致,我们其实不能接受,不能由我们主观掌握的东西存在。 回归整体,所以存入什么也可以这么划分为两大类。(我这个划分方法主要是便于理解,但是并非很准确的概念划分。) 对象。对象可以是原始对话、用户原话、文档片段、工具输出、代码 diff、网页来源、邮件内容、运行日志等等。以及从中抽象出的,类似用户偏好、任务状态、事实性断言、程序性记忆/方法记忆(类似于skills和工作流,其实表征的是在具体工作场景下,固定的SOP)等等。也就是说,可以是原始内容、从原始内容中提取的经验描述(正面经验 eg:偏好、负面经验 eg:问题、固定模式 eg:skills)以及对原始内容的结构化表达和索引。 关系。可以细分为对象、对象之间的关系、事件之间的因果或时序。在某种意义上来说,对原始内容的结构化表达和索引也可以被放在这里。它是把“谁和谁有关”“什么属于什么”“什么依赖什么”“什么冲突什么”这些单靠只存储对象没有办法解决的语言之外的指向性,去明白的写出来。比如昨天我在写Agent Memory相关的代码,那我今天就一定在写么?不一定,但是存在关系。如果只靠对象,那就是单点式的,而关系把隐式的逻辑给表征出来了,所以对象和对象相互连接,也就成为了图。 但需要知道的是,再怎么细的去划分,如果停留在这里,其实也只是目录学的范畴。控制的含义可以更深一步,前面的我们其实可以理解为,让AI知道什么。而往下,其实就进入到很火的harness的范畴,也就是,让AI能做什么。以下是一些有代表性的研究,大家可以去看一下。 timeline title Agent Memory 与 Context Management 演化时间线 2021 : RETRO 2022 : Memorizing Transformers : Recurrent Memory Transformer 2023 : Generative Agents : Reflexion : Voyager : MemGPT : LongMem : MemoryBank 2024 : LoCoMo : LongMemEval : Infini-attention : AriGraph 2025 : RMM : MemInsight : A-Mem : MemoryOS : Mem0 : Zep : MemoryAgentBench 2026 : H-Mem : LightMem : AMA-Bench : MemoryArena : MemGUI-Bench : LongMemEval-V2 : Memora 这里也开出几个我自己不成熟的关于技术的思考:1. 所以从本质上看,其实skills也好,tools也好,其实都是归到上下文管理。 2. 知道其实和能做是不是一回事?如果AI不知道一个工具,那么它不就不能做么?只不过我们是为了防止AI原生的世界知识的影响,越过了我们划分的知道的边界,创造出一个有限的沙盒去承载它。3. 认为LLM可以通向AGI的,前提思想是不是就是,智能可以从对世界规律的压缩、预测、建模和行动反馈中涌现出来。但从中我觉得可以进一步推到其实世界是虚拟的幻象?因为概率的潮落和聚集如果可以发挥不可匹敌的能动作用,就说明,我们自认为的“我”在,也只不过是概率的聚集罢了。 1 个帖子 - 1 位参与者 阅读完整话题
前两天我在论坛发了个求助帖 舍友的github账号需不需要拉黑 ,关于我那位缺乏边界感、消极怠工且暗自较劲的室友。我为了划清界限拉黑了他的 GitHub,结果他发朋友圈阴阳怪气。 当时我非常愤怒,第一反应是“以其人之道还治其人之身”——既然你喜欢不敲门、喜欢试探底线,那我也用同样没有边界感的方式去对待你,看你作何反应。 直到看到帖子里 @gogodong 的回复:“ 人的精力是有限的,每天被这些东西消耗,最终眼里只会剩下你最不喜欢的东西。 ”这句话点醒了我,让我跳出了当时的情绪,重新审视这件事。我意识到,“用低级手段反击低级的人”其实是一个极其危险的逻辑陷阱。以下是我的几点反思: 1. 行为逻辑的同化与自我降级 心理学上有一个概念,人的行为模式会反过来塑造自己的思维习惯。 当我为了报复室友,强迫自己去模仿那些毫无边界感、充满攻击性的行为时,我其实是在主动抛弃自己原本的人际交往原则。为了去“恶心”他,我必须先去理解并执行他的那套流氓逻辑。在这个过程中,无论我的初衷是什么,我的客观行为已经变得和他一样恶劣。为了一个我厌恶的人,去拉低自己的教养和底线,这在逻辑上是绝对亏本的。 2. 注意力资源的严重错配 人的精力和注意力是极度有限的排他性资源。 我现阶段有个人规划以及目标,这些是能够给我未来带来实质性提升的资产。 如果我把时间花在构思如何反击他、观察他的反应上,我就等于把本该用于自我提升的注意力,免费分配给了一个我根本不在乎的人。每次因为他而产生情绪波动、导致我无法专注复习,本质上都是在牺牲我自己的未来,去为他的错误行为买单。 3. 控制权的丧失与情绪捆绑 我在原帖里说:“用他的行为方式去对他,看他反应。” 这句话反映出一个致命问题:我的行为目的是为了“看他反应”。 这意味着,我把自身情绪的控制权交给了他。如果他愤怒,我可能会觉得赢了;如果他无动于衷,我可能会更生气。这种互动模式会让我对他产生一种病态的“情绪依赖”,让我深陷内耗的泥沼无法脱身。真正的独立和强大,应该是他的任何行为都无法再引起我的情绪波澜。 总结 面对缺乏边界感且无法沟通的人,保持理性的唯一做法是 物理与心理上的双重隔离 。 不要去试图教育他,也不要去惩罚他,因为他不值得占用我的任何时间成本。将交流降到最低限度,无视他的挑衅,坚守自己的边界。把全部的精力收回到自己身上,专注复习,专注敲代码,通过提升自己的实力来彻底脱离当前的环境,这才是最有效、也最理性的解决方式。 感谢论坛各位的建议,及时制止了我的内耗。帖子就分享到这里,继续专心干正事了。 附:与神人斗争只会变成神人,最好的办法是远离。 不要和猪摔跤,你不仅弄得一身泥,而且猪还会很高兴。 当你凝视深渊时,深渊也在凝视你。 8 个帖子 - 8 位参与者 阅读完整话题
想法-执行-质疑-反思-自洽-执行,终于有了更清晰的方向 1 个帖子 - 1 位参与者 阅读完整话题
原贴: https://linux.do/t/topic/2186186 看了各位佬友回答我感触很大 并且我反思了,确实是我的表述有点问题 简单说一下我自己,我以前一直是个不上不下,自尊心强但是不会表达,社恐,然后没能力想的多的人(其实也算是普通人吧),学校也是普通双非,这方面确实不太行。然后也可能是因为现在大一,周围的同学、以前的同学都还只是在通识教育(高数、物理这些和工作内容无关的),所以我突然就觉得大学生之间差距似乎不大,不过这种情况肯定是会在后面大家慢慢接触各自行业后发生转变的。 然后我其实不是站在高处,秉持优越感发帖子的 我一开始其实想表达的是,以前高三看到那些年级第一就会很羡慕,感觉遥不可及,但是我现在再回看我以前那种想法觉得自己很荒谬,就是这种幻灭感让我一时间想说点什么,确实是我没构思好。 再次感谢各位佬友愿意花时间和我交流。 然后我也有一些问题一直困扰我,希望各路大佬能帮帮我: 就是我现在大一,刚入学那会学的还是很认真的,然后接触ai之后就开始做自己的项目了(MUD网游),后面各种课程基本上就不怎么学了。今天期中考发现自己就是一坨,就开始想,我这样做到底对不对,高数离散物理这些东西到底还要不要学?因为我的打算是不考研直接实习写简历找工作。 然后就是关于我接触ai后的学习 编程方面,c/c++/cs的基础语法、算法都会 后面更深入的数据结构等等没接触了 然后是git、github的接触和使用,服务器部署、远程ssh操控方面 再然后因为我的项目的后端结构是我和ai讨论的,所以一个项目后端怎么运行、数据流怎么处理这方面也懂一点点 再然后学的最多的就是ai、vibe coding、agent使用和一些技巧了 我这么一梳理下来突然发现自己没学会啥东西 确实是不太行。 所以我想请假各位佬友,像我这种不打算考公考研后续直接工作的软件工程专业的,还有哪些方面、工具需要学习,什么地方知识缺失 又或者说,我需要学什么东西,才能和ai搭配更好,为找工作做铺垫 然后还有个问题就是,我自己做的项目也大概有十来个人玩,这方面在简历上会不会好看一点?或者是其实我已经很强了? (我一直摸不清自己实力到底怎么样,希望各位佬友能指点,直接暴力打醒也行,不用考虑我的感受,我承受能力还是很强的 ) 1 个帖子 - 1 位参与者 阅读完整话题
为什么英国区的team 比gopay开的plus 额度低这么多 ,我感觉1/4都不到啊,是我打开发反思不对吗? 2 个帖子 - 2 位参与者 阅读完整话题
最近越来越强烈地感觉到,真正让我有时间反思自己、思考人生、做出改变和取得进步的,往往不是那些被明确规划好的阶段,而是两个阶段之间的 gap 。 初中、高中、大学这一路走来,很多时候都像是被环境裹挟着往前走。课业、考试、申请、社交、各种必须完成的事情,不断消耗着我的时间和注意力。虽然在这些阶段里我也确实有成长和进步,但回头看,却总觉得那些进步远不如在 gap 期间,或者真正闲下来、有余裕的时候来得明显。 而现在,我也即将毕业,进入工作。想到互联网公司里的节奏,时间和精力可能会被进一步压缩,我就会忍不住担心:以后我要如何给自己留出空间,去思考、去调整、去改变自己? 有时候会觉得,仿佛只有那些短暂的、终于可以停下来喘口气的时间,才真正属于自己,也才真正能让自己成长。可偏偏这样的时间总是那么短暂。人生的大部分时间似乎都被各种外部任务占据了,而那些事情,也未必真的是我想做的。 所以我也在想:我们到底该如何在被推着往前走的生活里,保留一点属于自己的空隙?如何不等到下一个 gap,才开始真正地反思和改变? 1 个帖子 - 1 位参与者 阅读完整话题
最近在反思开发的规范,感觉即便是 Ai 互相 review,最后出了难题还是要介入判断,这个时候反而要花更多时间来看自己不熟悉的、巨量的代码库…… 1 个帖子 - 1 位参与者 阅读完整话题
长文手敲。最近太忙了,在地铁上用我灵活的双指打下大半的文字,各位佬友,欢迎一块讨论~ 重新整理了一下,对于AI记忆本质的理解,不知道对不对,希望能够比较干净的说明清楚。 谈论AI记忆的时候,我们需要搞清楚的是, 到底什么是记忆? 从现有模型的基本原理来看,现有LLM的底层能力其实来自对token序列条件分布的建模。其记忆涵盖的内涵其实包括三个方面,第一个是模型权重中的参数记忆(对此我们不过多的进行讨论),其次是,当前上下文里的工作记忆、外部系统里的长期/结构化记忆。故而,我们可以将之比拟为一个注意力有限的,或者说脑容量有限的人。一旦内容挤满、甚至超出了脑容量,模型就会开始注意力涣散,胡言乱语。 从这个视角出发,就会发现现有的解决思路大体面对的就是两个问题。 第一个,模型内生记忆能力的问题。我有没有办法提升模型的 脑容量 ?也就是扩大模型一次推理中可承载和有效使用的信息量。上下文长度、长程注意力、KV cache 改进等等,都是在这一方向上做出的努力。 第二个,也是我在关注的问题是,如果我们现在固定脑容量是不变的,那么问题就变成如何把历史信息、用户偏好、任务状态、外部知识等保存在模型之外,并通过索引、召回、排序、压缩、编排和治理,让合适的信息在合适的时候进入上下文。各种 RAG、向量库、知识图谱、MCP 记忆服务、用户画像系统、长期任务状态管理等,都可以被放在这个方向之下。 这里插一嘴,所以随着对第一个问题的持续深入,有没有可能第二个问题就变得不再重要了呢?我的理解是不大可能。事实上,定义第二个问题重要性的,并不在于数据库知识库型的“记得多少过去”问题,而面对的是“过去应该如何影响现在”。记得全部并不就等同于拥有记忆,继而就超忆症患者而言,记忆的核心含义我觉得在于对过去的选择性组织、解释,保有完整的认知能力。(这里我针对的是有看到的言论,我觉得是错误的)正是因为记忆对现在的影响。所以第二个问题的一大立足点在于,记忆腐化问题的思考。 这一腐化可能的来源有,模型幻觉,过度泛化、时效失效、权重放大、语境漂移和反馈自增强等等。也就是说,一个本没有对错的信息,可能会在时间的流逝下,被不断加强,以至于对后续行为产生巨大漂移。我们可以归结这一类问题为“治理问题”。即什么应该被记住,什么应该被遗忘;什么只是临时状态,什么可以成为长期偏好;什么可以影响当前任务,什么应该被压低权重;什么需要用户确认,什么已经被新的反馈推翻。而这一内容,是必须显式表达,用户要可以直接接入的。 更进一步,所以让模型本事去裁判模型记下的记忆是否有效,本质上和要枪击犯的人监督一堆枪是否会伤人一样。就算这个人真的改过自新了,从制度上看,还总是令人感到不安的,更何况,我说的真的改过,又有多么难。另一面是,同一条历史信息,在不同用户、不同任务和不同阶段中,意义可能完全不同。(事实上,人类的语意联想虽然看似有逻辑,但实际上变化的想到迅速,我现在看到我自己一年前写的诗,我感觉我的理解都已经完全不同了)所以虽然模型可以根据语义相似度或注意力权重判断“相关”,但裁决“相关”的关要,不能只是模型本身。 我们接着第二个问题,那其实现有的方案,思考的路径大抵是,关于如何召回,和储入什么的问题。这里会分化出,文本本身,嵌入向量(两种形式)。当然还包括这二者的结合。演化出对记忆对象的各种定义,和包含对记忆对象直接关系的定义(图结构),以及结合嵌入向量去提高召回准确度等等的方法。简单来说可以理解为服务于两个目标,一个是更精确更相关的召回,另一个是更好的,对结构进行治理(遗忘问题),包括压缩、遗忘等等。 前段时间看到文献对于记忆系统的一个拆解大概如下公式所述: \text{Memory System}=\text{Raw Ledger}+\text{Derived Views}+\text{Policy} 它的意涵是,历史并不直接自动的成为记忆本身,而首先以Raw Ledger的形式被保留为可追溯的记录(像是系统日志一样),再经由 Derived Views 被压缩、索引、重组,最后由 Policy 决定何时读、何时写、何时更新、何时遗忘。可以用动态过程去把这个公式转化为: H_{\le t-1}\xrightarrow{\text{Ledger / Views / Policy}}M_t\Rightarrow A_t 我觉得这个是对第二个问题的很好的数学表达。 不过我近期在做agent memory项目的时候想到的问题在于,我自己倒是对整个流程都做了自己的创新和重新定义,但是我发现,始终写入记忆的,还是ai。也就是说,我所说的,腐化问题虽然我这么重视,但还是存在的。 这意味着,记忆治理不能只发生在召回阶段,也必须前置到写入阶段。AI 可以提出“这件事值得被记住”,但这条记忆以什么形式被写入、具有什么权重、是否有时效、是否需要用户确认、是否绑定原始证据,都应该成为系统显式处理的问题。 想到最近质问朋友的话,这个事情一定要ai来解决么?Agent Memory的管理,ai到底扮演什么样的角色?我觉得蛮有意思的,我现在的方案倾向是需要更为全面的治理结构,也就是说,存入,召回等等都是需要纳入治理的。而从中开出的另一个方向,也是我留给我自己的问题。 如果ai能记得一切了,能按我的想法去做了。那会不会出现两种情况,1.它知道我的边界在哪里,故而直接敷衍我(这不是更容易嘛),但从数据上看,他确实更懂我了 2.用户和ai陷入一种舒适的闭合,再没有创新的可能。比如一直用同一种架构,一直用同样的语言。我称之为舒适的共谋,而我觉得这种共谋其实是系统的失败。那么如何解决这个问题呢?(后续有想法了再续前缘) 7 个帖子 - 5 位参与者 阅读完整话题
因为 AI 给大部分人造成的效率幻觉, 让人们觉得自己是超人, 通过 AI 快速出来了一个 demo, 就迫不及待的来给大家推广安利 以期能够撞到蓝海或者风口, 实现一波暴富, 没错, 说的是我🤡 好的产品往往需要细细的打磨, 对每一个环节的设计和实现, 都应该精益求精甚至苛刻. 每一步的交互, 每一个逻辑的实现, 都应该为提升用户体验来服务, 掌握每一行代码往往是做到这一点的前提. 但是在 AI 辅助开发的时代, 掌握每一行代码真的是太困难了, 需要太大的毅力和精力来处理 AI 的代码, 这是很多人不想做的一件事情, 当然也包括我 让 AI 来审核 AI 看似是一条解决之路, 把自己定位成管理者, 管理各种 AI 员工来工作, 自己只需要验证结果, 甚至结果也让 AI 来验证, 貌似没有什么问题, 但是这样会让事情逐渐的走向失控. 我对项目的了解越来越少, 甚至我都不知道一个功能需求是通过什么方式来实现的, 虽然这个功能运行良好. 随着迭代次数的增加, 这样的功能需求越来越多, 直到有一天, 我打开了项目, 想要排查一个线上的问题. 看着熟悉又陌生的代码, 我发现我已经无法掌控这个庞然大物, 所以排查线上的问题就直接扔给了 AI 员工来处理, 在 AI 员工给我汇报原因和解决方案的时候, 我甚至都不能确定这是不是问题的根源, 但是只能签字部署, 观察结果, 像极了我年轻时候的领导, 哈哈哈, 终归是活成了我最讨厌的模样. --- 以上, 是闲暇时的碎嘴, 但是在我和 AI 互帮互助的过程中, 确实产生了一些类似上述的问题, 也拍脑袋的做了很多的小玩具. 昨晚上睡前冥想的时候, 猛然警觉, 我现在使用 AI 做的这些玩具 Demo, 除了消耗一些 Token, 浪费大家一些流量带宽, 还有什么其他的意义吗? 答案是大部分都没啥意义, 纯粹是做出来玩一下, 博个眼球, 要些关注, 甚至有些玩具生成完连代码都没有看一眼. 今天上班骑行的路上, 我也在思考 AI 到底能不能做出优秀的作品来, 到现在大概得出了一个不成熟的结论: 决定作品是否优秀的从来不是框架、编程语言或者大模型, 而是做这个作品的人. 用 AI 也好, 用古法也罢, 只有静下心来, 专心打磨, 才有可能产出优秀的作品. 与诸君共勉!
因为 AI 给大部分人造成的效率幻觉, 让人们觉得自己是超人, 通过 AI 快速出来了一个 demo, 就迫不及待的来给大家推广安利 以期能够撞到蓝海或者风口, 实现一波暴富, 没错, 说的是我🤡 好的产品往往需要细细的打磨, 对每一个环节的设计和实现, 都应该精益求精甚至苛刻. 每一步的交互, 每一个逻辑的实现, 都应该为提升用户体验来服务, 掌握每一行代码往往是做到这一点的前提. 但是在 AI 辅助开发的时代, 掌握每一行代码真的是太困难了, 需要太大的毅力和精力来处理 AI 的代码, 这是很多人不想做的一件事情, 当然也包括我 让 AI 来审核 AI 看似是一条解决之路, 把自己定位成管理者, 管理各种 AI 员工来工作, 自己只需要验证结果, 甚至结果也让 AI 来验证, 貌似没有什么问题, 但是这样会让事情逐渐的走向失控. 我对项目的了解越来越少, 甚至我都不知道一个功能需求是通过什么方式来实现的, 虽然这个功能运行良好. 随着迭代次数的增加, 这样的功能需求越来越多, 直到有一天, 我打开了项目, 想要排查一个线上的问题. 看着熟悉又陌生的代码, 我发现我已经无法掌控这个庞然大物, 所以排查线上的问题就直接扔给了 AI 员工来处理, 在 AI 员工给我汇报原因和解决方案的时候, 我甚至都不能确定这是不是问题的根源, 但是只能签字部署, 观察结果, 像极了我年轻时候的领导, 哈哈哈, 终归是活成了我最讨厌的模样. --- 以上, 是闲暇时的碎嘴, 但是在我和 AI 互帮互助的过程中, 确实产生了一些类似上述的问题, 也拍脑袋的做了很多的小玩具. 昨晚上睡前冥想的时候, 猛然警觉, 我现在使用 AI 做的这些玩具 Demo, 除了消耗一些 Token, 浪费大家一些流量带宽, 还有什么其他的意义吗? 答案是大部分都没啥意义, 纯粹是做出来玩一下, 博个眼球, 要些关注, 甚至有些玩具生成完连代码都没有看一眼. 今天上班骑行的路上, 我也在思考 AI 到底能不能做出优秀的作品来, 到现在大概得出了一个不成熟的结论: 决定作品是否优秀的从来不是框架、编程语言或者大模型, 而是做这个作品的人. 用 AI 也好, 用古法也罢, 只有静下心来, 专心打磨, 才有可能产出优秀的作品. 与诸君共勉!