使用 claude 帮我整理了文章. 跟某个 AI 聊得正起劲,它突然把你十分钟前说的话忘了。或者反过来,你随口提过一句、早不在意的小事,它一直惦记着,时不时拿出来念叨。 这两件事看着相反,毛病是同一个:它分不清什么该记、什么该忘。 我们在 CZL AI 的对话平台上做记忆系统,折腾了很多轮。一开始想得很简单,把用户说的话存下来、下次带上不就行了。后来被现实反复教育,才认清一件事:给 AI 装记忆,难的不是怎么记住,是怎么忘得恰到好处。 这篇聊聊我们最后磨出来的这套记忆系统,以及每一层背后那些自以为想明白了、转头被打脸的经历。不讲代码,只讲思路。 为什么非做不可,又抄了谁 先说为什么。其实理由很简单,头部的对话 AI 全在做这件事。ChatGPT 有跨会话的 Memory ,Claude 和 Gemini 也都在往「记得住用户」走。道理也不难想,一个每次都把你当陌生人、聊完就失忆的助手,用起来总有种情感上的断层。你今天说了不吃辣,明天还得再说一遍,到第三次你就懒得开口了。所以记忆对我们不是花哨功能,是对话产品能不能让人一直用下去的分水岭。 具体怎么做,我们没想着从零发明。这条路开源社区已经趟了不少。 最直接的参照是 OpenClaw 那一套记忆生态( openclaw 还有围着它转的 memory-architecture 、 ClawMem 、Supermemory 这些)。它们把一个理念讲透了:给 agent 做记忆,不是塞一个大数据库,而是搭一套分层的东西。有时刻在线的核心档案,有按语义检索捞回来的事实库,甚至还有激活和衰减的机制,让久不用的记忆自然沉底。我们后面的分层,思路就是从这儿来的。 另一条线是 RAG 。它那招很关键,把信息变成语义坐标存起来、用的时候按相关度检索回来。这正是我们记忆里那个「向量事实库」的底层逻辑。说白了,我们就是把 RAG 这套成熟方案,专门改造去记用户的长期事实。 剩下的,是把这些抄来的好想法揉进自己产品的真实场景,然后被一堆现实问题逐个磨出来的。下面一层层说。 一块手表 最轻的一层,轻到都不算记忆。它压根不存,每次对话现算。 内容很朴素:现在几点、星期几、你在哪个时区、上次聊天隔了多久。 别小看这块表。对话里很多自然的小体贴,根本不需要什么记忆系统。你大半夜还在敲,它顺口劝你早点睡。隔了两周回来,它能察觉到有阵子没见了。 把这些只跟此刻有关的东西单拎出来当最轻的一层,是为了让后面几层别被带偏。它们明天就过期,不配进长期记忆。 我们上次聊到哪了 人和人熟不熟,除了长期了解,还有个最近聊过。上周跟朋友说的事,这周见面不用从头解释。 AI 也得有这种连续感。所以你每聊完一段,系统会悄悄找个小模型,给这段对话写句话总结存着。下回再聊,最近几天的总结跟着上场,它就记得我们最近在忙啥。 这里头有两个小心思。 一个是,不是啥对话都值得总结。你随口问一句就走的,总结个啥。所以设了道门槛,太短的、没营养的、小模型自己都觉得没啥好总结的,直接跳过。不然记忆里全是「用户问了个问题」这种废话。 另一个是它后来开窍了。最早总结只按时间捞,只带最近几天的。结果有个尴尬,你半年前认真聊过的项目今天又提起,AI 一脸茫然,因为那条总结早过了保鲜期。后来我们让它学会按相关度捞,除了最近几天,还会把历史里跟你当前这句话最对味的几条翻出来。前两天说的有印象,半年前聊过的今天提到也能接上,两头都占了。 「你是谁」那张卡 这层最像传统意义上的记忆,一张记着你核心信息的卡片,每轮对话都完整递给 AI 。 我是后端工程师,我喜欢你回答简短点,我在长期搞某个项目,这种定义你是谁、得让 AI 时刻记着的事,归这儿。 这层我们摔得最惨,故事也最多。 第一个,让 AI 自己记笔记,结果它卡机了。最初想得挺美,给 AI 一支笔,聊着聊着觉得有啥值得记就顺手记一下。上线没多久就出怪事,用户问能不能推荐点搭配,AI 回了个空白。 后来才搞明白,它一旦决定先记个笔记,就会停下来等系统反馈才继续,可我们当时的设计是记完不管了,于是它一直傻等,再也没把答案说出来。用户的问题,活生生被它自己掏笔记本这个动作打断了。我们先把这支笔收了,改成后台默默帮它记。再后来换了个法子重新发笔给它:它记完,系统拍拍它说记好了接着说,它才把话讲完。一个听起来简单到不行的「让 AI 自己记笔记」,背后来回调了好几次才稳。 第二个,卡片会写满。既然每轮都得带上整张卡,卡就不能无限大,太大了每次对话又慢又烧钱。可满了咋办,我们想了好几版。最早最莽,满了就不让写,用户体感立马变成这 AI 怎么说过的话又不记得了。后来改成两道兜底,满了先让小模型把卡上内容精简合并一遍,一个意思用更短的话说;要是精简完还塞不下,就把这条新的挪到下一层去存,绝不直接扔。记忆可以被整理、被搬家,但不许被拒之门外,这条规矩就是这么立下的。 第三个有点阴间,中文用户看着没满却死活记不进。前端按字数显示进度条,后端按字节数卡上限。中文一个字是一个字,但占三个字节。于是中文用户看着才用一半呢,系统这边早就爆了。这种坑,不踩到根本想不到。 第四个,这张卡用户得看得懂。卡片是摆在设置页让用户看、还能自己改的,可我们一度就干巴巴往那一列,也不说哪些是时刻记着、哪些是用到才想起。用户直接反馈,我看不懂这都是啥。后来给每类记忆都配了句人话,还按来源分了组,AI 自动记的、你手动加的、系统整理的。系统里头再精巧,用户看不懂,体验就是零分。 用到才翻箱的仓库 上面那张卡适合放少而精的东西。可人身上还有一大堆零碎、具体、平时用不上的细节,那只乌龟是 2024 年买的黑色原种,上次去某地的行程。这些塞进每轮都带的卡里太奢侈,一笔勾销又可惜。 这层就是它们的家。原理不神秘,把每条事实变成一串能表达它讲的是啥的数字坐标,存进仓库。等你开口,系统算一下你这句话和仓库里每条事实对不对味,只把最相关的几条临时拎出来。你聊到乌龟,乌龟才冒头;不聊,它就在仓库角落安静待着,一分当下的脑容量都不占。 这层也走得磕磕绊绊。 它一度是个暂存区,结果老丢东西。最早我们把它当草稿箱,先随便存着,等后台整理时再决定留不留。坏就坏在,整理时一旦清掉某条,它就彻底召不回来了,用户的体感就是这 AI 咋把之前记得的事又忘了。后来我们给它正名,当成正经的长期仓库,东西进来就是要长留的,靠用到才翻出来自然沉淀,不靠定期清空管理。 那谁来决定一条信息上那张卡、还是进这个仓库?交给 AI 自己拿主意。它在聊天现场,最清楚一条信息是这人的底色还是一个边角料。判断偶尔走眼也不要紧,后台有套机制慢慢帮它纠回来。 兜底的三道暗线 四层管的是记啥、记哪儿。要让这套东西长期不出乱子,记得多、记得准、不发胖,还得有三道横向的暗线兜着。 第一道,写入时去重。新事实进仓库前,先跟最像的那条比一比,太像了就合并,别新开一条。这能挡掉大半重复。 第二道是后台整理,也就是新陈代谢,整套系统的命门。系统会时不时请小模型把你的全部记忆通盘过一遍,删掉过期的、并掉重复的、把你反复提的细节提拔进核心卡、把过气的核心事实贬回仓库慢慢吃灰。这道整理按你的活跃度触发,你不来它就不折腾,零开销。值得说的是这个能上能下,一条事实可以从用到才想起升成时刻记着,因为你老提它;也能反过来降回去,因为它过气了。记忆不是个只进不出的库房,是个会自己代谢的活物。这条线上的参数我们来回调了无数次,多久代谢一次、像到啥程度算重复、啥样的新事实该护着别误删,全是拿真实数据一点点磨的。 第三道,容量封顶。每层都有天花板,满了就按有没有被用过踢掉最没存在感的那批。但有条死规矩,你亲手加的记忆永远受保护,系统绝不动它。 讲个新鲜出炉的真事。有用户发现自己记忆里冒出两条几乎一模一样的事实,意思完全一样,就形容词调了个位置。一查,这俩恰好都在保护期里,要么太新、要么最近刚被用过,结果负责去重的整理流程压根够不着它们。想通根子就好办了,保护的本意是别误删还没证明自己有用的新事实,可它不该顺手把重复也保护了,于是我们让整理流程学会横着比,认出换了个说法的同一件事再合并。这里有个挺有意思的差别:机器算两条像不像,会卡在阈值上死磕;可让小模型用大白话判一句这俩是不是一回事,准得多。 最后 这套东西的起点是抄来的,OpenClaw 那套分层、RAG 的语义召回、头部产品都在做的记得住用户。这些想法不难找,难的是上线之后,每一层、每一道暗线都被真实用户挨个踩了一遍坑,才有现在的样子。 回头看,存信息从来不是难点,硬盘有的是。难的全在反过来那半边:什么该忘,什么该让位,什么该沉到角落等人来翻。这事我们还在调,远没到终点。
nothing really matters.
nothing really matters.
nothing really matters.
nothing really matters.
今天, 被ChatGPT好好的上了一课 课程开卷考试, 也是比较水的课. 老师允许使用各种工具进行作答, 包括人工智能. 于是我就打开ChatGPT APP, 把题目扔进去回答. 题目比较复杂. 首先是Pro进阶思考了很久. 最后终于把答案吐出来了. 然后手机APP就卡住了, 一直渲染不出来数学公式. 手机各方面性能占用都不高, 但就是APP死活渲染不出结果. 最后是让室友帮忙在PC端打开相同的对话, 一张一张截图发给我. 多亏了好兄弟. 截图都截了9张. 最后时间太紧了, 没写完, 把最重要的答案全扔上去了. 我是真的没考虑过大量Latex公式渲染的极端情况, 误判了. 留下此帖, 警示后人. 如果未来有谁面对类似的使用场景, 一定要小心. 经过我回到宿舍后复盘, 这种需要大量渲染的情况, 一定要让它生成PDF并提供下载, 不要让它直接渲染答案. 希望能帮到有相同需求的朋友. 7 个帖子 - 5 位参与者 阅读完整话题
人总是无法共情以前的自己,为什么过去的我这么愚蠢呢,如何怎么怎么样就好了,不理解过去为什么会做出那样的决定,说出那样的话,为什么不早点开始,为什么不向他人寻求帮助 没有人能真正的理解自己,导致话语的传达的意思出现了偏差,产生了人际关系中的矛盾,这份跨越时空的话语偏差也让现在的我无法共情以前的自己 佬们是如何解决这一课题的,有什么可以点破的话,是从哪本书中了解到的呢 7 个帖子 - 5 位参与者 阅读完整话题
看到大量讨论LLM幻觉但事先不知道是幻觉的帖子有感而发 Gemini和ChatGPT的回答最下面写着这么一行字,他这么写是有他的道理的 LLM是有幻觉的,尽管2026年了幻觉表面看起来已经很少了,但不代表它没有幻觉了 但是很多佬友经常忽视了这个前提 所以经常会疑惑然后发帖 比如经典问题1,AI不知道自己是谁 问题2,DeepSeek <think 标签 所以遇到奇怪的回答,大家可以先往幻觉这个方向想 想得通就不发帖问,想不通问问也可以 但在问之前,一定要搜搜有没有一样的帖子在说这件事情 以及,不要一上来就想搞“大新闻”(发在前沿快讯里) 我知道佬友碰到这样的事情很兴奋很激动,也很想和别的佬友分享这件事情 但一定一定注意发帖时的用词和内容 否则你发的贴也会成为一种 幻觉 13 个帖子 - 8 位参与者 阅读完整话题
记录一下吧,上学上了十几年了 以后再也没有属于我的一间教室了 某种程度上来说学生阶段结束了,但是又没有完全结束 纪念一下吧 4 个帖子 - 3 位参与者 阅读完整话题
2026 ,0420-0426 四十岁,身上很多开关被突然打开了,比如喝冷饮必拉肚。 以前好几年都不会感冒发烧一次,可最近半年就感冒发烧了两次。 把吃灰了一年多的体脂秤掏出来,换上新电池,测量的结果和一年前相比,各项指标都在下降。 本周工作 Codex Plus 真是不够用,我本来还在想要不上 Pro ,但是这周实在太累了,被迫休息了好几次,这么看 Plus 也有好处,起码可以强制让你劳逸结合。 鸿蒙不值得 这周前五天都在没日没夜搞极简时钟的鸿蒙版,最长的一天干了 10 个小时,累瘫了。 回顾一周,大部分时间都在做无效工作。鸿蒙的开发真是让我大开眼界了,原来上架一个 App 居然能这么复杂。AI 再厉害,也干不过繁文缛节和没有标准的流程。 上周我说了,因为华为的 IAP 被卡住了,跟对接群里的华为人员沟通,最终回复就是这句:「按照文档规定,有内购就必须接入华为 IAP 」。但是这个华为 IAP 不仅仅是在后台申请就可以的,还需要审核,听过来人说,最终还有邮寄纸质材料去开通才可以……而苹果这边,IAP 是默认开通的。 开通 IAP 需要申请开通「商户服务」,里面有一个选项是产品类型,如果是已经上架的 App 就选「 App 」,还需要填写上架后的链接,否则就选「其他」,我这个还没上架,理所当然选择「其他」吧。结果申请被拒了,理由是让我改选「 App 」……WNM 。被拒还有另外一个理由,让我更新企业信息,需要手持身份证照相,我对这个非常抗拒,瞬间就不想接入这个傻福 IAP 了。 有好几个上架鸿蒙的开发者群友都说他们的 App 没有接入华为 IAP ,那为什么偏偏强制我接入才能上架?我找了几个鸿蒙市场里没接入华为 IAP 的 App (其中一个还是鸿蒙系统的预装 App ),截图发给工作人员,他们就问我 App 叫什么名字,他们好去核实。去吧,这个 App 叫做「抖音」。 Battle 的最后结果就是,他们不能在群里白纸黑字说可以不接入,不能「留痕」,只能按照文档的要求来答复,于是就打电话说第一版可以先不接入。 IAP 的问题解决了,下一关是本地通知。鸿蒙这个通知分两种,本地通知( App 在前台能发出来的)和代理提醒( App 在后台或者被杀掉后也能发出来的)。可这个代理提醒居然还需要在后台申请才可以在真机上运行。 下一关是实况窗,就是类似于 iOS 实况活动的交互,非常适合计时的展示。但是这个功能,也需要在后台申请,而且光是申请还是不够的,这个功能还有一个前置功能:远程推送。聪明的你一定也想到了,这个远程推送也需要申请,不光是要申请,还需要搞到真机的一个 token 才能在真机上调试,而这个 token ,文档里说每次重装 App 都会变化。据搞定的开发者说,远程推送搞定了,还要再在另外一个页面里第二次申请开通实况窗功能 ……总之实况窗我最终也没能在真机上搞出来,总是提示:实况窗没有启用,即使 profile 里已经明显写着包含了这个功能。 上面说的这些在鸿蒙里都叫做”开放能力“,其实就是对应着 iOS 开发里的”Capabilities“。不同之处是这些功能在 iOS 这边通过 Xcode 里勾选就直接开通了,也不需要重新生成各种文件。反观鸿蒙这边,默认开发者都是坏人,你想做点什么功能都要申请和审核,自动签名是无法在真机上使用这些功能的,必须手动配置全套的证书请求文件+数字证书+密钥+Profile+公钥指纹,还要绑定设备的 UDID ,而且每次申请开通一个功能,都需要重新生成一个 Profile 才能在真机上调试这个新功能。还有构建 App 的各种概念,我到最后也没搞懂,SignConfig 、Target 、Product 、Build mode ,互相嵌套引用。 终于,关关难过关关过,周五下午提交了正式版。不出所料,周六下午收到了审核拒绝的通知。理由有五个,前四个写着是不影响上架,需要后期优化,最后一个致命的理由是: App 里没有华为 IAP…… 还是那句话,不是我不积极适配,是没法积极,积极性都被一步步的傻福要求耗尽了。 其他 极简时钟 iOS ,周一提交了一个版本,去掉了 Mixpanel 的统计,加入更多 Firebase 的埋点。 极简日记 iOS ,在周日发现了两个 bug ,瞬间修复,瞬间提交。 Sticki ,分别在周六和周日提交了两个小版本,修复两个 bug ,对几处 UI 进行了优化。 还是 iOS 搞起来更舒心,特别是现在有各种 skills ,完全靠 AI 就能提交 App 了。 代码之外 挖自家的客户 接到一个公司记账报税的推销电话,要是以前我立刻就会挂掉,但是这次鬼使神差我就多聊了几句。我说我现在是 2400 一年,她说咋这贵啊,她家五一有活动,报价比我现在的低不少。我再问她是哪家,有意思的来了,这小姑娘就是我现在这家代账公司的……正好 Codex 额度用光了,和这个人聊了一中午,她真是施展了浑身解数让我转去她家,与此同时,我也问了一直和我对接的工作人员,问她有没有续费活动,争取一个大优惠😂。 R.I.P. Ed For All Mankind S05E03 ,给我看泪目了。全局的第一男主角,经历了六七十年的风风雨雨,终于英雄谢幕了。Ed 最后的记忆闪回实在是太催泪了,这部剧集的元老至此全部下线了。打开豆瓣,果然首屏都是在讨论这一集。
2026 ,0420-0426 四十岁,身上很多开关被突然打开了,比如喝冷饮必拉肚。 以前好几年都不会感冒发烧一次,可最近半年就感冒发烧了两次。 把吃灰了一年多的体脂秤掏出来,换上新电池,测量的结果和一年前相比,各项指标都在下降。 本周工作 Codex Plus 真是不够用,我本来还在想要不上 Pro ,但是这周实在太累了,被迫休息了好几次,这么看 Plus 也有好处,起码可以强制让你劳逸结合。 鸿蒙不值得 这周前五天都在没日没夜搞极简时钟的鸿蒙版,最长的一天干了 10 个小时,累瘫了。 回顾一周,大部分时间都在做无效工作。鸿蒙的开发真是让我大开眼界了,原来上架一个 App 居然能这么复杂。AI 再厉害,也干不过繁文缛节和没有标准的流程。 上周我说了,因为华为的 IAP 被卡住了,跟对接群里的华为人员沟通,最终回复就是这句:「按照文档规定,有内购就必须接入华为 IAP 」。但是这个华为 IAP 不仅仅是在后台申请就可以的,还需要审核,听过来人说,最终还有邮寄纸质材料去开通才可以……而苹果这边,IAP 是默认开通的。 开通 IAP 需要申请开通「商户服务」,里面有一个选项是产品类型,如果是已经上架的 App 就选「 App 」,还需要填写上架后的链接,否则就选「其他」,我这个还没上架,理所当然选择「其他」吧。结果申请被拒了,理由是让我改选「 App 」……WNM 。被拒还有另外一个理由,让我更新企业信息,需要手持身份证照相,我对这个非常抗拒,瞬间就不想接入这个傻福 IAP 了。 有好几个上架鸿蒙的开发者群友都说他们的 App 没有接入华为 IAP ,那为什么偏偏强制我接入才能上架?我找了几个鸿蒙市场里没接入华为 IAP 的 App (其中一个还是鸿蒙系统的预装 App ),截图发给工作人员,他们就问我 App 叫什么名字,他们好去核实。去吧,这个 App 叫做「抖音」。 Battle 的最后结果就是,他们不能在群里白纸黑字说可以不接入,不能「留痕」,只能按照文档的要求来答复,于是就打电话说第一版可以先不接入。 IAP 的问题解决了,下一关是本地通知。鸿蒙这个通知分两种,本地通知( App 在前台能发出来的)和代理提醒( App 在后台或者被杀掉后也能发出来的)。可这个代理提醒居然还需要在后台申请才可以在真机上运行。 下一关是实况窗,就是类似于 iOS 实况活动的交互,非常适合计时的展示。但是这个功能,也需要在后台申请,而且光是申请还是不够的,这个功能还有一个前置功能:远程推送。聪明的你一定也想到了,这个远程推送也需要申请,不光是要申请,还需要搞到真机的一个 token 才能在真机上调试,而这个 token ,文档里说每次重装 App 都会变化。据搞定的开发者说,远程推送搞定了,还要再在另外一个页面里第二次申请开通实况窗功能 ……总之实况窗我最终也没能在真机上搞出来,总是提示:实况窗没有启用,即使 profile 里已经明显写着包含了这个功能。 上面说的这些在鸿蒙里都叫做”开放能力“,其实就是对应着 iOS 开发里的”Capabilities“。不同之处是这些功能在 iOS 这边通过 Xcode 里勾选就直接开通了,也不需要重新生成各种文件。反观鸿蒙这边,默认开发者都是坏人,你想做点什么功能都要申请和审核,自动签名是无法在真机上使用这些功能的,必须手动配置全套的证书请求文件+数字证书+密钥+Profile+公钥指纹,还要绑定设备的 UDID ,而且每次申请开通一个功能,都需要重新生成一个 Profile 才能在真机上调试这个新功能。还有构建 App 的各种概念,我到最后也没搞懂,SignConfig 、Target 、Product 、Build mode ,互相嵌套引用。 终于,关关难过关关过,周五下午提交了正式版。不出所料,周六下午收到了审核拒绝的通知。理由有五个,前四个写着是不影响上架,需要后期优化,最后一个致命的理由是: App 里没有华为 IAP…… 还是那句话,不是我不积极适配,是没法积极,积极性都被一步步的傻福要求耗尽了。 其他 极简时钟 iOS ,周一提交了一个版本,去掉了 Mixpanel 的统计,加入更多 Firebase 的埋点。 极简日记 iOS ,在周日发现了两个 bug ,瞬间修复,瞬间提交。 Sticki ,分别在周六和周日提交了两个小版本,修复两个 bug ,对几处 UI 进行了优化。 还是 iOS 搞起来更舒心,特别是现在有各种 skills ,完全靠 AI 就能提交 App 了。 代码之外 挖自家的客户 接到一个公司记账报税的推销电话,要是以前我立刻就会挂掉,但是这次鬼使神差我就多聊了几句。我说我现在是 2400 一年,她说咋这贵啊,她家五一有活动,报价比我现在的低不少。我再问她是哪家,有意思的来了,这小姑娘就是我现在这家代账公司的……正好 Codex 额度用光了,和这个人聊了一中午,她真是施展了浑身解数让我转去她家,与此同时,我也问了一直和我对接的工作人员,问她有没有续费活动,争取一个大优惠😂。 R.I.P. Ed For All Mankind S05E03 ,给我看泪目了。全局的第一男主角,经历了六七十年的风风雨雨,终于英雄谢幕了。Ed 最后的记忆闪回实在是太催泪了,这部剧集的元老至此全部下线了。打开豆瓣,果然首屏都是在讨论这一集。
文丨果脯 2026年5月21日,腾讯魔方工作室群开发的《洛克王国:世界》上线了S2赛季更新。这款基于13年经典IP、以精灵收集养成为核心的大世界游戏,在2026年3月底正式上线后迅速成为年度爆款。据官方数据,游戏上线9天用户量便突破3000万,全平台预约人数达6000万,DAU达到1300万。 S2赛季上线前,这款产品更是被寄予厚望, 腾讯方面称其“有望成为下一款长青产品”。 此时,距离《三角洲行动》正式官宣跻身“长青游戏”,也才过去一个季度。 出乎所有人意料的是,5月21日S2赛季更新后,事情迅速脱离了轨道。 几天之内,玩家社区出现大量争议,游戏B站官方动态评论数一度突破百万。彼时,玩家发现游戏出现了大量未在版本公告中提及的修改内容,并且多个已于S1赛季修复的Bug重新出现。这套前所未有的重大运营失误,一度让玩家揣测《洛克王国:世界》的成功,令团队被内部人士“摘了桃子”,最终导致游戏于S1赛季的积累全部白费。 甚至有人因此夸张地总结: 《洛克王国:世界》“自刎归天”了。 玩家评论 争议一直持续到5月24日。当晚,游戏主策划“开水”发布了一封数千字的公开信,向玩家道歉并澄清了“团队换血”“空降管理层”等一系列传言。随后,官方也发放了一系列游戏珍稀道具作为补偿。 从公司公关层面看,这无疑是一次完成度较高的危机应对。但如果大家仅仅把这事当作一场“公关危机处理”来讨论,往往又会错过一个更要命的趋势:长线运营游戏作为文娱产品,与玩家间的信任关系已经是一个不可忽视的核心要素。 这种信任关系,对公司来说是口碑也是品牌,对玩家来说,则是一份“不能被背叛”的热爱成本。 口碑的重要性自不言而喻,好的品牌更是天然能为商品带来溢价。但很多时候,这种商家与用户建立起的信任关系,往往也是最容易崩坏的东西。而在游戏行业,这种信任关系可谓更加脆弱。 回过头看,S2的争议之所以会迅速发酵,核心原因反而是《洛克王国:世界》过去在S1赛季中的表现实在太完美,游戏在精灵生态方面铺设了大量细节,多数玩家能够感受到制作团队在这个虚拟世界中的投入与热爱。 后续每一次应对游戏出现的各类问题,他们更是都拿出了堪称完美的答复。彼时,玩家对《洛克王国:世界》多年的期待、担忧、恐惧与等待都落到了实处,对团队自然也是空前信任。而信任又让玩家愿意投入时间、情感和金钱,理解游戏必然存在的不完美设计,同时也对后续版本抱有期待。 但当观众开始仰视演员,往往就会忘记台上的也是凡人。 S2的巨大滑坡,迅速触动了玩家群体长久以来最敏感的神经:自己似乎又被游戏官方给骗了。之前有多信任,“背叛”带来的愤怒就有多强烈。 S2赛季的更新直接冲击了这层信任。 游戏最初的导火索,出现在男女角色战败动作的调整上。游戏中,女号战斗失败会“鸭子坐”在原地哭泣,男号则是站立叉腰。此次调整将女号“鸭子坐”改为站姿叉腰。修改前,曾有玩家表示男女号的战败动作应该统一,认为“鸭子坐”不雅。 针对这一问题,游戏于S2调整了动作,但这份调整并没有提前写进公告或尝试与玩家达成一致意见。于是,当事情实际发生后,各执一词的两方玩家开始激烈辩驳。 而更严重的问题还在后头——玩家在游戏中陆续发现了更多未在更新日志中公示的“暗改”内容。其中包括十多只主力精灵的数值被调整、精灵生态被删减、部分精灵骑乘姿态变化、精灵表情变化等等。甚至一些已经在S1赛季已被修复的Bug,都在S2中再度出现。 随着争议蔓延,社区中出现了各种猜测。 有玩家推测,制作团队已经被替换,新团队空降接管了项目,这才导致版本质量严重下滑。 甚至有人认为,版本中保留了一些原有团队留下的“不甘心的文案”。这些猜测被大量转发和讨论,进一步放大了玩家的不信任情绪。 5月24日,主策划“开水”在公开信中直接回应了上述猜测。 “现实比故事无聊很多: 没有换血,没有空降,没有另一个幕后团队。 搞出这些问题的人,就是我们自己。就是那个曾经给大家带来过快乐、感动和期待的原团队。这件事其实比‘阴谋论’更让人难受,非常抱歉辜负了大家的期待。” 在解释问题的技术原因时,开水也给出了团队内部针对此次问题的复盘:公测时团队未能来得及完成的调整与资源被遗留在S2版本中;一些在S1紧急修复的问题与数据没能合并回S2的开发分支;一些长期存在的底层问题在修复时引发了意料之外的连锁反应。简而言之,是版本分支管理出了问题。 此外,他还回顾了团队心态层面的变化。S1赛季的成功让团队产生了一种错觉,即“什么问题都可以靠热爱与努力解决”,这种心态导致S2的开发节奏变得激进和忙乱。 这种程度的自我批评超出了多数玩家的预期。和常见的运营公关策略不同,它没有试图将责任推给外部因素,也没有用模糊的措辞搪塞过去,而是承认了团队自身在流程和心态上的失误。社区评论区的高赞回复出现了明显转向,“暂时相信你,看后续表现”“再相信你一次”“希望洛克越来越好”成为主流。 官方实际给出的补偿也相当实在。5月22日凌晨首次紧急推送,发放了两颗棱镜球;此后又追加了包括织梦棱镜球、棱镜球、金镜子在内的多批道具。 官方动态 当然,真正推动信任修复的,不是补偿道具的总价,而是那封信所释放出的态度。 信中没有使用危机公关中常见的模板化语言,没有“深表歉意”“后续改进”这类空话。制作者在信中袒露了个人的低谷期感受,承认了团队在顺境中犯下的错误。这种诚实放在商业语境里或许显得冒险,但对于一款以“童年情怀”和“IP情感连接”为核心的产品来说,这是唯一有效的沟通方式。 于游戏公司而言,信任是品牌溢价,也是DAU和流水的基本盘。 而于玩家而言,信任是时间投入、情感投射和消费决策的安全感来源。 这两者之间的平衡点极其脆弱,甚至很多时候双方关系更像是对立博弈而非合作共赢。一次版本的版本管理失误、一次未经充分验证的快速响应、一个没有说清楚的改动,都可能将长期积累的信任毁于一旦。 在TapTap拍摄的纪录片《存档点》里,《苏丹的游戏》主创钻咖崩提到, “商业游戏想做到的事情,跟玩家希望看到的事情,利益是相悖的。” 很多人可能会单纯将其归因为商业化模式问题,但实际上这句话牵扯到的东西还有更多,比如团队的KPI、产能、成本等等。 当玩家的利益诉求实际落在这些问题上面,开发团队与玩家间的矛盾几乎不可避免。这也导致过去多年,长线游戏最朴实无华、最常见的公关策略就是“沉默”——没办法,说多错多,不如直接挨打立正。 纪录片《存档点》 然而在过去的几年里,这份关系正在发生一些悄然转变。 从明面上看,玩家越发适应甚至依赖当今GaaS型游戏机制,同时也能在多个维度去理解开发团队,知道互相都只是“打工人”。 而另一个显著的变化,是 GaaS型游戏的消费分级变得越来越透明 ,商业目标早在不知不觉间已然发生了转变。 在早期的手游时代,付费设计主要围绕“二八原则”展开,即少数高消费用户贡献大部分收入。但随着产品体量的扩大和DAU的增长,不同消费层次的体验差异问题越来越难以回避。当玩家意识到游戏的实际体验完全来源于付费,自然也就认为产商“骗肝骗氪”,要求维护普通玩家的游戏体验。 现如今,行业内的开发团队已经逐渐形成了一种共识: 可持续的商业模式应该以服务多数人为基础,让每位玩家都能找到自己的位置,即零氪、微氪、中氪、重氪这四个用户层都能在游戏中有对应的体验。 具体到不同厂商,网易倾向于做“三段式”分层(0至200元、200元至几万、5万至10万元以上),在同段位内体验相对接近,月卡和轻氪玩家的体验较为完整。腾讯的特点是分层更为精细,在大DAU项目中强调横向付费(皮肤、个性化道具等),尽量不明显伤害竞技公平;在MMO和长线项目中则通过VIP和成长线来承接不同层级的消费需求,同时控制付费天花板以避免劝退大盘。 同期,二次元品类的崛起,社区的成熟,也让这一切真正变得“透明”。 在二游里,一个玩家有没有满命座角色、有没有专属武器,都直观地反映在他的账号实力和游戏体验上。玩家开始明确地意识到,“有钱人是这么玩游戏的”。这种透明化一方面加剧了玩家之间的比较焦虑,另一方面也让消费行为的“分层”属性变得更加赤裸。 这自然也就提出了新的问题: 消费分层的边界到底该如何设计?如何把普通消费、中高端体验、奢侈品这些界定明确具象在游戏当中? 在这个视角下,腾讯游戏愿意且也有足够资本去给予普通玩家相对完整的游戏体验。《洛克王国:世界》的核心玩法是捉宠和探索,付费点集中在精灵外观、炫彩道具等横向消费上,并不影响核心的游戏循环完成度。这种设计思路与《三角洲行动》一致,也延续了腾讯在大DAU产品上的长期策略。 回溯更早期的腾讯游戏,《穿越火线》《地下城与勇士》《QQ飞车》等产品之所以能覆盖数亿用户,一个关键原因在于,它们为没有付费能力的玩家保留了基本的参与体验。 这些游戏的早期玩家中,有大量是通过免费渠道进入的。他们未必能拿到最好的装备或皮肤,但可以完整地体验到核心玩法。在最没钱的时候,多数人最先接触到的是腾讯游戏。可能有人说腾讯的游戏没有审美,但腾讯提供的不是审美,而是思考审美的条件:一个让用户先走进来、先玩起来、先体验到游戏乐趣的入口。 每个人的游戏需求不同。 有人希望在游戏中获得社交连接,有人追求竞技胜负,有人想在虚拟世界中收集和养成,有人只是想打发通勤的二十分钟。腾讯的产品策略没有试图为所有人提供同一种体验,而是为不同需求的人提供各自能够接受的版本。让更多人有了体验游戏的选择,这本身构成了腾讯游戏商业逻辑中最稳固的一环。 因此,哪怕过去腾讯游戏的口碑并不算好,外部评价其“没有创新”“缺乏审美”“靠社交导量”等批评声音长期存在。但一个无法回避的事实是,随着时代发展,腾讯始终能握住国内市场热度最高的游戏产品。从当年的《穿越火线》《地下城与勇士》《英雄联盟》,到如今的《王者荣耀》《和平精英》《三角洲行动》,未来还可能是《洛克王国:世界》。 也正是基于“让更多人体验游戏”这一理念,腾讯游戏最终在近几年明确提出了长青游戏战略。 而要理解长青游戏,首先需要理解这个时代对游戏产品提出的新要求。 毋庸置疑,中国游戏市场正在从上半场进入下半场。 腾讯集团高级副总裁马晓轶曾解释,之所以提出长青游戏概念,核心背景是中国游戏市场已经逐渐变为一个成熟市场,出爆款越来越难。 腾讯集团高级副总裁 马晓轶 没办法,在时间精力有限的情况下,市场产品越多,内容越细化,玩家就越能针对性选择那些完全符合自己需求的游戏。这几天导致,产品获取一个新用户的成本持续上升,而失去一个老用户的代价也变得更大。 在这种市场环境下,信任不再是抽象的价值观,而是一套可被验证的产品方法论。 回看腾讯游戏近年的“新贵”们,《三角洲行动》起步来源于FPS玩家对J3工作室的认可,《洛克王国:世界》的顺利也离不开玩家对IP的热爱。 毕竟一款游戏如果无法让玩家持续信任它,玩家会很快流失到下一个选择。过去一款端游或手游可能依靠上线期的买量投放和渠道推广快速冲高流水,然后在用户流失前回收成本。但在一个成熟市场中,这种路径的回报率正在持续下降。当用户获取成本上升到一定临界点之后,只有那些能够把用户留下来、让用户持续消费的产品,才具备商业上的可持续性。 这正是长青游戏概念成立的底层逻辑。 在腾讯的定义中,长青游戏有一套明确的量化标准:本土及国际市场,季度平均日活跃账户数超过500万的手游或超过200万的端游,且年流水超过40亿元。马晓轶在2025年时曾统计过,全球符合这一标准的产品大约有70款,其中14款来自腾讯,腾讯投资的公司还有8款。在2025年一年内,跨过长青游戏收入线的新游戏只有约6款。 说白了, 长青游戏的稀缺性不在技术或资金层面,而是在信任层面。 季度DAU超过500万且年流水超过40亿元,意味着产品不仅要吸引大量用户进入,更要让他们持续留下。玩家不会因为一款游戏来自大厂就持续登录,他们持续登录的唯一原因是他们相信在这款游戏里投入时间能得到回报。 马晓轶也反复强调过一个概念: 游戏是一个成功率非常低的行业。 他给出的数据是,过去一年Steam上约有1.9万款PC游戏,手机上超过6万款移动游戏,但成功的数量极低。就算叠加各种资源、能力和IP,新游戏的中奖率最高也只有30%。 这意味着腾讯游戏策略的核心逻辑不是押注某一个爆款,而是系统性地提升成功的概率。 落实到具体做法上,该策略就是帮助更多团队活得足够久、迭代足够多次,让每个团队有不止一次冲击长青的机会。马晓轶的表述是:如果每次中奖率只有30%,你可能得抽4次才能中1次。所以他会跟很多团队说,不是不愿意花钱,而是如果活得足够久,能迭代很多次的话,成功的概率会更大。 洛克王国:世界 这里有一个经常被忽视的关键点: 团队能够活得足够久、迭代足够多次的前提,恰恰是玩家愿意给团队这个机会。如果一次版本失误就导致玩家大规模流失,那就不存在反复迭代的可能性。 所以,腾讯长青游戏战略的底层逻辑,并不是单纯的研发投入和技术积累,而是一套围绕“获取信任、维护信任、修复信任”构建的产品方法论。 信任是长青游戏战略得以运转的前提条件,而不是它的副产品,玩家哪怕不认“腾讯游戏”,旗下工作室也至少会有一家得获得他们的认可。这也是为什么腾讯的产品线中能持续出现大DAU产品。 从《王者荣耀》到《和平精英》到《三角洲行动》,再到今天的《洛克王国:世界》,这些产品并非出自同一个团队或同一个品类,但它们共享同一套底层机制:在被验证过的大品类赛道中,投入充足的研发资源和时间,允许团队迭代试错。 这套机制能够成立,建立在玩家愿意留下来等待产品变好的基础上。《三角洲行动》最初上线时社区充满质疑,经过半年迭代后双端DAU突破1200万并最终突破3000万。《金铲铲之战》最初上线成绩并不算好,随着持续迭代突破千万DAU并稳定在畅销榜前十。这些案例说明的是一件事:玩家给了产品迭代的机会,产品用迭代回应了玩家的信任。开发者和玩家,不应该是你死我活的对抗关系。 在过去的两年里,腾讯产出有潜力新品的频率正在明显加快。从2025年的《三角洲行动》到2026年的《洛克王国:世界》,这个所谓看起来很“难”的事情,于腾讯而言已经显露出一种可持续的生产路径。 除去2026年上半年已上线的《王者荣耀世界》《逆战未来》《洛克王国:世界》等产品,目前腾讯手中仍有不少于68款储备游戏,其中至少23款预计在2026年内有重要动态。 王者荣耀世界 从具体的产品表现来看,《三角洲行动》自2024年9月上线后,经过半年长线运营,DAU于2025年4月突破1200万,三个月后攀升至2000万,同年9月周年庆时达到3000万。进入2026年第一季度,该产品已开始为腾讯持续贡献创纪录的流水。 紧随其后的《洛克王国:世界》,2026年3月底全平台上线,开服13小时新增用户超1500万,首月平均DAU达到1300万。再加之同期上线的《王者荣耀世界》,几款重磅产品在半年之内梯次爆发,这种节奏在过去任何一家游戏大厂的单一年度中都极为罕见。 这种产出频率的加快并非偶然。 回头去看,腾讯给出第一个支柱是 战略聚焦 。2024年下半年,腾讯内部明确提出了“保持聚焦和减少内耗”的目标,驱动团队重心从过去多点开花的“赛马机制”转移到核心赛道的长线运营上。后续,天美工作室群将原本分散的13个工作室合并为4个专注于核心产品的研发子工作室,资源集中投入使团队能够在同一个项目上进行多次迭代。 第二个支柱是 AI驱动的工业化管线 。据腾讯方面披露,AI已全面渗透进游戏研发侧的美术、程序、测试、运营等环节。以混元大模型为基础的视觉生成平台,能直接将游戏美术从概念设计推进至三维建模交付,极大压缩了传统研发中的高耗时环节。财报明确指出,《洛克王国:世界》得益于这类工业管线,能够维持每年新增超过200只精灵的产能。 如果马晓轶将游戏成功比作“抽奖”,那么腾讯当下的运转机制,已经让这种“抽奖”变成了一种高度工业化的常规生产。毕竟哪有小孩天天哭,哪有赌狗一直输——更何况腾讯这都算不上“赌”。 从《三角洲行动》到《洛克王国:世界》的接连引爆,不是简单的运气叠加,而是战略聚焦与工业化基建共同作用下,将原本充满不确定性的爆款突破转化为高概率、可持续生产路径的阶段性结果。 但工业化只能解决产出频率的问题,不能解决用户留存的问题。这也是为什么信任这一维度在长青游戏战略中占有不可替代的位置。 工业化管线可以让腾讯更快地做出更多高质量产品,但如果这些产品无法获得玩家的信任,它们就无法跨过季度DAU 500万和年流水40亿元的门槛,无法成为真正的长青游戏。换句话说,腾讯的长青游戏生产路径由两层机制构成:底层是工业化管线带来的产能保障,上层是信任维护带来的用户留存。缺了任何一层,这条路径都无法持续运转。 这种策略需要耐心,也需要资金和组织的支撑。不是所有公司都有条件支撑一个团队反复“抽奖”。 腾讯的体量和现金流提供了这个基础。2026年一季度,腾讯本土市场游戏收入达到454亿元,同比增长6%;国际市场游戏收入同比增长13%,达到188亿元。这样一个收入底盘,意味着腾讯有足够的资源让多个团队并行试错、长周期投入。 要知道,游戏行业的周期远比外界想象的要长。这个行业的一个周期可能是4到5年。 2021年前后立项或投资的产品(如《三角洲行动》《黑神话:悟空》),直到2024年才开始集中释放成果。 而今天所做的决策,可能要到2030年左右才能看到结果。 这种长周期思维也体现在腾讯对GaaS和买断制单机的看法变化上。马晓轶曾提到,做一款长青的GaaS产品可能需要“一章一章打过去”。如果把目光放长远,把一款买断单机当做验证美术、玩法、故事的垂直切片,那完全可以支持团队去做单机。这种认知的更新说明,腾讯的长青游戏策略并非固守某一种模式,而是在不断根据市场反馈调整方法论。 回到《洛克王国:世界》这个案例。S2赛季的事故是一次典型的“活得更久、迭代更多次”过程中不可避免的代价。在版本管理层面,团队犯了错误。但这些错误之所以能被看见、被讨论、被修复,前提是这款产品有足够大的玩家基数,有足够多的玩家在乎它变成什么样。真正不被在乎的错误,反而才是最为可怕的东西。 结语 2026年5月24日晚,主策划开水在公开信中写下了一段话,后来被不少玩家��复引用: “在很长一段时间内,我不喜欢玩自己做的游戏,玩家也不喜欢我做的东西。后来我也只能尽可能将游戏、甚至自己都视作一段数据,因为如果不这样我会很痛苦。” 他接着说,《洛克王国:世界》的成功让他和团队格外珍惜这份被玩家需要的感觉。而这种珍惜,恰恰是他们在S1的顺境中产生了侥幸心理、在S2犯下错误的根源。 这是一个制作人对自己的诚实审视。他把游戏的商业成功和团队在流程上的漏洞放在同一封信里交代,没有试图美化任何一方。 开水的一封信 节选 于《洛克王国:世界》而言,S2赛季的事故已成为过去。它在财务上不会对这款产品造成致命影响。2026年一季度的财报中,这款产品已被列为“新品接力”的一员,每年超过200个精灵的工业化产能也在持续运转中。这件事留下的真正印记不在财报上,而在一百万条评论、一封数千字的信、以及那看不见摸不着的信任之中。 信任是一种极其脆弱、又极其持久的资产。 它可以被一次版本管理失误瞬间动摇,也可以在坦诚的沟通中被重新扶正。每一次产品事故都是一次对信任的压力测试。一家公司能否走得更远,不取决于它能否避免所有错误,而取决于它如何面对错误、是否敢于承认错误、以及能否在承认之后拿出值得信任的行动。 于腾讯而言,《洛克王国》IP从页游走到手游走过了15年,S2赛季只是这条漫长路径中的一个节点。 长青游戏的“长青”本身,不是成功的结果,而是在不断面对和修复问题的过程中,持续被验证的信任。 本文首发自 “36氪游戏” 。