AI 智能体有个硬伤:记不住你。每次新对话都是白纸一张。你上周讨论过的项目背景、写过的代码逻辑、提过的个人偏好,它全忘了。这不是你的问题,是所有对话式 AI 的天生缺陷。 Memory Sidecar v3.1.0 就是为了解决这个。它是一个外挂记忆系统,跑在你的智能体( Hermes 、Claude Code 、Cursor 、Codex ,什么都行)旁边,不碰核心代码,独立进程、共享目录。装完你的智能体就有了三层记忆:热层(当前会话 context )→ 温层( PostgreSQL 事实图谱,50ms 级召回)→ 冷层(知识图谱 + 十万条消息的全文搜索)。 说人话就是:它帮你智能体记住了所有聊过的东西,并且知道在什么时候把什么拿出来。 架构很薄。去掉了之前那个笨重的 Docker 中间层,现在三层的故障点更少,部署一条命令搞定。支持重点档案( Focused Dossier )——比如某个重要的人、长期项目、反复出现的故障,可以单独追踪、优先召回。 生产数据来自一台连续跑了 2 个月的 Hermes 服务器:10,885 个知识图谱页面、42,481 个提取的事实节点、105,601 条可搜索的会话消息。不是原型,是每天在用的东西。 安装很简单:设一下 AGENT_HOME ,跑 install.sh ,选个 embedding 模型( 6 种可选,默认推荐中英混合的 multilingual-e5-small ),其他自动完成。开源 MIT 协议。 https://github.com/mage0535/hermes-memory-installer
AI 智能体有个硬伤:记不住你。每次新对话都是白纸一张。你上周讨论过的项目背景、写过的代码逻辑、提过的个人偏好,它全忘了。这不是你的问题,是所有对话式 AI 的天生缺陷。 Memory Sidecar v3.1.0 就是为了解决这个。它是一个外挂记忆系统,跑在你的智能体( Hermes 、Claude Code 、Cursor 、Codex ,什么都行)旁边,不碰核心代码,独立进程、共享目录。装完你的智能体就有了三层记忆:热层(当前会话 context )→ 温层( PostgreSQL 事实图谱,50ms 级召回)→ 冷层(知识图谱 + 十万条消息的全文搜索)。 说人话就是:它帮你智能体记住了所有聊过的东西,并且知道在什么时候把什么拿出来。 架构很薄。去掉了之前那个笨重的 Docker 中间层,现在三层的故障点更少,部署一条命令搞定。支持重点档案( Focused Dossier )——比如某个重要的人、长期项目、反复出现的故障,可以单独追踪、优先召回。 生产数据来自一台连续跑了 2 个月的 Hermes 服务器:10,885 个知识图谱页面、42,481 个提取的事实节点、105,601 条可搜索的会话消息。不是原型,是每天在用的东西。 安装很简单:设一下 AGENT_HOME ,跑 install.sh ,选个 embedding 模型( 6 种可选,默认推荐中英混合的 multilingual-e5-small ),其他自动完成。开源 MIT 协议。 https://github.com/mage0535/hermes-memory-installer
AI 智能体有个硬伤:记不住你。每次新对话都是白纸一张。你上周讨论过的项目背景、写过的代码逻辑、提过的个人偏好,它全忘了。这不是你的问题,是所有对话式 AI 的天生缺陷。 Memory Sidecar v3.1.0 就是为了解决这个。它是一个外挂记忆系统,跑在你的智能体( Hermes 、Claude Code 、Cursor 、Codex ,什么都行)旁边,不碰核心代码,独立进程、共享目录。装完你的智能体就有了三层记忆:热层(当前会话 context )→ 温层( PostgreSQL 事实图谱,50ms 级召回)→ 冷层(知识图谱 + 十万条消息的全文搜索)。 说人话就是:它帮你智能体记住了所有聊过的东西,并且知道在什么时候把什么拿出来。 架构很薄。去掉了之前那个笨重的 Docker 中间层,现在三层的故障点更少,部署一条命令搞定。支持重点档案( Focused Dossier )——比如某个重要的人、长期项目、反复出现的故障,可以单独追踪、优先召回。 生产数据来自一台连续跑了 2 个月的 Hermes 服务器:10,885 个知识图谱页面、42,481 个提取的事实节点、105,601 条可搜索的会话消息。不是原型,是每天在用的东西。 安装很简单:设一下 AGENT_HOME ,跑 install.sh ,选个 embedding 模型( 6 种可选,默认推荐中英混合的 multilingual-e5-small ),其他自动完成。开源 MIT 协议。 https://github.com/mage0535/hermes-memory-installer
AI 智能体有个硬伤:记不住你。每次新对话都是白纸一张。你上周讨论过的项目背景、写过的代码逻辑、提过的个人偏好,它全忘了。这不是你的问题,是所有对话式 AI 的天生缺陷。 Memory Sidecar v3.1.0 就是为了解决这个。它是一个外挂记忆系统,跑在你的智能体( Hermes 、Claude Code 、Cursor 、Codex ,什么都行)旁边,不碰核心代码,独立进程、共享目录。装完你的智能体就有了三层记忆:热层(当前会话 context )→ 温层( PostgreSQL 事实图谱,50ms 级召回)→ 冷层(知识图谱 + 十万条消息的全文搜索)。 说人话就是:它帮你智能体记住了所有聊过的东西,并且知道在什么时候把什么拿出来。 架构很薄。去掉了之前那个笨重的 Docker 中间层,现在三层的故障点更少,部署一条命令搞定。支持重点档案( Focused Dossier )——比如某个重要的人、长期项目、反复出现的故障,可以单独追踪、优先召回。 生产数据来自一台连续跑了 2 个月的 Hermes 服务器:10,885 个知识图谱页面、42,481 个提取的事实节点、105,601 条可搜索的会话消息。不是原型,是每天在用的东西。 安装很简单:设一下 AGENT_HOME ,跑 install.sh ,选个 embedding 模型( 6 种可选,默认推荐中英混合的 multilingual-e5-small ),其他自动完成。开源 MIT 协议。 https://github.com/mage0535/hermes-memory-installer
项目地址: https://github.com/mage0535/hermes-memory-installer 背景 用过 AI 智能体( Claude Code / Cursor / Hermes )的人应该都体会过:每次新对话就是一张白纸。上个会话讨论过的架构决策、当事人、项目背景,下个会话全不记得。重新描述一次两次忍了,十次二十次就麻了。 这个项目的思路是:在智能体旁边跑一个记忆 sidecar ,不碰智能体核心代码。智能体正常写会话,sidecar 负责归档、索引、治理、召回。 v3.0 做了什么 v3.0 实现了完整的外挂记忆管线: 会话采集 → session_to_gbrain.py (增量归档到 gbrain ) 治理重建 → memory_governance_rebuild.py ( FTS5 索引、memory object 多版本状态、向量嵌入) 分层召回 → tiered_context_injector.py ( L1 最近会话 / L2 关键词搜索 / L3 治理对象 + 语义向量,RRF 融合 + 意图重排序) 健康监控 → memory_guardian.py (容量、重复率、stuck 操作检测、安全排空) 编排 + 验收 → memory_maintenance_cycle.py + sidecar_acceptance_check.py 几个值得说的设计 多智能体兼容 统一用 AGENT_HOME 环境变量定位智能体数据目录,向后兼容 HERMES_HOME 。设个变量就能挂到不同智能体上。 多版本记忆对象 同一个事实的多版陈述自动分 conflict group ,最新最好的标记 active ,其余 superseded (设 valid_to )。查询只返回 active ,但历史不丢。 可选向量索引 配置 EMBEDDING_API_URL ( OpenAI 兼容格式)即可自动为 memory object 生成嵌入存到 canonical_semantic_index 表。不配的话,全文本检索( FTS5 / LIKE / hindsight / gbrain )完全正常。 Focused Dossier 重要人物 / 关系 / 项目可以提升为一级记忆对象。生产版已验证了 relationship dossier 。 生产情况 生产服务器跑了半年多,12600+ 会话、2GB state.db 、75MB governance.db 。每周跑一次完整维护周期(归档→重建→排空→召回验证),持续稳定。 欢迎 PR / Issue / Star ⭐ 使用方式 git clone https://github.com/mage0535/hermes-memory-installer.git cd hermes-memory-installer python3 installer/install.py --noninteractive AGENT_HOME=/root/.hermes python3 /root/.hermes/scripts/memory_maintenance_cycle.py