emo - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

v2ex · 2026-06-11 19:01:19+08:00 · tech

/ip firewall mangle remove [find] /ip firewall nat remove [find] /ip route remove [find dst-address=0.0.0.0/0] /interface pppoe-client remove [find name=pppoe1] /interface pppoe-client remove [find name=pppoe2] /routing table remove [find name=to-pppoe1] /routing table remove [find name=to-pppoe2] /system scheduler remove [find name=check-pppoe-failover] /interface bridge port remove [find interface=WAN] /interface bridge port remove [find interface=LAN1] /interface bridge port remove [find interface=LAN2] /interface bridge port add bridge=bridge-lan interface=LAN1 /interface bridge port add bridge=bridge-lan interface=LAN2 /ip dns set allow-remote-requests=yes servers=******,****** /interface pppoe-client add name=pppoe1 interface=WAN ac-name="****" user="****" password="****" add-default-route=no use-peer-dns=no disabled=no add name=pppoe2 interface=WAN ac-name="****" user="****" password="****" add-default-route=no use-peer-dns=no disabled=no /ip firewall nat add chain=srcnat out-interface=pppoe1 action=masquerade add chain=srcnat out-interface=pppoe2 action=masquerade /routing table add fib name=to-pppoe1 add fib name=to-pppoe2 /ip firewall mangle add comment=PCC1 chain=prerouting in-interface=bridge-lan connection-mark=no-mark dst-address-type=!local per-connection-classifier=both-addresses-and-ports:2/0 action=mark-connection new-connection-mark=conn-pppoe1 passthrough=yes add comment=PCC2 chain=prerouting in-interface=bridge-lan connection-mark=no-mark dst-address-type=!local per-connection-classifier=both-addresses-and-ports:2/1 action=mark-connection new-connection-mark=conn-pppoe2 passthrough=yes add comment=ROUTE1 chain=prerouting in-interface=bridge-lan connection-mark=conn-pppoe1 action=mark-routing new-routing-mark=to-pppoe1 passthrough=no add comment=ROUTE2 chain=prerouting in-interface=bridge-lan connection-mark=conn-pppoe2 action=mark-routing new-routing-mark=to-pppoe2 passthrough=no /ip route add dst-address=0.0.0.0/0 gateway=pppoe1 routing-table=to-pppoe1 distance=1 add dst-address=0.0.0.0/0 gateway=pppoe2 routing-table=to-pppoe2 distance=1 add dst-address=0.0.0.0/0 gateway=pppoe1 distance=1 add dst-address=0.0.0.0/0 gateway=pppoe2 distance=2 /system scheduler add name=check-pppoe-failover interval=10s on-event=":local p1 [/interface get pppoe1 running]; :local p2 [/interface get pppoe2 running]; :if (\$p1 && \$p2) do={/ip firewall mangle enable [find comment=PCC1]; /ip firewall mangle enable [find comment=PCC2]; /ip firewall mangle enable [find comment=ROUTE1]; /ip firewall mangle enable [find comment=ROUTE2];}; :if (\$p1 && !\$p2) do={/ip firewall mangle enable [find comment=PCC1]; /ip firewall mangle disable [find comment=PCC2]; /ip firewall mangle enable [find comment=ROUTE1]; /ip firewall mangle disable [find comment=ROUTE2];}; :if (!\$p1 && \$p2) do={/ip firewall mangle disable [find comment=PCC1]; /ip firewall mangle enable [find comment=PCC2]; /ip firewall mangle disable [find comment=ROUTE1]; /ip firewall mangle enable [find comment=ROUTE2];};"

我想想目前，大家经常说的名词有哪些啊，agent, MCP, tools, Plugin, Prompt, workflow，Hook，skill，harness，memory/context大概就是这些吧，为了方便大家理解，和大佬指正错误，我将按名词进行解释：

LinuxDo 最新话题 · 2026-06-11 17:55:32+08:00 · tech

agent 是智能体的意思，什么是智能体呢，为啥不叫AI了啊，也不叫大模型了，其实这并不是孤立的概念，AI中文就是人工智能，英文全称：Artificial Intelligence，其实就是计算机科学的一个分支，用来研究开发模拟，延伸人的理论方法技术和应用研究。大模型是ai具象化的技术产品，大模型还分了LLM语言大模型、VLM视觉大模型、MLLM多模态、技术上又出现了很多细节，比如混合专家模型-MOE。 MCP 是定的ai识别的上下文协议，用来，调用外部的服务器，返回固定内容信息的一个规则，大家都用这个规则，不就方便了ai调用外部工具获取信息了。方便打通不同企业数据库和ai的交互。 tools 就是工具的意思，这里和mcp紧密相连，tools泛指一类工具，遵循的上下文协议也未必是mcp。方便ai通过这个工具进行获取信息。 plugin是插件的意思，就是个扩展包，这不是ai独有的概念，浏览器有插件，任何应用都可能有插件，一个插件里面东西就多了，可以包含skill，agents，hooks，mcp severs等内容。 prompt是提示词的意思，大模型学的东西多了，大模型要在知识汪洋中预测你想要的下一个词，简直不要太难，那么就帮她缩小范围降低幻觉，那就是定人物，定任务范围，定目标，这样将结合以上的信息，进行数据处理，就大大降低了，大模型胡说八道的可能性。大模型本身就是个统计学问题，根本不具备任何智慧，和反思能力，并非动态进化的，而是提前通过人类社会无数的现有文档，向量化，然后通过多维向量的训练出来的，一个具备无数维度的数学矩阵，通过通过上下文的切割成token又称词元，一个词元就是一个数字，多个词元就组成了一个数学矩阵，将这个数学矩阵扔到transform架构的数学矩阵中。我也不知道是不是百亿参数是不是也决定了词元的数量呢，会影响回应呢？ workflow就是工作流，针对一项工作设计的工作流程，使其完成特定的任务，取代繁重的工作。 hook钩子的意思，什么是钩子啊就是，当执行到特定情况或者涉及特殊判断的时候就会触发的程序，相当于一个钩子，勾住了你的工作流，在特定情况下触发，进而保证进程的稳定和顺利。 skill技能的意思，技能可以是一个md说明的工作文档，也可以是md说明文档加一些小程序、或者一些模板的综合体，目标就是让大模型能按你的md说明文档进行工作。 harness就是一个工作台，工作台上啥也有，自由搭配，想用啥就用啥，比如有plugin、tools、prompt、workflow、hook、skill、和设定好的agent。 AI / 人工智能 └── 大模型 / LLM / VLM / MLLM └── Agentic System / 智能体系统 ├── Prompt：给模型的指令 ├── Context：当前任务上下文 ├── Memory：可长期保存或检索的历史信息 ├── Tools：模型可调用的外部能力 │ └── MCP：连接 tools / resources / prompts 的标准协议之一 ├── Workflow：预设流程 ├── Hook：生命周期触发器 ├── Skill：可复用能力包 ├── Plugin：可安装扩展包 └── Harness：运行框架 / 执行外壳 agent 是配置了 instructions、tools，以及可选运行行为的 LLM MCP Server 可以向 AI 应用暴露 resources、prompts 和 tools。这样不同 AI 应用和不同外部系统之间就不用每次都重新写一套私有接口。 Tool：一个具体能力 MCP Tool：通过 MCP 协议暴露出来的 tool MCP Server：把一组 tools / resources / prompts 提供给 AI 应用 Agent：根据任务需要决定是否调用这些工具 plugin 可能包含 tools、skills、agents、hooks、MCP servers 等内容。简单说，plugin 是“打包和分发能力”的方式。 prompt 帮模型缩小范围，降低幻觉。这个是对的。OpenAI 文档也把 prompt engineering 描述为编写有效指令，让模型更稳定地产生符合要求的内容。大模型本质上是通过大量数据训练出来的神经网络，它没有人类意义上的主观意识，也不会在普通对话中自动修改自己的模型参数。它的回答来自当前输入、上下文、训练得到的参数，以及推理时的生成过程。我们看到的“推理”“反思”“自我检查”，更多是模型在特定提示、上下文或工具流程下表现出来的能力，而不是人类式的自我意识。 Token：文本被切分后的处理单位。 Token ID：token 被映射成的数字编号。 Embedding：token ID 进入模型后对应的向量表示。 Parameter：模型训练出来的权重和偏置。 Context window：一次输入/输出能处理的 token 上限。 Training tokens：训练时看过的数据 token 数量。 Vocabulary size：分词器支持的 token 种类数量。文本会先被 tokenizer 切成 token，再映射成 token ID。模型会把 token ID 转成向量表示，也就是 embedding，然后送入 Transformer 网络中计算。Transformer 通过注意力机制和多层神经网络，结合上下文预测后续 token。参数量指的是模型内部训练出来的权重数量，和输入 token 数不是同一个概念。 Workflow 是预先设计好的流程。它强调“步骤固定、路径清楚、可控性强”。比如先读订单，再判断退款规则，再调用退款接口，再发送通知。workflow 里可以用大模型，也可以不用大模型。它和 agent 的区别是：workflow 的路径主要由人或程序提前写好；agent 的路径更多由模型根据目标和中间结果动态决定。 Anthropic 对这个区别说得很清楚：workflows 是 LLM 和工具通过预定义代码路径编排；agents 则是 LLM 动态决定自己的流程和工具使用。这个方向对。Anthropic 的 Agent Skills 文档也把 skill 描述为模块化能力包，包含 instructions、metadata 和可选资源，比如 scripts、templates，Claude 会在相关任务中自动使用。另一个官方指南也说 Skills 可以是由 instructions、scripts、resources 组成的文件夹 Context：这次对话/这次任务临时放进来的信息。 Memory：跨会话保存、以后还能拿出来用的信息。 Context 是模型当前这次任务能看到的信息，比如用户问题、系统指令、聊天历史、检索到的文档、工具返回结果等。Memory 是被长期保存、之后还能被取出来的信息，比如用户偏好、项目背景、历史决策、常用规则等。Memory 不是模型参数本身发生了变化，而是系统把相关历史信息保存下来，在需要时重新塞回 context。 5 个帖子 - 4 位参与者阅读完整话题

[问与答] 无外网服务器如何使用 claudecode？

v2ex · 2026-06-11 15:23:20+08:00 · tech

我本地可以用 claudecode 调大模型，但是 vscode remote ssh 到一个无外网的服务器上 claudecode for vscode 就跑不了了，请教一下有没有什么方法可以在无外网的服务器上用 claudecode ？

[问与答] 无外网服务器如何使用 claudecode？

v2ex · 2026-06-11 15:09:46+08:00 · tech

我本地可以用 claudecode 调大模型，但是 vscode remote ssh 到一个无外网的服务器上 claudecode for vscode 就跑不了了，请教一下有没有什么方法可以在无外网的服务器上用 claudecode ？

谷歌开源Diffusion Gemma，可在h100上跑出1000tps

LinuxDo 最新话题 · 2026-06-11 01:34:02+08:00 · tech

Blazing fast inference: By shifting the decode bottleneck from memory-bandwidth to compute, DiffusionGemma generates up to 4x faster token output on dedicated GPUs. (1000+ tokens per second on a single NVIDIA H100, 700+ tokens per second on NVIDIA GeForce RTX 5090). 一些补充 Diffusion是一种不同于主流文本大模型Next Token Predict的模型架构，常用于图片生成领域中。NTP是从左向右逐个token生成的，而Diffusion则是给定一块空白区域，模型预测这片区域的每个位置可能的内容，并一次次进行纠错，最终生成完整内容。 14 个帖子 - 9 位参与者阅读完整话题

开源 · remote-input · 用手机上的语音识别，给电脑打字

LinuxDo 最新话题 · 2026-06-10 21:43:21+08:00 · tech

本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出一个手机给电脑打字的小工具，使用 Rust 语言开发，AGPL 许可证。 github.com GitHub - WantenMN/remote-input: Type on your phone, paste into your desktop Type on your phone, paste into your desktop 程序启动后会在局域网内启动一个 HTTPS 服务，手机连上同一 WiFi 就能在浏览器里访问，会有一个输入框，输入完文字，点发送，内容就会自动粘贴到电脑当前光标所在的位置。想法来源于一个月前（实际上很早之前就有这个想法，之前用 Python 做过一版，不太满意）：手机语音识别结果实时输出到电脑上开发调优豆包输入法的语音识别效果我认为是最好的，但现在豆包输入法目前只支持 Mac，没有 Windows 和 Linux。豆包 AI 的语音输入不太好用，并且需要电脑上有麦克风，不如手机灵敏。所以我有了一个想法，开发两个配套的程序，一个在手机上，另一个在电脑上，它们通过局域网连接通信。大概流程手机端：一个输入框，默认激活输入法。启动语言识别功能，直接说话电脑端：后台程序，接收到手机端发来的文… 此外，对于语音输入的看法，这个主题的观点和我的挺相近的，贴在这供参考：强烈推荐语音输入，几乎可以告别打字了，无论是否Vibe Coding 搞七捻三随着大模型的发展，现在语音输入非常成熟了，尤其在Mac端，Windows也没问题。废话少说，直接说结论。如果不想花钱，就上豆包语音输入法，Mac端、iOS端和安卓端都有。它的效果就是，识别率高，能给你正常的加上标点符号。中英文混合输入没问题，微信输入法就做不到这一点。如果你更期待的是结构化的输入，也就是你输入一段零散的话，想到什么说什么，然后输入法把你说的话给你整合出来，基本上保持原意… 5 个帖子 - 3 位参与者阅读完整话题

你的 AI 助手总是"失忆"，原因就这 4 个（以及我们是怎么解决的）

V2EX - 技术 · 2026-06-10 17:53:51+08:00 · tech

先说结论搞了两年 agent memory ，最痛的体会是：现在的记忆系统从根上就是歪的。不是缺功能，是方向错了。痛点一：记忆脆弱 —— 存了一堆，但啥都不懂把几十万封邮件扔进向量数据库，得到的是一个很大但完全没用的上下文堆。存和理解是两码事。痛点二：时间推理残缺问一句"我上周在搞啥"，大多数系统直接宕机。数据有，但时间感没有。痛点三：遗忘困境这条反直觉——记住一切反而更糟。上下文会腐烂。但要写一个好的遗忘算法，比堆存储难多了。痛点四：评估缺失你的记忆系统到底有没有在干活？大多数团队根本没法量化。benchmark 散乱且没有标准。我们的解法：抄作业——Coding Agents 早就搞定了看 GitHub 的工作流： Issue → PR → Code Review → Git History → Test → Status Update 每一步都被追踪、版本化、可查询。上下文不消失，它是演进的。我们把这个模式搬到了个人 AI：原始消息（邮件/Slack/Notion ） → 结构化记忆洞察 Agent 执行前读记忆，执行后更新记忆两个维度：空间维度（关联记忆）+ 时间维度（时间旅行查询）空间维度：一起放电的神经元就连线当你访问洞察 A ，与它关联的洞察自动加强。长期不访问的连接会衰减。问"为什么这个客户卡住了？"，系统不只找到当前项目——还会联想到 3 个月前的类似情况。时间维度：给你的记忆装一台时光机时间旅行 API 支持查询任意时间点的记忆状态： "Q3 2024 我的优先级是啥？" "1 月到 3 月我们做了哪些决定？" "展示 2 月底那个项目的样子" 不是摘要，是那个时刻的真实快照。遗忘引擎：学会放手三级系统（短 → 中 → 长记忆），评分公式综合考虑：最近访问时间访问频率重要性是否被收藏 6 个月前的普通客户问候？可能就丢了。3 个月前的关键决策？保留并强化。目标不是存更久，是存得更聪明。跑分结果 ┌──────────────────┬───────┐ │ Benchmark │ 成绩 │ ├──────────────────┼───────┤ │ LoCoMo │ 96.3% │ ├──────────────────┼───────┤ │ LongMemEval-S500 │ 97.6% │ └──────────────────┴───────┘ 基本达到 SOTA 。但真正的数字是 35%——CL-bench （ Context Learning Benchmark ）。上下文学习能力（把存储的上下文应用到新情况）才是真正难的问题。开源 GitHub: https://github.com/melandlabs/openloomi 欢迎来踩，——我们认为这是整个系统里最有趣、也最没被解决好的问题。有问题尽管问。

你的 AI 助手总是"失忆"，原因就这 4 个（以及我们是怎么解决的）

V2EX - 技术 · 2026-06-10 17:53:51+08:00 · tech

先说结论搞了两年 agent memory ，最痛的体会是：现在的记忆系统从根上就是歪的。不是缺功能，是方向错了。痛点一：记忆脆弱 —— 存了一堆，但啥都不懂把几十万封邮件扔进向量数据库，得到的是一个很大但完全没用的上下文堆。存和理解是两码事。痛点二：时间推理残缺问一句"我上周在搞啥"，大多数系统直接宕机。数据有，但时间感没有。痛点三：遗忘困境这条反直觉——记住一切反而更糟。上下文会腐烂。但要写一个好的遗忘算法，比堆存储难多了。痛点四：评估缺失你的记忆系统到底有没有在干活？大多数团队根本没法量化。benchmark 散乱且没有标准。我们的解法：抄作业——Coding Agents 早就搞定了看 GitHub 的工作流： Issue → PR → Code Review → Git History → Test → Status Update 每一步都被追踪、版本化、可查询。上下文不消失，它是演进的。我们把这个模式搬到了个人 AI：原始消息（邮件/Slack/Notion ） → 结构化记忆洞察 Agent 执行前读记忆，执行后更新记忆两个维度：空间维度（关联记忆）+ 时间维度（时间旅行查询）空间维度：一起放电的神经元就连线当你访问洞察 A ，与它关联的洞察自动加强。长期不访问的连接会衰减。问"为什么这个客户卡住了？"，系统不只找到当前项目——还会联想到 3 个月前的类似情况。时间维度：给你的记忆装一台时光机时间旅行 API 支持查询任意时间点的记忆状态： "Q3 2024 我的优先级是啥？" "1 月到 3 月我们做了哪些决定？" "展示 2 月底那个项目的样子" 不是摘要，是那个时刻的真实快照。遗忘引擎：学会放手三级系统（短 → 中 → 长记忆），评分公式综合考虑：最近访问时间访问频率重要性是否被收藏 6 个月前的普通客户问候？可能就丢了。3 个月前的关键决策？保留并强化。目标不是存更久，是存得更聪明。跑分结果 ┌──────────────────┬───────┐ │ Benchmark │ 成绩 │ ├──────────────────┼───────┤ │ LoCoMo │ 96.3% │ ├──────────────────┼───────┤ │ LongMemEval-S500 │ 97.6% │ └──────────────────┴───────┘ 基本达到 SOTA 。但真正的数字是 35%——CL-bench （ Context Learning Benchmark ）。上下文学习能力（把存储的上下文应用到新情况）才是真正难的问题。开源 GitHub: https://github.com/melandlabs/openloomi 欢迎来踩，——我们认为这是整个系统里最有趣、也最没被解决好的问题。有问题尽管问。

[推广] FreeModel 中转站推广注册各得$10 刀

v2ex · 2026-06-10 17:32:29+08:00 · tech

邀请链接： https://freemodel.dev/invite/FRE-7250a1d2

[问与答] 抠图有什么好的技术栈推荐吗？

v2ex · 2026-06-10 15:22:30+08:00 · tech

之前 AI 推荐 remove.bg 的 API 方案，看了下 89 美元给 500 张图的额度，我 tm 。。。抠图为什么这么贵自己部署的话，有好的开源方案推荐吗？各位佬，谢谢

[问与答] 抠图有什么好的技术栈推荐吗？

v2ex · 2026-06-10 15:22:30+08:00 · tech

之前 AI 推荐 remove.bg 的 API 方案，看了下 89 美元给 500 张图的额度，我 tm 。。。抠图为什么这么贵自己部署的话，有好的开源方案推荐吗？各位佬，谢谢

记录：vscode的codex插件在ssh remote的配置，以此使用本机sscwitch配置

LinuxDo 最新话题 · 2026-06-10 15:15:34+08:00 · tech

场景：本机有ccswitch，用vscode ssh连接remote后，希望codex插件能走本机的ccs配置。解决方案：本机ccswitch开启路由模式，这里我设定路由端口为17666 修改远程主机的 ~/.codex/config.toml 配置文件: model_provider = "custom" model = "gpt-5.5" model_reasoning_effort = "medium" [model_providers.custom] name = "custom" wire_api = "responses" requires_openai_auth = false base_url = "http://127.0.0.1:17666/v1" 启用ssh反代，打开ssh配置文件，添加最后两行内容： Host 192.168.xx.xx HostName xxx User xxx RemoteForward 127.0.0.1:17666 127.0.0.1:17666 ExitOnForwardFailure yes 重启remote的vscode服务:快捷键 shift+ctrl+p ，点击 Kill VS Code Server on Host 测试一下，正常运行 2 个帖子 - 1 位参与者阅读完整话题

[技术栈] Cluade code 的 rc 命令怎么没了

v2ex · 2026-06-10 15:06:19+08:00 · tech

/rc 就是 remote-control 敲一个 /rc 就可以连到手机，这样蹲坑，或者坐地铁还可以干活，不浪费 5h 冷却 Claude Code v2.1.162 版本怎么没了我是 pro 订阅，之前 145 版本左右还是有的

[技术栈] Cluade code 的 rc 命令怎么没了

v2ex · 2026-06-10 15:06:19+08:00 · tech

/rc 就是 remote-control 敲一个 /rc 就可以连到手机，这样蹲坑，或者坐地铁还可以干活，不浪费 5h 冷却 Claude Code v2.1.162 版本怎么没了我是 pro 订阅，之前 145 版本左右还是有的

你的 AI 助手总是"失忆"，原因就这 4 个（以及我们是怎么解决的）

V2EX - 技术 · 2026-06-10 14:41:10+08:00 · tech

先说结论搞了两年 agent memory ，最痛的体会是：现在的记忆系统从根上就是歪的。不是缺功能，是方向错了。痛点一：记忆脆弱 —— 存了一堆，但啥都不懂把几十万封邮件扔进向量数据库，得到的是一个很大但完全没用的上下文堆。存和理解是两码事。痛点二：时间推理残缺问一句"我上周在搞啥"，大多数系统直接宕机。数据有，但时间感没有。痛点三：遗忘困境这条反直觉——记住一切反而更糟。上下文会腐烂。但要写一个好的遗忘算法，比堆存储难多了。痛点四：评估缺失你的记忆系统到底有没有在干活？大多数团队根本没法量化。benchmark 散乱且没有标准。我们的解法：抄作业——Coding Agents 早就搞定了看 GitHub 的工作流： Issue → PR → Code Review → Git History → Test → Status Update 每一步都被追踪、版本化、可查询。上下文不消失，它是演进的。我们把这个模式搬到了个人 AI：原始消息（邮件/Slack/Notion ） → 结构化记忆洞察 Agent 执行前读记忆，执行后更新记忆两个维度：空间维度（关联记忆）+ 时间维度（时间旅行查询）空间维度：一起放电的神经元就连线当你访问洞察 A ，与它关联的洞察自动加强。长期不访问的连接会衰减。问"为什么这个客户卡住了？"，系统不只找到当前项目——还会联想到 3 个月前的类似情况。时间维度：给你的记忆装一台时光机时间旅行 API 支持查询任意时间点的记忆状态： "Q3 2024 我的优先级是啥？" "1 月到 3 月我们做了哪些决定？" "展示 2 月底那个项目的样子" 不是摘要，是那个时刻的真实快照。遗忘引擎：学会放手三级系统（短 → 中 → 长记忆），评分公式综合考虑：最近访问时间访问频率重要性是否被收藏 6 个月前的普通客户问候？可能就丢了。3 个月前的关键决策？保留并强化。目标不是存更久，是存得更聪明。跑分结果 ┌──────────────────┬───────┐ │ Benchmark │ 成绩 │ ├──────────────────┼───────┤ │ LoCoMo │ 96.3% │ ├──────────────────┼───────┤ │ LongMemEval-S500 │ 97.6% │ └──────────────────┴───────┘ 基本达到 SOTA 。但真正的数字是 35%——CL-bench （ Context Learning Benchmark ）。上下文学习能力（把存储的上下文应用到新情况）才是真正难的问题。开源 GitHub: https://github.com/melandlabs/openloomi 欢迎来踩，——我们认为这是整个系统里最有趣、也最没被解决好的问题。有问题尽管问。

你的 AI 助手总是"失忆"，原因就这 4 个（以及我们是怎么解决的）

V2EX - 技术 · 2026-06-10 14:41:10+08:00 · tech

先说结论搞了两年 agent memory ，最痛的体会是：现在的记忆系统从根上就是歪的。不是缺功能，是方向错了。痛点一：记忆脆弱 —— 存了一堆，但啥都不懂把几十万封邮件扔进向量数据库，得到的是一个很大但完全没用的上下文堆。存和理解是两码事。痛点二：时间推理残缺问一句"我上周在搞啥"，大多数系统直接宕机。数据有，但时间感没有。痛点三：遗忘困境这条反直觉——记住一切反而更糟。上下文会腐烂。但要写一个好的遗忘算法，比堆存储难多了。痛点四：评估缺失你的记忆系统到底有没有在干活？大多数团队根本没法量化。benchmark 散乱且没有标准。我们的解法：抄作业——Coding Agents 早就搞定了看 GitHub 的工作流： Issue → PR → Code Review → Git History → Test → Status Update 每一步都被追踪、版本化、可查询。上下文不消失，它是演进的。我们把这个模式搬到了个人 AI：原始消息（邮件/Slack/Notion ） → 结构化记忆洞察 Agent 执行前读记忆，执行后更新记忆两个维度：空间维度（关联记忆）+ 时间维度（时间旅行查询）空间维度：一起放电的神经元就连线当你访问洞察 A ，与它关联的洞察自动加强。长期不访问的连接会衰减。问"为什么这个客户卡住了？"，系统不只找到当前项目——还会联想到 3 个月前的类似情况。时间维度：给你的记忆装一台时光机时间旅行 API 支持查询任意时间点的记忆状态： "Q3 2024 我的优先级是啥？" "1 月到 3 月我们做了哪些决定？" "展示 2 月底那个项目的样子" 不是摘要，是那个时刻的真实快照。遗忘引擎：学会放手三级系统（短 → 中 → 长记忆），评分公式综合考虑：最近访问时间访问频率重要性是否被收藏 6 个月前的普通客户问候？可能就丢了。3 个月前的关键决策？保留并强化。目标不是存更久，是存得更聪明。跑分结果 ┌──────────────────┬───────┐ │ Benchmark │ 成绩 │ ├──────────────────┼───────┤ │ LoCoMo │ 96.3% │ ├──────────────────┼───────┤ │ LongMemEval-S500 │ 97.6% │ └──────────────────┴───────┘ 基本达到 SOTA 。但真正的数字是 35%——CL-bench （ Context Learning Benchmark ）。上下文学习能力（把存储的上下文应用到新情况）才是真正难的问题。开源 GitHub: https://github.com/melandlabs/openloomi 欢迎来踩，——我们认为这是整个系统里最有趣、也最没被解决好的问题。有问题尽管问。

[问与答] 抠图有什么好的技术栈推荐吗？

v2ex · 2026-06-10 14:26:14+08:00 · tech

之前 AI 推荐 remove.bg 的 API 方案，看了下 89 美元给 500 张图的额度，我 tm 。。。抠图为什么这么贵自己部署的话，有好的开源方案推荐吗？各位佬，谢谢

[问与答] 抠图有什么好的技术栈推荐吗？

v2ex · 2026-06-10 14:18:31+08:00 · tech

之前 AI 推荐 remove.bg 的 API 方案，看了下 89 美元给 500 张图的额度，我 tm 。。。抠图为什么这么贵自己部署的话，有好的开源方案推荐吗？各位佬，谢谢

你的 AI 助手总是"失忆"，原因就这 4 个（以及我们是怎么解决的）

V2EX - 技术 · 2026-06-10 14:09:36+08:00 · tech

先说结论搞了两年 agent memory ，最痛的体会是：现在的记忆系统从根上就是歪的。不是缺功能，是方向错了。痛点一：记忆脆弱 —— 存了一堆，但啥都不懂把几十万封邮件扔进向量数据库，得到的是一个很大但完全没用的上下文堆。存和理解是两码事。痛点二：时间推理残缺问一句"我上周在搞啥"，大多数系统直接宕机。数据有，但时间感没有。痛点三：遗忘困境这条反直觉——记住一切反而更糟。上下文会腐烂。但要写一个好的遗忘算法，比堆存储难多了。痛点四：评估缺失你的记忆系统到底有没有在干活？大多数团队根本没法量化。benchmark 散乱且没有标准。我们的解法：抄作业——Coding Agents 早就搞定了看 GitHub 的工作流： Issue → PR → Code Review → Git History → Test → Status Update 每一步都被追踪、版本化、可查询。上下文不消失，它是演进的。我们把这个模式搬到了个人 AI：原始消息（邮件/Slack/Notion ） → 结构化记忆洞察 Agent 执行前读记忆，执行后更新记忆两个维度：空间维度（关联记忆）+ 时间维度（时间旅行查询）空间维度：一起放电的神经元就连线当你访问洞察 A ，与它关联的洞察自动加强。长期不访问的连接会衰减。问"为什么这个客户卡住了？"，系统不只找到当前项目——还会联想到 3 个月前的类似情况。时间维度：给你的记忆装一台时光机时间旅行 API 支持查询任意时间点的记忆状态： "Q3 2024 我的优先级是啥？" "1 月到 3 月我们做了哪些决定？" "展示 2 月底那个项目的样子" 不是摘要，是那个时刻的真实快照。遗忘引擎：学会放手三级系统（短 → 中 → 长记忆），评分公式综合考虑：最近访问时间访问频率重要性是否被收藏 6 个月前的普通客户问候？可能就丢了。3 个月前的关键决策？保留并强化。目标不是存更久，是存得更聪明。跑分结果 ┌──────────────────┬───────┐ │ Benchmark │ 成绩 │ ├──────────────────┼───────┤ │ LoCoMo │ 96.3% │ ├──────────────────┼───────┤ │ LongMemEval-S500 │ 97.6% │ └──────────────────┴───────┘ 基本达到 SOTA 。但真正的数字是 35%——CL-bench （ Context Learning Benchmark ）。上下文学习能力（把存储的上下文应用到新情况）才是真正难的问题。开源 GitHub: https://github.com/melandlabs/openloomi 欢迎来踩，——我们认为这是整个系统里最有趣、也最没被解决好的问题。有问题尽管问。

[问与答] 抠图有什么好的技术栈推荐吗？

v2ex · 2026-06-10 14:04:55+08:00 · tech

之前 AI 推荐 remove.bg 的 API 方案，看了下 89 美元给 500 张图的额度，我 tm 。。。抠图为什么这么贵自己部署的话，有好的开源方案推荐吗？各位佬，谢谢

/tag/emo