/ip firewall mangle remove [find] /ip firewall nat remove [find] /ip route remove [find dst-address=0.0.0.0/0] /interface pppoe-client remove [find name=pppoe1] /interface pppoe-client remove [find name=pppoe2] /routing table remove [find name=to-pppoe1] /routing table remove [find name=to-pppoe2] /system scheduler remove [find name=check-pppoe-failover] /interface bridge port remove [find interface=WAN] /interface bridge port remove [find interface=LAN1] /interface bridge port remove [find interface=LAN2] /interface bridge port add bridge=bridge-lan interface=LAN1 /interface bridge port add bridge=bridge-lan interface=LAN2 /ip dns set allow-remote-requests=yes servers=******,****** /interface pppoe-client add name=pppoe1 interface=WAN ac-name="****" user="****" password="****" add-default-route=no use-peer-dns=no disabled=no add name=pppoe2 interface=WAN ac-name="****" user="****" password="****" add-default-route=no use-peer-dns=no disabled=no /ip firewall nat add chain=srcnat out-interface=pppoe1 action=masquerade add chain=srcnat out-interface=pppoe2 action=masquerade /routing table add fib name=to-pppoe1 add fib name=to-pppoe2 /ip firewall mangle add comment=PCC1 chain=prerouting in-interface=bridge-lan connection-mark=no-mark dst-address-type=!local per-connection-classifier=both-addresses-and-ports:2/0 action=mark-connection new-connection-mark=conn-pppoe1 passthrough=yes add comment=PCC2 chain=prerouting in-interface=bridge-lan connection-mark=no-mark dst-address-type=!local per-connection-classifier=both-addresses-and-ports:2/1 action=mark-connection new-connection-mark=conn-pppoe2 passthrough=yes add comment=ROUTE1 chain=prerouting in-interface=bridge-lan connection-mark=conn-pppoe1 action=mark-routing new-routing-mark=to-pppoe1 passthrough=no add comment=ROUTE2 chain=prerouting in-interface=bridge-lan connection-mark=conn-pppoe2 action=mark-routing new-routing-mark=to-pppoe2 passthrough=no /ip route add dst-address=0.0.0.0/0 gateway=pppoe1 routing-table=to-pppoe1 distance=1 add dst-address=0.0.0.0/0 gateway=pppoe2 routing-table=to-pppoe2 distance=1 add dst-address=0.0.0.0/0 gateway=pppoe1 distance=1 add dst-address=0.0.0.0/0 gateway=pppoe2 distance=2 /system scheduler add name=check-pppoe-failover interval=10s on-event=":local p1 [/interface get pppoe1 running]; :local p2 [/interface get pppoe2 running]; :if (\$p1 && \$p2) do={/ip firewall mangle enable [find comment=PCC1]; /ip firewall mangle enable [find comment=PCC2]; /ip firewall mangle enable [find comment=ROUTE1]; /ip firewall mangle enable [find comment=ROUTE2];}; :if (\$p1 && !\$p2) do={/ip firewall mangle enable [find comment=PCC1]; /ip firewall mangle disable [find comment=PCC2]; /ip firewall mangle enable [find comment=ROUTE1]; /ip firewall mangle disable [find comment=ROUTE2];}; :if (!\$p1 && \$p2) do={/ip firewall mangle disable [find comment=PCC1]; /ip firewall mangle enable [find comment=PCC2]; /ip firewall mangle disable [find comment=ROUTE1]; /ip firewall mangle enable [find comment=ROUTE2];};"
agent 是智能体的意思,什么是智能体呢,为啥不叫AI了啊,也不叫大模型了,其实这并不是孤立的概念,AI中文就是人工智能,英文全称:Artificial Intelligence,其实就是计算机科学的一个分支,用来研究开发模拟,延伸人的理论方法技术和应用研究。大模型是ai具象化的技术产品,大模型还分了LLM语言大模型、VLM视觉大模型、MLLM多模态、技术上又出现了很多细节,比如混合专家模型-MOE。 MCP 是定的ai识别的上下文协议,用来,调用外部的服务器,返回固定内容信息的一个规则,大家都用这个规则,不就方便了ai调用外部工具获取信息了。方便打通不同企业数据库和ai的交互。 tools 就是工具的意思,这里和mcp紧密相连,tools泛指一类工具,遵循的上下文协议也未必是mcp。方便ai通过这个工具进行获取信息。 plugin是插件的意思,就是个扩展包,这不是ai独有的概念,浏览器有插件,任何应用都可能有插件,一个插件里面东西就多了,可以包含skill,agents,hooks,mcp severs等内容。 prompt是提示词的意思,大模型学的东西多了,大模型要在知识汪洋中预测你想要的下一个词,简直不要太难,那么就帮她缩小范围降低幻觉,那就是定人物,定任务范围,定目标,这样将结合以上的信息,进行数据处理,就大大降低了,大模型胡说八道的可能性。大模型本身就是个统计学问题,根本不具备任何智慧,和反思能力,并非动态进化的,而是提前通过人类社会无数的现有文档,向量化,然后通过多维向量的训练出来的,一个具备无数维度的数学矩阵,通过通过上下文的切割成token又称词元,一个词元就是一个数字,多个词元就组成了一个数学矩阵,将这个数学矩阵扔到transform架构的数学矩阵中。我也不知道是不是百亿参数是不是也决定了词元的数量呢,会影响回应呢? workflow就是工作流,针对一项工作设计的工作流程,使其完成特定的任务,取代繁重的工作。 hook钩子的意思,什么是钩子啊就是,当执行到特定情况或者涉及特殊判断的时候就会触发的程序,相当于一个钩子,勾住了你的工作流,在特定情况下触发,进而保证进程的稳定和顺利。 skill技能的意思,技能可以是一个md说明的工作文档,也可以是md说明文档加一些小程序、或者一些模板的综合体,目标就是让大模型能按你的md说明文档进行工作。 harness就是一个工作台,工作台上啥也有,自由搭配,想用啥就用啥,比如有plugin、tools、prompt、workflow、hook、skill、和设定好的agent。 AI / 人工智能 └── 大模型 / LLM / VLM / MLLM └── Agentic System / 智能体系统 ├── Prompt:给模型的指令 ├── Context:当前任务上下文 ├── Memory:可长期保存或检索的历史信息 ├── Tools:模型可调用的外部能力 │ └── MCP:连接 tools / resources / prompts 的标准协议之一 ├── Workflow:预设流程 ├── Hook:生命周期触发器 ├── Skill:可复用能力包 ├── Plugin:可安装扩展包 └── Harness:运行框架 / 执行外壳 agent 是配置了 instructions、tools,以及可选运行行为的 LLM MCP Server 可以向 AI 应用暴露 resources、prompts 和 tools。这样不同 AI 应用和不同外部系统之间就不用每次都重新写一套私有接口。 Tool:一个具体能力 MCP Tool:通过 MCP 协议暴露出来的 tool MCP Server:把一组 tools / resources / prompts 提供给 AI 应用 Agent:根据任务需要决定是否调用这些工具 plugin 可能包含 tools、skills、agents、hooks、MCP servers 等内容。简单说,plugin 是“打包和分发能力”的方式。 prompt 帮模型缩小范围,降低幻觉。这个是对的。OpenAI 文档也把 prompt engineering 描述为编写有效指令,让模型更稳定地产生符合要求的内容。 大模型本质上是通过大量数据训练出来的神经网络,它没有人类意义上的主观意识,也不会在普通对话中自动修改自己的模型参数。它的回答来自当前输入、上下文、训练得到的参数,以及推理时的生成过程。我们看到的“推理”“反思”“自我检查”,更多是模型在特定提示、上下文或工具流程下表现出来的能力,而不是人类式的自我意识。 Token:文本被切分后的处理单位。 Token ID:token 被映射成的数字编号。 Embedding:token ID 进入模型后对应的向量表示。 Parameter:模型训练出来的权重和偏置。 Context window:一次输入/输出能处理的 token 上限。 Training tokens:训练时看过的数据 token 数量。 Vocabulary size:分词器支持的 token 种类数量。 文本会先被 tokenizer 切成 token,再映射成 token ID。模型会把 token ID 转成向量表示,也就是 embedding,然后送入 Transformer 网络中计算。Transformer 通过注意力机制和多层神经网络,结合上下文预测后续 token。参数量指的是模型内部训练出来的权重数量,和输入 token 数不是同一个概念。 Workflow 是预先设计好的流程。它强调“步骤固定、路径清楚、可控性强”。比如先读订单,再判断退款规则,再调用退款接口,再发送通知。workflow 里可以用大模型,也可以不用大模型。它和 agent 的区别是:workflow 的路径主要由人或程序提前写好;agent 的路径更多由模型根据目标和中间结果动态决定。 Anthropic 对这个区别说得很清楚:workflows 是 LLM 和工具通过预定义代码路径编排;agents 则是 LLM 动态决定自己的流程和工具使用。 这个方向对。Anthropic 的 Agent Skills 文档也把 skill 描述为模块化能力包,包含 instructions、metadata 和可选资源,比如 scripts、templates,Claude 会在相关任务中自动使用。 另一个官方指南也说 Skills 可以是由 instructions、scripts、resources 组成的文件夹 Context:这次对话/这次任务临时放进来的信息。 Memory:跨会话保存、以后还能拿出来用的信息。 Context 是模型当前这次任务能看到的信息,比如用户问题、系统指令、聊天历史、检索到的文档、工具返回结果等。Memory 是被长期保存、之后还能被取出来的信息,比如用户偏好、项目背景、历史决策、常用规则等。Memory 不是模型参数本身发生了变化,而是系统把相关历史信息保存下来,在需要时重新塞回 context。 5 个帖子 - 4 位参与者 阅读完整话题
我本地可以用 claudecode 调大模型,但是 vscode remote ssh 到一个无外网的服务器上 claudecode for vscode 就跑不了了,请教一下有没有什么方法可以在无外网的服务器上用 claudecode ?
我本地可以用 claudecode 调大模型,但是 vscode remote ssh 到一个无外网的服务器上 claudecode for vscode 就跑不了了,请教一下有没有什么方法可以在无外网的服务器上用 claudecode ?
Blazing fast inference: By shifting the decode bottleneck from memory-bandwidth to compute, DiffusionGemma generates up to 4x faster token output on dedicated GPUs. (1000+ tokens per second on a single NVIDIA H100, 700+ tokens per second on NVIDIA GeForce RTX 5090). 一些补充 Diffusion是一种不同于主流文本大模型Next Token Predict的模型架构,常用于图片生成领域中。NTP是从左向右逐个token生成的,而Diffusion则是给定一块空白区域,模型预测这片区域的每个位置可能的内容,并一次次进行纠错,最终生成完整内容。 14 个帖子 - 9 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 一个手机给电脑打字的小工具,使用 Rust 语言开发,AGPL 许可证。 github.com GitHub - WantenMN/remote-input: Type on your phone, paste into your desktop Type on your phone, paste into your desktop 程序启动后会在局域网内启动一个 HTTPS 服务,手机连上同一 WiFi 就能在浏览器里访问,会有一个输入框,输入完文字,点发送,内容就会自动粘贴到电脑当前光标所在的位置。 想法来源于一个月前(实际上很早之前就有这个想法,之前用 Python 做过一版,不太满意): 手机语音识别结果实时输出到电脑上 开发调优 豆包输入法的语音识别效果我认为是最好的,但现在豆包输入法目前只支持 Mac,没有 Windows 和 Linux。豆包 AI 的语音输入不太好用,并且需要电脑上有麦克风,不如手机灵敏。 所以我有了一个想法,开发两个配套的程序,一个在手机上,另一个在电脑上,它们通过局域网连接通信。 大概流程 手机端:一个输入框,默认激活输入法。启动语言识别功能,直接说话 电脑端:后台程序,接收到手机端发来的文… 此外,对于语音输入的看法,这个主题的观点和我的挺相近的,贴在这供参考: 强烈推荐语音输入,几乎可以告别打字了,无论是否Vibe Coding 搞七捻三 随着大模型的发展,现在语音输入非常成熟了,尤其在Mac端,Windows也没问题。 废话少说,直接说结论。如果不想花钱,就上豆包语音输入法,Mac端、iOS端和安卓端都有。 它的效果就是,识别率高,能给你正常的加上标点符号。中英文混合输入没问题,微信输入法就做不到这一点。 如果你更期待的是结构化的输入,也就是你输入一段零散的话,想到什么说什么,然后输入法把你说的话给你整合出来,基本上保持原意… 5 个帖子 - 3 位参与者 阅读完整话题
先说结论 搞了两年 agent memory ,最痛的体会是:现在的记忆系统从根上就是歪的。不是缺功能,是方向错了。 痛点一:记忆脆弱 —— 存了一堆,但啥都不懂 把几十万封邮件扔进向量数据库,得到的是一个很大但完全没用的上下文堆。存和理解是两码事。 痛点二:时间推理残缺 问一句"我上周在搞啥",大多数系统直接宕机。数据有,但时间感没有。 痛点三:遗忘困境 这条反直觉——记住一切反而更糟。上下文会腐烂。但要写一个好的遗忘算法,比堆存储难多了。 痛点四:评估缺失 你的记忆系统到底有没有在干活?大多数团队根本没法量化。benchmark 散乱且没有标准。 我们的解法:抄作业——Coding Agents 早就搞定了 看 GitHub 的工作流: Issue → PR → Code Review → Git History → Test → Status Update 每一步都被追踪、版本化、可查询。上下文不消失,它是演进的。 我们把这个模式搬到了个人 AI: 原始消息(邮件/Slack/Notion ) → 结构化记忆洞察 Agent 执行前读记忆,执行后更新记忆 两个维度:空间维度(关联记忆)+ 时间维度(时间旅行查询) 空间维度:一起放电的神经元就连线 当你访问洞察 A ,与它关联的洞察自动加强。长期不访问的连接会衰减。 问"为什么这个客户卡住了?",系统不只找到当前项目——还会联想到 3 个月前的类似情况。 时间维度:给你的记忆装一台时光机 时间旅行 API 支持查询任意时间点的记忆状态: "Q3 2024 我的优先级是啥?" "1 月到 3 月我们做了哪些决定?" "展示 2 月底那个项目的样子" 不是摘要,是那个时刻的真实快照。 遗忘引擎:学会放手 三级系统(短 → 中 → 长记忆),评分公式综合考虑: 最近访问时间 访问频率 重要性 是否被收藏 6 个月前的普通客户问候?可能就丢了。3 个月前的关键决策?保留并强化。 目标不是存更久,是存得更聪明。 跑分结果 ┌──────────────────┬───────┐ │ Benchmark │ 成绩 │ ├──────────────────┼───────┤ │ LoCoMo │ 96.3% │ ├──────────────────┼───────┤ │ LongMemEval-S500 │ 97.6% │ └──────────────────┴───────┘ 基本达到 SOTA 。但真正的数字是 35%——CL-bench ( Context Learning Benchmark )。 上下文学习能力(把存储的上下文应用到新情况)才是真正难的问题。 开源 GitHub: https://github.com/melandlabs/openloomi 欢迎来踩,——我们认为这是整个系统里最有趣、也最没被解决好的问题。 有问题尽管问。
先说结论 搞了两年 agent memory ,最痛的体会是:现在的记忆系统从根上就是歪的。不是缺功能,是方向错了。 痛点一:记忆脆弱 —— 存了一堆,但啥都不懂 把几十万封邮件扔进向量数据库,得到的是一个很大但完全没用的上下文堆。存和理解是两码事。 痛点二:时间推理残缺 问一句"我上周在搞啥",大多数系统直接宕机。数据有,但时间感没有。 痛点三:遗忘困境 这条反直觉——记住一切反而更糟。上下文会腐烂。但要写一个好的遗忘算法,比堆存储难多了。 痛点四:评估缺失 你的记忆系统到底有没有在干活?大多数团队根本没法量化。benchmark 散乱且没有标准。 我们的解法:抄作业——Coding Agents 早就搞定了 看 GitHub 的工作流: Issue → PR → Code Review → Git History → Test → Status Update 每一步都被追踪、版本化、可查询。上下文不消失,它是演进的。 我们把这个模式搬到了个人 AI: 原始消息(邮件/Slack/Notion ) → 结构化记忆洞察 Agent 执行前读记忆,执行后更新记忆 两个维度:空间维度(关联记忆)+ 时间维度(时间旅行查询) 空间维度:一起放电的神经元就连线 当你访问洞察 A ,与它关联的洞察自动加强。长期不访问的连接会衰减。 问"为什么这个客户卡住了?",系统不只找到当前项目——还会联想到 3 个月前的类似情况。 时间维度:给你的记忆装一台时光机 时间旅行 API 支持查询任意时间点的记忆状态: "Q3 2024 我的优先级是啥?" "1 月到 3 月我们做了哪些决定?" "展示 2 月底那个项目的样子" 不是摘要,是那个时刻的真实快照。 遗忘引擎:学会放手 三级系统(短 → 中 → 长记忆),评分公式综合考虑: 最近访问时间 访问频率 重要性 是否被收藏 6 个月前的普通客户问候?可能就丢了。3 个月前的关键决策?保留并强化。 目标不是存更久,是存得更聪明。 跑分结果 ┌──────────────────┬───────┐ │ Benchmark │ 成绩 │ ├──────────────────┼───────┤ │ LoCoMo │ 96.3% │ ├──────────────────┼───────┤ │ LongMemEval-S500 │ 97.6% │ └──────────────────┴───────┘ 基本达到 SOTA 。但真正的数字是 35%——CL-bench ( Context Learning Benchmark )。 上下文学习能力(把存储的上下文应用到新情况)才是真正难的问题。 开源 GitHub: https://github.com/melandlabs/openloomi 欢迎来踩,——我们认为这是整个系统里最有趣、也最没被解决好的问题。 有问题尽管问。
邀请链接: https://freemodel.dev/invite/FRE-7250a1d2
之前 AI 推荐 remove.bg 的 API 方案,看了下 89 美元给 500 张图的额度,我 tm 。。。抠图为什么这么贵 自己部署的话,有好的开源方案推荐吗?各位佬,谢谢
之前 AI 推荐 remove.bg 的 API 方案,看了下 89 美元给 500 张图的额度,我 tm 。。。抠图为什么这么贵 自己部署的话,有好的开源方案推荐吗?各位佬,谢谢
场景:本机有ccswitch,用vscode ssh连接remote后,希望codex插件能走本机的ccs配置。 解决方案 : 本机ccswitch开启路由模式,这里我设定路由端口为17666 修改远程主机的 ~/.codex/config.toml 配置文件: model_provider = "custom" model = "gpt-5.5" model_reasoning_effort = "medium" [model_providers.custom] name = "custom" wire_api = "responses" requires_openai_auth = false base_url = "http://127.0.0.1:17666/v1" 启用ssh反代,打开ssh配置文件,添加最后两行内容: Host 192.168.xx.xx HostName xxx User xxx RemoteForward 127.0.0.1:17666 127.0.0.1:17666 ExitOnForwardFailure yes 重启remote的vscode服务:快捷键 shift+ctrl+p ,点击 Kill VS Code Server on Host 测试一下,正常运行 2 个帖子 - 1 位参与者 阅读完整话题
/rc 就是 remote-control 敲一个 /rc 就可以连到手机,这样蹲坑,或者坐地铁还可以干活,不浪费 5h 冷却 Claude Code v2.1.162 版本怎么没了 我是 pro 订阅,之前 145 版本左右还是有的
/rc 就是 remote-control 敲一个 /rc 就可以连到手机,这样蹲坑,或者坐地铁还可以干活,不浪费 5h 冷却 Claude Code v2.1.162 版本怎么没了 我是 pro 订阅,之前 145 版本左右还是有的
先说结论 搞了两年 agent memory ,最痛的体会是:现在的记忆系统从根上就是歪的。不是缺功能,是方向错了。 痛点一:记忆脆弱 —— 存了一堆,但啥都不懂 把几十万封邮件扔进向量数据库,得到的是一个很大但完全没用的上下文堆。存和理解是两码事。 痛点二:时间推理残缺 问一句"我上周在搞啥",大多数系统直接宕机。数据有,但时间感没有。 痛点三:遗忘困境 这条反直觉——记住一切反而更糟。上下文会腐烂。但要写一个好的遗忘算法,比堆存储难多了。 痛点四:评估缺失 你的记忆系统到底有没有在干活?大多数团队根本没法量化。benchmark 散乱且没有标准。 我们的解法:抄作业——Coding Agents 早就搞定了 看 GitHub 的工作流: Issue → PR → Code Review → Git History → Test → Status Update 每一步都被追踪、版本化、可查询。上下文不消失,它是演进的。 我们把这个模式搬到了个人 AI: 原始消息(邮件/Slack/Notion ) → 结构化记忆洞察 Agent 执行前读记忆,执行后更新记忆 两个维度:空间维度(关联记忆)+ 时间维度(时间旅行查询) 空间维度:一起放电的神经元就连线 当你访问洞察 A ,与它关联的洞察自动加强。长期不访问的连接会衰减。 问"为什么这个客户卡住了?",系统不只找到当前项目——还会联想到 3 个月前的类似情况。 时间维度:给你的记忆装一台时光机 时间旅行 API 支持查询任意时间点的记忆状态: "Q3 2024 我的优先级是啥?" "1 月到 3 月我们做了哪些决定?" "展示 2 月底那个项目的样子" 不是摘要,是那个时刻的真实快照。 遗忘引擎:学会放手 三级系统(短 → 中 → 长记忆),评分公式综合考虑: 最近访问时间 访问频率 重要性 是否被收藏 6 个月前的普通客户问候?可能就丢了。3 个月前的关键决策?保留并强化。 目标不是存更久,是存得更聪明。 跑分结果 ┌──────────────────┬───────┐ │ Benchmark │ 成绩 │ ├──────────────────┼───────┤ │ LoCoMo │ 96.3% │ ├──────────────────┼───────┤ │ LongMemEval-S500 │ 97.6% │ └──────────────────┴───────┘ 基本达到 SOTA 。但真正的数字是 35%——CL-bench ( Context Learning Benchmark )。 上下文学习能力(把存储的上下文应用到新情况)才是真正难的问题。 开源 GitHub: https://github.com/melandlabs/openloomi 欢迎来踩,——我们认为这是整个系统里最有趣、也最没被解决好的问题。 有问题尽管问。
先说结论 搞了两年 agent memory ,最痛的体会是:现在的记忆系统从根上就是歪的。不是缺功能,是方向错了。 痛点一:记忆脆弱 —— 存了一堆,但啥都不懂 把几十万封邮件扔进向量数据库,得到的是一个很大但完全没用的上下文堆。存和理解是两码事。 痛点二:时间推理残缺 问一句"我上周在搞啥",大多数系统直接宕机。数据有,但时间感没有。 痛点三:遗忘困境 这条反直觉——记住一切反而更糟。上下文会腐烂。但要写一个好的遗忘算法,比堆存储难多了。 痛点四:评估缺失 你的记忆系统到底有没有在干活?大多数团队根本没法量化。benchmark 散乱且没有标准。 我们的解法:抄作业——Coding Agents 早就搞定了 看 GitHub 的工作流: Issue → PR → Code Review → Git History → Test → Status Update 每一步都被追踪、版本化、可查询。上下文不消失,它是演进的。 我们把这个模式搬到了个人 AI: 原始消息(邮件/Slack/Notion ) → 结构化记忆洞察 Agent 执行前读记忆,执行后更新记忆 两个维度:空间维度(关联记忆)+ 时间维度(时间旅行查询) 空间维度:一起放电的神经元就连线 当你访问洞察 A ,与它关联的洞察自动加强。长期不访问的连接会衰减。 问"为什么这个客户卡住了?",系统不只找到当前项目——还会联想到 3 个月前的类似情况。 时间维度:给你的记忆装一台时光机 时间旅行 API 支持查询任意时间点的记忆状态: "Q3 2024 我的优先级是啥?" "1 月到 3 月我们做了哪些决定?" "展示 2 月底那个项目的样子" 不是摘要,是那个时刻的真实快照。 遗忘引擎:学会放手 三级系统(短 → 中 → 长记忆),评分公式综合考虑: 最近访问时间 访问频率 重要性 是否被收藏 6 个月前的普通客户问候?可能就丢了。3 个月前的关键决策?保留并强化。 目标不是存更久,是存得更聪明。 跑分结果 ┌──────────────────┬───────┐ │ Benchmark │ 成绩 │ ├──────────────────┼───────┤ │ LoCoMo │ 96.3% │ ├──────────────────┼───────┤ │ LongMemEval-S500 │ 97.6% │ └──────────────────┴───────┘ 基本达到 SOTA 。但真正的数字是 35%——CL-bench ( Context Learning Benchmark )。 上下文学习能力(把存储的上下文应用到新情况)才是真正难的问题。 开源 GitHub: https://github.com/melandlabs/openloomi 欢迎来踩,——我们认为这是整个系统里最有趣、也最没被解决好的问题。 有问题尽管问。
之前 AI 推荐 remove.bg 的 API 方案,看了下 89 美元给 500 张图的额度,我 tm 。。。抠图为什么这么贵 自己部署的话,有好的开源方案推荐吗?各位佬,谢谢
之前 AI 推荐 remove.bg 的 API 方案,看了下 89 美元给 500 张图的额度,我 tm 。。。抠图为什么这么贵 自己部署的话,有好的开源方案推荐吗?各位佬,谢谢
先说结论 搞了两年 agent memory ,最痛的体会是:现在的记忆系统从根上就是歪的。不是缺功能,是方向错了。 痛点一:记忆脆弱 —— 存了一堆,但啥都不懂 把几十万封邮件扔进向量数据库,得到的是一个很大但完全没用的上下文堆。存和理解是两码事。 痛点二:时间推理残缺 问一句"我上周在搞啥",大多数系统直接宕机。数据有,但时间感没有。 痛点三:遗忘困境 这条反直觉——记住一切反而更糟。上下文会腐烂。但要写一个好的遗忘算法,比堆存储难多了。 痛点四:评估缺失 你的记忆系统到底有没有在干活?大多数团队根本没法量化。benchmark 散乱且没有标准。 我们的解法:抄作业——Coding Agents 早就搞定了 看 GitHub 的工作流: Issue → PR → Code Review → Git History → Test → Status Update 每一步都被追踪、版本化、可查询。上下文不消失,它是演进的。 我们把这个模式搬到了个人 AI: 原始消息(邮件/Slack/Notion ) → 结构化记忆洞察 Agent 执行前读记忆,执行后更新记忆 两个维度:空间维度(关联记忆)+ 时间维度(时间旅行查询) 空间维度:一起放电的神经元就连线 当你访问洞察 A ,与它关联的洞察自动加强。长期不访问的连接会衰减。 问"为什么这个客户卡住了?",系统不只找到当前项目——还会联想到 3 个月前的类似情况。 时间维度:给你的记忆装一台时光机 时间旅行 API 支持查询任意时间点的记忆状态: "Q3 2024 我的优先级是啥?" "1 月到 3 月我们做了哪些决定?" "展示 2 月底那个项目的样子" 不是摘要,是那个时刻的真实快照。 遗忘引擎:学会放手 三级系统(短 → 中 → 长记忆),评分公式综合考虑: 最近访问时间 访问频率 重要性 是否被收藏 6 个月前的普通客户问候?可能就丢了。3 个月前的关键决策?保留并强化。 目标不是存更久,是存得更聪明。 跑分结果 ┌──────────────────┬───────┐ │ Benchmark │ 成绩 │ ├──────────────────┼───────┤ │ LoCoMo │ 96.3% │ ├──────────────────┼───────┤ │ LongMemEval-S500 │ 97.6% │ └──────────────────┴───────┘ 基本达到 SOTA 。但真正的数字是 35%——CL-bench ( Context Learning Benchmark )。 上下文学习能力(把存储的上下文应用到新情况)才是真正难的问题。 开源 GitHub: https://github.com/melandlabs/openloomi 欢迎来踩,——我们认为这是整个系统里最有趣、也最没被解决好的问题。 有问题尽管问。
之前 AI 推荐 remove.bg 的 API 方案,看了下 89 美元给 500 张图的额度,我 tm 。。。抠图为什么这么贵 自己部署的话,有好的开源方案推荐吗?各位佬,谢谢