本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 说明:基于仓库事实、版规和 README 做了校对与排版。AI 生成/润色记录截图已随帖上传。 项目地址: GitHub - MrGeDiao/paper-reading-zh: Evidence-aware Chinese paper reading rules for Codex, Claude Code, Claude Project, and ChatGPT Project · GitHub 6 个帖子 - 5 位参与者 阅读完整话题
做了个毒舌 AI 小应用:Spicy AI ,专治简历废话、X 自嗨和跟女朋友聊天嘴硬 地址: https://spicyai.icu 它不是那种温柔鼓励型 AI ,而是反过来: 你把材料交上来,它负责把问题骂清楚。 目前支持三个场景: 1. 毒舌简历官 可以上传 / 粘贴简历内容,比如: PDF DOCX Markdown 纯文本 LinkedIn 主页 网页简历 URL 流程是先提取文本,再解析成偏 ATS 的结构化简历,最后生成一份比较毒舌的诊断报告。 主要看这些问题: 简历到底有没有重点 是不是像模板套出来的废话 经历有没有结果和证据 技术栈是不是堆名词 有没有“回去等通知”的风险 2. 毒舌 X 诊断 目前先做了手动版。 可以输入: X handle bio 从 X Analytics 导出的内容 CSV 或者粘贴一些代表性推文 它会根据账号数据和内容表现,判断这个账号到底是在做内容,还是在自我感动。 3. 毒舌恋爱军师 这个比较娱乐。 可以粘贴聊天记录,也可以上传聊天截图识别文本。 然后 AI 会判断两个人的互动状态,比如谁在上头,谁在敷衍,谁在嘴硬。 适合拿来审: 热恋吵架 暧昧拉扯 分手复盘 “TA 到底喜不喜欢我” 当然,别太当真。 但也别完全不当真。 目前还很简单粗糙 这个东西目前更像一个可以玩的 MVP 。 很多地方肯定还可以继续打磨,比如: 判词的毒舌程度 简历解析准确度 X 数据分析维度 聊天截图 OCR 效果 海报样式 移动端体验 也欢迎大家直接骂。 毕竟这个产品自己就是干这个的。 网站地址: https://spicyai.icu
做了个毒舌 AI 小应用:Spicy AI ,专治简历废话、X 自嗨和跟女朋友聊天嘴硬 地址: https://spicyai.icu 它不是那种温柔鼓励型 AI ,而是反过来: 你把材料交上来,它负责把问题骂清楚。 目前支持三个场景: 1. 毒舌简历官 可以上传 / 粘贴简历内容,比如: PDF DOCX Markdown 纯文本 LinkedIn 主页 网页简历 URL 流程是先提取文本,再解析成偏 ATS 的结构化简历,最后生成一份比较毒舌的诊断报告。 主要看这些问题: 简历到底有没有重点 是不是像模板套出来的废话 经历有没有结果和证据 技术栈是不是堆名词 有没有“回去等通知”的风险 2. 毒舌 X 诊断 目前先做了手动版。 可以输入: X handle bio 从 X Analytics 导出的内容 CSV 或者粘贴一些代表性推文 它会根据账号数据和内容表现,判断这个账号到底是在做内容,还是在自我感动。 3. 毒舌恋爱军师 这个比较娱乐。 可以粘贴聊天记录,也可以上传聊天截图识别文本。 然后 AI 会判断两个人的互动状态,比如谁在上头,谁在敷衍,谁在嘴硬。 适合拿来审: 热恋吵架 暧昧拉扯 分手复盘 “TA 到底喜不喜欢我” 当然,别太当真。 但也别完全不当真。 目前还很简单粗糙 这个东西目前更像一个可以玩的 MVP 。 很多地方肯定还可以继续打磨,比如: 判词的毒舌程度 简历解析准确度 X 数据分析维度 聊天截图 OCR 效果 海报样式 移动端体验 也欢迎大家直接骂。 毕竟这个产品自己就是干这个的。 网站地址: https://spicyai.icu
做了个毒舌 AI 小应用:Spicy AI ,专治简历废话、X 自嗨和跟女朋友聊天嘴硬 地址: https://spicyai.icu 它不是那种温柔鼓励型 AI ,而是反过来: 你把材料交上来,它负责把问题骂清楚。 目前支持三个场景: 1. 毒舌简历官 可以上传 / 粘贴简历内容,比如: PDF DOCX Markdown 纯文本 LinkedIn 主页 网页简历 URL 流程是先提取文本,再解析成偏 ATS 的结构化简历,最后生成一份比较毒舌的诊断报告。 主要看这些问题: 简历到底有没有重点 是不是像模板套出来的废话 经历有没有结果和证据 技术栈是不是堆名词 有没有“回去等通知”的风险 2. 毒舌 X 诊断 目前先做了手动版。 可以输入: X handle bio 从 X Analytics 导出的内容 CSV 或者粘贴一些代表性推文 它会根据账号数据和内容表现,判断这个账号到底是在做内容,还是在自我感动。 3. 毒舌恋爱军师 这个比较娱乐。 可以粘贴聊天记录,也可以上传聊天截图识别文本。 然后 AI 会判断两个人的互动状态,比如谁在上头,谁在敷衍,谁在嘴硬。 适合拿来审: 热恋吵架 暧昧拉扯 分手复盘 “TA 到底喜不喜欢我” 当然,别太当真。 但也别完全不当真。 目前还很简单粗糙 这个东西目前更像一个可以玩的 MVP 。 很多地方肯定还可以继续打磨,比如: 判词的毒舌程度 简历解析准确度 X 数据分析维度 聊天截图 OCR 效果 海报样式 移动端体验 也欢迎大家直接骂。 毕竟这个产品自己就是干这个的。 网站地址: https://spicyai.icu
做了个毒舌 AI 小应用:Spicy AI ,专治简历废话、X 自嗨和跟女朋友聊天嘴硬 地址: https://spicyai.icu 它不是那种温柔鼓励型 AI ,而是反过来: 你把材料交上来,它负责把问题骂清楚。 目前支持三个场景: 1. 毒舌简历官 可以上传 / 粘贴简历内容,比如: PDF DOCX Markdown 纯文本 LinkedIn 主页 网页简历 URL 流程是先提取文本,再解析成偏 ATS 的结构化简历,最后生成一份比较毒舌的诊断报告。 主要看这些问题: 简历到底有没有重点 是不是像模板套出来的废话 经历有没有结果和证据 技术栈是不是堆名词 有没有“回去等通知”的风险 2. 毒舌 X 诊断 目前先做了手动版。 可以输入: X handle bio 从 X Analytics 导出的内容 CSV 或者粘贴一些代表性推文 它会根据账号数据和内容表现,判断这个账号到底是在做内容,还是在自我感动。 3. 毒舌恋爱军师 这个比较娱乐。 可以粘贴聊天记录,也可以上传聊天截图识别文本。 然后 AI 会判断两个人的互动状态,比如谁在上头,谁在敷衍,谁在嘴硬。 适合拿来审: 热恋吵架 暧昧拉扯 分手复盘 “TA 到底喜不喜欢我” 当然,别太当真。 但也别完全不当真。 目前还很简单粗糙 这个东西目前更像一个可以玩的 MVP 。 很多地方肯定还可以继续打磨,比如: 判词的毒舌程度 简历解析准确度 X 数据分析维度 聊天截图 OCR 效果 海报样式 移动端体验 也欢迎大家直接骂。 毕竟这个产品自己就是干这个的。 网站地址: https://spicyai.icu
Chrome 长期开着几十个标签页,完全没办法找到或者整理,前阵子看到 ZaraZhang 的 Tab-Out 插件,感觉 idea 好赞,就这这个基础上做了二开。 Vibe-coding 让人上瘾,自己用的也很爽,这次也走完了发布到 Chrome 市场的流程,欢迎大家使用: - ** [安装插件] ** https://chromewebstore.google.com/detail/signaltabs-tab-workspace/paamdcbpjkcpcpnncoggpdikfmeeinhd - [官网地址] https://www.signaltabs.com/ **功能简述**: 1 、重新组织打开的所有标签页:按照域名分组、固定标签页单独一组等 2 、无压整理:一键清理重复标签、一键关闭所有、随时召回 3 、保存待看的 saved for later 清单,可以多端同步 4 、全局搜索,在任何页面,按下 CTRL+SHIFT+K ,可唤起全局搜索功能 5 、中英文双语配置、light&dark 主题自动切换
Chrome 长期开着几十个标签页,完全没办法找到或者整理,前阵子看到 ZaraZhang 的 Tab-Out 插件,感觉 idea 好赞,就这这个基础上做了二开。 Vibe-coding 让人上瘾,自己用的也很爽,这次也走完了发布到 Chrome 市场的流程,欢迎大家使用: - ** [安装插件] ** https://chromewebstore.google.com/detail/signaltabs-tab-workspace/paamdcbpjkcpcpnncoggpdikfmeeinhd - [官网地址] https://www.signaltabs.com/ **功能简述**: 1 、重新组织打开的所有标签页:按照域名分组、固定标签页单独一组等 2 、无压整理:一键清理重复标签、一键关闭所有、随时召回 3 、保存待看的 saved for later 清单,可以多端同步 4 、全局搜索,在任何页面,按下 CTRL+SHIFT+K ,可唤起全局搜索功能 5 、中英文双语配置、light&dark 主题自动切换
Chrome 长期开着几十个标签页,完全没办法找到或者整理,前阵子看到 ZaraZhang 的 Tab-Out 插件,感觉 idea 好赞,就这这个基础上做了二开。 Vibe-coding 让人上瘾,自己用的也很爽,这次也走完了发布到 Chrome 市场的流程,欢迎大家使用: - ** [安装插件] ** https://chromewebstore.google.com/detail/signaltabs-tab-workspace/paamdcbpjkcpcpnncoggpdikfmeeinhd - [官网地址] https://www.signaltabs.com/ **功能简述**: 1 、重新组织打开的所有标签页:按照域名分组、固定标签页单独一组等 2 、无压整理:一键清理重复标签、一键关闭所有、随时召回 3 、保存待看的 saved for later 清单,可以多端同步 4 、全局搜索,在任何页面,按下 CTRL+SHIFT+K ,可唤起全局搜索功能 5 、中英文双语配置、light&dark 主题自动切换
之前在读博的时候,会遇到很多复杂的资料,以前没有 AI ,都是自己捣鼓一些小工具去辅助处理的,慢慢地就形成了一个稳定的解析项目雏形,但也只有身边的人在用。 后来有了 AI ,我们都以为,哟,高科技来了,要解放了。谁知一读 PDF 就开始胡说八道,分析起报告一堆数据错误。搞科研、学医、金融、数据行业的应该都明白吧。 这是遇上“AI 幻觉”了,因为 AI 只能扫描一些短平快的文字,复杂的格式它是解析不了的,所以你问它这种文档相关的问题,它只能胡乱编一个数据蒙你。 所以我结合之前的项目经验,做出了一个 AI 原生的文档解析工具——Knowhere ,专治“AI 幻觉”。并且今天开源出来给大家。 它能干的事很简单:帮 AI 去解析那些复杂难啃的文档:比方说大文件( 20 页+)、层级多(八章 40 节 120 小点)、格式花的( PDF/Excel/PPT ),通通都能搞定。 你只要安装好 Knowhere 插件,再把文件交给 AI ,AI 就会调用 Knowhere 。 复杂的文档经过 Knowhere 的解析,会变成方便 AI 理解的 JSON 等文件,AI 拿到解析过后的高质量文件切片去做检索和生成,就能给出更精确的回答。 除此之外,Knowhere 还有记忆功能,能把你给它的信息建成一棵“知识树”,在你提问的时候能根据历史跨文档给出答案。 我们实测: AI 产品感知提升 80%+,上百份文件扫描耗时 10min 内; Token 消耗降低 50%+,解析效率提升 3 倍+; 多模态信息提取完整度 95%+,复杂表格解析准确率 95%+。 我可以负责任地说,吊打市面上同类产品: Unstructured:免费版限速严重、定价贵、中文文档效果一般 LlamaParse:强绑 LlamaIndex 生态,云端延迟明显,成本高 MinerU:本地部署依赖地狱,VLM 模式 GPU 要求极高 Docling:首次加载模型 1.5GB ,扫描件 OCR 质量还不如 MinerU 一句话,比 Knowhere 解析好的没它便宜,比 Knowhere 便宜的解析没它好,简直就是性价比拉满。 而且 Knowhere 还是 AI 原生的,更符合 AI Agent 轻量化+高精度的要求。 如果你也在做 AI 应用开发,或者正在被长文档折磨,那不妨试一试 Knowhere 。 求个 Star⭐支持一下,谢谢各位老哥👉 https://github.com/Ontos-AI/knowhere
之前在读博的时候,会遇到很多复杂的资料,以前没有 AI ,都是自己捣鼓一些小工具去辅助处理的,慢慢地就形成了一个稳定的解析项目雏形,但也只有身边的人在用。 后来有了 AI ,我们都以为,哟,高科技来了,要解放了。谁知一读 PDF 就开始胡说八道,分析起报告一堆数据错误。搞科研、学医、金融、数据行业的应该都明白吧。 这是遇上“AI 幻觉”了,因为 AI 只能扫描一些短平快的文字,复杂的格式它是解析不了的,所以你问它这种文档相关的问题,它只能胡乱编一个数据蒙你。 所以我结合之前的项目经验,做出了一个 AI 原生的文档解析工具——Knowhere ,专治“AI 幻觉”。并且今天开源出来给大家。 它能干的事很简单:帮 AI 去解析那些复杂难啃的文档:比方说大文件( 20 页+)、层级多(八章 40 节 120 小点)、格式花的( PDF/Excel/PPT ),通通都能搞定。 你只要安装好 Knowhere 插件,再把文件交给 AI ,AI 就会调用 Knowhere 。 复杂的文档经过 Knowhere 的解析,会变成方便 AI 理解的 JSON 等文件,AI 拿到解析过后的高质量文件切片去做检索和生成,就能给出更精确的回答。 除此之外,Knowhere 还有记忆功能,能把你给它的信息建成一棵“知识树”,在你提问的时候能根据历史跨文档给出答案。 我们实测: AI 产品感知提升 80%+,上百份文件扫描耗时 10min 内; Token 消耗降低 50%+,解析效率提升 3 倍+; 多模态信息提取完整度 95%+,复杂表格解析准确率 95%+。 我可以负责任地说,吊打市面上同类产品: Unstructured:免费版限速严重、定价贵、中文文档效果一般 LlamaParse:强绑 LlamaIndex 生态,云端延迟明显,成本高 MinerU:本地部署依赖地狱,VLM 模式 GPU 要求极高 Docling:首次加载模型 1.5GB ,扫描件 OCR 质量还不如 MinerU 一句话,比 Knowhere 解析好的没它便宜,比 Knowhere 便宜的解析没它好,简直就是性价比拉满。 而且 Knowhere 还是 AI 原生的,更符合 AI Agent 轻量化+高精度的要求。 如果你也在做 AI 应用开发,或者正在被长文档折磨,那不妨试一试 Knowhere 。 求个 Star⭐支持一下,谢谢各位老哥👉 https://github.com/Ontos-AI/knowhere
之前在读博的时候,会遇到很多复杂的资料,以前没有 AI ,都是自己捣鼓一些小工具去辅助处理的,慢慢地就形成了一个稳定的解析项目雏形,但也只有身边的人在用。 后来有了 AI ,我们都以为,哟,高科技来了,要解放了。谁知一读 PDF 就开始胡说八道,分析起报告一堆数据错误。搞科研、学医、金融、数据行业的应该都明白吧。 这是遇上“AI 幻觉”了,因为 AI 只能扫描一些短平快的文字,复杂的格式它是解析不了的,所以你问它这种文档相关的问题,它只能胡乱编一个数据蒙你。 所以我结合之前的项目经验,做出了一个 AI 原生的文档解析工具——Knowhere ,专治“AI 幻觉”。并且今天开源出来给大家。 它能干的事很简单:帮 AI 去解析那些复杂难啃的文档:比方说大文件( 20 页+)、层级多(八章 40 节 120 小点)、格式花的( PDF/Excel/PPT ),通通都能搞定。 你只要安装好 Knowhere 插件,再把文件交给 AI ,AI 就会调用 Knowhere 。 复杂的文档经过 Knowhere 的解析,会变成方便 AI 理解的 JSON 等文件,AI 拿到解析过后的高质量文件切片去做检索和生成,就能给出更精确的回答。 除此之外,Knowhere 还有记忆功能,能把你给它的信息建成一棵“知识树”,在你提问的时候能根据历史跨文档给出答案。 我们实测: AI 产品感知提升 80%+,上百份文件扫描耗时 10min 内; Token 消耗降低 50%+,解析效率提升 3 倍+; 多模态信息提取完整度 95%+,复杂表格解析准确率 95%+。 我可以负责任地说,吊打市面上同类产品: Unstructured:免费版限速严重、定价贵、中文文档效果一般 LlamaParse:强绑 LlamaIndex 生态,云端延迟明显,成本高 MinerU:本地部署依赖地狱,VLM 模式 GPU 要求极高 Docling:首次加载模型 1.5GB ,扫描件 OCR 质量还不如 MinerU 一句话,比 Knowhere 解析好的没它便宜,比 Knowhere 便宜的解析没它好,简直就是性价比拉满。 而且 Knowhere 还是 AI 原生的,更符合 AI Agent 轻量化+高精度的要求。 如果你也在做 AI 应用开发,或者正在被长文档折磨,那不妨试一试 Knowhere 。 求个 Star⭐支持一下,谢谢各位老哥👉 https://github.com/Ontos-AI/knowhere
之前在读博的时候,会遇到很多复杂的资料,以前没有 AI ,都是自己捣鼓一些小工具去辅助处理的,慢慢地就形成了一个稳定的解析项目雏形,但也只有身边的人在用。 后来有了 AI ,我们都以为,哟,高科技来了,要解放了。谁知一读 PDF 就开始胡说八道,分析起报告一堆数据错误。搞科研、学医、金融、数据行业的应该都明白吧。 这是遇上“AI 幻觉”了,因为 AI 只能扫描一些短平快的文字,复杂的格式它是解析不了的,所以你问它这种文档相关的问题,它只能胡乱编一个数据蒙你。 所以我结合之前的项目经验,做出了一个 AI 原生的文档解析工具——Knowhere ,专治“AI 幻觉”。并且今天开源出来给大家。 它能干的事很简单:帮 AI 去解析那些复杂难啃的文档:比方说大文件( 20 页+)、层级多(八章 40 节 120 小点)、格式花的( PDF/Excel/PPT ),通通都能搞定。 你只要安装好 Knowhere 插件,再把文件交给 AI ,AI 就会调用 Knowhere 。 复杂的文档经过 Knowhere 的解析,会变成方便 AI 理解的 JSON 等文件,AI 拿到解析过后的高质量文件切片去做检索和生成,就能给出更精确的回答。 除此之外,Knowhere 还有记忆功能,能把你给它的信息建成一棵“知识树”,在你提问的时候能根据历史跨文档给出答案。 我们实测: AI 产品感知提升 80%+,上百份文件扫描耗时 10min 内; Token 消耗降低 50%+,解析效率提升 3 倍+; 多模态信息提取完整度 95%+,复杂表格解析准确率 95%+。 我可以负责任地说,吊打市面上同类产品: Unstructured:免费版限速严重、定价贵、中文文档效果一般 LlamaParse:强绑 LlamaIndex 生态,云端延迟明显,成本高 MinerU:本地部署依赖地狱,VLM 模式 GPU 要求极高 Docling:首次加载模型 1.5GB ,扫描件 OCR 质量还不如 MinerU 一句话,比 Knowhere 解析好的没它便宜,比 Knowhere 便宜的解析没它好,简直就是性价比拉满。 而且 Knowhere 还是 AI 原生的,更符合 AI Agent 轻量化+高精度的要求。 如果你也在做 AI 应用开发,或者正在被长文档折磨,那不妨试一试 Knowhere 。 求个 Star⭐支持一下,谢谢各位老哥👉 https://github.com/Ontos-AI/knowhere
之前在读博的时候,会遇到很多复杂的资料,以前没有 AI ,都是自己捣鼓一些小工具去辅助处理的,慢慢地就形成了一个稳定的解析项目雏形,但也只有身边的人在用。 后来有了 AI ,我们都以为,哟,高科技来了,要解放了。谁知一读 PDF 就开始胡说八道,分析起报告一堆数据错误。搞科研、学医、金融、数据行业的应该都明白吧。 这是遇上“AI 幻觉”了,因为 AI 只能扫描一些短平快的文字,复杂的格式它是解析不了的,所以你问它这种文档相关的问题,它只能胡乱编一个数据蒙你。 所以我结合之前的项目经验,做出了一个 AI 原生的文档解析工具——Knowhere ,专治“AI 幻觉”。并且今天开源出来给大家。 它能干的事很简单:帮 AI 去解析那些复杂难啃的文档:比方说大文件( 20 页+)、层级多(八章 40 节 120 小点)、格式花的( PDF/Excel/PPT ),通通都能搞定。 你只要安装好 Knowhere 插件,再把文件交给 AI ,AI 就会调用 Knowhere 。 复杂的文档经过 Knowhere 的解析,会变成方便 AI 理解的 JSON 等文件,AI 拿到解析过后的高质量文件切片去做检索和生成,就能给出更精确的回答。 除此之外,Knowhere 还有记忆功能,能把你给它的信息建成一棵“知识树”,在你提问的时候能根据历史跨文档给出答案。 我们实测: AI 产品感知提升 80%+,上百份文件扫描耗时 10min 内; Token 消耗降低 50%+,解析效率提升 3 倍+; 多模态信息提取完整度 95%+,复杂表格解析准确率 95%+。 我可以负责任地说,吊打市面上同类产品: Unstructured:免费版限速严重、定价贵、中文文档效果一般 LlamaParse:强绑 LlamaIndex 生态,云端延迟明显,成本高 MinerU:本地部署依赖地狱,VLM 模式 GPU 要求极高 Docling:首次加载模型 1.5GB ,扫描件 OCR 质量还不如 MinerU 一句话,比 Knowhere 解析好的没它便宜,比 Knowhere 便宜的解析没它好,简直就是性价比拉满。 而且 Knowhere 还是 AI 原生的,更符合 AI Agent 轻量化+高精度的要求。 如果你也在做 AI 应用开发,或者正在被长文档折磨,那不妨试一试 Knowhere 。 求个 Star⭐支持一下,谢谢各位老哥👉 https://github.com/Ontos-AI/knowhere
之前 4 月中旬的时候我发过一个帖子,说我做了一个叫 Knowhere 的文档解析插件,专治非结构化数据。当时有老哥问后台用的是什么服务,我说准备开源出去,后面可以关注一下。 今天,它来了。 Knowhere 正式开源。 仓库在这里: https://github.com/Ontos-AI/knowhere 先说说我为什么做这个东西。 做 AI 应用开发的兄弟应该都有同感——模型越来越强了,但一碰到复杂文档,还是容易崩。 比如你丢一份几十页的财报 PDF 进去,AI 要么开始胡编,要么直接说没有这个内容。这叫“AI 幻觉”。 最开始我也以为是模型不行,换了 Claude 换 GPT ,折腾了一圈发现问题根本不在这里。 根本上,喂给 AI 的原材料就是烂的。 现在市面上绝大多数文档解析工具,处理方式简单粗暴:按固定字数一刀切,把所有内容打碎成碎片。问题是文档里的信息是有层级、有关联、有上下文的一刀切进去,逻辑全断了。AI 拿到一堆碎片,只能靠猜。 更要命的是 PDF 里的多级表头、Excel 里的复杂行列关系、PPT 里的图文混排,传统方案基本束手无策。 强行切下去的结果就是:解析不准 → 检索不到 → AI 脑补 → 你被气死。 Knowhere 是怎么搞的。 我们花了挺长时间,自研了一套 Tree-like 算法。这个名字的由来很直白——它做的事,是把每一份文档都解析成结构化的知识树,而不是一堆散落的碎片。 核心差异在于: 传统方案:按固定字数暴力切片,标题和内容的归属关系全断,跨页表格直接乱码。 Knowhere:在解析时就完整保留文档的层级结构和逻辑关联,标题、段落、表格、图片,各自的归属关系和上下文全部对齐。 这样做出来的数据切片,关联是自带的。AI 拿到之后不再需要在碎片间瞎猜,追问的时候也能精准溯源。 几个硬指标,给老哥们参考。 我们做了大量实测,几个关键数据可以分享: 多模态解析:PDF 、Word 、PPT 、Excel 、图片全支持,信息提取完整度 95%以上。 复杂表格:多级表头这类传统方案的死穴,Knowhere 准确率 90%以上,输出带完整属性的 HTML ,下游不需要额外修正。 Token 消耗:相比传统 RAG 方案降低 50%以上。 解析效率:提升 3 倍+,上百份文件扫描 10 分钟内完成。 溯源能力:每条输出都可精确回溯到源文档的具体位置,从根源上降低幻觉。 另外,我们已经在 OpenClaw 智能体生态里深度集成,作为原生文档解析引擎在跑。配置好 API Key 之后,Agent 会自动调用 Knowhere 处理文档,不需要学新命令。 这次开源的内容包括完整的文档摄入、解析链路。你可以选择: SaaS 版:开箱即用,免费试用 14 天,不用绑卡 https://knowhereto.ai/?utm_source=v2ex 自托管:想自己部署的老哥可以直接拉仓库跑 pip install knowhere-self-hosted # 或者作为 OpenClaw 插件安装 openclaw plugins install @ontos-ai/knowhere-claw 最后说点心里话。 市面上其实有一些 PDF 解析的开源方案,比如 MinerU Web 、Docling 、Marker 这些,各有千秋。但它们更多是通用文档解析工具,不是专门为 AI Agent 设计的。 Knowhere 的定位不太一样——它从一开始就是给 AI 和智能体啃的。解析只是第一步,后续我们会逐步加入检索 API ,进一步降低大模型调用成本,让数据真正可复用。 我们相信:大模型的能力上限,取决于你喂给它的数据质量。 如果你也在被 AI 幻觉折磨,欢迎来试试。有任何问题或者想法,直接提 issue ,或者评论区聊聊,我看到都会回。 最后,求个 Star ⭐ https://github.com/Ontos-AI/knowhere 开源的路很长,希望大家 PR/issue ,多多反馈~
首先是万恶之源 主包觉得有点难绷,于是 ,以后遇到npd我就直接随机抽卡砸一张过去 3 个帖子 - 2 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 hi~各位佬友! 这算是我加入L站以来第一个帖子,连续潜水了一段时间,发现大家其实都对 跨agent/session的上下文漂移 问题有很多苦恼! 我潜心研究了一阵子,今天正式准备把我的这份skill------「 RecallLoom 」开源啦~希望能给大家提供一个比较合理的、系统化的解决方案(skill形式),同时也算是新人报道了吧! 敬请各位大佬批评指正! 先给自己叠个甲吧 叠甲 (点击了解更多详细信息) 背景 正如前文所说,现在大家越来越高频使用codex、claude code等这类agent产品,来辅助开展日常各项工作和学习任务,同时,大家也游走于各大公益站、中转站来降低tokens的平均使用成本,这就导致在开展某些 长期的、依赖历史决策过程的连续性项目 时,在频繁切换不同agent、对话线程过程中,搞乱了甚至丢失了之前的一些决策细节、演进历史,我们还得花时间手动把项目背景重新和agent拉齐,我把它称作"重启税"。 谁都不想承担这份额外负担,因此,我带着RecallLoom来了!感觉这会是大家的刚需! 开发过程 RecallLoom项目的诞生源起我在某ai产品公司实习时,使用codex推进一份PRD写作过程中遇到的真实痛点。 大家都知道,PRD不是一蹴而就的,在写文档内容之前需要经历市场分析、用户研究、需求和痛点分析、竞品分析等过程,后续才开始进行方案转化、产品功能设计、原型产出等步骤,最后还要经过多轮需求评审,才能打磨好一份真正意义上的产品需求文档。 在这过程中,可能需要开好多session,又要历经很长一段时间,可能今天推进一点这个步骤,明天又完善一些别的部分,需求评审了又得回去看好几天之前写的内容。 如果重新拉回一个超长session,可能自己都不记得当时在讨论啥了,上下文窗口爆了,即使自动compact可能也丢失了一些细节。其实还是蛮痛苦的,那只能自己再开一个session,再把这条线凭印象重新给ai讲一遍。 所以我到处找,有什么好的解决办法,一看大家其实普遍都或多或少有这样的困扰。我看到大家比较省事的做法就是在项目的agent.md等入口文档下功夫,或者更进一步,干脆自己写个memory.md当作项目笔记,把很多过程、想法和细节记录下来,之后ai优先参考,可能会更快地拉齐状态。这确实是个好办法,给我提供了思路! 同时,我也观察到,其实有很多产品级别或者agent架构级别的记忆、上下文优化项目,其方案都做的很成熟了,但是他们的形态都比较重,可能我需要额外安装,行动成本也有点点高。那究竟有什么形态是轻量级的、同时又普遍通用的呢?我想到了skill。 其实,RecallLoom的第一个版本就是一个SKILL.MD文档,记录了一套我从各大平台拼凑出来的一份我觉得比较好的上下文状态解决方案,基本上就是大家熟悉的三层架构------高层、滚动层、日报层(这个架构的原始提出者我已经无法找到啦,感谢思路)。这样我每天只要说个上班,ai就能从项目本地恢复进展,过程中ai会自己做一些进度的记录写到滚动层里,也会形成一份当日日报。等我要收工了,我就说个下班,ai会完整执行一次全量更新动作。我觉得,这还真的能一定程度上解决"重启税"的问题。 后来,我发现单靠SKILL.MD文档来约束ai对于上下文的记录还是太信任它了,往往就会出现你为啥这个也要记录?你记的乱七八糟的、格式去哪了?你咋这个不记下来啊?------就是记录的质量和稳定性太差了。于是,开启了正式迭代之路。 由于在日常使用中发现越来越多问题,我其实也对这个vibecoding很有兴趣,脑子里每天都在冒出很多关于它的新想法和下一步迭代思路,那我就干脆把它作为一份正式的项目推进吧! 因为这份实习太占据我的研发时间,于是我毅然决然辞职了 (其实是天天都在干dirtywork受不了了啊,还不如让我做这个事情!) 专心迭代 。 直到今天,大家看到了我正式发布的0.3.3版本,从0.1.0上线到今天,刚好10天啦~! 当然,由于受限于我自己的真实使用需求场景和技术能力,skill肯定存在很多不足和需要远期慢慢迭代的部分,我已经有了下一个大版本的升级思路了!( 剧透 ) 项目目标 当一个项目需要跨agent、跨session、跨线程持续推进时,之前花了很多时间才形成的背景、决策、阶段判断、细节约束,很容易在切换过程中变碎、变浅,甚至直接丢掉。然后我们就得重新解释、重新拉齐、重新回忆,我把它叫作「重启税」。RecallLoom想做的,就是尽量把这份税降下来。 项目架构和实现原理 把原本散落在不同对话里的项目连续性内容,挪到一个跟着项目走的sidecar文件夹里,让ai按照RecallLoom约定的标准协议和安全边界在旁边单独维护一套continuity文件。默认情况下,这套内容会放在项目根目录的一个隐藏文件夹【.recallloom/】里,不过也支持可见模式。 当前大体是这样一套分层结构: context_brief.md 放相对稳定的高层背景,比如项目在做什么、边界是什么、现在大概处在哪个阶段 rolling_summary.md 放当前状态,也就是"现在到底是什么情况",这部分会随着项目推进持续滚动更新 daily_logs/ 放日报式、里程碑式的记录,承接当天做了什么、确认了什么、还有什么风险、下一步要做什么 config.json 和 state.json 放机器可读的信息,用来记录版本、状态、修订号之类的东西,方便后面的校验和安全写入 update_protocol.md 给具体项目留一个"项目级特殊规则"的位置,防止所有项目都只能套同一套死模板 如果说,只用一个memory.md或类似文档来记项目状态,那么随着时间推移,会把高层背景、当前状态、历史过程、当日进展全部糊在一个文件里,时间一长其实非常容易失控。要么越来越啰嗦,要么越来越乱,要么看着什么都记了,其实真正有用的东西反而淹没了。 所以RecallLoom把他们拆开了: 稳定背景归稳定背景 当前状态归当前状态 日常证据归日常证据 这样恢复的时候,AI不需要把所有历史全吞下去,也能先从最关键的几层把项目状态接起来。 如果它只是一个SKILL.md,其实是不够的,只靠prompt去约束记录行为,太容易失控了,于是后面我给它补了一层 helper scripts,来专门控制一些不好的事情发生。 总结下来,其架构就是 用skill规定工作流和使用方式 用sidecar承载项目连续性 用helper去给关键读写动作加护栏 实现原理其实就是 先把项目连续性拆成不同层次 再给每一层一个相对明确、相对稳定的落点 最后用一套尽量窄但尽量可靠的读写规则,把恢复和记录这两件事固定下来 特性 截止0.3.3版本,RecallLoom基本实现了: 轻量 :不用上一个很重的上下文系统,不用额外搭复杂基础设施,一个skill完事~ 项目本地化 :产生的文件跟着项目走,不锁死在某个agent自己的记忆里 分层存储 :高层背景、当前状态、日报证据拆开管理,不堆成一锅粥 适合长期项目 :比较适合那种跨天、跨session、跨agent持续推进的事情 尽量减少「重启税」 :让重新开一个会话就又要从头讲一遍的事儿少发生一点 支持中英文workspace 写入有护栏 :不是瞎写、瞎覆盖,会做结构和修订检查,尽量减少出现越写越跑偏 尽量不污染项目主体 :所有产物默认放sidecar,不往你项目原本代码和正文文档里乱拉屎 可移除 :如果不想用了,删了sidecar基本就相当于卸载,不动任何你的东西 快速开始 先把skill包接进你的agent npx skills add https://github.com/Frappucc1no/recall-loom --skill recallloom 第一次使用时,显式唤起RecallLoom 比如可以这样: @recallloom 用RecallLoom接管这个项目 或者直接在agent的skill选择器里选择它 如果项目还没初始化,就先初始化 输入 rl-init 或者明确让agent帮你初始化RecallLoom 如果RecallLoom在初始化或cold start时读取了你项目里的原始文档、说明、历史材料,这些内容只是被用来参考,不会被删除,也不会从你的项目里搬走。 然后就按正常项目节奏使用 比如: 继续这个项目 先帮我恢复项目上下文 从上次停下的地方继续 记录今天的关键进展 如果不想用了 通常情况下, 删掉sidecar基本就等于移除RecallLoom~ 如果你额外启用了bridge,那就先移除bridge,再删sidecar,会更干净一点。 我需要佬友们的帮助 RecallLoom迭代到现在这个版本,我觉得它已经适合搬到台面上让大家来尝尝咸淡了,如果能一定程度上解决佬友们的问题我觉得,这是我的荣幸! 但是!版本的迭代光靠我自己一个人反复测,其实始终有局限!因为我自己可能就陷在codex里了(因为确实用习惯了,没有怎么在其他agent里重度实测,但是skill毕竟还是比较通用的,我觉得没有非常结构性的大问题),而看不到很多特殊角度的问题。很多可能是我觉得理所当然的设计,但是大家用起来觉得,“太重了”、“浪费时间”、"浪费我的token"之类的。 所以,我很希望能尽早听到真实反馈! 快给我如下类型的反馈! (点击了解更多详细信息) GitHub链接 github.com GitHub - Frappucc1no/recall-loom: Portable continuity layer for long-running AI... Portable continuity layer for long-running AI projects across models, agents, and sessions. 如果真的帮到了你,欢迎star,并且帮我推荐给更多需要它的佬友们!十分感谢! 致谢 感谢各大中转站、公益站提供的GPT资源! 最后放一个自我推销 (点击了解更多详细信息) 3 个帖子 - 2 位参与者 阅读完整话题
在玩了 pt 这么久,尤其是动漫方面,一直有个痛:下载的 BDRip 想保种,又想让 Emby 刮削得漂亮,每次手动改名改到怀疑人生。特别是那种一季几十集、还带 OVA 、SP 的番,Emby 扫进去不是罗马音乱码就是集数错乱,特典全堆在 S00 里根本分不清哪个是哪个。 于是我自己写了一个工具,叫 AnimeMan ,专门解决这个破事。用了一段时间感觉挺稳的,分享给有同样烦恼的坛友。 它到底能干啥? 说人话就是: 你下载的动漫文件夹扔给它,它帮你自动在 Emby/Jellyfin 媒体库里生成硬链接,同时刮削好元数据、下载海报、整理字幕,源文件继续做种不动。 几个我特别需要的功能: 1. 硬链接保种 不复制、不移动文件,只在 Emby 目录下创建一个“入口”。硬盘空间不浪费,上传量照刷不误。 2. AI 看懂奇葩命名 [VCB-Studio] Toaru Kagaku no Railgun S [01][Ma10p_1080p][x265_flac].mkv 这种算是小儿科。 更狠的是 1072.mkv (总集数)、 III [21] (罗马数字季号),它都能自动换算成正确的 SXXEXX 。 3. 特典/OVA 自动归类 建个规则,文件名里带 [OVA] 、 [SP] 、 [NCED] 的统统自动扔进 Season 00 ,不再污染正片。 4. 失败文件批量修正 再智能也难免有 TMDB 搜不到的。以前遇到这种我得手动去 TMDB 查 ID 、建文件夹、改名、移过去,10 个文件能折腾半小时。 现在在 Web 界面里勾选一下,内置搜索 TMDB ,自动排序集数,2 分钟全搞定。 5. 字幕也能一起整理 同目录下的 .ass 、 .srt 自动匹配到对应剧集,还能调用 ffsubsync 自动调轴(日语字幕尤其需要)。 6. 纯 Web 界面,手机也能管 所有配置都在网页上点点就行,TMDB API Key 也可以直接在网页里填,不用 SSH 改文件。躺沙发上用手机就能批量修正失败文件。 怎么部署? 地址: https://github.com/gegd19/AnimeMan 注意: 第一次用需要去 TMDB 申请个免费 API Key ( 申请地址 ),然后在 Web 界面里粘贴进去就行, 不用手动改配置文件 。 最后 这工具一开始就是给自己写的,后来功能越加越多,干脆整理一下开源了。如果你也被动漫文件名折磨过,不妨试试看,应该能省下不少时间。 有什么问题或者建议,直接在 GitHub 提 Issue ,我看到都会回。觉得好用的话给个 Star 就更好了~ 让每一部番,既保种又完美入库。 🎌