WWW.YOUINFO.SITE
标签聚合 spine

/tag/spine

linux.do · 2026-04-24 15:15:09+08:00 · tech

大家好,最近我们团队又开源了一个新项目,和大家分享一下 我们平时读长篇技术书、学术著作、小说,或者海量文档的时候, 最抓狂的痛点就是“怎么才能高效抓住精髓” 。直接扔给大模型总结? 要么上下文窗口一炸,丢三落四; 要么总结得“四平八稳”,但完全没按你的阅读意图来; 更别提结构、人物弧光、知识脉络这些“脊柱”级信息,基本全没了…… 今天给大家带来的 SpineDigest ,就是专门解决这个“蒸馏”痛点的开源工具 我们之前的开源项目: PDF Craft 它的能力 SpineDigest 把任意长篇内容(书籍、文档)“蒸馏”成它的脊柱(Spine) ——不只是文字总结,还给你 章节拓扑 + 知识图谱 + 可复用的结构化档案 。 它完全跳出了“简单 prompt 让 LLM 总结”的低效循环,用了一套 提示驱动 + 知识图谱 + 对抗式多智能体 的流水线,真正做到: 按你的意图提取知识单元(Chunk) 你给一个 prompt,它就严格按照你的需求去“抓”关键点。比如你读小说想“保留所有主要和次要角色的情感转变”,它就只抓这个;你读技术书想“重点保留算法推导和性能对比”,它也精准服从。 构建知识图谱 + Snake(知识蛇链) 把提取出来的知识块变成节点,自动连边、聚类,形成有序的“知识蛇链”。一眼就能看出全书的逻辑骨架、章节脉络、概念关联——再也不是一坨平铺的文字。 对抗式多智能体总结 一个“答辩者”负责写总结,一群“教授”智能体(各持一条 Snake)轮番挑战、挑刺、补漏。几轮迭代后出来的总结,既忠实于原书结构,又高度浓缩,还不会漏掉你关心的部分。真正做到了“结构保留 + 意图对齐”。 输出 .sdpub 档案格式 这是我们最得意的功能。一次处理完,所有中间结果(Chunk、图谱、Snake、总结)全部打包进一个 .sdpub 文件。以后想重新导出成 Markdown、EPUB、纯文本…… 完全不需要再跑 LLM ,秒级完成。 而且可以用我们的 Inkora 查看器直接打开,图形化浏览知识图谱和蛇链。 支持格式和使用方式 输入:EPUB、Markdown、纯文本、.sdpub 输出:Markdown、EPUB、纯文本、.sdpub 支持 stdin/stdout 管道调用,完美适配 AI Agent 工作流 Node.js >= 22.12.0,一行命令搞定: # 全局安装 npm install -g spinedigest # 最常用:把 EPUB 蒸馏成 Markdown(按你的 prompt) spinedigest --input ./your-book.epub --output ./digest.md --prompt "保留所有主要和次要角色的情感转变" # 先打包成 .sdpub,以后随便转格式 spinedigest --input ./your-book.epub --output ./book.sdpub spinedigest --input ./book.sdpub --output ./book.md CLI 参数文档里都有详细说明,还提供了 Library API,方便二次开发。 为什么它比直接用大模型强 普通 LLM 总结的本质问题是 “不知道该砍什么” 。SpineDigest 用 提示驱动提取 + 图谱聚类 + 对抗审查 ,直接把决策权交给结构和你的意图。 在我们自己内部测试中,处理 30 万字的技术书,总结质量和结构保留度完胜单次 prompt。 给谁用的? 想快速吃透技术书的同学 做文献综述、知识管理的研究者 写书评、做读书笔记的博主 正在构建 Agent 工作流的开发者(CLI 设计天生为 Agent 准备) 任何被“信息过载”折磨的人 Inkora 查看器 下载地址: https://inkora.oomol.com/download/sdpub 有任何使用问题、想看更多使用案例,或者对 .sdpub 格式有想法的,欢迎在仓库 Issue 区或者这里留言,我们会持续迭代。 4 个帖子 - 4 位参与者 阅读完整话题