最近在整理自己的知识库和写 AI Prompt 的时候,发现把各种格式的文档( PDF, Word, PPT 等)转换成干净的 Markdown 是一件挺头疼的事。市面上的工具要么排版乱,要么就是收费昂贵且流程繁琐。 于是我动手做了这个小站:Document to Markdown。 做这个工具的初衷 现在的 AI 工具( LLMs )对 Markdown 的理解能力远高于纯文本或复杂的 HTML 。我希望建立一个简单的 Workflow ,让大家能快速把手头的各种“硬核”文档变成 AI 友好、笔记软件友好的 Markdown 格式。 目前支持的功能 多格式支持: PDF, DOCX, PPTX, XLSX, HTML, CSV, 甚至还有 EPUB 。 结构还原: 尽量保留了原文档的标题层级、列表和表格(表格转换是我花精力最多的地方)。 隐私保护: 采用 Request-only 模式,我们不保存用户上传的原文件,也不持久化生成的 Markdown ,只做实时转换。 开发者友好: 已经规划了 API 接入,方便集成到大家自己的 RAG 或自动化流程中。 为什么需要大家的反馈? 目前产品还在早期阶段,虽然我自己测试了很多样例,但文档格式千奇百怪,肯定还有很多坑: 转换质量: 复杂的 PDF 或嵌套表格转换效果是否符合预期? 交互体验: 目前的上传和预览流程是否顺手? 功能需求: 除了现有的格式,大家是否还需要支持其他冷门格式(如特定代码格式或 Wiki 语法)? 网站地址: https://documenttomarkdown.com/ 目前提供免费的 Trial 次数(登录后每天有 10 次免费额度),欢迎大家随意“蹂躏”。如果觉得好用,或者有任何想吐槽的地方,请直接在评论区留言。 每一条建议我都会认真看,非常感谢!
最近在整理自己的知识库和写 AI Prompt 的时候,发现把各种格式的文档( PDF, Word, PPT 等)转换成干净的 Markdown 是一件挺头疼的事。市面上的工具要么排版乱,要么就是收费昂贵且流程繁琐。 于是我动手做了这个小站:Document to Markdown。 做这个工具的初衷 现在的 AI 工具( LLMs )对 Markdown 的理解能力远高于纯文本或复杂的 HTML 。我希望建立一个简单的 Workflow ,让大家能快速把手头的各种“硬核”文档变成 AI 友好、笔记软件友好的 Markdown 格式。 目前支持的功能 多格式支持: PDF, DOCX, PPTX, XLSX, HTML, CSV, 甚至还有 EPUB 。 结构还原: 尽量保留了原文档的标题层级、列表和表格(表格转换是我花精力最多的地方)。 隐私保护: 采用 Request-only 模式,我们不保存用户上传的原文件,也不持久化生成的 Markdown ,只做实时转换。 开发者友好: 已经规划了 API 接入,方便集成到大家自己的 RAG 或自动化流程中。 为什么需要大家的反馈? 目前产品还在早期阶段,虽然我自己测试了很多样例,但文档格式千奇百怪,肯定还有很多坑: 转换质量: 复杂的 PDF 或嵌套表格转换效果是否符合预期? 交互体验: 目前的上传和预览流程是否顺手? 功能需求: 除了现有的格式,大家是否还需要支持其他冷门格式(如特定代码格式或 Wiki 语法)? 网站地址: https://documenttomarkdown.com/ 目前提供免费的 Trial 次数(登录后每天有 10 次免费额度),欢迎大家随意“蹂躏”。如果觉得好用,或者有任何想吐槽的地方,请直接在评论区留言。 每一条建议我都会认真看,非常感谢!
最近在整理自己的知识库和写 AI Prompt 的时候,发现把各种格式的文档( PDF, Word, PPT 等)转换成干净的 Markdown 是一件挺头疼的事。市面上的工具要么排版乱,要么就是收费昂贵且流程繁琐。 于是我动手做了这个小站:Document to Markdown。 做这个工具的初衷 现在的 AI 工具( LLMs )对 Markdown 的理解能力远高于纯文本或复杂的 HTML 。我希望建立一个简单的 Workflow ,让大家能快速把手头的各种“硬核”文档变成 AI 友好、笔记软件友好的 Markdown 格式。 目前支持的功能 多格式支持: PDF, DOCX, PPTX, XLSX, HTML, CSV, 甚至还有 EPUB 。 结构还原: 尽量保留了原文档的标题层级、列表和表格(表格转换是我花精力最多的地方)。 隐私保护: 采用 Request-only 模式,我们不保存用户上传的原文件,也不持久化生成的 Markdown ,只做实时转换。 开发者友好: 已经规划了 API 接入,方便集成到大家自己的 RAG 或自动化流程中。 为什么需要大家的反馈? 目前产品还在早期阶段,虽然我自己测试了很多样例,但文档格式千奇百怪,肯定还有很多坑: 转换质量: 复杂的 PDF 或嵌套表格转换效果是否符合预期? 交互体验: 目前的上传和预览流程是否顺手? 功能需求: 除了现有的格式,大家是否还需要支持其他冷门格式(如特定代码格式或 Wiki 语法)? 网站地址: https://documenttomarkdown.com/ 目前提供免费的 Trial 次数(登录后每天有 10 次免费额度),欢迎大家随意“蹂躏”。如果觉得好用,或者有任何想吐槽的地方,请直接在评论区留言。 每一条建议我都会认真看,非常感谢!
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 今天在公司讨论怎么把图片和HTML转成PPT,突然有一个想法,尝试了一下挺好用。 然后写一个skills并且开源,希望对佬们有用 GPT5.5 + codex 提示词: 使用LearnDeck 写一个ppt ,随便一个demo,酷炫一点 效果: 链接: github.com GitHub - LearnAIHubC/LearnDeck: Turn learning material into polished, editable... Turn learning material into polished, editable presentation decks. 5 个帖子 - 3 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 AI PPT赛道终结者,史上最最最强PPT Skill!!! 使用GPT生成豪华的图片格式PPT,然后转换为 完全可编辑 的PPTX文件,效果几乎完美。 本技能是个技能包,包含以下3个技能,可以拆分使用和优化: 技能 作用 输入 → 输出 GordenImagePPTGen 生成「图片格式的 PPT」 主题/内容 → 每页 .png + 图片型 .pptx GordenImage2PPTX 把「图片 PPT / 图片」还原成可编辑 pptx 图片 → 可编辑 .pptx(背景+骨架+图标+文本 四层) GordenSuperPPTSkill 打包编排前两者,依次执行 主题/内容 → 图片型 PPT + 可编辑 pptx 只要做图片版 PPT → GordenImagePPTGen 只把图片转可编辑 → GordenImage2PPTX 一键"先出图再转可编辑" / 未指定 → GordenSuperPPTSkill (A->B 串联) 效果展示 1、GordenImagePPTGen(Gorden的图片PPT生成技能)生成图片格式的PPT 2、GordenImage2PPTX(Gorden的图片转PPTX技能)把图片转换为完全可编辑的PPTX文件 如何使用 仅限订阅Codex使用。 第1步:把Github仓库地址发给Codex让他安装技能; Github地址: GitHub - GordenSun/GordenSuperPPTSkills · GitHub 第2步:按需使用。GPT 5.5模型,推理强度选"中"即可。 如果只生成图片格式PPT,提示词: 使用GordenImagePPTGen技能,生成一个N页的PPT,内容为XXX,要求PPT要求豪华、信息密度高、排版复杂 如果只想 把图片PPT转换成可编辑的PPTX文件 ,提示词: 把当前文件夹里的XXX.png,使用GordenImage2PPTX,还原成可编辑的PPT,必须严格遵循技能步骤 说明: 1)本技能仅适用于Codex,因为必须使用GPT生成图片和GPT的视觉能力,理论上Opus+GPT生图接口也可以实现,但是本技能没有做专门的适配。 2)图片转可编辑PPTX文件,比较费额度,转换1张图片大概耗费Plus订阅5小时额度的10%。 3)框架图默认是整体的一张图,也支持拆分成一个个独立的框架模块图,提示词里明确告诉Codex即可。 原理讲解 核心使用的是GPT的生图能力和视觉解析能力。 大致步骤是:依次提取PPT图片的背景图、框架图、图标和装饰图、文本。最后在PPT里按坐标拼装起来。当然为了实现完美的效果,做了很多细节验证和约束规则。 使用过程中,你能看到GPT生成的过程图片。 背景图 框架图 图标和装饰 以上,如果你用着觉得不错,记得给我的Github仓库点一个Star: GitHub - GordenSun/GordenSuperPPTSkills · GitHub 5 个帖子 - 4 位参与者 阅读完整话题
Anthropic 官方的Document Skills 这个算是基础款skills集 支持docx、xlsx、pptx、pdf,如果你想体验 Claude 风格的文档创建和编辑流程,这套技能很有参考价值 大概可以看作 Office 类 Skills 应该如何设计的参考实现。 repo: Anthropic Skills GitHub SenseNova-Skills 与其说是单一文档工具,不如说是一整套 Office 工作流工具包 有五个场景,一共23个skills,可以一起装 数据分析 深度研究(Deep Research) 搜索 PPT 生成 图片与可视化生成 整个研究过程会留下完整的中间文件,可以在你的openclaw或者codex的工作区找到,对后续调整实际的workflow特别有帮助 (类似于你直接修改openclaw里面的SOUL.md文件一样) request.md → plan.json → sub_reports/*.md → synthesis.md → report.md 相关链接: SenseNova-Skills GitHub SenseNova-Skills on ClawHub kywork-Skills 属于同一类产品:面向 AI Agent 的 Office 办公技能套件。 包含: PPT 文档处理 Excel 图片生成 搜索 / Deep Research 甚至音乐生成 支持 Claude Code、Codex CLI、OpenClaw 等兼容 Skills 的 Agent。 如果你想看看一个“AI Office Suite(AI 办公套件)”应该如何打包和组织,值得参考 仓库: Skywork-Skills GitHub OfficeCLI 严格来说它不只是一个 Skill,更像是一个供 Agent 使用的 Office 控制层(Office Control Layer)。 特点: 支持 Word、Excel、PowerPoint 无需安装 Microsoft Office 单一可执行文件即可运行 我觉得它最有意思的地方在于对 Agent 非常友好的“渲染-检查-修正”流程: 让 Agent 先创建内容 → 渲染结果 → 自己检查 → 自动修复问题。 仓库: OfficeCLI GitHub 1 个帖子 - 1 位参与者 阅读完整话题
一个认证需要用到pptx和架构图领导于是叫我用ai生成,于是我使用codex生成,今天又叫生成说明文档,于是领导过来问我用什么ai工具,我说用codex,可能因为他之前不认识这个工具,就先问我用的是什么模型。我说是gpt模型后,领导觉得国外模型存在数据安全风险,担心聊天记录被导出造成信息泄露,所以要求后续改用workbuddy。 7 个帖子 - 6 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 亲爱的佬友们,自荐一个最近刚做的AI PPT skills 基于gpt-image-2强大的世界重塑级画图能力,亲测非常好用! 一句话 用 OpenAI gpt-image-2 一句话生成视觉强烈的 PPT — Claude Code / Codex / Cursor 装成 Skill 后直接说人话就能用。内置 10 套精选风格 + 模板克隆模式(丢一张 .pptx 模板进去,AI 仿版式换内容),产出 HTML viewer(键盘翻页)+ 16:9 .pptx 双份。 仓库 github.com GitHub - JuneYaooo/gpt-image2-ppt-skills: Clone any .pptx into your own deck — OpenAI… Clone any .pptx into your own deck — OpenAI gpt-image-2 mimics the layout, you supply the content. 10 bundled styles. | 把任何 .pptx 模板"抄"成你的 PPT:gpt-image-2 仿版式、你换内容,另含 10 套精选风格。Claude Code / OpenClaw skill. 支持的功能 10 套内置风格 (Spatial Glass / Tech Blue / Editorial Mono / Dark Aurora / Riso / Wabi / Swiss Grid / Hand Sketch / Y2K Chrome / Vector Illustration) 模板克隆模式 — 丢一个 .pptx 进去,自动渲染 + vision 抽风格 + JSON Schema 复刻 md-first 编排 — slides_plan.md 人审友好,md_to_plan.py 转 JSON 双产物 — HTML viewer(键盘翻页 / 空格自动播放 / ESC 全屏)+ 16:9 .pptx 示例图 10 风格封面对照: 模板克隆 before/after: 欢迎试用和反馈,多多交流,感谢 2 个帖子 - 2 位参与者 阅读完整话题
简单测试了一下,似乎就增加了这一点功能,没啥亮点,有点一般阿 似乎还能提取视频中的一些音频啥的 2 个帖子 - 2 位参与者 阅读完整话题