大家好,发现一个有意思的开源项目 AI Workdeck ( github.com/zeweihan/aiworkdeck )。 这是一个 AI 原生的法律工作台,定位类似法律行业的 VS Code 。 主要特点: 一站式工作台:合同审查、案例检索、文书生成统一界面 插件市场:按需安装各种法律工具插件 私有化部署:数据不出服务器 开源免费:MIT 协议 对于做法律科技的开发者来说,这个项目的插件市场架构设计值得参考。对于律所 IT 负责人,可以基于它做二次开发。 有在做法律 AI 相关项目的朋友吗?欢迎交流。
大家好,最近开源了一个法律科技项目 AI Workdeck ,定位是法律行业的 VS Code 。 核心功能: 一站式工作台:合同审查、法律研究、文书起草等集成在一个界面 插件市场:像 VS Code 扩展市场一样,按需安装专业工具 自主进化:根据使用习惯持续优化工作流 私有化部署:法律数据敏感,支持完全本地化 项目地址: https://github.com/zeweihan/aiworkdeck 官网: https://www.aiworkdeck.com 欢迎法律人和开发者一起参与建设,也欢迎提 PR 和 Issue 。
程序员有 VS Code ,律师有什么? 合同审查靠 Word + 邮件来回传,尽调报告靠 Excel + 复制粘贴,证据管理靠文件夹命名规范。AI 只能当聊天窗口挂在旁边。 所以我们做了 AI Workdeck —— 一个面向律师和文档密集型团队的 AI 原生工作台。 核心功能: 项目管理 + 文件树:像 IDE 一样组织案件文档结构 AI Agent 层:流式响应、MCP 编排 文档在线编辑:集成 WPS WebOffice ,直接编辑 DOCX/XLSX 文档解析 & 生成:MinerU 解析、AI PPT 、TTS 证据链工作流:编号、关联、审查记录 隐私优先:私有化部署,数据不出内网 插件体系:可扩展的垂直场景面板 技术栈:Java/Spring Boot + Vue + Electron ,Docker 化部署。 GitHub: https://github.com/zeweihan/aiworkdeck 官网: https://www.aiworkdeck.com License: AGPLv3 ,商业授权可联系。 欢迎 Star 、Fork 、提 Issue 。
最近在研究 MCP ( Model Context Protocol )在专业领域的落地应用,搭了一个开源的 AI 工作台 AI Workdeck 。 核心思路是:把各种文档处理能力封装成 MCP Server ,然后用 Agent 来编排调用。 举个例子,在法律文档审查场景里: 合同解析 MCP Server — 负责提取条款、识别风险点 比对 MCP Server — 负责文档版本对比 检索 MCP Server — 负责从知识库中检索相关法规 然后通过 Agent 编排,用户只需要上传文档,系统自动调用相关工具完成分析。 技术栈: 后端用 FastAPI MCP Server 用 Python SDK Agent 层支持多种编排模式 前端用 Next.js 相比直接用 ChatGPT 处理文档,这种架构的好处是每个 MCP Server 可以独立开发、测试和部署,而且可以复用社区已有的 Server 。 项目完全开源,欢迎感兴趣的同学一起交流。 GitHub: https://github.com/zeweihan/aiworkdeck
JoyClaw JoyClaw - 满血龙虾 JoyClaw 是京东 JoyAgent+ 旗下 AI Native 工作台,支持 macOS 与 Windows 客户端下载,提供 Agent 开发、企业办公 AI 能力与满血龙虾智能体体验。 5 个帖子 - 5 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 https://github.com/LumenStorm/OrisonSpace Orison Space 是一款面向小说创作者的 AI 小说工作台,主要专注于内容创作上,想解决在创作过程中管理混乱、工具分散的问题。 我们把项目管理、章节写作、世界观设定、角色设定、素材库、AI Agent 协作这些功能都整合到了一个桌面应用里,希望大家从灵感记录、大纲设计、正文创作,再到图片素材生成,都能在一个统一的流程下完成,这样就不用来回切换工具了。 项目也支持本地文件管理、版本记录、AI 润色等功能。不过说实话,现在这个项目还远远谈不上完善,很多功能都还在持续打磨的过程中,体验上肯定还有不少问题。 也是闭门造车三个月了,所以这次在L站发布开源推广,也是真心想听听佬友的意见和建议。无论是功能、交互体验,还是创作流程上的问题,都欢迎各位评论与反馈。 (此为测试生成小说) 一些题外话 首先我知道,关于AI小说生成已经有相当多开源项目和闭源产品了。但我在写自己构想的SF小说时,却发现那些软件/skills是对网文投稿的特化生产,有着过于繁重的框架与skills,并不能够辅助自己创作。 随后我想到:既然coding与writing都是输出文本的过程,为什么不直接做一个IDE呢?IDE可是足够成熟的标准生产工具;为什么不模仿coding agent做一个writing agent,在这个agent下进行vibe-writing呢?这决定了项目的架构基础:模仿IDE风格,随后我与志同道合的好友Saki一起进行了agent的架构选型、研发调优、交互改善。 既然是创作,那肯定是人来主导, 人在回路式的agent交互。 三月以来,迭代到发布版为止,我们构思了多种方案,最终决定将agent的自由度调高,让用户导入skills来支持对多种题材和风格,这样才能提升agent。 当然,我们之后也会制作一套比较泛用与部分题材特化的skills,这个项目刚刚起步,距离我想象的完全形态还有漫长的距离,慢慢来吧------ 5 个帖子 - 2 位参与者 阅读完整话题
界面神似 Codex… Kimi Kimi Work:知识工作者的 AI 桌面智能体工作台 Kimi Work 是全面覆盖金融投研、科研学术与白领办公的桌面端 AI 工作台。内置 300 Agent 全天候替你整理文件、操作网页、自动化任务、生成精美 Office 产物,重塑 PC 端 AI 办公体验。 3 个帖子 - 3 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 为了加速开发效率和利用token plan,很多佬经常并行开多个Agent CLI窗口。 然而,codex / claude-code 回车一时爽,管理恢复火葬场。 为了解决项目中多Agent CLI工作台管理的问题,开发了 CC-Branch。 可视化管理项目 CLI 。一个项目中经常并发多开很多个窗口,不同的Agent CLi(Codex,Claude,Kimi-cli等等),不同的 Terminal (VS Code、Cursor、Warp等等),都可以在CLI的管理面板上快捷配置。 一键恢复Agent工作台 。之前不小心关闭了窗口,需要重新输入多次命令行,恢复之前的对话。现在CC Branch只需一键启动即可。 同时配置远端和本地项目 。支持通过SSH连接本地项目,同时支持一个Terminal面板下面混合本地和远程项目,实现跨端同项目协作。 欢迎访问项目链接,顺手点个star就更好啦~ 项目地址 : GitHub - GeminiLight/cc-branch: Restore your multi-agent CLI workbench in one click. · GitHub 桌面端下载链接 : Releases · GeminiLight/cc-branch · GitHub CLI 安装命令 : pip install cc-branch 可视化配置项目CLI 自定义配置Agent / Terminal 一键开启多 CLI 工作台 1 个帖子 - 1 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 无限画布二开版:一个更适合自托管的 AI 图片创作工作台 最近在论坛里发现了一个非常好的ai图片创作开源项目 basketikun/infinite-canvas ,这两天根据自己的需求做了一版二次开发,重点增强了图片生成工作台、创作工作流、素材复用、账号同步和 R2 对象存储能力。项目会继续开源,适合想在自己服务器上搭一个 AI 图片创作工具的朋友试用和二开,暂不推荐商用。 项目地址: github.com GitHub - HuFakai/infinite-canvas: 面向AI创作的开源无限画布工作台,集成 AI... 面向AI创作的开源无限画布工作台,集成 AI 生图、参考图编辑、视频生成、画布编排、对话助手、提示词库和素材管理等功能、兼容OpenAI接口,支持chatgpt2api、grok2api、flow2api、newapi等接入。 原项目地址: github.com GitHub - basketikun/infinite-canvas: 面向AI创作的开源无限画布工作台,集成 AI... 面向AI创作的开源无限画布工作台,集成 AI 生图、参考图编辑、视频生成、画布编排、对话助手、提示词库和素材管理等功能、兼容OpenAI接口,支持chatgpt2api、grok2api、flow2api、newapi等接入。 原帖 【开源无限画布】统一AI创作网关:集成图/文生图/视频的无限画布,兼容2api项目和OpenAI接口 开发调优 本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 一周开源总… 项目定位 这个项目不是单纯的“输入提示词生成图片”页面,而是把图片创作常用流程整合到一个工作台里: 无限画布:整理图片、文本、参考图和生成节点。 生图工作台:连续生成、对比、分类、复用历史结果。 创作工作流:把固定提示词结构沉淀成模板,只替换少量变量即可批量生成同类型图片。(我个人非常需要也经常使用) AI 创建工作流 Agent:直接根据提示词生成工作流。(本人比较懒,尤其是有了ai后,能交给ai的都让ai来干活) 提示词库和素材库:把常用提示词、参考图、生成结果沉淀下来。 自托管存储:支持 SQLite + S3/R2,把图片文件放到自己的对象存储。(主要为了给朋友用,方便线上跨设备使用,白嫖的Cloudflare R2对象存储,每个账号可以白嫖10g,同时可以添加多个R2,自动统计容量,到达9g后自动禁用并切换下一个,作为L站忠实用户,能白嫖绝不掏钱) 适合的场景包括电商海报、小红书封面、AI 写真风格探索、菜谱图、UI 视觉稿、广告创意图等。 新增功能截图 (点击了解更多详细信息) 相比原项目新增和增强的功能 (点击了解更多详细信息) 快速启动 (点击了解更多详细信息) 我帖子内的项目介绍,AI生成、润色内容部分截图 (点击了解更多详细信息) 当前适合谁使用 如果你有这些需求,可以试试: 想在自己服务器上跑一个 AI 图片创作工作台。 想把多个 OpenAI 兼容渠道统一管理。 想使用 Cloudflare R2 保存生成图片。 想把常用提示词和参考图沉淀成素材。 想把固定创作流程封装成工作流模板。 想继续二开一个图片创作类开源项目。 目前项目仍然处于快速开发阶段,不建议直接作为稳定商用系统使用。数据结构和功能还会继续调整,适合个人自用、学习、二开和小范围测试。 致谢 最后必须感谢原开源作者。 本项目基于 basketikun/infinite-canvas 二次开发,原项目提供了非常好的无限画布基础、节点交互和 AI 创作雏形。我这版主要是在原项目基础上继续扩展生图工作台、工作流、存储、账号同步和部署能力。 原项目地址: https://github.com/basketikun/infinite-canvas 感谢原作者的开源工作,也欢迎大家去给原项目点 Star。如果你觉得还不错的话可以给我点个赞和Star,谢谢! 1 个帖子 - 1 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 项目 github.com GitHub - GALIAIS/LoraHub 通过在 GitHub 上创建帐户来为 GALIAIS/LoraHub 开发做出贡献。 花了不少时间优化,写这项目主要是现有的用着都不顺手,本项目直接整合了三个不同后端,anima_lora训练应该已经没问题,其余两个不能保证 1 个帖子 - 1 位参与者 阅读完整话题
https://github.com/muxy-app/muxy
FlowForge Crypto:一款开源的可视化、节点式的现代密码学/加密解密工作台 平时在搞逆向分析、协议抓包或者 CTF 的时候,大家肯定没少跟各种加密算法打交道。为了验证一段数据是 AES 、RSA 还是单纯的 Base64 ,我们往往需要在各种在线工具、本地小插件,甚至写 Python 脚本之间来回切换,有时候步骤一多,自己都绕晕了。 为了解决这个痛点,我开发了一款 完全开源、纯前端运行 的可视化加密解密工作台 —— FlowForge Crypto 。 只需像连线游戏一样拖拽节点,就能直观地构建和测试复杂的加密工作流,执行过程所见即所得。今天开源分享给大家,希望能成为大家手边实用的辅助利器! 🌟 核心亮点 ⚡ 可视化工作流 :告别繁琐的代码和独立的转换工具。通过连线的方式组合各个算法节点,数据流向清晰可见,非常适合分析复杂的嵌套加密协议。 🛠️ 丰富的算法支持 : 对称加密 :AES (GCM/CBC), ChaCha20-Poly1305 等 非对称加密 :RSA, ECC (椭圆曲线) 哈希算法 :SHA-256, SHA-3, MD5 等 编码转换 :Base64, Hex, Base58, Base32, UTF-8 衍生与认证 :PBKDF2, Argon2, HMAC, JWT 解析, OTP 等 ⏱️ 实时执行反馈 :修改任意节点的参数或数据,整个工作流会瞬间自动重新计算。 📝 详细日志追踪 :内置执行日志,每一步转换的耗时和结果一目了然,方便定位错误。 🛡️ 安全隐私 :纯前端( React 19 + Vite )实现,核心基于 WebCrypto 及成熟库,所有数据计算都在浏览器本地完成, 不会上传任何数据 ,分析敏感协议时绝对安全。 📸 运行界面截图 🌐 访问与下载 本项目目前提供在线 Web 版(免安装直接用),同时也完全开源。 👉 **在线体验 (Live Demo)**: https://flowforge-crypto.pages.dev/ 💻 GitHub 开源地址 : https://github.com/marlkiller/flowforge-crypto 🚀 进阶玩法:一键导入工业级加密流 为了让大家快速上手,页面内置一些生成好的配置文件。在页面左侧菜单点击 [Demo] 按钮,即可一键加载完整的加解密/签名/验证流程 这个流程展示了: 多级派生 :从同一个密码派生出不同的加密密钥和签名密钥。 安全打包 :版本号 + 随机盐 + IV + 密文 + HMAC 签名的完整构造逻辑。 实时校验 :修改左侧任何输入,右侧解密链路实时联动,非常适合深入理解加密协议结构。 💡 后续计划 目前项目还在持续迭代中,后续计划加入: 更多小众逆向算法支持。 常用加密特征的自动识别节点。 工作流的本地导入导出功能。 欢迎各位大佬体验、拍砖、提 Bug 。如果觉得这个工具对你的分析工作有帮助,去 GitHub 给个 Star ⭐ 就更感激不尽啦!
https://github.com/muxy-app/muxy
IT之家 5 月 18 日消息,阿里云今日宣布,QoderWork 正式上线设计工作台(Design Desk),支持语音输入, 用户可直接通过语音描述需求、下达指令 ,即可在无限画布上获得可运行、可编辑、可交付的设计产物,普通人也能产出专业设计。 IT之家从官方介绍获悉,设计工作台是 QoderWork 自定义工作台的首个细分领域模式,内置一百多种风格参考与数十个设计技能, 实现了设计即代码 。设计师与研发从第一步起操作同一份可运行文件,设计产物可一键交付至 Qoder IDE 等开发工具,设计产物直接进入研发环节。 QoderWork 设计工作台通过 Questions、Design Plan 以及 Nudge 三个机制重构了 AI 生产设计的流程: Questions:结构化追问,降低信息损耗。输入不足时 AI 先追问对齐意图,而非猜测执行,将无效迭代降至最低。 Design Plan:先计划,再执行。AI 在生成前输出结构化设计计划(布局、风格、内容层级),经用户确认后才执行,方向对齐在前。 Nudge:参数化微调,保持设计意图。生成后,配色、间距、圆角等关键决策以可调参数暴露,无需重新描述即可微调。 设计师:定向迭代、多端协作,无需反复导出修改 传统流程中,每处修改都意味着重新导出切图、更新标注、同步研发、验收还原。设计师的精力被切碎在工具与沟通之间。 QoderWork 设计工作台则将迭代压缩至画布之内:圈选区域、标注意图,AI 基于画面上下文即时调整;设计师还可通过 Nudge 实时微调配色与间距,反复精修直到满意;设计产物保留可读、可接手的工程文件结构。 例如,一位 UI 设计师使用设计工作台快速探索首页方向,选定方案后通过画笔标注连续迭代四轮,导出 React + Vite 工程,研发可继续接入业务逻辑,跳过了传统「设计稿 → 标注 → 沟通 → 还原」的多轮沟通。 产品经理:随时更新高保真原型,需求对齐及时且准确 传统产品设计中,高保证原型可以直观展现产品设计方向,但依赖设计师排期且周期较长,无法及时响应产品经理需求及时更新并用于对齐项目进度。 QoderWork 设计工作台则为产品经理们提供了第三条路径:信息不足时 AI 先结构化追问(Questions)对齐意图,再经 Design Plan 确认方向,即可在画布上获得具备设计品质的可交互原型,直接用于需求评审或团队汇报。 例如,产品经理需在周会前展示新功能的交互方案。她在设计工作台中选定 SaaS Dashboard 风格参考,描述页面结构与核心信息模块,几轮交互后即获得可点击交互的高保真原型,直接用于投屏演示。 市场运营:几句话生成多场景交付物料 市场运营视觉需求频次高、窗口短,单场活动涉及主视觉、Banner、落地页多项产出,设计资源有限,通常只能交付单一方向。 而在 QoderWork 设计工作台中多方向并行可以成为常规操作:输入主题与调性,通过 Design Plan 确认方向后即可生成;切换风格参考即获得不同方向,覆盖海报、Banner、落地页等高频需求。 阿里云表示,设计工作台是 QoderWork 自定义工作台的首个细分领域模式, 后续还将有更多灵活、可拓展的工作台 。
项目链接 GitHub: https://github.com/yoqu/lingji-cut github.io 网页介绍带视频讲解 灵机剪影是什么? 灵机剪影是一个本地优先的开源 AI 视频创作工作台。 它不是单纯的视频播放器、字幕工具或者时间线 Demo ,而是想把内容创作里一堆分散环节串起来:写稿、AI 审稿、TTS 语音、字幕、素材管理、时间线剪辑、信息卡、封面生成和 MP4 导出。 简单说,就是给做口播视频、知识视频、播客切片、图文讲解类视频的人用的桌面端编辑器。 为什么做灵机剪影? 因为我自己有整理资料看播客视频的习惯,且我自己也在做抖音博主,目前小有成就,几万粉丝,我日常做视频因为本身不是做视频剪辑科班出身的,所以每次剪辑我都觉得非常的费劲费力,最后做出来的质量还不好。 中间有段时间那么干脆使用了 skill 通过 AI 制作,但是实现过程中发现 AI 生成出来的成品还是有细微问题,需要我手动调整,让 AI 调整太费 TOKEN ,且时间 成本很高 ,要等 AI 费时 。 写稿在一个地方,审稿在一个地方,TTS 又在一个地方,字幕还要单独处理,最后进剪辑软件再把素材、字幕、卡片、封面重新整理一遍。 很多工具单点能力很强,但串起来之后还是很累。 所以我专门针对我的播客工作流程研发这么一套工具,通过流水线作业,把全部流程都写进一款软件中,并能通过 MCP 桥接到 claude code 或 codex 等 agent 工具中,实现 AI 和工具的双向奔赴。 所以我想做一个更“创作者工作台”一点的工具: 从一份原始素材开始,逐步变成脚本、音频、字幕、视觉卡片、封面和最终视频。中间尽量保留人工可控,而不是黑盒一键生成完就不能改。 灵机剪影有什么特点? 本地优先:项目文件保存在本地目录,不强依赖云端工程。 AI 写稿工作台:支持 original.md / script.md 、多文件标签、搜索替换、版本历史、AI 生成、AI 审稿和批注采纳。 一站式视频编辑界面:素材、预览、Inspector 、时间线和导出配置在同一个工作区里。 自动口播流程:可以从文稿触发 TTS 、字幕解析、内容分析、封面候选和视觉卡片生成。 时间线编辑:支持音频、字幕、图片、视频、文字、AI 卡片、多视觉轨、多音频轨、拖拽、吸附、拆分、裁剪、复制 / 剪切 / 粘贴和轨道锁定。 多 Provider AI 配置:支持 OpenAI 兼容模型、Gemini 、LM Studio 、图片生成 Provider 、MiniMax TTS 等配置。 Agent / MCP 集成:可以连接 Claude ACP Runtime ,并提供 lingji_* MCP 工具给 Claude Code / Codex / Gemini 等客户端操作脚本工作台。 Remotion 导出:通过 Remotion 渲染 MP4 ,支持 H.264 、分辨率、质量配置和导出进度展示。 适合谁用? 比较适合这些场景: 做知识区 / 工具教程 / 产品介绍视频 做口播类短视频 从已有音频和 SRT 开始剪辑 想把 AI 生成内容和人工剪辑放在同一个流程里 想要一个可折腾、可改代码、可本地保存工程的开源视频工具 如果你只是想剪一个复杂 Vlog ,或者需要非常成熟的专业 NLE ,目前它还不是 Premiere / Final Cut / 达芬奇这种级别的替代品。 技术栈 Electron React TypeScript Remotion Zustand CodeMirror Framer Motion TailwindCSS MCP SDK Vitest 当前状态 - 2026-05-15 目前已经完成并可用的部分: 本地项目创建 / 打开 脚本工作台 AI 生成脚本 AI 审稿和批注采纳 文件标签和版本历史 本地视频 / 音频导入 TTS 口播生成 SRT 字幕解析 素材管理 时间线编辑 字幕轨道 图片 / 视频 / 文字 / AI 卡片 Overlay 多轨道编辑 封面候选和封面编辑相关能力 Remotion MP4 导出 AI Provider / TTS / 图片生成 / Prompt 配置 Agent / MCP 集成 macOS 本地打包 会持续更新吗? 会。 这个项目本身就是我自己创作流程里需要的工具,所以会继续维护。 后面会继续补稳定性、模板能力、导出体验、AI 工作流、封面和卡片生成,以及更完整的文档。 欢迎佬友们提 issue 、提建议、PR ,也欢迎直接吐槽哪里不好用。 截图 / 视频展示 这里放截图: 最后 灵机剪影现在还不是一个“完美的视频剪辑软件”,更像是一个正在长出来的 AI 视频创作工作台。 如果你也经常在“写稿 - 配音 - 字幕 - 卡片 - 剪辑 - 导出”之间来回横跳,希望这个项目能帮你少折腾一点。
项目链接 GitHub: https://github.com/yoqu/lingji-cut github.io 网页介绍带视频讲解 灵机剪影是什么? 灵机剪影是一个本地优先的开源 AI 视频创作工作台。 它不是单纯的视频播放器、字幕工具或者时间线 Demo ,而是想把内容创作里一堆分散环节串起来:写稿、AI 审稿、TTS 语音、字幕、素材管理、时间线剪辑、信息卡、封面生成和 MP4 导出。 简单说,就是给做口播视频、知识视频、播客切片、图文讲解类视频的人用的桌面端编辑器。 为什么做灵机剪影? 因为我自己有整理资料看播客视频的习惯,且我自己也在做抖音博主,目前小有成就,几万粉丝,我日常做视频因为本身不是做视频剪辑科班出身的,所以每次剪辑我都觉得非常的费劲费力,最后做出来的质量还不好。 中间有段时间那么干脆使用了 skill 通过 AI 制作,但是实现过程中发现 AI 生成出来的成品还是有细微问题,需要我手动调整,让 AI 调整太费 TOKEN ,且时间 成本很高 ,要等 AI 费时 。 写稿在一个地方,审稿在一个地方,TTS 又在一个地方,字幕还要单独处理,最后进剪辑软件再把素材、字幕、卡片、封面重新整理一遍。 很多工具单点能力很强,但串起来之后还是很累。 所以我专门针对我的播客工作流程研发这么一套工具,通过流水线作业,把全部流程都写进一款软件中,并能通过 MCP 桥接到 claude code 或 codex 等 agent 工具中,实现 AI 和工具的双向奔赴。 所以我想做一个更“创作者工作台”一点的工具: 从一份原始素材开始,逐步变成脚本、音频、字幕、视觉卡片、封面和最终视频。中间尽量保留人工可控,而不是黑盒一键生成完就不能改。 灵机剪影有什么特点? 本地优先:项目文件保存在本地目录,不强依赖云端工程。 AI 写稿工作台:支持 original.md / script.md 、多文件标签、搜索替换、版本历史、AI 生成、AI 审稿和批注采纳。 一站式视频编辑界面:素材、预览、Inspector 、时间线和导出配置在同一个工作区里。 自动口播流程:可以从文稿触发 TTS 、字幕解析、内容分析、封面候选和视觉卡片生成。 时间线编辑:支持音频、字幕、图片、视频、文字、AI 卡片、多视觉轨、多音频轨、拖拽、吸附、拆分、裁剪、复制 / 剪切 / 粘贴和轨道锁定。 多 Provider AI 配置:支持 OpenAI 兼容模型、Gemini 、LM Studio 、图片生成 Provider 、MiniMax TTS 等配置。 Agent / MCP 集成:可以连接 Claude ACP Runtime ,并提供 lingji_* MCP 工具给 Claude Code / Codex / Gemini 等客户端操作脚本工作台。 Remotion 导出:通过 Remotion 渲染 MP4 ,支持 H.264 、分辨率、质量配置和导出进度展示。 适合谁用? 比较适合这些场景: 做知识区 / 工具教程 / 产品介绍视频 做口播类短视频 从已有音频和 SRT 开始剪辑 想把 AI 生成内容和人工剪辑放在同一个流程里 想要一个可折腾、可改代码、可本地保存工程的开源视频工具 如果你只是想剪一个复杂 Vlog ,或者需要非常成熟的专业 NLE ,目前它还不是 Premiere / Final Cut / 达芬奇这种级别的替代品。 技术栈 Electron React TypeScript Remotion Zustand CodeMirror Framer Motion TailwindCSS MCP SDK Vitest 当前状态 - 2026-05-15 目前已经完成并可用的部分: 本地项目创建 / 打开 脚本工作台 AI 生成脚本 AI 审稿和批注采纳 文件标签和版本历史 本地视频 / 音频导入 TTS 口播生成 SRT 字幕解析 素材管理 时间线编辑 字幕轨道 图片 / 视频 / 文字 / AI 卡片 Overlay 多轨道编辑 封面候选和封面编辑相关能力 Remotion MP4 导出 AI Provider / TTS / 图片生成 / Prompt 配置 Agent / MCP 集成 macOS 本地打包 会持续更新吗? 会。 这个项目本身就是我自己创作流程里需要的工具,所以会继续维护。 后面会继续补稳定性、模板能力、导出体验、AI 工作流、封面和卡片生成,以及更完整的文档。 欢迎佬友们提 issue 、提建议、PR ,也欢迎直接吐槽哪里不好用。 截图 / 视频展示 这里放截图: 最后 灵机剪影现在还不是一个“完美的视频剪辑软件”,更像是一个正在长出来的 AI 视频创作工作台。 如果你也经常在“写稿 - 配音 - 字幕 - 卡片 - 剪辑 - 导出”之间来回横跳,希望这个项目能帮你少折腾一点。
IT之家 5 月 15 日消息,阿里今天发布 Qoder 1.0,可自主完成执行、验证和交付全流程任务, 支持 Windows、macOS 和 Linux 平台 ,号称“从 AI IDE 升级为智能体自主开发工作台”。 据介绍,Qoder 1.0 将 Quest 从 IDE 内的一个模式升级为独立视窗, 集成任务管理、状态追踪、产物追查和知识调用能力 。开发者定义目标后,执行、验证和交付均由 Agent 在工作台内完成。支持按需展开文件目录、代码变更、终端输出、浏览器预览等工程信息,可不离开上下文深入查看项目细节。 Qoder 1.0 将并行范围扩展至跨项目、跨代码库维度,开发者可在多个 Workspace 中同时运行不同项目的 Agent 任务。每个 Quest 任务拥有独立的状态标签(运行中 / 等待确认 / 已完成),无需逐一切换窗口,一屏即可掌握全局进展。任务完成后,系统自动生成 Summary 交付清单。 IT之家从“阿里云”公众号获悉,Qoder 1.0 新增自定义专家能力。开发者可创建专属 Agent 团队,为其配置领域知识、任务技能和外部工具接口,打造贴合自身业务场景的 Agent 团队。
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 项目链接 GitHub: github.com GitHub - yoqu/lingji-cut: Open-source video creation tool Open-source video creation tool github.io网页介绍带视频讲解 灵机剪影是什么? 灵机剪影是一个本地优先的开源 AI 视频创作工作台。 它不是单纯的视频播放器、字幕工具或者时间线 Demo,而是想把内容创作里一堆分散环节串起来:写稿、AI 审稿、TTS 语音、字幕、素材管理、时间线剪辑、信息卡、封面生成和 MP4 导出。 简单说,就是给做口播视频、知识视频、播客切片、图文讲解类视频的人用的桌面端编辑器。 为什么做灵机剪影? 因为我自己有整理资料看播客视频的习惯,且我自己也在做抖音博主,目前小有成就,几万粉丝,我日常做视频因为本身不是做视频剪辑科班出身的,所以每次剪辑我都觉得非常的费劲费力,最后做出来的质量还不好。 中间有段时间那么干脆使用了 skill 通过 AI 制作,但是实现过程中发现 AI 生成出来的成品还是有细微问题,需要我手动调整,让 AI 调整太费 TOKEN,且时间 成本很高 ,要等AI 费时 。 写稿在一个地方,审稿在一个地方,TTS 又在一个地方,字幕还要单独处理,最后进剪辑软件再把素材、字幕、卡片、封面重新整理一遍。 很多工具单点能力很强,但串起来之后还是很累。 所以我专门针对我的播客工作流程研发这么一套工具,通过流水线作业,把全部流程都写进一款软件中,并能通过 MCP 桥接到 claude code 或 codex 等 agent 工具中,实现 AI和工具的双向奔赴。 所以我想做一个更“创作者工作台”一点的工具: 从一份原始素材开始,逐步变成脚本、音频、字幕、视觉卡片、封面和最终视频。中间尽量保留人工可控,而不是黑盒一键生成完就不能改。 灵机剪影有什么特点? 本地优先:项目文件保存在本地目录,不强依赖云端工程。 AI 写稿工作台:支持 original.md / script.md、多文件标签、搜索替换、版本历史、AI 生成、AI 审稿和批注采纳。 一站式视频编辑界面:素材、预览、Inspector、时间线和导出配置在同一个工作区里。 自动口播流程:可以从文稿触发 TTS、字幕解析、内容分析、封面候选和视觉卡片生成。 时间线编辑:支持音频、字幕、图片、视频、文字、AI 卡片、多视觉轨、多音频轨、拖拽、吸附、拆分、裁剪、复制 / 剪切 / 粘贴和轨道锁定。 多 Provider AI 配置:支持 OpenAI 兼容模型、Gemini、LM Studio、图片生成 Provider、MiniMax TTS 等配置。 Agent / MCP 集成:可以连接 Claude ACP Runtime,并提供 lingji_* MCP 工具给 Claude Code / Codex / Gemini 等客户端操作脚本工作台。 Remotion 导出:通过 Remotion 渲染 MP4,支持 H.264、分辨率、质量配置和导出进度展示。 适合谁用? 比较适合这些场景: 做知识区 / 工具教程 / 产品介绍视频 做口播类短视频 从已有音频和 SRT 开始剪辑 想把 AI 生成内容和人工剪辑放在同一个流程里 想要一个可折腾、可改代码、可本地保存工程的开源视频工具 如果你只是想剪一个复杂 Vlog,或者需要非常成熟的专业 NLE,目前它还不是 Premiere / Final Cut / 达芬奇这种级别的替代品。 技术栈 Electron React TypeScript Remotion Zustand CodeMirror Framer Motion TailwindCSS MCP SDK Vitest 当前状态 - 2026-05-15 目前已经完成并可用的部分: 本地项目创建 / 打开 脚本工作台 AI 生成脚本 AI 审稿和批注采纳 文件标签和版本历史 本地视频 / 音频导入 TTS 口播生成 SRT 字幕解析 素材管理 时间线编辑 字幕轨道 图片 / 视频 / 文字 / AI 卡片 Overlay 多轨道编辑 封面候选和封面编辑相关能力 Remotion MP4 导出 AI Provider / TTS / 图片生成 / Prompt 配置 Agent / MCP 集成 macOS 本地打包 会持续更新吗? 会。 这个项目本身就是我自己创作流程里需要的工具,所以会继续维护。 后面会继续补稳定性、模板能力、导出体验、AI 工作流、封面和卡片生成,以及更完整的文档。 欢迎佬友们提 issue、提建议、PR,也欢迎直接吐槽哪里不好用。 截图 / 视频展示 这里放截图: 也可以放 30 秒演示视频: 最后 灵机剪影现在还不是一个“完美的视频剪辑软件”,更像是一个正在长出来的 AI 视频创作工作台。 如果你也经常在“写稿 - 配音 - 字幕 - 卡片 - 剪辑 - 导出”之间来回横跳,希望这个项目能帮你少折腾一点。 3 个帖子 - 2 位参与者 阅读完整话题
大家好,我做了一个叫 Seedream 4.7 AI 的图片生成工作台。 我的目标是让 AI 图片生成更适合真实的创意工作,而不只是生成“看起来很漂亮”的随机图片。 欢迎大家来体验: Seedream 4.7
大家好,我做了一个叫 Seedream 4.7 AI 的图片生成工作台。 我的目标是让 AI 图片生成更适合真实的创意工作,而不只是生成“看起来很漂亮”的随机图片。 欢迎大家来体验: Seedream 4.7