产品如何设计？一个AI 驱动的播客自动生成平台

发布时间：2026-06-08T19:00:40+08:00 阅读：0 分类：tech

求助一下佬们，因为平时也会听些播客，想着去完成个AI 驱动的播客自动生成平台，现在已经Vibe Coding了个基本框架项目，目前一句话描述项目是用户输入主题或文本，系统自动调用大语言模型生成播客脚本，再通过 TTS（文本转语音）将脚本合成为完整的播客音频。
但是这个还能怎么优化，也去看过类似平台，只是处理了对应的功能而已，没有的对应的产品思维和业务思维，想探讨和学习一下，如果说这就是对应的局限，核心功能其实已经完成了，如果真想设计一个产品住其他的都是服务？还是？感觉比较迷茫，如果真要去自己弄出一个产品出来，想问一下佬们怎么规划和继续完成。还有什么优化的地方？

下面是核心功能：

功能说明 播客生成 输入主题或原文，AI 自动生成播客脚本并转为音频，支持 topic 和 sourceText 两种输入模式 多模型支持 策略模式适配多个 AI 供应商（MiMo、OpenAI），可分别选择 Chat 模型和 TTS 模型 双人对话模式 支持 duo（Host + Guest）说话人模式，默认主持人 Mia（女声）、嘉宾 Milo（男声） 语音预设系统 内置系统预设 + 用户自定义上传语音文件，Host/Guest 可独立配置不同声音 实时进度推送 通过 SSE (/stream/{taskId}) 实时推送任务阶段（脚本生成→分段合成→音频拼接→完成） 音频合成与拼接 基于 FFmpeg 将多段 TTS 音频拼接为完整 MP3；无 FFmpeg 时自动降级为 Mock 模式 时长控制 可指定播客目标时长（durationMinutes，默认 5 分钟） 多语言 支持语言选择（默认中文 zh） 去重与缓存 基于内容哈希检测重复提交，自动复用已有任务结果 过期清理 每 5 分钟清理超过 30 分钟的过期任务及其临时文件

感觉也有些词不达意，望包容，谢谢

3 个帖子 - 3 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文

延伸阅读