[分享创造] 🎙️ MaxSpeak — 开源免费的 AI 语音合成工作台, 300+ 音色 / 音色复刻 / 音色设计 MINIMAX 接口

[分享创造] 🎙️ MaxSpeak — 开源免费的 AI 语音合成工作台, 300+ 音色 / 音色复刻 / 音色设计 MINIMAX 接口
[分享创造] 🎙️ MaxSpeak — 开源免费的 AI 语音合成工作台, 300+ 音色 / 音色复刻 / 音色设计 MINIMAX 接口

poster

🎙️ MaxSpeak — AI 语音合成工作台

免费 · 开源 · 300+ 音色 · 音色复刻 · 音色设计

🔗 在线体验: https://maxspeak.vercel.app 📦 GitHub: https://github.com/harlan-zhang/maxspeak


这是什么?

一个基于 MiniMax 语音大模型的全栈 TTS 工具,浏览器打开即用。

能做什么?

  • AI 语音合成 — 文本转语音,9 种情感风格(开心/悲伤/愤怒/耳语…)、语速/音高精细调控、22 种副语言标签(叹气/笑声/呼吸…)
  • 音色复刻 — 上传 10 秒音频即可克隆任意音色,适合播客、有声书、无障碍场景
  • 音色设计 — 用自然语言描述想要的音色,AI 即时生成("温暖亲切的女声,适合读睡前故事")
  • 流式播放 — SSE 流式输出实现边生成边播放,长文本自动切换流式
  • 300+ 预置音色 — 中英日韩粤 + 西葡法德俄等 20+ 语言

技术栈

Next.js 14 + TypeScript + Tailwind CSS + Zustand + Web Audio API

为什么开源?

MiniMax 的 API 能力很强但缺少一个好用的前端。这个工具把复杂的 API 参数(情感控制、副语言标签、音色修饰、发音词典…)全部做成了可视化界面,降低使用门槛。

关于 API Key

应用本身不要钱,语音合成走 MiniMax API 按量计费(约 ¥2-3.5/万字符)。API Key 只存浏览器本地,不经过任何第三方服务器。

部署

如果想自己部署,点一下就行: Deploy with Vercel


欢迎试用,有任何建议或 bug 直接提 Issue 🙏

来源: v2ex查看原文