佬们有声音克隆的大模型/方案么

佬们有声音克隆的大模型/方案么
佬们有声音克隆的大模型/方案么

昨天玩了下站内佬的虚拟伴侣项目,成功跑起来了:

github.com

GitHub - Open-LLM-VTuber/Open-LLM-VTuber: Talk to any LLM with hands-free voice interaction,...

Talk to any LLM with hands-free voice interaction, voice interruption, and Live2D taking face running locally across platforms

现在想搞个声音克隆,让ai回答的时候文字转成克隆的tts;

在站内查了下,相关的帖子大多都是半年前一年前的了。。。

大概查到这些:

我是更倾向于调api的方式(怕电脑跑不动),目前想着用minimax,但好像挺昂贵啊 :tieba_006:

佬们有没有其他或者做成了的方案捏?

6 个帖子 - 6 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文