我现在在做有声书/故事类内容的自动配音。角色对白部分目前问题不大,因为每个角色说的话相对短,TTS 的情绪、音色和表现力比较容易控制,效果也还可以。现在主要卡在"旁白"上,因为旁白文本通常很长,需要承担大量叙述、转场、气氛铺垫和情绪推进。 如果直接用普通 TTS 生成,常见问题是: 语调太平,像播报或机械朗读; 长文本情绪不稳定,前后听感不一致; 缺少有声书旁白需要的节奏感、停顿和抑扬顿挫; 语速、段落停顿、情绪推进不太好控制; 分段生成再拼接时,容易出现语气断裂或衔接不自然。 我想找的是更适合"中文有声书旁白"的 TTS 模型或生成方案。目标效果大概是: 普通话清晰,适合长时间听; 语速可控,不能太快; 情绪有层次,但不要戏剧化过头; 有自然停顿和叙述节奏; 能稳定处理较长旁白文本; 最好能通过 prompt / instruction 控制旁白风格。 想求助各位佬:有没有适合中文有声书旁白的 TTS 模型或方案推荐? 1 个帖子 - 1 位参与者 阅读完整话题
刚在B站刷到一个不良人角色对话旁白的视频,作者剪得真好,不良人前六季在我心中地位没有其他作品能撼动! bilibili.com 古有天罡赋,今有星云赋!_哔哩哔哩_bilibili -, 视频播放量 117318、弹幕量 32、点赞数 4768、投硬币枚数 1644、收藏人数 2982、转发人数 353, 视频作者 吊打你55555, 作者简介... 2 个帖子 - 2 位参与者 阅读完整话题
懒人听书,听到308集时候,突然就换了旁白配音,新的旁白声音难听的一批,就那种突然变成说书人的感觉,评论区里一片骂声。 幸运的是各主角的声音没变化。 想着后面700多集接着听这个声音就难受,有啥办法还原一下下,把新的旁白配音替换成旧的音色( 只替换旁白的音色/音调 ,模拟之前的旁白配音, 而不是从头TTS ,最好可以是 实时替换 的),有什么好办法做到吗? 可以感受下,懒人听书《诡道异仙》的308集之前( 道诡异仙|精品声音剧 | 声娱文化 | 全网爆款神作 | 中式克苏鲁|《哪吒2》配音cv作品-狐尾的笔-声娱文化-有声小说下载,懒人听书官网 - 懒人听书,知名有声阅读平台 ),和 308集之后的旁白差异( 道诡异仙|精品声音剧 | 声娱文化 | 全网爆款神作 | 中式克苏鲁|《哪吒2》配音cv作品-狐尾的笔-声娱文化-有声小说下载,懒人听书官网 - 懒人听书,知名有声阅读平台 )。 这俩音色和语气音调差异有亿点大,还有救不? 1 个帖子 - 1 位参与者 阅读完整话题