🚀 个人主页 极客小俊
✍🏻 作者简介:程序猿、设计师、技术分享
🐋 希望大家多多支持, 我们一起学习和进步!
🏅 欢迎评论 ❤️点赞💬评论 📂收藏 📂加关注
ChatTTS-增强版v3整合包 简单更高效 开箱即用!
如果之前的ChatTTS
搭建你实在是搞不懂,也没关系
这里我推荐嘟嘟
大佬开源的ChatTTS-增强版v3
整合包!
一键启动,方便快捷, 无脑安装!
ChatTTS-增强版v3整合包下载
关注微信公众号, 在后台回复关键字:ChatTTSv3
即可免费获取下载地址~ 你懂的!😋😋
如图
安装
下载之后是一个压缩包, 直接解压到合适的盘符下,这里我选择D盘
如图
这里我解压到D盘
会出现一个DUDULab_ChatTTS_Ench_WIN_v3.0
的目录进入到里面,直接双击启动器.exe
就可以启动ChatTTS
如图
最终启动成功!
如图
注意
启动之后小黑屏不要关闭,否则就会失去ChatTTS
的相关服务功能,网页也会打不开!
如图
安装CUDA
但是可能你电脑中缺少一些环境组件会有相关提示:
有可能会提示你CUDA异常
例如
这种情况下你直接到它提供的地址去下载安装一下就可以啦!
CUDA下载地址
https://developer.nvidia.com/cuda-11-8-0-download-archive
如图
根据自己的系统情况下载
如图
最后我们再次启动,直接双击启动器.exe
看看效果是不是可以正常开启了呢!
如图
那么现在我们就可以来使用它来进行文本转语音
的工作了!
使用教程
使用上也很简单,默认情况下,我们直接输入文字,点击右侧的生成就可以得到合成音频了
如图
加入语气词配置
我们可以在文字中加入一些语气词汇描述
,来让合成音效更加逼真!
如下
笑声 --> [laugh]
停顿 --> [uv_break]
口语化 --> [oral]
如图
如果不加语气词,你也可以直接点击勾选提炼文本
也是可以的!
大家可以自行去尝试一下!
音色配置
音色也就是你听到的声音,我们可以配置不同的声音来进行合成!
ChatTTS-v3
默认情况下是使用的女生音色,
我们往下拉到选择音色配置
,点击即可选择
如图
然后一定要记住点击应用配置
按钮,才能生效!
如图
最后再次点击生成就可以了,当然我们也可以点击随机一个音色
进行抽卡的形式,随机抽出一个音色来进行合成!
然后觉得不错的情况下也可以保存音色配置
到预设文件夹里面,下次就重复使用!
扩展加载音色
默认只有4个音色肯定是不够的,我们可以添加更多的音色来进行声音合成!
首先打开魔塔社区官网,在这里我们可以找到很多优质的音色
地址如下
https://modelscope.cn/studios/ttwwwaa/ChatTTS_Speaker
如图
然后往下拉,找到音色列表然后选择一个合适的音色,也可以在下面试听效果,觉得不错就直接下载
如图
然后回到ChatTTS-v3
中找到音色选项
勾选上传音色
如图
然后把刚刚下载的音色文件
拖拽到这里
如图
最后点击生成,就是我们下载的音色了!
当然如果你觉得这个音色不错的话,那么我们可以把它保存到ChatTTS-v3整合包目录
中!
在配置管理
下可以自定义一个音色名称
,然后点击保存音色配置
就可以了
如图
下次我们要用到这个音色的时候,直接到选择音色配置
中点击一下刷新配置列表
就可以看到刚刚自定义的音色了!
如图
当然我们也可以直接把下载的音色文件拷贝到以下目录也是可以的!
X:\DUDULab_ChatTTS_Ench_WIN_v3.0\data
赶紧去试试看吧!
批量处理
如果是有很多文字,我们需要分开处理,尤其是后期配音,需要把每一段音频进行分开!
并且从ChatTTS-v3
生成的角度来讲,也是这样最好拆分开,有利于合成后的效果!
ChatTTS-v3
支持批量处理txt
和srt
的能力!
这里我简单给大家演示一下处理txt
格式
首先我们要新建一个记事本
的文本文件,在里面写入要生成的内容,这里有格式要求
TXT文件格式
- 每行一个独立段落!
- 或使用
[split]
作为分隔符
语法格式
文字内容
[split]
文字内容
举个栗子
以下是一个符合ChatTTS
处理要求的Java开发
主题TXT对话
文件格式
[开发者A] 这次升级JDK21后,新特性Record模式真好用
[split]
[开发者B] 确实,模式匹配让代码简洁不少。但新项目用Spring Boot 3.2还是3.1?
[split]
[开发者A] 建议直接上3.2,响应式编程支持更完善。记得检查Hibernate版本兼容性
[split]
[开发者B] 遇到个循环依赖问题,@Lazy注解能解决吗?
[split]
[架构师] 推荐用构造器注入替代字段注入,配合@ComponentScan调整包结构更彻底
[split]
[测试员] 单元测试覆盖率到85%了,Mockito和Testcontainers配合效果不错
注意事项
- 每段使用
[split]
明确分隔 - 使用
[角色]
标注对话身份,方便后期剪辑
如图
接着我们打开ChatTTS-v3
, 然后勾选批量处理
, 把上面这个记事本文本文件拖拽到里面来!
如图
在下面选择好音色,最后点击生成即可!
如图
生成完毕之后,我们可以点击打开输出文件夹
按钮,跳转到生成目录中!
如图
这样我们就分别得到了一个合并音色
和拆分音色
可以方便我们后期剪辑自由发挥!
最后
怎么样,ChatTTS
一键让文字说话是不是简单又实用!
对于我们后期剪辑的剪辑师来说简直是福利满满!
让你的设备轻松开口说话再也不是一件难事,沟通从此有声有色,简单又神奇,还不赶紧搞起来!
"👍点赞" "✍️评论" "收藏❤️"
欢迎一起交流学习❤️❤️💛💛💚💚
好玩 好用 好看
的干货教程可以点击下方关注❤️微信公众号❤️
说不定有意料之外的收获哦..🤗嘿嘿嘿、嘻嘻嘻🤗!
🌽🍓🍎🍍🍉🍇