GPT-SoVITS:最佳中文语音克隆,支持5秒音频、1分钟音频
强大的少量样本语音转换和文本转语音 WebUI,1分钟的语音数据也可以用来训练一个好的TTS模型!
一、软件介绍
语音克隆,目前支持英语、日语和中文。
特性:
- 零样本 TTS:输入 5 秒的人声样本,体验即时文本到语音转换;
- 少量样本 TTS:仅使用 1 分钟的训练数据即可微调模型,提高语音相似度和逼真度;
- 跨语言支持:使用与训练数据集不同的语言进行推理,目前支持英语、日语和中文;
- WebUI工具:集成了语音伴奏分离、自动训练集分割、中文ASR、文本标注等功能,帮助初学者创建训练数据集和GPT/SoVITS模型;
如果是Windows用户(使用 win>=10 进行测试),您可以直接通过预压缩进行安装。只需下载预压缩,解压并双击 go-webui.bat 即可启动 GPT-SoVITS-WebUI。
二、在线演示
在线演示视频: 耗时两个月自主研发的低成本AI音色克隆软件,免费送给大家!;
三、项目地址
THE END