GPT-SoVITS:最佳中文语音克隆,支持5秒音频、1分钟音频

强大的少量样本语音转换和文本转语音 WebUI,1分钟的语音数据也可以用来训练一个好的TTS模型!

一、软件介绍

语音克隆,目前支持英语、日语和中文。

特性:

  • 零样本 TTS:输入 5 秒的人声样本,体验即时文本到语音转换;
  • 少量样本 TTS:仅使用 1 分钟的训练数据即可微调模型,提高语音相似度和逼真度;
  • 跨语言支持:使用与训练数据集不同的语言进行推理,目前支持英语、日语和中文;
  • WebUI工具:集成了语音伴奏分离、自动训练集分割、中文ASR、文本标注等功能,帮助初学者创建训练数据集和GPT/SoVITS模型;

如果是Windows用户(使用 win>=10 进行测试),您可以直接通过预压缩进行安装。只需下载预压缩,解压并双击 go-webui.bat 即可启动 GPT-SoVITS-WebUI。

二、在线演示

在线演示视频: 耗时两个月自主研发的低成本AI音色克隆软件,免费送给大家!

三、项目地址

Github: https://github.com/RVC-Boss/GPT-SoVITS

THE END