python

TTS基于深度学习的文本转语音

Posted by eye on 09-04，2023

coqui tts官网

用于文本转语音的深度学习工具包，经过研究和生产环境的考验

特性

用于 Text2Speech 任务的高性能深度学习模型。
Text2Spec 模型（Tacotron、Tacotron2、Glow-TTS、SpeedySpeech）。
扬声器编码器可有效计算扬声器嵌入。
声码器模型（MelGAN、Multiband-MelGAN、GAN-TTS、ParallelWaveGAN、WaveGrad、WaveRNN）
快速高效的模型训练。
终端和 Tensorboard 上的详细训练日志。
支持多扬声器 TTS。
高效、灵活、轻量但功能齐全Trainer API。
已发布且可供使用的模型。
用于在dataset_analysis.
使用和测试模型的实用程序。
模块化（但不是太多）代码库可以轻松实现新想法。