用于文本转语音的深度学习工具包,经过研究和生产环境的考验
特性
- 用于 Text2Speech 任务的高性能深度学习模型。
- Text2Spec 模型(Tacotron、Tacotron2、Glow-TTS、SpeedySpeech)。
- 扬声器编码器可有效计算扬声器嵌入。
- 声码器模型(MelGAN、Multiband-MelGAN、GAN-TTS、ParallelWaveGAN、WaveGrad、WaveRNN)
- 快速高效的模型训练。
- 终端和 Tensorboard 上的详细训练日志。
- 支持多扬声器 TTS。
- 高效、灵活、轻量但功能齐全Trainer API。
- 已发布且可供使用的模型。
- 用于在dataset_analysis.
- 使用和测试模型的实用程序。
- 模块化(但不是太多)代码库可以轻松实现新想法。