ChatTTS 语音生成

Posted by eye on 06-01,2024

ChatTTS

ChatTTS 是一个用于日常对话的生成语音模型。

ChatTTS 是专为 LLM 助手等对话场景设计的文本转语音模型。它支持英语和中文。我们的模型经过 100,000+ 小时的中英文训练。HuggingFace 上的开源版本是一个 40,000 小时的预训练模型,没有 SFT。

对话式 TTS:ChatTTS 针对基于对话的任务进行了优化,可实现自然且富有表现力的语音合成。它支持多位发言者,从而促进互动对话。
细粒度控制:该模型可以预测和控制细粒度的韵律特征,包括笑声、停顿和感叹词。
更好的韵律:ChatTTS 在韵律方面超越了大多数开源 TTS 模型。我们提供预训练模型以支持进一步的研究和开发。