ChatTTS是一种专为对话场景设计的文本到语音模型,例如LLM助手。它提供了专为与多个发言者进行互动对话而优化的会话式TTS,提供自然和富有表现力的语音合成。该模型在预测和控制微妙的语调特征(如笑声、停顿和插话)方面表现出色,超越了许多开源TTS模型在语调方面的表现。ChatTTS的主要模型经过了超过100,000小时的中文和英文音频数据训练,支持使用预训练模型进行进一步的研究和开发。该平台的路线图包括开源基础模型、流式音频生成和多情感控制版本。值得注意的是,ChatTTS仅供学术和研究目的使用,鼓励用户负责和道德地利用这项技术。有关该模型和路线图的咨询,请联系团队[email protected]。