ChatTTS 是一個專門為對話情境設計的文本轉語音模型,例如 LLM 助手。它提供了針對與多個說話者進行互動對話進行優化的會話式 TTS,提供自然和富有表現力的語音合成。該模型擅長於預測和控制微細的韻律特徵,如笑聲、暫停和插話,勝過許多開源 TTS 模型在韻律方面的表現。ChatTTS 的主要模型基於超過 100,000 小時的中英文音頻數據進行了訓練,支持使用預先訓練模型進行進一步的研究和開發。該平台的路線圖包括開源基本模型、流式音頻生成以及多情感控制版本。值得注意的是,ChatTTS 僅用於學術和研究目的,鼓勵用戶負責任地和道德地利用這項技術。有關模型和路線圖的詢問,用戶可以通過電子郵件 [email protected] 與團隊聯繫。