ChatTTS - 概要

ChatTTSは、LLMアシスタントなどの対話シナリオ向けに特別に設計されたテキスト読み上げモデルです。複数のスピーカーとの対話に最適化された会話型TTSを提供し、自然で表現豊かな音声合成を実現します。このモデルは笑い声、一時停止、感嘆などの微細な抑揚特徴を予測および制御する点で優れており、抑揚に関して多くのオープンソースTTSモデルを凌駕しています。中国語と英語のオーディオデータを10万時間以上使用してトレーニングされたメインモデルを搭載しており、ChatTTSは事前にトレーニングされたモデルを使用してさらなる研究と開発をサポートしています。プラットフォームのロードマップには、ベースモデルのオープンソース化、ストリーミングオーディオ生成、およびマルチエモーション制御バージョンが含まれています。ChatTTSは学術および研究目的にのみ使用することを意図しており、ユーザーには技術を責任を持ってかつ倫理的に利用するよう奨励しています。モデルやロードマップに関するお問い合わせは、[email protected]までお問い合わせください。

ChatTTS - 紹介

GitHubリポジトリ：2noiseによるChatTTSコード