ChatTTS - 소개

깃허브 저장소: 2noise의 ChatTTS 코드

ChatTTS - 소개
link

ChatTTS는 LLM 어시스턴트와 같은 대화 시나리오에 특별히 설계된 텍스트 음성 변환 모델입니다. 이는 다중 화자와의 대화에 최적화된 대화형 TTS를 제공하여 자연스럽고 표현력 있는 음성 합성을 제공합니다. 이 모델은 웃음, 일시 정지, 감탄사와 같은 세부적인 억양 기능을 예측하고 제어하는 데 뛰어나며, 억양 측면에서 많은 오픈 소스 TTS 모델들을 능가합니다. 중국어와 영어 오디오 데이터를 10만 시간 이상 학습한 주요 모델을 기반으로, ChatTTS는 사전 훈련된 모델을 통해 추가적인 연구 및 개발을 지원합니다. 이 플랫폼의 로드맵에는 기본 모델의 오픈 소스화, 스트리밍 오디오 생성, 다중 감정 제어 버전이 포함되어 있습니다. ChatTTS는 학술 및 연구 목적으로만 사용되도록 의도되었으며, 사용자들은 기술을 책임있고 윤리적으로 활용할 것을 권장합니다. 모델 및 로드맵에 대한 문의 사항이 있으면, 사용자는 [email protected]팀에 문의할 수 있습니다.