ChatTTS - Introducción

Репозиторий GitHub: Код ChatTTS от 2noise

ChatTTS - Introducción
link

ChatTTS - это модель текст в речь, специально разработанная для диалоговых сценариев, таких как помощник LLM. Она предлагает разговорный TTS, оптимизированный для интерактивных разговоров с несколькими дикторами, обеспечивая естественный и выразительный синтез речи. Модель отличается в предсказании и управлении тонкими просодическими особенностями, такими как смех, паузы и междометия, превосходя многие открытые модели TTS в терминах просодии. С главной моделью, обученной на более чем 100 000 часов аудиоданных на китайском и английском языках, ChatTTS поддерживает дальнейшие исследования и разработку с предварительно обученными моделями. Дорожная карта платформы включает в себя открытие базовых моделей, потоковую генерацию аудио и версии с управлением множеством эмоций. Важно отметить, что ChatTTS предназначен исключительно для академических и исследовательских целей, и пользователей призывают использовать технологию ответственно и этично. Для запросов о модели и дорожной карте пользователи могут связаться с командой по адресу [email protected].