ChatTTS là một mô hình chuyển văn bản thành giọng nói được thiết kế đặc biệt cho các tình huống đối thoại, chẳng hạn như trợ lý LLM. Nó cung cấp TTS trò chuyện được tối ưu hóa cho các cuộc trò chuyện tương tác với nhiều người nói, mang lại tổng hợp giọng nói tự nhiên và biểu cảm. Mô hình vượt trội trong việc dự đoán và kiểm soát các đặc điểm ngữ điệu tinh tế như tiếng cười, sự tạm dừng và sự xen vào, vượt qua nhiều mô hình TTS mã nguồn mở khác về mặt ngữ điệu. Với một mô hình chính được huấn luyện trên hơn 100.000 giờ dữ liệu âm thanh tiếng Trung và tiếng Anh, ChatTTS hỗ trợ nghiên cứu và phát triển thêm với các mô hình được huấn luyện trước. Lộ trình của nền tảng bao gồm việc công khai mã nguồn các mô hình cơ bản, tạo ra âm thanh trực tiếp, và các phiên bản kiểm soát nhiều cảm xúc. Điều quan trọng cần lưu ý là ChatTTS chỉ dành cho mục đích học thuật và nghiên cứu, và người dùng được khuyến khích sử dụng công nghệ một cách có trách nhiệm và đạo đức. Để biết thông tin chi tiết về mô hình và lộ trình, người dùng có thể liên hệ với nhóm qua địa chỉ email [email protected].