Seed-TTS 是字节跳动推出的高级文本到语音(TTS)模型,具有以下主要功能:1. 高质量语音生成;2. 上下文学习能力;3. 情感控制;4. 语音属性可控,包括情感、语调等;5. 零样本学习能力;6. 支持内容编辑和多语种翻译;7. 语音分解,提供更高的灵活性和控制力。其工作原理包括语音分词、条件文本处理、声学声码器等步骤。应用场景涵盖虚拟助手、有声读物、视频配音、客户服务自动化等领域。用户可以通过官方 Demo 体验该产品,并在虚拟助手、电子书转换为有声读物等场景中使用。
Seed-TTS
字节跳动推出的高级文本到语音(TTS)模型
Introduction
Information
- PublisherSeeAISeeAI
- Websitehttps://bytedancespeech.github.io/seedtts_tech_report/
- Published date2024/11/04