Spark-TTS是什么?基于 Qwen2.5 的下一代文本转语音系统
Spark-TTS是一款先进的文本到语音系统,结合Qwen2.5大型语言模型,实现高效的自然语音合成。它支持跨语言零样本语音克隆,可调整性别、音调和语速,适用于多语言场景。独特的BiCodec编码技术提升推理速度和灵活性,通过VoxBox数据集训练,简化语音合成流程并提高效率。
Spark-TTS是一款先进的文本到语音系统,结合Qwen2.5大型语言模型,实现高效的自然语音合成。它支持跨语言零样本语音克隆,可调整性别、音调和语速,适用于多语言场景。独特的BiCodec编码技术提升推理速度和灵活性,通过VoxBox数据集训练,简化语音合成流程并提高效率。