Fish Audio发布S2:多说话人、词级情绪控制、完全开源
Fish Audio 发布新一代文本转语音(TTS)模型 S2,其在情感可控性和表现力方面实现了重大突破,支持词级或短语级的情绪调节,并且完全开源,适合实时应用场景如对话机器人和虚拟主播。
image.png
【AiBase提要:】
🎭 强大的情感可控性,支持自然语言指令调节语音韵律与情绪。
🌐 完全开源,包含模型权重、微调代码及流式推理引擎。
🗣️ 原生多说话人支持,实现对话轮转与音色一致性。
Fish Audio 发布新一代文本转语音(TTS)模型 S2,其在情感可控性和表现力方面实现了重大突破,支持词级或短语级的情绪调节,并且完全开源,适合实时应用场景如对话机器人和虚拟主播。
image.png
【AiBase提要:】
🎭 强大的情感可控性,支持自然语言指令调节语音韵律与情绪。
🌐 完全开源,包含模型权重、微调代码及流式推理引擎。
🗣️ 原生多说话人支持,实现对话轮转与音色一致性。