«

Fish Audio发布S2:多说话人、词级情绪控制、完全开源

起点购机 发布于 阅读:76 行业资讯


Fish Audio 发布新一代文本转语音(TTS)模型 S2,其在情感可控性和表现力方面实现了重大突破,支持词级或短语级的情绪调节,并且完全开源,适合实时应用场景如对话机器人和虚拟主播。

image.png

【AiBase提要:】

🎭 强大的情感可控性,支持自然语言指令调节语音韵律与情绪。

🌐 完全开源,包含模型权重、微调代码及流式推理引擎。

🗣️ 原生多说话人支持,实现对话轮转与音色一致性。