«

Fish Audio发布S2：多说话人、词级情绪控制、完全开源

起点购机发布于 2026-3-12 13:12 阅读：76 行业资讯

Fish Audio 发布新一代文本转语音（TTS）模型 S2，其在情感可控性和表现力方面实现了重大突破，支持词级或短语级的情绪调节，并且完全开源，适合实时应用场景如对话机器人和虚拟主播。

image.png

【AiBase提要:】

🎭 强大的情感可控性，支持自然语言指令调节语音韵律与情绪。

🌐 完全开源，包含模型权重、微调代码及流式推理引擎。

🗣️ 原生多说话人支持，实现对话轮转与音色一致性。

推荐阅读