告别生硬AI语音!这款开源工具让播客制作像写文案一样简单
只需两段声音样本+文字脚本,就能生成自然流畅的双人对话音频,MOSS-TTSD正在重新定义AI语音合成
什么是MOSS-TTSD?
MOSS-TTSD(Text to Spoken Dialogue)是一款由上海创智学院、复旦大学和模思智能的OpenMOSS团队联合开发的开源双语对话语音合成模型。它打破了传统TTS只能生成单句语音的限制,能够直接将文本对话脚本转换为自然、富有表现力的口语对话。
无论是中文还是英文,无论是克隆名人声音还是生成虚拟角色对话,MOSS-TTSD都能轻松搞定。它具备零样本双人语音克隆和长文本语音生成能力,其出色的对话合成效果甚至可以与商业解决方案相媲美。更重要的是,它完全开源且支持商业使用,让每个人都能享受到顶尖的语音合成技术。
在线体验
想亲身体验MOSS-TTSD的神奇效果?访问官方Hugging Face Space即可在线尝试:
https://huggingface.co/spaces/fnlp/MOSS-TTSD
https://www.open-moss.com/cn/moss-ttsd/