大模型——告别生硬AI语音！这款开源工具让播客制作像写文案一样简单

不二人生

于 2025-08-05 20:46:45 发布

阅读量80

点赞数

CC 4.0 BY-SA版权

分类专栏：大模型文章标签：人工智能大模型播客

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/king14bhhb/article/details/149945694

大模型专栏收录该内容

328 篇文章 ¥39.90 ¥99.00

订阅专栏

超级会员免费看

告别生硬AI语音！这款开源工具让播客制作像写文案一样简单

只需两段声音样本+文字脚本，就能生成自然流畅的双人对话音频，MOSS-TTSD正在重新定义AI语音合成

什么是MOSS-TTSD？

MOSS-TTSD（Text to Spoken Dialogue）是一款由上海创智学院、复旦大学和模思智能的OpenMOSS团队联合开发的开源双语对话语音合成模型。它打破了传统TTS只能生成单句语音的限制，能够直接将文本对话脚本转换为自然、富有表现力的口语对话。

无论是中文还是英文，无论是克隆名人声音还是生成虚拟角色对话，MOSS-TTSD都能轻松搞定。它具备零样本双人语音克隆和长文本语音生成能力，其出色的对话合成效果甚至可以与商业解决方案相媲美。更重要的是，它完全开源且支持商业使用，让每个人都能享受到顶尖的语音合成技术。

在线体验

想亲身体验MOSS-TTSD的神奇效果？访问官方Hugging Face Space即可在线尝试：
https://huggingface.co/spaces/fnlp/MOSS-TTSD

https://www.open-moss.com/cn/moss-ttsd/

核心亮点

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

不二人生 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。