25-09-26 16:33 发布于 浙江 来自 微博视频号
“别让声音困住你的效率”

通义百聆,企业级语音基座大模型来啦!
云栖大会上,我们正式发布全新品牌——通义百聆。现阶段,通义百聆包含了领先的Fun-ASR语音识别大模型与CosyVoice语音合成大模型,致力于攻克复杂环境下的语音落地应用难题,推动语音智能从“能听会说”向“听懂、听准、悦耳表达”的更高阶能力演进。

核心关注:
👂️听得懂:基于数千万小时真实场景音频训练,模型不仅具备高精度离线识别能力,更深度融合金融、互联网、制造等十余个行业的语境与“黑话”,精准捕捉如“SOP”“私域拉新”等专业术语,确保语义理解无偏差。
👂️听得准:依托首创的Context增强架构,通过引入RAG机制强化领域术语识别,结合上下文理解有效“降幻觉”,并从根本上缓解“串语种”问题,为企业级应用树立可信赖的语音交互新标杆。
👂️悦耳表达:借助语音解耦训练等创新方法,通义百聆在语音合成方面实现高表现力与高稳定性的统一,支持多语种合成与跨语种声音复刻,为企业提供真实、自然、富有感染力的语音输出能力。

快来阿里云百炼、魔搭社区上手体验吧!
#通义百聆# L通义大模型的微博视频
欢迎新用户
o p

正在加载,请稍候...

通义云启(杭州)信息技术有限公司

  • ü 审核时间 2025-02-08
  • Ü 简介: 让代码流动,以开放之火燎技术之原。
更多 a
101关注 153508粉丝 502微博