阿里云视频生成大模型万相2.1(Wan)重磅开源,此次开源采用Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务。
万相2.1开源链接:
Huggingface的:https://huggingface.co/Wan-AI
魔搭社区:https://modelscope.cn/organization/Wan-AI
GitHub的:https://github.com/Wan-Video/Wan2.1
在线体验:https://tongyi.aliyun.com/wanxiang
此次开源的两个参数版本模型:
14B版本万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出,在权威评测集Vbench中,万相2.1以总分86.22%大幅超越Sora、Luma、Pika等国内外模型,稳居榜首位置。
1.3B版本万相模型不仅超过了更大尺寸的开源模型,甚至还和一些闭源的模型结果接近,同时能在消费级显卡运行,仅需8.2GB显存就可以生成480P视频,适用于二次模型开发和学术研究。
首个具备支持中文文字生成能力,且同时支持中英文文字特效生成的视频生成模型:
更稳定的复杂运动生成能力:
如果你对这篇文章感兴趣,不妨点赞、分享或留言交流你的看法。让我们一起见证AI的无限可能!
文末活动
【深度问答】在评论区留下您的评论。
【彩蛋】关注公众号,持续获取AI最新信息与技术解析
【进群】添加小编微信,备注:“进群”,免费拉您进入AI大佬讨论群,共话AI