“MAGREF通过掩码引导机制与多模态输入融合,实现了复杂场景下多主体的连贯生成与精确控制,推动视频生成技术进入新阶段。”
一、产品概述
MAGREF 是字节跳动推出的一款多主体视频生成工具,专为复杂场景下的高质量视频合成设计。其核心能力在于:
- 多主体连贯性:在包含人物、物体、背景的复杂场景中保持动态一致性。
- 精确控制:通过掩码引导、文本提示及参考图像,实现对主体动作、布局和风格的精准控制。
- 高视觉质量:生成视频在面部相似度、细节真实度和自然性方面达到行业领先水平。
MAGREF支持多种生成模式:
- 单人视频:生成特定人物的动态视频(如舞蹈、演讲)。
- 多人互动视频:模拟多个角色之间的自然互动(如对话、协作)。
- 组合视频:结合人物、物体与环境生成完整场景(如室内布置、户外活动)。