前言:Tune-A-Video提出了一个新的文本-视频任务:One-Shot视频生成,能够在视频对象编辑、背景编辑、风格转换、可控生成等领域取得了非常好的效果。这篇博客详细解读Tune-A-Video的论文和代码,希望能对做扩散模型视频生成的读者们有所帮助。
目录
改进后的Unet结构UNet3DConditionModel
贡献概述
Tune-A-Video提出了一个新的文本-视频任务:One-Shot视频生成,即只有一个单一的文本-视频样本对用于训练文本-视频生成器。
博主认为这篇论文的两个主要创新点:
- 引