アリババのAIモデルの発表攻勢が続いています。動画生成AI分野では、7月末に発表した「Wan2.2」に続き、8月中旬に画像や動画を参考にしながら制御を可能にする派生モデルの「Wan 2.2 Fun Control」、さらに、8月27日には音声と画像から動画を生成する「Wan2.2 S2V」をリリース。いずれも性能の高さを保ちながら、オープンモデルとして公開されており、量子化(圧縮)モデルであれば、ローカルPC上でも動かすことができるのが魅力的です。それぞれのツールの持つ実力を試しました。 FunControl:参照動画で“動き”を精密制御 Wan 2.2 Fun Controlは、人物やキャラクターの画像と動画情報をリファレンス情報として入力すると、ControlNetの輪郭線(Canny)、深度(Depth)、ポージング(OpenPose)、さらに軌道制御(Trajectory Cont

