generated at
SparseCtrl
毎フレームではなく、1もしくは少しのフレームに対して条件を与えるのみで動画生成を制御する(temporally sparse signals)
ControlNetとの比較
>vanilla ControlNetは、ノイズの入ったサンプルと条件を加算して、UNet Encoderに入力します。
>sparse condition encoderは、ノイズの入ったサンプルを除去し、条件とマスクを結合して入力します。