generated at
CatVTON
cross attentionを削除したのでテキスト入力なし、ControlNet等のポーズ指定もなし
衣服(もしくは参照人物)と指定の人物画像を空間次元(spatial dimension)で結合する

ComfyUI実装
公式による実装なのだけどComfyUI壊されるので非推奨