generated at
IP-Adapterモデル
for SD v1.5
https://github.com/tencent-ailab/IP-Adapterplusはよりきめ細かい調整をした

for SDXL
ViT-H/14のほうが遥かに軽量だが性能に大きな差はない
最初から1024✕1024で訓練せず、512✕512の後ファインチューニングの際アップスケールすることで計算コストを下げた

for Flux

for Stable Diffusion 3.5


(IP-Adapterモデルではないけれど併用するので掲載)
Clip visionモデル
ip-adapter_sdxlを使う場合のみこっち