generated at
2/17/2025, 7:38:42 PM
pix2pix-zero
https://pix2pixzero.github.io
Project
https://github.com/pix2pixzero/pix2pix-zero
pix2pixzero/pix2pix-zero
https://arxiv.org/abs/2302.03027
Zero-shot Image-to-Image Translation
https://huggingface.co/spaces/ysharma/pix2pix-zero-01
Demo
元の画像の形を保持できる
image2image
手法
img2imgは元の画像にノイズを追加、それから徐々にノイズ除去をしていく
かけるノイズを強くすると元画像の形を保持できなくなる
pix2pix-zeroも元の画像にノイズを追加するが、それとは別に形を維持するために
cross-attention guidance
を生成する
目標のクロスアテンションマップに近づくようにノイズ除去をしていく
比較(
SDEdit
+ word swap, DDIM + word swap,
prompt-to-prompt
)
InstructPix2Pix
は
GPT-3
と
Stable Diffusion
を組み合わせてデータセットを作り、それを用いて条件付き拡散モデルを作っていた
対してpix2pix-zeroは既存のモデルをそのまま利用できる
ただ、目的が違うので比較するものでもない
zero-shot
image2image
画像編集