/work4ai/pix2pix-zero - Scrapbox Reader

generated at 2/17/2025, 7:38:42 PM

pix2pix-zero
https://pix2pixzero.github.ioProject
https://github.com/pix2pixzero/pix2pix-zeropix2pixzero/pix2pix-zero
https://arxiv.org/abs/2302.03027Zero-shot Image-to-Image Translation
https://huggingface.co/spaces/ysharma/pix2pix-zero-01Demo
元の画像の形を保持できるimage2image手法
img2imgは元の画像にノイズを追加、それから徐々にノイズ除去をしていく
かけるノイズを強くすると元画像の形を保持できなくなる
pix2pix-zeroも元の画像にノイズを追加するが、それとは別に形を維持するためにcross-attention guidanceを生成する
目標のクロスアテンションマップに近づくようにノイズ除去をしていく

比較(SDEdit + word swap, DDIM + word swap, prompt-to-prompt )
　

InstructPix2PixはGPT-3とStable Diffusionを組み合わせてデータセットを作り、それを用いて条件付き拡散モデルを作っていた
対してpix2pix-zeroは既存のモデルをそのまま利用できる
ただ、目的が違うので比較するものでもない

zero-shot image2image
画像編集