/work4ai/Deep Shrink Hires.fix

generated at 2/12/2025, 10:11:41 PM
Deep Shrink Hires.fix
https://gist.github.com/kohya-ss/3f774da220df102548093a7abc8538edkohya-sskohya-ss/forward_of_sdxl_original_unet.py
Kohyaさん考案の高解像度画像を破綻なく生成する手法
>https://twitter.com/kohya_tech/status/1724273551937786164Kohya Tech
>
>アイデアは極めて単純で、「構図を決めるのはノイズに近いtimesteps」「構図を決めるのはU-Netの深い部分」らしいことが分かっていますので、その部分のlatentsを縮小してあげるだけです。
>"Deep in U-Net, shrinking noisy latents for  Hires.fix"の略ということで。

>https://twitter.com/kohya_tech/status/1724411566920278204Kohya Tech
>謎highresfixですが、depthを大きくするとU-Netの深い層で、浅くすると浅い層でlatentを縮小します。timestepsは適用範囲です。この例では1000~900で3層目で縮小、900~700で4層目で縮小します。
>
>適用層を深くすると全体の構図は安定しますが、個別の物体がゆがむようです。浅くすると細部が破綻します。depth_1<=depth_2がよさそうです。
>timestepsは大きくすると適用範囲が狭まるので構図が乱れて、小さくすると適用範囲が広がりディテールに影響します。

実装
https://gist.github.com/laksjdjf/487a28ceda7f0853094933d2e138e3c6laksjdjf/kohya_hiresfix.py
Deep Shrink Hires.fix.json
https://github.com/comfyanonymous/ComfyUI/blob/bd07ad1861949007139de7dd5c6bcdb77426919c/comfy_extras/nodes_model_downscale.pyComfyUI公式
PatchModelAddDownscaleノード
https://github.com/wcde/sd-webui-kohya-hiresfixwcde/sd-webui-kohya-hiresfix

関連？
Hires.fix
ScaleCrafter