generated at
P+
通常、テキスト埋め込みはU-netのすべてのレイヤーに同じものが注入される(P)
しかし、U-netのレイヤーごとに、影響を与えるトークンの種類が違うということが分かってきた
画像から分かるように、色は外側のレイヤーに影響され、形は内側のレイヤーの影響を受けている
同じような挙動を利用して、手足にだけLoRAを適用させるハイポリLoRAを層別適用してみたみたいなものがある
これをP+として、さらなる応用を研究する

P+解析

合わせてExtended Textual Inversion(XTI)を提案
レイヤー別にTextual Inversionをする
形やスタイルなど、特定の要素のみに適用できるので、最後の猫がわかりやすいけれど、編集自由度が上がっている

スタイルミキシング
スタイルの影響受けるレイヤーと形の影響を受けるレイヤーに別のTexual Inversionを埋め込むだけでT2I-Adapterのスタイルのようなことができてしまう