P+
通常、テキスト埋め込みは
U-netのすべてのレイヤーに同じものが注入される(P)
しかし、U-netのレイヤーごとに、影響を与えるトークンの種類が違うということが分かってきた
画像から分かるように、色は外側のレイヤーに影響され、形は内側のレイヤーの影響を受けている
これをP+として、さらなる応用を研究する
P+解析
レイヤー別にTextual Inversionをする
形やスタイルなど、特定の要素のみに適用できるので、最後の猫がわかりやすいけれど、
編集自由度が上がっている
スタイルミキシング
スタイルの影響受けるレイヤーと形の影響を受けるレイヤーに別のTexual Inversionを埋め込むだけで
T2I-Adapterのスタイルのようなことができてしまう