Stable Diffusionでkawaiiを出す
Stable Diffusionがpublicになった当初、2022/8/24 ごろの試行の記録
fine tuningのツールは出揃っていなかったし、ノウハウもほぼなかった暗中模索の時代
全然出ないので試行錯誤する
Twitterでよく回ってくるのは
852話氏のツイート
300文字ぐらい入れてるらしい
便利定型句
zshconda activate ldm
python scripts/txt2img.py --prompt "a photograph of an astronaut riding a horse" --plms --n_samples 2
dir\\wsl$\Ubuntu\home\motoso
TODO
アニメのスタイルを見つける
今後進化予定のようなのでそこそこでいいかも
構図をだせるか
あおりがだせるか
ふかんがだせるか
ショットをつかいわけられるか
❌ full shot\
補足的に映像読み込ませた方が早そう
pix2pixやる
まとめ
512x512以上で出力する
基礎実験からいこう。
目標が定まらないと走りづらいので、月ノ美兎を最終目標とする
後から補足: VRAM節約のために256×256で出力していたため、最初の方は低品質な出力になっている。途中で気づいて512にした
"kawaii girl"
最弱の呪文からはじめよう。
dark haired japanese high school girl
左下の学習元がきになるが、右下は明らかに謎の物体だし右上も理解不能。左上はなんか惜しい。この中だと左上か中央上がイメージに近い
実車っぽいのは今は目指してないのでstyleをアニメやイラストに固定したい
Hokusai級に有名なイラストレーターって誰?
たぶんアニメのスクショのほうが学習してるはずなのでアニメによせてみる
dark haired japanese high school girl. japanese anime style
路線はだいぶ良くなった(左下は謎)
髪の毛短いなと思ったけど、長さを指定していなかった。腰ぐらいまである。
japanese high school girl with waist-length black hair. japanese anime style.
離れたな!
5/6がwaist-lengthじゃなくない?
この呪文はだめかも
委員長は吸い込まれそうな青い目をしている
japanese high school girl with waist-length black hair, blue eyes that seem to suck you in. japanese anime style
2枚目と同じやつが出てるね?右上は3枚目と同じだし。右下はいいかげんにしろ!!
顔のアップばっかりなので、全身描いてほしい。
full shotにしよう
japanese high school girl with waist-length black hair, blue eyes that seem to suck you in. japanese anime style. full shot.
いやミリもfull shotじゃないんですけど...
右下が変わらないのなんなの?1つ前にめっちゃ影響されてる?
制服を着てほしい
japanese high school girl in uniform with waist-length black hair, blue eyes. japanese anime style. full shot.
一つ前のものに依存しているかかくにんするために、みぎしたのがぞうを消した
関係なかった(コード上も関係なさそう)
明らかに同じようなものが出ているのはなぜ?
シードが同じ?だから
ベクトルがそんなに変わらないから
ここから512x512にした(VRAMの関係上2x2が限界)
サイズが関係あるのか気になるので japanese high school girl in uniform with waist-length black hair, blue eyes. japanese anime style. full shot.
で試す
かなり変わった!しかも明らかに良い方向に
full shotはルーンとして効果がなさそうだから削る
japanese anime styleだけでは限界がありそう。画風を2Dキャラクターよりにするにはどうすればいいか?
手っ取り早いのはあちらで有名な作品を入れてしまうことだろう
japanese high school girl in uniform with waist-length black hair, blue eyes.
RWBY style
ビンゴ
調査
アニメ風にするルーン
--beta
以前のMidjourney。うまくいってない。
> アニメっぽくするには bold outline, few gradations
などを入れると良いことが分かった
>
makoto_shinkai_artgerm_ilya_kuvshinov_beautiful_anime_women_with_black_red_and_red_lace_trim_long_black_and_red_hair_wind_powers_symme_-H_640_-C_18.0_-n_9_-i_-S_1859528417_ts-1660525367_idx-8
他の人の限界
>最近流行ってる風の雰囲気の良い環境と女の子を描いてもらおうとしたがむずかしく、結局顔のクローズアップになってしまう。
>好きそうな雰囲気が出たら50ぐらいまで増やし、ベクトルが変化しなければ150ぐらいまで上げてみる、みたいな場合と、50まで増やしてベクトルが変わったら22~30ぐらいを探る場合があった。
>上記の作品群は上手くいった作品しか載せておらず、大量の失敗作品を糧に成り立っている。
zshPLMS Sampler: [00:09<00:00, 5.50it/s]
data: [00:13<00:00, 13.24s/it]
Sampling: [00:13<00:13, 13.24s/it
Running PLMS Sampling with 50 timesteps
PLMS Sampler: [00:08<00:00, 5.72it/s]
data: [00:09<00:00, 9.24s/it]
Sampling: [00:22<00:00, 11.24s/it]