generated at
2/12/2025, 9:02:02 PM
JoyTag
https://github.com/fpgaminer/joytag
fpgaminer
/joytag
https://www.reddit.com/r/MachineLearning/comments/18nb15l/p_i_built_an_open_sota_image_tagging_model_to_do/
[P]
CLIPではできないことをするために、オープンなSotA画像タグ付けモデルを構築した
タグ付け
のための
視覚モデル
CLIP
等主要な視覚モデルは健全とみなされた画像のみで学習されているため表現の幅が狭まってしまっている
より包括的でNSFWなものにも対応できるものを目指し作成された
少なくともStable Diffusion界隈では
WD14-tagger
はこれに置き換えられていきそう
ComfyUI VLM nodes
で使う
リアル系の強さは言わずもがな、この画像からスバルさん読み取れるのか
とても強い
関連
WD14-tagger