generated at
Florence-2
Florence-2の作成に使ったデータセット
>126百万枚の画像、500百万のテキスト注釈、1.3億の領域テキスト注釈、3.6億のテキストフレーズ領域注釈を含む大規模なデータセット

モデル
https://huggingface.co/blog/finetune-florence2Fine-tuning Florence-2 - Microsoft's Cutting-edge Vision Language Models

関連