/work4ai/CC12M - Scrapbox Reader

generated at 2/17/2025, 5:40:47 PM
CC12M
https://github.com/google-research-datasets/conceptual-12mgoogle-research-datasets/conceptual-12m
https://arxiv.org/abs/2102.08981Conceptual 12M: Pushing Web-Scale Image-Text Pre-Training To Recognize Long-Tail Visual Concepts
Conceptual 12M
>Conceptual 12M (CC12M) は、視覚と言語の事前学習に使用することを目的とした、~1,200 万の画像とテキストのペアを含むデータセットです。 
>これは、画像キャプションモデルの事前トレーニングとエンドツーエンドのトレーニングに広く使用されているデータセットである Conceptual Captions (CC3M) よりも大きく、はるかに多様な視覚概念のセットをカバーしています。