generated at
TinyLlama-1.1B
3兆トークンから1.1BのLlamaモデルを学習する
16台のNvidia A100 40GBで90日間での学習完了を目指す
2023/9/1に開始
全体的に伸び続けている?