generated at
OpenLLaMA
LLaMAをオープンライセンスで再現する
EasyLMを使い学習
RedPajamaのデータセットを使用
今回は200億トークンだが、今後1.2兆トークンでも学習予定

ライセンス