generated at
PolyLM
640Bトークンで訓練された多言語LLM
>バイリンガルデータをトレーニングデータに統合
>プレトレーニング中に非英語データの割合を最初の段階で30%から最終段階で60%まで増加させるカリキュラム学習戦略を採用

ライセンス