generated at
lm-evaluation-harness
>自己回帰言語モデルの少数ショット評価のためのフレームワーク
> このプロジェクトは、生成言語モデルを多数の異なる評価タスクでテストするための統一されたフレームワークを提供します。