generated at
NLPタスクを評価する方法まとめ
NLPタスクを、LLMのタスクとデータセットを元に分類し、評価方法をまとめる


自然言語生成(NLG)タスク
要約タスク:
翻訳タスク:
記事作成


推論(Reasoning)タスク
数学推論
常識推論
記号推論


知識集約タスク
一般タスク
専門タスク


自然言語理解(NLU)タスク
感情分析、レビュー分類、自然言語推論(NLI)、質問応答


関連論文