generated at
2/23/2025, 12:28:25 PM
Date Understanding
Big-bench
のデータセットの1つ
常識推論に分類される
このタスクは、事前に学習された言語モデルが日付を理解する能力をテストするために設計されている。
文脈は、日付情報を含む1つまたは2つの文であり、明示的(例えば、今日は...)または暗黙的(例えば、昨日は...)である。
コンテキストが与えられたら、モデルはMM/DD/YYYYの日は何ですかという質問に答えなければならない。
このタスクは人間にとっては単ですが、多くの言語モデルにとっては困難
具体例
https://github.com/google/BIG-bench/tree/main/bigbench/benchmark_tasks/date_understanding