generated at
RLHF
> @mr_bay_area: LLMの学習にRLHFが何故必要なのかは専門家も割と疑問に思ってる印象で、それに対するYoav Goldbergによる一つの回答。短くまとめると、「LLMが何を知っているかを知らない状態で『LLMに知らないことを知らないと答えるよう学習させる』のが教師あり学習では不可能だから」。 https://gist.github.com/yoavg/6bff0fecd65950898eba1bb321cfbd81