generated at
2/15/2025, 3:14:11 PM
注意の差分
アテンションの移動式投票
に関連しての議論
Differential Transformer
の話は、私に新しい視点を与えてくれたように思う。これはもちろん機械学習の分野の話だが、アナロジーとして人間に広げると、
注意
というものを考える時に個人だけを見るのではなく複数の人での違いに注目することが有益かもしれないと示唆してくれる
Differential Transformer