generated at
2/16/2025, 6:56:50 AM
トランスフォーマー
Attention is All You Needed
論文
ニューラルネットワークのどこにアテンションを当てるか
マルチヘッドのセルフアテンションを多層に重ねた