generated at
RNN
ニューラルネットワークが二つの目的を持って最適化される感じかな
出力層は、普通に結果の損失関数を小さくするように訓練されていく
中間層は、上手く次の時刻に渡せるデータを生み出せる様に訓練されていく感じ?