Gemini 1.5
AIモデルの「コンテキスト・ウィンドウ」は、情報を処理するための構成要素であるトークンで構成されている。トークンは、単語、画像、動画、音声、コードの一部または全部を指す。モデルのコンテキスト・ウィンドウが大きければ大きいほど、与えられたプロンプトでより多くの情報を取り込み、処理することができます。
1.5 Proのコンテキスト・ウィンドウの容量は、Gemini 1.0の当初の32,000トークンをはるかに超えて増加しました。現在では、本番で最大100万トークンを実行することができます。
つまり1.5 Proは、1時間のビデオ、11時間のオーディオ、3万行以上のコードベース、70万語以上の単語など、膨大な量の情報を一度に処理できるのだ。私たちの研究では、最大1000万トークンのテストにも成功しています。
> @shanegJP: 新しいGemini 1.5 Pro (5/14) は中国語でGPT-4oを超え世界一です。他もほぼ全て僅差です。日本語は少ないのでlmsysに出てないが、かなりいいので試して下さい。 そしてこれからは性能だけでなく、プロダクト全てのUXに力を入れます。ちなみにGemini 1.5 Proの非英語事後学習は私のチーム担当です。