Google は Gemini 1.5 で長い文脈の理解において画期的な進歩をもたらします

2024/02/16

Googleは、AI Studio経由の初期テスト用にGemini 1.5 Proをリリースすると発表した。この新しいモデルのアップデートでの重要な焦点の 1 つは、最初は 128,000 トークンのコンテキストウィンドウをサポートする長いコンテキストのコンテンツを理解する能力ですが、これを 100 万トークンまでスケールアップするという目標があります。

Google が発行した技術論文によると、Gemini 1.5 Pro は 1.0 Pro および 1.0 Ultra の両方よりも優れたパフォーマンスを発揮します。 Ultra と比較すると、1.5 Pro のコア機能の勝率は 54.8%、テキストの勝率は 77%、ビジョンの勝率は 46%、オーディオの勝率は 20% です。 1.0 Pro よりもはるかに優れたパフォーマンスを示し、それぞれ 87.1%、100%、77%、60% のスコアを記録しました。

このモデルのハイライトには次のようなものがあります。

膨大な情報についての推論

Gemini 1.5 Pro は、アポロ 11 号の月へのミッションに関する 402 ページの記録を分析して要約することができます。

モダリティ全体の理解を深める

Gemini 1.5 Pro は、サイレントのバスターキートン映画など、さまざまなモダリティに対して高度に洗練された推論タスクを実行できます。

より長いコードブロックによる問題解決

Gemini 1.5 Pro は、100,000 行のコードを推論して、役立つ解決策、変更、説明を提供します。

Google CEO の Sundar Pichai 氏は、Gemini の新バージョンについて次のように述べています。

「私たちのチームは、安全性を中核として最新モデルの最前線を押し広げ続けています。彼らは急速な進歩を遂げています。実際、私たちは次世代の Gemini 1.5 を導入する準備ができています。さまざまな面で劇的な改善が見られ、1.5 Pro はより少ないコンピューティングを使用しながら 1.0 Ultra と同等の品質を達成します。

この新世代は、長い文脈の理解においても画期的な進歩をもたらします。私たちはモデルが処理できる情報量を大幅に増やすことができ、最大 100 万のトークンを継続的に実行し、これまでの大規模な基盤モデルの中で最長のコンテキストウィンドウを達成しました。」

Gemini Pro 1.5 への早期アクセスをご希望の場合は、このGoogle AI Studio フォームにご記入ください。 Googleはこのアップデートを全ユーザーにいつリリースするかについては明らかにしていないが、テストが完了したらいつでもリリースする予定だ。

出典: Google

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル