Google が Gemini 1.5 シリーズの最新モデルを発表、API の価格を 50% 引き下げ

Google が Gemini 1.5 シリーズの最新モデルを発表、API の価格を 50% 引き下げ

本日、Google は、強化された生産対応の 2 つの Gemini 1.5 モデル、Gemini-1.5-Pro-002 と Gemini-1.5-Flash-002を発表しました。これらの最新モデルは、5 月にリリースされたオリジナルの Gemini 1.5 モデルと比較して、段階的な改善が施されています。

改訂された Gemini 1.5 シリーズ モデルでは、MMLU-Pro が約 7% 向上し、MATH および HiddenMath ベンチマークが約 20% 強化され、ビジョンおよびコーディング シナリオが 2% ~ 7% 改善されています。さらに、Google はモデル応答の全体的な有用性を改善しました。これらのモデルは、より簡潔な形式で応答を生成するようになり、デフォルトの出力長は以前のモデルよりも約 5% ~ 20% 短くなりました。

モデルの機能向上に加えて、Google は価格面でも注目すべき変更を実施し、Gemini 1.5 シリーズのモデル API のコストを削減しています。

  • 入力トークンが 64% 削減されます。
  • 出力トークンが 52% 削減されます。
  • 2024 年 10 月 1 日より、128K トークン未満のプロンプトに対して、Gemini 1.5 Pro の増分キャッシュ トークンが 64% 削減されます。
Google 1.5 Pro モデル

Google はレート制限も引き上げ、開発者が高度な AI アプリケーションを作成できるようにしています。Gemini 1.5 Flash モデルの有料層のレート制限は 2,000 RPM になり、Pro モデルではそれぞれ 1,000 と 360 から 1,000 RPM に引き上げられました。さらに、これらの新しいモデルではレイテンシが削減され、開発者は 2 倍の速度と 3 倍のレイテンシで期待される出力を得ることができます。

アップデートされた Gemini 1.5 (-002 モデル) のリリースにより、Google は安全プロトコルを維持しながらユーザーの指示に従うモデルの機能を強化しました。デフォルトでは、Google はこれらの最新モデルに AI コンテンツ セーフティ フィルターを適用しません。代わりに、開発者は特定のニーズに基づいてフィルターを適用できます。

最後に、Google は「Gemini-1.5-Flash-8B-Exp-0924」として知られる Gemini 1.5 モデルのアップグレード版を公開しました。この実験バージョンでは、テキスト アプリケーションとマルチモーダル アプリケーションの両方でパフォーマンスが大幅に向上しています。開発者は、これらの更新された Gemini 1.5 モデルすべてに、Google AI Studio と Gemini API を通じてアクセスできるようになりました。大企業や Google Cloud のお客様は、これらの新しく更新された Gemini 1.5 モデルを Vertex AI で利用できます。

ソース

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です