Google、Gemini ユーザー向けに高品質のテキスト画像変換モデル Imagen 3 をリリース

2024/10/12

今年初め、Google はこれまでで最も高度なテキストから画像への生成モデルである Imagen 3 を発表しました。この更新バージョンでは、画像の品質と精度が数多く向上しています。Google によると、Imagen 3 は並外れたレベルの詳細度を実現し、前身の Imagen 2 と比較して、気を散らすアーティファクトを最小限に抑えたフォトリアリスティックな画像を作成します。

最近、Google は Imagen 3 モデルを世界中のすべての Gemini ユーザーが利用できるようにしました。このリリースにより、標準の Gemini ユーザーと Gemini Advanced ユーザーの両方が、生成したいビジュアルを説明でき、Gemini は AI を介して対応する画像を生成します。ただし、人物を描いた画像を生成できるのは、Gemini Advanced にアクセスできるユーザーのみであることに注意してください。

生成された画像が期待どおりでない場合は、リクエストで詳細を追加して改良することができます。画像の仕様が正確であればあるほど、Gemini が提供する結果はより正確になります。強化された Imagen 3 モデルは、自然言語とプロンプトの背後にある意図をより深く理解し、詳細な説明から微妙な詳細まで捉えます。

Imagen 3 が優れているもう 1 つの分野は、テキストレンダリングです。これは、多くの最新の画像生成モデルにとって課題となっていた側面です。この機能により、ユーザーはカスタムの誕生日の挨拶、標識でマークされた場所、その他のさまざまなパーソナライズされたリクエストを作成できます。

ここで、 Gemini の Imagen 3 モデルの機能を調べてください。

ソース

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル