Google、ユーザーがテキストベースのプロンプトを使用してリアルな画像やビデオを作成できるようにする Lumiere Generative AI を発表

2024/01/31

生成 AI は急速に大きな発展を遂げてきました。ここ数日間、私は親戚やタトゥーアーティストと何度か会話を交わし、AIがどのように徐々にあらゆる業界に浸透しつつあるのか、前進する唯一の方法はAIの仕組みを正しく理解することであることについて話し合いました。 Google は、テキストベースのコマンドでよりリアルな画像やビデオを作成できる新しい生成 AI ツールである Lumiere を発表しました。

Google の Lumiere は、AI が未来であり、それを変えるために私たちにできることは何もないことを証明するもう 1 つの証拠です

Lumiere のハイライトの 1 つは、途切れのないリアルな動きを作成できるという事実です。これは印象的ではないように聞こえるかもしれませんが、最新の生成 AI ツールの助けを借りて、私たちは非常に遠くまで進んで、素晴らしいものを作成することができます。

Lumiere は、画像の生成に役立つ拡散確率モデルも使用しています。これは時空 U-Net と連携しています。知らない人のために説明すると、U-Net は、時間的なアップスケーリングとダウンスケーリング、および画像に追加されるアテンションブロックを実現するアーキテクチャとして機能します。最も優れている点は、この新しい生成 AI ツールが他の多くのモデルで使用できることです。これにより、これまでに見たものよりもはるかにリアルに見える画像やビデオを作成できるようになります。

Lumiere は以下の作成に使用できます。

シネマグラフ: 画像の単一セクションがアニメーション化される場所
修復: ビデオ内のオブジェクトが別のオブジェクトに置き換えられます。
様式化された世代: あらゆる作品のアートスタイルを別のものに変えることができます
画像からビデオへ: 任意の画像をアニメーション化するのに役立ちます。
ビデオからビデオ: ユーザーが異なるアートスタイルでビデオを作成できるようにします。

この記事の執筆時点では、ビデオの長さはわずか 5 秒ですが、ビデオトランジションや複数のカメラアングルを作成する機能はありません。 Lumiere を試してみたい場合は、標準の GPU だけでは実行できないことにも注意してください。 PC 上のグラフィック機能を駆動する強力な何かが必要です。そうでない場合、ツールは単に機能しません。これは当然のことです。

Lumiere の導入はさまざまな観点から興味深いように思えます。つい昨日、私はタトゥーアーティストと、クライアントがこれまでに作成したことのないものを探していたため、AIを使用してクライアントのためにどのようにして多数のタトゥーを作成できたのかについて話していました。これらのツールが近い将来どれほど強力になるかは想像することしかできませんが、混乱だけを引き起こそうとする悪者にこれらのツールが使用されないことを願っています。

ニュースソース:ルミエール

Google の Lumiere は、AI が未来であり、それを変えるために私たちにできることは何もないことを証明するもう 1 つの証拠です

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル