安定した拡散でより良い顔を作成する方法

2023/01/26

Stable Diffusion を使用すると、テキストに基づいてほぼすべての画像を作成できます。たとえば、プロジェクトで AI の顔を改善する必要があるかもしれませんが、元の顔を改善するのに問題があります。もしそうなら、Stable Diffusion の顔作成プロセスを改善するためのヒントを参考にしてください。詳細については、読み進めてください。

安定した拡散でより良い顔を作成するにはどうすればよいですか?

Stable Diffusion でより良い顔を作成するには、Deforum Stable Diffusion v0.5 という Google Colab をセットアップする必要があります。これを行う方法は次のとおりです。

ブラウザを開き、この Web サイトにアクセスします。
「接続」ボタンを押して、「NVIDIA GPU」をクリックします。これは Google サーバーの GPU であるため、心配する必要はありません。NVIDIA グラフィックスカードは必要ありません。
Web サイトがコンピューターを使用するためのシステム権限を付与します。
GPU カードの下のセクション (「モデルと出力パス」) を押します。
Google Colab を Google ドライブに接続し、[モデルと出力パス] の横にチェックマークが表示されるまで待ちます。
「セットアップ環境」を選択し、システムにアカウントを接続させます。「Python 定義」についても同じことを行います。
「モデルの選択とロード」に進みます。このセクションでは、Google ドライブにアップロードするモデルが必要です。これを行うには、をダウンロードします。「重みのダウンロード」セクションで「sd-v1.4.ckpt」を押して、この Web サイトから ckpt ファイルをダウンロードします。このファイルを、改善したいモデルを含む Google Drive AI フォルダーにアップロードします。
「モデルの選択と読み込み」セクションの横にある「再生」ボタンを押します。緑色のチェックマークが表示されるまで待つと、Google Colab が起動して実行されます。

Google Colab がセットアップされたので、Stable Diffusion で AI の顔を改善できます。このプロセスは、古いレンダリングの改善とも呼ばれ、画像の解像度を変更することになります。

改善したい顔を切り取り、別の画像として保存します。
顔を Google Colab 一時ドライブ (左側のパネル) にドラッグしてアップロードします。
画像を右クリックし、「パスのコピー」ボタンをクリックします。
右側のメニューの「init_image」フィールドに画像を貼り付けます。
「プロンプト」ウィンドウに移動し、顔に必要なプロンプトを入力します。
最良の結果を得るには、引用符内にプロンプトを入力してください。
「実行」セクションに進み、「画像設定」メニューを見つけます。
ピクセル解像度を変更して、顔の明瞭度を高めます。たとえば、ほとんどの場合、800×800 で十分です。
「実行」ウィンドウの下にある赤い「再生」ボタンを押して、画像をレンダリングします。
画像は異なる解像度でレンダリングされます。目的の効果が得られるまで、この手順を試してみてください。
ドライブから画像をダウンロードし、オリジナルの上に重ねます。

より良い顔を作成するために、安定した拡散を伴うバリエーションをどのように使用しますか?

解像度を変更して顔を直接改善するだけでなく、バリエーションを導入してよりシャープな画像を生成することもできます。最初のステップは、「アニメーション」設定を「なし」に設定することです。必要な作業は次のとおりです。

上記の手順に従って、Google ドライブを Google Deforum Stable Diffusion 0.5 Colab に接続します。
Colab の左側のパネルに顔の画像をアップロードします。
「アニメーション」メニューに移動し、「animation_mode」設定を「なし」に変更します。
「アニメーション」セクションの横にある「再生」ボタンをクリックして、変更を保存します。

「アニメーション」設定を変更したら、アニメーションを作成したくないので、他のほとんどの設定を無視できます。ただし、「プロンプト」セクションを微調整する必要があります。次の手順を実行します：

元のプロンプトを出発点として使用します。
AI 顔に特徴を追加するか削除するかに応じて、線を変更して必要なバリエーションを作成します。「アニメーションプロンプト」ウィンドウではなく、「プロンプト」セクションで作業します。
プロンプトの最初と最後に引用符を配置します。
プロンプトの末尾 (引用符の後) にカンマを入力します。
「プロンプト」ウィンドウの左上隅にある「再生」ボタンをクリックして、画像をレンダリングし、進行状況を保存します。

次に微調整したいメニューは「実行」メニューです。より具体的には、「画像設定」ウィンドウに移動して、次の変更を行う必要があります。

「サンプリング設定」に移動し、「シード」設定を「-1」に設定します。
希望の効果が得られるまで、「Sampler」設定をいじってみてください。
必要な数の「ステップ」を設定します。「スケール」の値もあなた次第です。
「Sampler」ウィンドウで「ddim」レンダリングを使用した場合は、「ddim_eta」を「1」に設定します。
「バッチ設定」が見つかるまで下にスクロールし、「n_batch」行に向かいます。必要なバリエーションの数をテキストボックスに入力します。
「初期設定」に移動し、「use_init」オプションの横にあるボックスを押します。設定の横にチェックマークが表示されます。
元の画像の 50% を再利用する場合は、「強度」フィールドに「0.5」と入力します。ソースマテリアルをどの程度再利用するかに応じて、高い値または低い値を入力できます。
左パネルの「ファイル」アイコンをクリックします。最適化する顔の画像が含まれているフォルダーに移動し、左側のセクションにドラッグします。システムが写真をロードするのを待ち、右クリックして「パスのコピーボタン」を押します。
パスを「init_image」フィールドに貼り付け、「Image Settings」メニューの左上隅にある赤い「Play」ボタンをクリックします。
プログラムに画像をレンダリングさせ、バリエーションを追加させます。画面の下部に新しい顔とバリエーションが表示されます。

安定した拡散で画像生成を改善する方法

Stable Diffusion で面を改善する場合、作業の大部分は適切なプロンプトを作成することになります。システムは、この機能に依存して、「txt2img」テクノロジーを使用して画像を生成します。テキストプロンプトやその他のパラメーターを使用して、入力に基づいて画像を生成します。

前述のように、目的の結果を作成するには、ある時点で「シード」値を入力する必要があります。バリエーションを組み込む際の「ステップ」の数を変更することもできます。

ただし、これらの機能は、結果の顔を改善するという点ではあまり役に立たない場合があります。代わりに、「プロンプト」ゲームを強化して、高品質の画像生成を確保する必要があります。そのために役立つヒントをいくつか紹介します。

具体的である – フレーズの始まりは終わりよりも重要であるため、テキストプロンプトは非常に詳細にする必要があります。特に最初の部分は重要です。重要な情報を省略すると、目的の外観が得られない場合があります。
英語にこだわる – Stable Diffusion の開発者は、20 億を超える英語のテキストと画像のペアを使用しました。他の 100 以上の言語はペア数が少なく、個々の言語の割合が英語の割合よりもはるかに小さいことを意味します。その結果、英語以外でプロンプトを作成しても、正しい結果が得られない場合があります。
アートのジャンルとタイプを含める – Stable Diffusion は、アクリル画や油絵、ファッション写真、漫画、版画など、あらゆる種類の画像を生成できます。したがって、必要な画像の形式を指定すると、アルゴリズムがより正確になります。
トレンディに – 芸術的な画像を探している場合は、「ArtStation のトレンド」などの名前を追加して、Stable Diffusion を目的の画像にできるだけ近づけることができます。
さまざまな言葉で遊ぶ – プロンプトを書くときは、説明をやり過ぎてはいけません。したがって、「シャープフォーカス」や「劇的な照明」などのさまざまな技術的特性や、「素晴らしい」、「ゴージャス」、「素晴らしい」などの形容詞を試してみてください。
アーティストの名前を追加 – Stable Diffusion を使用すると、有名なアーティストのスタイルで画像を作成できます。この効果を得るには、Andry Warhol、Caspar David Friedrich、Auguste Renoir などのアーティストの名前をプロンプトに追加します。
否定を使用する – インターフェイスの一部のバージョンは、否定的なプロンプトに反応します。これらにより、イメージを生成するときにシステムが避けるべきことを示すことができます。

想像力とクリエイティビティを安定拡散で発揮させましょう

特に AI の顔やその他の画像を強化したい場合は、Stable Diffusion の習得に時間がかかる場合があります。1 つか 2 つの行を間違えると、プロジェクトが簡単に劣化する可能性があるため、プロンプトを作成して生成パラメーターを入力するときは、細心の注意を払う必要があります。少し調整するだけで、写真の顔やその他の部分を簡単に美化できるはずです。

どのくらいの頻度で安定拡散を使用しますか? 画像にバリエーションを追加したことがありますか? もしそうなら、それらはどのような効果を生み出しましたか? 以下のコメントセクションであなたの経験を共有してください。

安定した拡散でより良い顔を作成するにはどうすればよいですか?

より良い顔を作成するために、安定した拡散を伴うバリエーションをどのように使用しますか?

安定した拡散で画像生成を改善する方法

想像力とクリエイティビティを安定拡散で発揮させましょう

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル