マイクロソフトが、ゲームや映画で AI が生成するサウンドに関する新しい特許を申請
マイクロソフトは、映画、ビデオ ゲーム、ライブ レコーディング、および関連分野を含む幅広いメディアで AI によって生成された音楽/サウンドトラック/オーディオを使用するための新しい特許を申請しました。この特許は「オーディオ素材を作成するための人工知能モデル」と題され、2022 年 11 月 17 日に公開されMICROSOFT TECHNOLOGY LICENSING , LLCが特許出願人です。
特許の説明では、ビジュアル、オーディオ、テキスト (キュー) を使用した機械学習技術を含む大規模なデータセットで構築された人工知能システムを使用して、リアルタイムのサウンドを生成する方法について説明しています。以下の特許の正確な説明を読むことができます。
ビジュアル データセットに付随するオーディオ スコアを生成するように 1 つまたは複数の AI モデルをトレーニングする方法には、複数のオーディオビジュアル データセットを含むトレーニング データを受信することと、複数のオーディオビジュアル データセットのそれぞれを解析して、複数の視覚的特徴、テキスト的特徴、およびオーディオ的特徴を抽出することが含まれます。この方法には、機械学習ネットワークを介して、複数の視覚的およびテキスト特徴を複数の音声特徴と照合することも含まれます。ビジュアル、テキスト、およびオーディオ機能間の相関関係に基づいて、1 つまたは複数の AI モデルがトレーニングされ、特定のデータセットに付随する 1 つまたは複数のオーディオ スコアが生成されます。
特許によると、この新しい技術は、システムが状況に応じてリアルタイムで音を生成するのに役立ちます。または、より簡単に言えば、動的/適応的な音を生成するのに役立ちます。興味深いことに、このテクノロジーは、このテクノロジーの実装例としてビデオゲームを考えると、ビデオゲームでの選択と状況に基づいて各人の経験を分離します。
マイクロソフトのサウンド用の新しい AI は、ゲームでのダイナミック/アダプティブ ミュージックの通常の使用をはるかに超える可能性があります。プレーヤーのアクションは、適切なオーディオ キューと音楽を使用してリアルタイムで動的に評価できます。その結果、サウンド体験は人によって異なります。
たとえば、特定のゲームや映画でユーザーが遭遇する所定の状況に従って記録された、事前に記録されたビデオ ゲームや映画のバックグラウンド スコアとサウンドを使用します。ただし、ビデオ ゲームは映画よりも多くの AI テクノロジを使用しています。ビデオ ゲームでは、 NPCとのプレイヤー インタラクションや、プレイヤーの動きに基づくダイナミック サウンドの主要なレベルなど、多くの領域で既に AI が実装されています。
一方、映画はビデオ ゲームに比べて厳格です。映画のすべての側面が事前に決定されて記録されており、視聴者にとってリアルタイムで変化するものは何もないからです。したがって、特許に記載されているように、この新しい技術はメディアの分野で革命的なものになる可能性があります。これはすべてを変え、プレーヤーや視聴者は、消費するメディアにこれまで以上に関与し、没頭するようになります.
また、現実的に考えれば、それほど大げさなことではありません。近年、AI テクノロジーは、ターゲットを絞った広告に AI を使用するだけでなく、1 行のテキストで超リアルな写真やビデオを作成できるようになったため、大幅に進化しています。テクノロジーは長い道のりを歩んできており、遅かれ早かれメディア業界のあらゆる分野に導入され、長いプロセスを自動化するでしょう。
人工知能がリアルタイムで作成するサウンドトラックのようなものを見るのは興味深いでしょう。それで、あなたはこれについてどう思いますか?このような体験を楽しみにしていますか?以下のコメントセクションでお知らせください。
コメントを残す