Google には、テキスト プロンプトを音楽に変えることができる AI があります

Google には、テキスト プロンプトを音楽に変えることができる AI があります

AI によって生成されたアートをめぐる論争が十分でない場合、Google は MusicLM を作成しました。これは、テキストの説明、画像、および単純なメロディーから音楽を生成するシステムです。話がうますぎると思われる場合は、読み続けて詳細を確認してください。

Google には MusicLM という AI があります

Google はまだMusicLMを正式にリリースしていませんが、生成 AI システムはすでに話題になっています。Google は、このテクノロジーで何ができるかをサンプリングした研究概要の中で、このテクノロジーを「テキストの説明から忠実度の高い音楽」を生成するモデルとして説明しています。

280,000 時間以上の音楽を使用してトレーニングされたこのソフトウェアは、さまざまな音楽シナリオをさまざまな形式で提供します。これには、リッチ キャプションからの音声生成ストーリー モード絵画のキャプション コンディショニング(絵とその説明を組み合わせたもの) が含まれます (Google には、AI によって生成された音声のサンプルが含まれています)。

横にテキストの説明がある 2 枚の絵と、AI から生成された音声

AI を音楽制作に利用したのは Google が初めてではありません。たとえば、LALAL.AI には人工ニューラル ネットワークを使用したカシオペア アルゴリズムがあり、エンジニアによる手動実行を必要とせずにボーカルと楽器を分離します。しかし、Google は、テキストだけから音楽を生成できるシステムの作成において、大きな飛躍を遂げました。

Google が MusicLM をリリースしない: その理由は次のとおりです

Google にとって残念なことに、MusicLM をリリースする可能性は低いです。最も明白な理由は、著作権で保護された音楽を侵害していることです。Google がテストを実行したところ、システムが吐き出したすべての曲の少なくとも 1% が、ソフトウェアのトレーニングに使用された曲と同一であることがわかりました。

その統計は低いように見えるかもしれませんが、それは災難を意味し、Google は訴訟に巻き込まれる準備ができていません。

さらに、この技術はその分野では比類のないものかもしれませんが、まだ洗練が必要な要素があります。ボーカルはバギーで歪んでいて、言語は現実世界の既存のどの言語よりも Simlish に似ています。

Google は MusicLM を再考すべき

MusicLM は、ミュージシャンにも非ミュージシャンにも同様に大きな助けとなる可能性がありますが、Google が大幅な改善を行わない限り、公開すべきではありません。システムをリリースする場合、少なくとも 2 つの大きな変更が必要です。

まず、Google は MusicLM をより倫理的にする方法を見つける必要があります。Shutterstock は、AI アート生成をより倫理的で、ユーザーにとってアクセスしやすいものにしました。おそらく、Google もそれに続くでしょう。Google が MusicLM をライセンス可能な音楽で訓練し、システムに貢献したアーティストに報酬を与えるなら、それをリリースすることは実現可能かもしれません。

第二に、Google はボーカルを改善する必要があります。Google が非現実的なボーカルや意味不明な音声を回避する方法を見つけられない場合は、それらを完全に無視する必要があります。ボーカロイドみたいなソフトがスタンダードで、それが出来ないと機能が駄目ですよね。

今日じゃないよ、Google

MusicLM には多くの複雑な問題があることは明らかであり、ソフトウェアをそのままリリースするのは間違った動きです。しかし、テクノロジーは瞬く間に進歩するため、より良いものが登場する可能性は常にありますが、今日ではそうではありません.

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です