2023 年に AI 音楽を生成する方法 (チュートリアル)

公開: 2023-09-02

プロのミュージシャンになるという夢を抱いたことはありますが、音楽の才能はありませんか? 人工知能 (AI) のおかげで、テキスト プロンプトのみを使用して素晴らしいトラックを作成できるようになりました。 AI 音楽ジェネレーターは現在 AI の最もホットなトレンドですが、それには十分な理由があります。 音楽の能力がほとんどまたはまったくない人でも、ソーシャル メディアの投稿や YouTube ビデオなどで使用する素晴らしいサウンドトラックを作成できます。 この投稿では、生成 AI の仕組みと、いくつかのステップで AI 音楽を生成する方法について説明します。

飛び込んでみましょう。

目次
  • 1 AIミュージックとは?
  • 2 AI音楽はどのように機能するのか?
    • 2.1リカレント ニューラル ネットワーク
    • 2.2敵対的生成ネットワーク
    • 2.3生成用の事前トレーニング済みトランスフォーマー
    • 2.4音楽情報検索 (MIR)
  • AI を使用して音楽を生成する3 つのメリット
  • 4 AI音楽の生成方法
    • 4.1 1. 無料アカウントにサインアップする
    • 4.2 2. Mubert インターフェイスを探索する
    • 4.3 3. 最初の AI 音楽トラックを生成する
    • 4.4 4. トラックをダウンロードする
    • 4.5 5. Mubert Studio でトラックをリストする
  • 5 つの音声付き AI 音楽ジェネレーター
    • 5.1ランドル
    • 5.2シンセサイザー V
    • 5.3無効化
  • 6 AI音楽の未来
  • AI 音楽生成に関する7 つの最終的な考え

AIミュージックとは何ですか?

2015 年に生成 AI が導入されて以来、テキスト読み上げ、自然言語処理、AI アート ジェネレーターなど、さまざまな形式の人工知能が登場しました。 これらの他の形式と同様に、AI 音楽はテキスト プロンプトを使用して、さまざまな楽器、スタイル、ジャンルの音楽トラックを生成します。 また、作曲を作成したり、既存の音楽を変更したり、ボーカルを生成したりすることもできます。

以下は、Mubert を使用して短いテキスト プロンプトを使用して生成した短いクリップです。

AI音楽はどのように機能するのでしょうか?

他の形式の生成 AI と同様、音楽の作成に使用されるソフトウェアは、曲、アーティスト、ジャンルなどの大量の音楽データに基づいてトレーニングされたディープラーニング コンピューター システムに基づいています。 これらのモデルは、リカレント ニューラル ネットワーク (RNN)、敵対的生成ネットワーク (GAN)、事前学習済み生成トランスフォーマー (GPT)、または音楽情報検索 (MIR) に基づくことができます。 これらの用語の意味を理解するために、それぞれが何であるかを詳しく見てみましょう。

リカレント ニューラル ネットワーク

リカレント ニューラル ネットワーク (RNN) は、文や時系列などのシーケンスで送られるデータの理解と処理に優れた特殊なニューラル ネットワークです。 これらは、私たちの脳が情報を処理する方法と似た方法で機能します。 簡単に言えば、RNN は他の AI アルゴリズムでは困難な連続データの結果を予測できます。 RNN は、音楽など、特定の順序やパターンに従うデータを処理する場合に特に役立ちます。

敵対的生成ネットワーク

主に画像、アバター、その他の形式の AI を生成するために使用されますが、AI 音楽の作成にも使用されます。 GANS はジェネレーターとディスクリミネーターの 2 つの部分で構成され、これら 2 つのニューラル ネットワークを使用してシステムをトレーニングし、音楽を生成します。 識別子は、指定された入力が本物か偽物かを判断するために使用されます。 ジェネレーターの仕事は、ディスクリミネーターを騙そうとすることです。 数千回のトレーニング セッションを通じて、ジェネレーターはディスクリミネーターが違いを見分けられないレベルまで結果を改善します。 画像生成では、これは比較的単純なタスクです。 ただし、音楽の場合、楽器、ジャンル、スタイル、タイミングなど、ほぼ無制限の変数が存在します。

事前にトレーニングされた生成トランスフォーマー

ChatGPT の背後にいる人々によって作成された生成事前トレーニング トランスフォーマーは、トランスフォーマーと事前トレーニングの力を組み合わせた高度な言語モデルです。 彼らは大量のデータから学習し、人間のようなテキスト、画像、音楽を生成できます。 音楽に基づく GPT モデルは、モデルが曲内の次の音符またはコードを予測できるようにするシード シーケンスを入力することによって機能します。

音楽情報検索 (MIR)

MIR は、コンピュータが音楽データから情報を分析、理解、抽出できるようにする技術の研究および開発分野です。 AI アルゴリズムを使用して音楽コンテンツを処理および解釈することで、音楽とマシンの間の橋渡しとして機能します。 たとえば、MIR を使用すると、機械はオーディオの特徴とメタデータに基づいて音楽をジャンル、ムード、またはその他のクラスに分類することを学習できます。 次に、マシンはこの情報を使用して、テンポ、リズミカル パターン、倍音構造、コードなどに基づいてオリジナルの音楽を生成します。

AI を使用して音楽を生成する利点

AI音楽ジェネレーターの最大の利点の1つは、その使いやすさです。 Mubert を例に考えてみましょう (この記事の後半でさらに詳しく説明します)。 作成したい音楽の簡単な説明を書くと、数分以内に、クリエイティブなプロジェクトで使用できるバックグラウンド トラックが完成します。 これらのプログラムには、ライセンスフリーの音楽制作という追加の利点もあり、契約や法的合意に煩わされることなく、生成された音楽をどこでも使用できます。

AI 音楽ジェネレーターを非常に魅力的なものにするもう 1 つの重要な要素は、価格です。 ほとんどのプラットフォームは無料で使用できるか、月額 20 ~ 30 ドル以下の料金で利用できるため、最も倹約的な顧客でも利用しやすくなっています。 最後に、これらのツールは高度なカスタマイズも提供します。 Landr などの多くの AI プログラムでは、ミュージック クリップの編集、ボーカルの追加、さらには他のトラックとのブレンドを可能にするダウンロード可能なアプリが提供されています。 以前は、これらの作業には音楽編集プログラムに関する広範な専門知識が必要でしたが、AI の力のおかげで、誰でも優れた音楽アーティストになれるようになりました。

AI音楽を生成する方法

AI 音楽を生成するにはいくつかのプログラムを使用できますが、このチュートリアルでは、Mubert を使用してそれを行う方法を説明します。

ムバート音楽AI

Mubert は、バックグラウンド トラック用にパーソナライズされた音楽を作成できる優れた音楽ジェネレーターです。 音楽はWebアプリまたはAPIを通じて作成できます。 Mubert の主な利点はその使いやすさです。 単純なテキスト プロンプトを使用して、ゲーム、マーケティング ビデオ、アプリなどのサウンドトラックを生成できます。 無料プランと有料プランがあり、無料版では最大 25 個の無料トラックを作成できます。 ただし、無料版を使用する場合は、Web サイトにリンクして使用を帰属させる必要があります。

最初の傑作を作成する手順を見てみましょう。

1. 無料アカウントにサインアップする

最初のステップは、無料アカウントにサインアップすることです。 まず、Mubert Web サイトに移動し、サインアップボタンをクリックします。

ムバートの登録

Google または Facebook でログインするか、メール アドレスとパスワードを使用して新しいアカウントを作成できます。 完了したら、 「アカウントの作成」ボタンをクリックします。

Mubertアカウントを作成する

Mubert から、サインアップ プロセスを完了するために入力する必要がある確認コードが電子メールで送信されます。

メール認証

コードを取得したら、指定されたテキスト ボックスに貼り付けて、 [アカウントの作成]をクリックします。

AI音楽を生成する方法

2. Mubert インターフェイスを探索する

アカウントが作成されると、Mubert の直感的なインターフェイスが初めて表示されます。 新しいトラックを簡単に生成したり (1)、参照 URL で検索したり (2) することができます。これについては、この投稿の後半で詳しく説明します。 一方、トラックの生成機能を使用する場合は、テキスト プロンプトを入力したり (3)、トラックの長さを設定したり (4)、ジャンル、ムード、またはアクティビティから音楽を生成するものを選択したり (5) することができます。 すべてのフィールドに入力したら、[トラックの生成] ボタン (6) をクリックして、Mubert のパワーを体験してください。

ムバートインターフェイス

AI 音楽の生成方法: ジャンル

ムバートのジャンル

テキスト プロンプトから最初の AI 音楽を作成する前に、Mubert のジャンルを詳しく見てみましょう。 これらは、アンビエント、クラシック、ロックなど、特定のスタイルの音楽を作成するのに最適です。 プロンプトに何を書くべきかについてサポートが必要な場合は、ジャンルなどの事前定義されたスタイルを使用して音楽を作成できます。 たとえば、 EDMジャンルを選択すると、強力なベースラインを持つクリップを生成できます。

AI 音楽を生成する方法: ムード

ムバートの気分

同様に、美しい、穏やか、元気を与えるなどのムードを選択して、クリップのトーンを設定することができます。 たとえば、この 15 秒のトラックは、美しく穏やかなムードを選択して作成しました。

AI 音楽を生成する方法: アクティビティ

ムバートの活動

最後に、チル、集中、ゲーム、スポーツなどのアクティビティ プリセットの 1 つを選択して、アクティビティ スタイルを音楽に適用できます。 たとえば、睡眠アクティビティを選択し、などのサブカテゴリを選択して、他のプロジェクトで使用できるリアルな雨音を作成できます。

プリセットを使用する場合、一度に複数のカテゴリを選択することはできないことに注意してください。 たとえば、気分を選択する場合、ジャンルやアクティビティを同時に選択することはできません。 ジャンル、気分、アクティビティを組み合わせたい場合は、プロンプトを入力できます。

3. 最初の AI 音楽トラックを生成する

このステップでは、テキスト プロンプトを使用して AI 音楽を生成する方法を説明します。 投稿のサイズを抑えるために、15 秒の長さを使用しますが、必要に応じて任意の長さを選択できます。 他の生成 AI と同様に、テキストは少ない方が良いです。 これは特にムバートに当てはまります。 長く説明的なプロンプトを使用すると、混乱が生じ、望ましくない結果が生じる可能性があります。 したがって、プロンプトは短く簡潔にすることが最善です。

まず、テキスト フィールドに次のプロンプトを入力します:プログレッシブ、ボーカル、トライバル、ハウス、ミニマル(1)。 次に、デュレーションを15 秒に設定し (2)、 [トラックの生成]をクリックします (3)。 トラックが完成すると、コントロールのすぐ下に表示されます。 そこから、再生アイコン(4) をクリックしてトラックをプレビューします。 同じプロンプトに基づいてトラックを再生成したい場合は、「再生成」ボタンをクリックします (5)。 結果に満足したら、ダウンロード アイコンをクリックしてダウンロードに保存します (6)。 無料ユーザーには最大 25 トラックが許可されているため、結果が気に入らない場合は必ず削除してください (7)。

トラック設定

トラックを再生成する場合は、トラック、ループ、ミックス、ジングルのいずれかを選択できます。 ミックス設定を選択し、トラックの長さを 15 秒に保ちます。

トラックの種類

こちらがミックス前のオリジナルトラックです。

リミックスされたトラックは次のとおりです。

参照による検索

テキスト プロンプトまたはプリセットを使用して AI 音楽を作成することに加えて、リファレンスによる検索機能を使用することもできます。 この機能を使用すると、YouTube URL を入力してビデオに含まれるトラックを検索できます。 たとえば、独自のビデオの 1 つを使用してテストしてみます。 YouTube URL を入力し (1)、トラック検索ボタン (2) をクリックします。

リファレンスによる検索ツール

私たちの経験では、リファレンスビデオによる検索は、テキストから音楽へのプロンプトを使用するよりもかなり時間がかかり、結果はまちまちでした。 おそらく、このツールがまだベータ版であるため、解決すべき問題がいくつかあることは間違いありません。

4. トラックをダウンロードする

前述したように、トラックをダウンロードしてプロジェクトで使用できます。 ただし、無料アカウントを使用している場合は、コンテンツを Mubert のものとする必要があります。 保存したトラックをダウンロードするには、画面右上のアバター画像に移動し、 [ダウンロード]をクリックします。

ムバートのダウンロード

そこから、トラックのいずれかをクリックしてダウンロードできます。

トラックをダウンロードする

ポップアップが表示されたら、コピー アイコン(1) をクリックして帰属テキストをコピーし、 [同意してダウンロード] (2) をクリックします。

AI音楽を生成する方法

新しい AI 音楽の使用方法を自由に設定したい場合は、有料サブスクリプションにサインアップできます。 プランの価格は手頃で、クリエイター プランは月額わずか 11.69 ドルから始まります。 サブスクリプションに関係なく、作成した作品を Spotify や Apple Music などにアップロードすることはできません。 ただし、Mubert Studio でトラックを販売することはできます。これについては次のセクションで説明します。

ムバートの価格設定

5. Mubert Studio でトラックをリストする

Mubert の最も優れた点の 1 つは、作成した AI 音楽トラックから受動的収入を生み出すことができることです。 Mubert Studio を使用します。 まず、ホーム ページの Mubert Studio の下にある [投稿] ボタンをクリックします。

ムバート スタジオ

次に、アカウントを設定する必要があります。 まずメールアドレスを入力し (1)、次に[続行]ボタン (2) をクリックします。

Mubert スタジオの登録

パスワードを作成し (1)、もう一度[続行] (2) をクリックします。

Mubert スタジオへのログイン

最初のストリームの作成

ログインしたら、最初のストリームを作成する準備が整います。 まず、インターフェースの左上にある「ストリームの作成」ボタンをクリックします。

ストリームの作成

画面が更新されると、いくつかの空白のフィールドが表示されます。 これらに記入して、Mubert のスタジオにトラックをリストします。 まずトラックに名前を付け (1)、キーを定義し (2)、スケールを定義し (3)、1 分あたりの拍数 (BPM) を定義し (4)、アクティビティを割り当てます (5)。 必須フィールドはこれらのみですが、気分、天気、ジャンル、タグの残りのフィールドに入力すると、他のユーザーが検索時にあなたのトラックを見つけられるようになります。

ストリーム設定

トラックのキーと BPM を見つけるには、Mubert のダウンロードに移動し、スタジオに追加する予定のトラックをクリックします。

トラック情報

パラメータを設定したら、サンプルの追加/編集ボタンをクリックしてトラックを追加します。

トラックをアップロードする

次に、 「アップロード」をクリックして、コンピュータからダウンロードしたトラックを追加します。 注: Studio では MP3 をアップロードできないため、ダウンロードしたトラックを wav ファイルに変換する必要があります。 ただし、心配する必要はありません。VLC メディア プレーヤーなどのオープンソース ソフトウェア アプリを使用してファイルを変換できます。

トラックを追加

トラックがアップロードされたら、BPM とキーが一致していることを確認し、[ストリーム設定の編集]ボタンをクリックします。

ストリーム設定を編集する

最後に、 [ストリームを保存]ボタンをクリックすると、ストリームをライブにすることができます。

ストリームを保存する

メイン ページで[自分のストリーム]をクリックして、ストリームを表示、編集、または聴くことができます。

私のストリーム

音声付きAI音楽ジェネレーター

Mubert はバックグラウンド トラックを生成するのに最適ですが、音楽ボーカルが必要な場合はどうすればよいでしょうか? 音声トラックを作成するには 2 つの方法があります。 ナレーションやその他の自然な音声を作成したい場合は、AI 音声ジェネレーターを使用できます。 ただし、これらには通常、歌声のためのツールは含まれていません。 その場合、AIオーディオツールが必要になります。 このリストにあるツールの 1 つは、別のブログ投稿で紹介されています。 他の 2 つは、音声と BGM を組み合わせて芸術作品を作成するのに役立つダウンロード可能なアプリケーションです。

ランドル

Landr AI オーディオ

Landr は、直感的なインターフェイスを通じて音楽を作成、編集、配信できる最高評価の AI オーディオ ツールです。 月額 12 ドルという低価格で、作品を簡単にミックスしてマスタリングできる仮想スタジオにアクセスできます。 Lady Gaga や Post Malone などのレコーディング アーティストによって使用されている Landr は、プロフェッショナルにとって頼りになるプラットフォームです。

料金:月額 12 ドル。

ランダーを入手

シンセサイザーV

シンセサイザー V スタジオ

Dreamsonics Synthesizer V も、ボーカル付きの音楽を作成したい場合に最適なプログラムです。 テキストプロンプトを使用してトラックを作成し、お気に入りの AI 音声を適用できます。 このアプリは無料でダウンロードでき、サンプル AI 音声が付属しているので、試してみることができます。 自分に合ったプラットフォームだと判断した場合は、さまざまな AI 音声を購入できます。 無料版では最大 3 つのトラックを作成できるため、ニーズに合うかどうかを判断するのに十分な時間がかかります。

価格:無料、パッケージは 79 ドルから。

シンセサイザー V を入手

撤回する

AIを復活させる

ボーカル用の最後のツールはRevocalizeです。 このリストにある他のツールとは動作が異なります。 テキスト プロンプトで音声を生成する代わりに、自分の声を録音することができます。 AI の魔法により、Revocalize はあなたの声を変更および強化し、さまざまなトーン、エフェクト、ピッチを追加できるようにします。 さらに良いことに、独自のアルゴリズムである Voice Identity (UVI) 歌唱モデルを使用し、あなたの声を保護し、セキュリティを確保します。 著作権保護により、それを自由に使用する権利が与えられます。 これは、他の AI プラットフォームが直面するすべての著作権問題を考慮すると、優れた機能です。

注: Revocalize の無料版にアクセスしたい場合は、サインアップして待機リストに登録する必要があります。

価格:無料、月額プランは 9 ドルから。

リボカライズを取得

AI 音楽の未来

AI が生成する音楽の未来は明るいです。 雇用市場や人間の創造性を脅かすものだと見る人もいるかもしれないが、それは誤りである。 それは、議員がAIクリエイター人間のアーティストの権利を守るために何らかの法的保護を整備できればの話だ。 現在、オリジナリティと所有権の間の境界線は曖昧になっています。 AI業界の主要企業が関与した訴訟が係争中であるため、結果がどうなるかを見るのは興味深いでしょう。 それまでの間、コミットする前に、プラットフォームの創設アルゴリズムとトレーニングアルゴリズムを調査することが重要です。 強固なパートナーシップを通じて、AI は音楽作成プロセスを合理化するツールとして機能します。

AI 音楽生成に関する最終的な考え

次の YouTube 動画のバックグラウンド トラックが必要な場合でも、ボーカルを含む完全なトラックが必要な場合でも、AI ミュージックはそれを実現する優れた方法です。 人工知能の力を利用して、テキスト プロンプトから AI 音楽を生成し、編集して、数分で簡単に公開できます。 Mubert や Landr などのツールを使用すると、経験がなくてもプロフェッショナルな結果を達成できます。

人工知能についてさらに詳しく知りたいですか? 他の AI に関する投稿もご覧ください。

  • AIアートとは何ですか? アート ジェネレーターの仕組み (2023)
  • 2023 年の AI アートの作り方 (詳細チュートリアル)
  • キャラクター AI: 知っておくべきことすべて
  • 2023 年に Photoshop AI Generative Fill を使用する方法 (詳細なチュートリアル)

注目の画像(whiteMocca / Shutterstock.com経由)