Sign In
使い方は超簡単。
とりあえず、Webページに移動したら、右上のSign Inを押す。
Sign Inのポップアップが出てくるので、グーグルかディスコードかXか選んでサインイン。(ここからは、各システムで表示が違うんで割愛します。)
グーグルなら、アカウントの選択画面が出てくるので
アカウントをクリックすると、ログインされます。
Discord
クリックすると、ディスコードにログインしてるなら以下のような表示がでてくるので、認証するとログインできます。
X
下の画面の外の右上に、自分のアカウントが表示されていると思います。
アカウントが問題なければ、Authorize appを押すと、
下のようなページに移動するので、しばらく待つと、ログインした状態でUdioの画面に戻ります。
サブスクリプションについて
Free
無料で音楽が生成できます。
・1日当たり10クレジット、さらに1か月あたり100クレジットを追加・標準処理キュー・最大2つの同時生成(4トラック生成される)・トラックのリミックスと延長
Standard
10ドル/月(年払いの場合、8ドル/月)スタンダードなプラン。Freeに比べて同時生成が増えるより多くの機能へアクセスできる・1200クレジット/月、1日当たりの生成制限なし・優先処理キュー(Freeに比べて優先処理される)・最大3つの同時生成(6トラック生成される)・Freeの機能+インペインティング、カスタムカバーアート、カスタムユーザーアバター
Pro
30ドル/月(年払いの場合、24ドル)最も多くの同時生成。特別な機能、早期アクセス・4800クレジット/月、1日あたりの制限なし・優先処理キュー・最大4つの同時生成(8トラック)・スタンダードプランの全機能
曲の生成
ログインが済むと、↓のような画面になるので(Crateボタンが活性化する)
サイコロボタンを押して生成
プロンプト入力のテキストボックスの横にあるサイコロマーク(赤枠部分)を押すと、ランダムにプロンプトを生成してくれる。
↓押してみたら、プロンプトが生成された。
テキストボックスにプロンプトを入力して生成
Crateボタンの左横のプロンプト入力のテキストボックスににプロンプトを入力。
英語でプロンプトを入力しようとすると、Suggested tagsの候補が表示されるので、それを参考にプロンプトを入力していってもいいと思います。
Suggested tagsで曲のスタイルを選択できます。
テキストボックスの下にあるSuggested tagsの中から、選んでいく方法でもプロンプトを生成できます。
Suggested tagsの参考になるサイト見つけたので、追記しておきます。
RateYourMusicっていうサイトです。
以下は翻訳してるんですが、お気に入りの曲を探してこの”ジャンル(Genres)”と”記述子(Descriptors)”の部分を参考にするといいみたいです。
噂では、UdioのSuggested tagsはここから持ってきたのではないかという話もあったり?
以下が翻訳無しの場合。
これを参考に入れてみると、似た系統の音楽が生成されてくるはずです。
以下は、赤枠部分を参考に、生成してみましたが、いかがでしょうか?
Suggested tagsを含む、プロンプトの仕様(Manual Mode以外)について
これは、mubertに似ていて、mubertのテキストプロンプトが送られたときの挙動が、
テキストメッセージが送られたときに、タグベースを持つトランスフォーマーニューラルネットワークに送られ、対応するサウンドのセットが自動的に選択されます。 (Mubert API v2 · Apiaryより)
つまり、テキストをタグに分解して、タグによって分類された音楽のサウンドセットのなかのどれかが選ばれて音楽を生成しているっていう感じみたいです。
Udioでも、同じようにテキストプロンプトが送信された場合、タグベースに分解されて、破綻なく綺麗な曲になるようにタグを元にプロンプトが解釈されてから、曲が生成されるという流れになっています。
そのため、タグに存在しないものは無視されるか、近いものに変換されているのだと思われます。
Manual Modeで、Suggested tagsを利用推奨している理由もこの辺りがあって、タグに存在しないものを解釈できないため、無視する形になるからだと思われます。
歌詞を作成する
Lyricsのチェックボックスをクリックし選択すると、その項目が選択された状態になります。
Custom Write your own lyrics
Customを選択すると、Write custom lyrics hereと書かれたテキストボックスが表示されます。
このテキストボックスに、歌詞を入力します。
歌詞の文字数に関しては、350文字未満でないと「Use less than 350 characters for best results」というエラーが出ます。
出ても生成はできるみたいです。
最良の結果が欲しい場合、200~350文字に限定するのがよさそうです。
歌詞の行数としては、6行が最適で、遅い曲の場合は少なく、速い曲の場合は多くなります。
短い歌詞の時は,[break]などを入れて曲を切っておくと、変な音が入るのを防げる可能性が増えます。
カスタム歌詞の仕様
[Verse]、[Chorus]、[Hook]、[Guitar Solo]、[Drop]などのタグを使うことで、歌詞にいろいろなスパイスを加えることができます。
Sunoでいうところのメタタグに当たる部分ですね。
曲の構成をしていしたり、曲で使う楽器などを指定するのに使用します。
邦楽では、「Aメロ」「Bメロ」「サビ」のようにセクションが分けられますが、洋楽では、「verse」「chorus」(サビ)というように分けられます。
よく使われるのが前述にもあるように、「verse」「chorus」で、[verse],[chorus]のように[]で囲んで使用します。
[Verse]歌詞[Chorus]歌詞のようになります。
曲で説明すると、
[Verse]
ネオンが裂く闇、虚空を舞う
粉塵裏切りの街角、狂い咲く鋼の花
絡みつく電子の腕、息もできずに
宵闇に浮かぶ、歪んだ現実の像(ゾウ)
[Chorus]
潜め、この狂乱の旋風(たつまき)に
感覚の限界を突き破り、飛び越えろ
揺れる心地、永遠(とわ)に
迷い込む解き放たれた野生の鼓動、光の中へ
ていう感じで書くことになります。
Udioでは30秒しか曲が作れない仕様なので、[Verse]ならVerse単体だけを入力して、次にExtendで[Chorus]を繋げるといった使い方になります。
これだけでは単調になるので、ほかにも、邦楽でいうBメロを表す、Pre-chorus、Cメロを表すbridgeなどがあります。
これらを使うとより歌が盛り上がります。
他にもこの[]の中にスタイルワードを入れて、よりどのような曲にしたいかを指定することもできます。
[emotional Verse],[epic Verse],[Happy Chorus]など。
他のパートとしては、曲の最初を表す[Intro],曲の最後を表す[outro],一番聞かせたいところを指定する[Hook],繰り返しを意味する[Refrain]や曲の中断を意味する[Break]などもあります。
また、インストゥルメンタルのタグとしては、[Break][Instrumental Interlude][Melodic Instrumental][Percussion Breakdown][Syncopated Bass][Guitar Solo][Build][Beat Drop]などがあります。
指定のしかたによって、楽器単体のソロだったり、いろいろあるので、調べて使ってみるのも面白いと思います。
(いろいろありすぎて説明しきれない……)
簡単曲の指標をまとめました
Unofficial Community Udio Generation Tipsより翻訳して抜粋しています。
節のラベル:[verse], [Verse 1], [verse 2]
コーラスのラベル: [pre-chorus], [chorus],
その他セクションラベル:[intro], [bridge], [outro], [breakdown] [Drop], [interlude], [buildup], [Refrain] (reported to help with consistency), [sample], [Rhythmic flow with syncopation], [dance interlude], [interlude drop], [Chorus: Vocalist], [Verse: Vocalist]
セクションタグ以外のタグ
話し言葉と声の説明
[spoken]タグは話し言葉のセリフに使用します。
[voice1、spoken], [voice2、spoken]異なる人が話すときのためのラベル例えば、(UDIO (Let The Groove Be Your Guide) [Full Track], Disco, Funk by BobbyB)[Verse1:female] (https://www.udio.com/songs/bqkZ7Qgq8ZvDCBQp4V2seX)名前で指定(Udio | The Expendables (The Musical) by Lunakris)
トーンと声の説明(例:叫び声)[breakdown (screaming)] (I Hate You With All Your Heart by jakemarsh)
その他の例[Emotional], [scream], [cry], [crowd]
言語サポート:タグに言語(ドイツ語)を追加し、プロンプト [German] Was ist das? と入力すると、AIが適切に発音します。
既知の問題:タグを追加するだけでなく、歌詞で性別を指定することをお勧めします(カスタム歌詞を使用する場合)。
楽器タグ: [guitar solo], [saxophone], [violin solo][Harmonica Break][Harmonica Bridge]はあまり効果がなかった
音楽のスタイル/曲調/要素の説明
“[high energy, upbeat, fast-paced Balkan brass instrumental, exciting and exhilarating]”[record scratching][レコードのスクラッチ] と [DJのスクラッチ] は機能するようだが、一貫性がない。
最初のプロンプトを: tempo xxx bpmと設定すると、かなり安定して動作するようです。
アウトロセクションで[fade out]を使うと、歌詞の後に余裕があれば、心地よいフェードアウト効果が得られます。
コーラスを繰り返す[Chorus – 曲のテーマを強化するためにコーラスを繰り返す – 「Repeated chorus with an added echo for depth」
他の例:[classical piano], [organ], [bass piano],[instrumental: attack], [instrumental: release]
発音単語を音素/音節に分解するUtilization -> “Utili-zation”Petaflops -> “Peta-flops”Backpropagation -> “Back-propa-gation”
頭字語、文字、数字のスペルアウト“U-D-I-O”AMD -> “ay-em-dee”991 FP16 TFlops dream6 PCIe lanes, 64 gigs per sec, data strem–>>“nine hundred ninety one Eff-pee-sixteen teraflops dream,six pee-see-eye-E lanes, sixty four gigs per sec, data stream”
単語以外の音節“Hmmmm Ohhh woah””ahhhhhhhh”, “ooooooohhhh”
リミックスとエクステンションリミックス中の歌詞の変更については、FAQも参考にしてください。
対応言語
英語、中国語、日本語、ロシア語、ポーランド語、ドイツ語、フランス語、イタリア語
※ただし、Suggested tagsに入っていれば、歌ってくれるものもある例:韓国語(Korean)
Instrumental
曲だけの音楽を作るときに使います。
歌ものであれば、イントロやアウトロ、間奏で使います。
Auto-generated
Udio搭載のAIに歌詞を作成してもらいます。
Crateボタンを押す
上の方法のどれかを選択してCrateボタンを押すと、1回の生成で2曲曲が生成されてきます。
曲生成のワークフローのサンプル
Unofficial Community Udio Generation Tipsから翻訳して抜粋
最初から作る場合:Suggested tagsでジャンルを選び、楽器編成やボーカリストの好みを特定するタグを選らぶ。
例えば、outlaw country & honky tonk, male vocalist, female vocalist, acoustic guitar, close harmonies(アウトロー・カントリー&ホンキートンク、男性ボーカル、女性ボーカル、アコースティック・ギター、クローズ・ハーモニー`)
次に、**Custom*** write your own lyricsのボックス内に歌詞を入力します。
(Intro)
[Instrumental Break]
He’s an outlaw by nature, (a rebel by choice.)
With the wind in his hair, (and the dust on his boots.)
Singing songs of freedom, (with his raspy voice.)
He’s an outlaw forever, (playing his roots.)
歌詞を入力したら、生成します。
生成された2曲のうち1曲が気に入ったら、ファイル名を変更し、カバーアートをつけてリストの中で目立つようにします。
カバーアートがないものは、あとで削除して、リストをごちゃごちゃしないように片づけます。
曲の流れがわかっているので、[Verse] [Pre Chorus] [Chorus] [Bridge]のプロンプトに合わせて歌詞を作ることができ、曲の雰囲気に合った一貫したアウトプットを得ることができる。私は、1つのセクションにつき6行から8行の歌詞を作成するのが最も効果的だと感じています(音節数と流れによって異なります)。
もしカスタム歌詞が真ん中のヴァースやコーラスで、32秒を埋めきれない場合は、歌詞の前か後に[Instrumental Break]や[Interlude]を追加して、セクションに肉付けし、AIがアドリブや歌詞のアーティファクトを入れるのを防いでみてください。
タグの例
[Verse] [Verse 1] [Verse 2]
[Verse 1: Voice One] [Verse 2: Voice Two]
[Chorus] [Chorus 1] [Chorus 2] [Chorus: Both Male Vocalists]
[Spoken Verse 1: Male Voice] [Dialogue 1: Female Voice 1]
[Spoken Word: Male Voice] [Spoken Word: Female Voice]
[Build: Male Vocalist] [Build: Female Vocalist]
[Chorus: 2x]
[Bridge]
[Pre=Chorus]
[Pre-Drop]
[Drop]
[Post-Drop]
[Verse 1: Male Vocalist]
[Verse 2: Female Vocalist]
[All:]
[Hook]
[Intro: Sound of train chugging]←イントロを電車のゴロゴロ音で
[Chorus: Gunshots in the distance]←サビ遠くで銃声が聞こえる
[Verse 1: With street ambiance]←バース1ストリートの雰囲気とともに
[Pre-Dialogue]
[Instrumental Break]
[Build: Male Vocalist]
[Whispers in the dark]←暗闇でささやく
[Chorus: All, Detective (Male), Siren (Female), (Chorus)]
[Dialogue Bridge]
[DETECTIVE (spoken)] [FEMALE SUSPECT (spoken)]
[Instrumental Streak]
[Whispers]
[Instrumental Break]
[Dialogue Interlude]
コメント