広告・取材掲載

広告・取材掲載

「これまで聞いたことのない音を創造」 エヌビディア、オーディオ生成AIモデル「Fugatto」発表

ビジネス 海外

米半導体大手エヌビディアは11月25日、オーディオ生成AIモデル「Fugatto」を発表した。 

Fugatto(Foundational Generative Audio Transformer Opus 1)は、テキストプロンプトに基づいて音楽、スピーチ、サウンドを合成。他のオーディオ生成AIから一線を画しているのは、推論レベルの技術により、これまで聞いたことのない音の創造を含め、あらゆるオーディオのミックスを出力できることだ。
 

「ニャーと鳴くトランペット」や「吠えるサックス」といった斬新なプロンプトに基づいた曲を作ることもでき、同社は「ユーザーが説明できるものなら何でも作ることができる」と説明。「深く、うなるような低音パルスと断続的で甲高いデジタル音が合わさった、まるで巨大な知覚を持つ機械が目覚めたような音」といった描写から、ユニークなサウンドエフェクトを生成する能力を持つ。 

このほか、曲のボーカルを分離したり、楽器や、メロディーを変えたりといった音楽の編集や、アクセントやトーンの変更も可能だ。

現時点で一般公開はされておらず、今後のリリース予定なども不明だが、ウェブサイトに多数のサンプルが載っている。 

(文:坂本 泉)  

榎本編集長「NVIDIAから音楽生成AI、Fugatto(フガート)登場。動画を見てもらえば分かるが、プロンプトでSFXやシンセパッドのような音を未知の混ざり具合で作れるだけでなく、楽曲からボーカルを抜き出し、そこに新たなプロンプトで別のトラックを添えたり、メロディラインをボーカルに変えたり、あるいはせりふのトーンを怒ったふうにとか、幸せな感じになど応用力が高い。楽曲自体を生成するというより、創作をサポートするツールで実用的だ。連載でも語ったが生成AIはそちらの方でまず開花するだろう。それが新しい楽器の領域に到達すれば新たなメガトレンドを音楽にもたらすこともありえる 

 

ライター:坂本 泉(Izumi Sakamoto)

フリーランスのライター/エディター/フォトジャーナリスト。日本の大学を卒業後、国外で日系メディアやPR会社に勤務。イベントレポートやインタビューを中心に、カルチャーから経済まで幅広い分野の取材や記事執筆、編集、撮影などを行う。