HYBEの子会社・SupertoneがAPI公開、歌唱合成音声技術や音声変換技術なども追加予定
Supertoneは、自社の技術を各種プラットフォームやアプリケーションなどに連携できるようサポートする「Supertone API」をクローズドベータテスト(CBT)形式で公式ウェブサイトにて公開した。「Supertone API」CBTは、日本語にも対応している。
Supertoneは2020年3月に設立されたAIオーディオ技術企業。現在、HYBEの子会社として様々なメディア分野で最先端のオーディオ技術を提供している。
API(Application Programming Interface)は、互いに異なるソフトウェア間でデータをやり取りし、機能を共有できるようにする仕組み。開発者が他のサービスで提供するデータや機能を、自社サービスに取り込むことができるようになる
最初にAPIで提供されるAI音声技術は、テキストを音声に変換する「Text-to-Speech」(TTS)。Supertoneが独自に開発した音声合成基盤モデルNANSY(Neural Analysis & Synthesis)が適用されたSupertoneのTTS技術は、自然で豊かな感情を表現した音声を作り出せることが特徴となっている。NANSYを通じて、音色・発音・音高(ピッチ)・アクセントの4つの構成要素を調整し、実際の人の発話に近い声を具現化することができる。
TTS APIは対話型ゲームのキャラクター製作やオーディオブック、アニメーション、チャットサービスなどTTS技術を必要とする誰もが活用することが可能。特にSupertoneは既存のNANSYモデルの改善により、テキストが音声で出力されるまでの時間を減らし、チャットボットのように即時的な音声フィードバックが必要なサービス開発を容易にした。
今回のAPI公開に先立ち、SupertoneはインタラクティブAIコンテンツプラットフォーム「zeta」を運営する韓国のScatter Lab社と協業し、TTS技術をAPIで提供している。11月初めにzetaはユーザーが自らAIチャットボットキャラクターを製作し、声をつけることができる機能を公開した。これに連動しているSupertoneのTTS技術がユーザーのサービス体験の満足度を高めている。
今後、Supertoneは「Supertone API」において、TTS技術だけでなく、歌唱合成音声技術(Singing Voice Synthesis)や音声変換技術(Voice Conversion)なども追加していく予定。
Supertone代表のイ・ギョグは、「Supertone APIはSupertoneのAI音声技術の活用の幅を広げ、商用化を加速させる契機になるだろう」とし「ビジネスパートナー社だけでなく個人または小規模なコンテンツクリエイターもAPI形態でSupertoneのAI音声技術を導入し、より簡単で豊かにサービス製作ができるようになることを願っている」とコメントしている。
広告・取材掲載