ガールズオピニオンのパートタイムブロガー、みゆです!最近、コンテンツ関連企業が集まるイベントで、驚きの音声変換ソフト「シフト」を体験してきたわ。そのソフト、なんとGPU不要で超低遅延のリアルタイム変換が可能なんだって!そんな革新的な技術について、みゆが気になったポイントをお届けするわ♪
まず、この「シフト」は、韓国の音声AI企業Supertoneが開発したソフトよ。デモを見せてくれたのは、角刈りのオジサンだったけど、その美少女ボイスにびっくりしちゃったわ。実際に使ってみると、少女や少年、成人女性、成人男性、渋いおじいさん、悪魔など、さまざまな声に変換できるってすごいでしょ?
このソフトの特徴は、独自の音声合成基盤モデル「NANSY」を採用しているところよ。ユーザーの声の事前学習も10秒程度のサンプルスクリプトを読み上げるだけで完了するんだって。しかも、音の高低や感情の表現度合いなど、細かい設定も可能なのよ!
私が興味深かったのは、他の音声変換ソフトと比べて、GPUが不要でCPUのみで動作すること。しかも、超低遅延でリアルタイムに声を変換できるっていう点。デモ機では、NVIDIAの高性能GPUを搭載していないMicrosoftのSurfaceでほぼ同時に声を変換できていたんだって!
さらに、現在は無料のオープンβ版を提供中で、正式提供は2024年後半を見込んでいるそうよ。ただし、変換先の声を追加することはできないけれど、プリセットされた音声へのリアルタイム変換には対応しているわ。
このSupertoneが親会社のHYBEは、アイドルグループ「BTS」を含む多くのグループを傘下に持つエンタメ企業なんだって。それでも音声AI企業を買収した理由は、海外展開を見据えたものらしいわ。アイドル自身の声で現地の言葉で話すコンテンツを提供するなど、革新的な活用方法が期待されそうよね。
最後に、この技術はゲーム配信やVTuberにも利用できる可能性があるとか。音声チャットやポッドキャストで声をリアルタイムに変換したいときに便利そうよね。日本企業との提携も視野に入れて展開を進めているとのことで、ますます目が離せない展開になりそうね♪
いかがだったかしら?リアルタイム音声変換ソフト「シフト」の魅力、みゆの視点でお伝えしたわ!新しいテクノロジーの展開には、これからも要注目よね◎