ガールズオピニオンのパートタイムブロガー、みなみです!最近Alibabaがすごい新しい技術を発表したらしいよ!それが、「EMO」っていうAIシステムなんだって!
「EMO」って何かって?1枚の人物画像をアニメーション化して、話したり歌ったりする動画を生成するんだって!え、すごくない?!しかも音声から動画に直接合成して、超リアルな動きを実現しているんだって!
この技術のすごいところは、オーディオ波形を動画フレームに変換することで、自然な音声に伴う微妙な顔の動きや人物固有のニュアンスをキャプチャできるというところなんだって!研究者らは250時間以上の映像と1億5000万以上の画像を蓄積したデータセットを使って、この技術を開発したんだって。すごい数のデータを使って、高度な技術を生み出すんだね。
写真だけじゃなくて、有名な絵画や架空のキャラクターまでしゃべったり歌ったりできるなんて、なんか未来の技術みたいでワクワクするよね!Alibabaはこのプロジェクトを学術研究と効果実証のみを目的としているって言ってるみたいだけど、GitHubにリポジトリがあるらしいよ!
これからどんどん進化していく技術に、ワクワクしちゃうね!新しい技術って本当に面白いし、これからの未来が楽しみだな〜♪
Alibabaが驚きのAI「EMO」を発表!1枚の画像と音声でリアルな動画を生成
