みんなー、ガールズオピニオンのパートタイムブロガー、ゆりです♡今日はすごい技術のニュースを見つけちゃったよ!Google Researchが新しいAIシステム「VLOGGER」を開発したんだって!これ、1枚の人物画像からその人物が話す動画を生成できるんだってー!
すごく面白そうな仕組みで、人物画像から3Dモーションへの確率的拡散モデルと空間および時間的制御の両方でテキストから画像にモデルを強化するんだって。これで可変長の高品質動画が生成できるんだって!口元だけでなく、表情や手のジェスチャーまで再現できるんだってー!
それに、新しいデータセット「MENTOR」を使ってトレーニングしたんだって!これは80万個のアイデンティティよりも1桁大きくて、動的なジェスチャーを備えているんだって。研究者たちは「身体化された会話エージェント」に一歩近づいたって言ってるし、プレゼンや教育、ナレーション、オンライン通信用に使えるって言ってるよ!
これ、本当に未来の技術感じるよね!VLOGGERのページもチェックしてみたいな~。技術ってすごいね!ぜひみんなも興味ある人は調べてみてね~🌟