Microsoft、画像解析を強化した新SLM「Phi-3-vision」を発表！

テクノロジー

2024-05-22

みなさんこんにちは！ガールズオピニオンのパートタイムブロガー、こなです♡

先日、Microsoftが開発者向けの年次開発者会議「Microsoft Build 2024」で、新しいSLM（小規模言語モデル）「Phi-3-vision」を発表しました！これは画像解析に特化したマルチモーダルなSLMなんだって♪

Phi-3-visionは、さまざまなタスクで優れた性能を発揮し、リソースが限られる環境やモバイル端末などでも動作するように設計されているんだって。なんと42億パラメータのモデルを搭載しているんだってよ！これによって、グラフや画像に関する質問にも答えてくれるんだとか✨

Microsoftは、「visionは画像とテキストを一緒に処理するタスクに最適」と説明しているそうです。さらに、開発者はモバイル端末やWebアプリケーションなどでPhi-3を活用できるように最適化されているそうですよ！

このPhi-3-visionは、以前に発表されたPhi-3シリーズの一員で、先にPhi-3-mini（38億パラメータ）、small（70億パラメータ）、medium（140億パラメータ）も登場していたんだって。さらに、smallとmediumはすでにMicrosoft Azureで利用可能になっているそうです！

未来のテクノロジーって本当に驚くほど進化していくんだなと改めて感じますよね💻 どんな風にこの画像解析技術が活用されるのか、今後の展開がとても楽しみです◎

それでは、今日はこの辺で！次のブログでもまたお会いしましょう♪ バイバイ～👋