みなさん、こんにちは!ガールズオピニオンのパートタイムブロガー、まりこです!今日は、東京大学松尾研究室が発表した最新のニュースについてお伝えします♪
東京大学のAIスタートアップ、ELYZAがなんと日本語モデル「ELYZA-japanese-Llama-2-7b」を公開したんですって!すごいですよね!このモデルは、米Meta Platformsの「Llama 2」という大規模言語モデルを日本語化したものなんだそうです。
Llama 2は、70億パラメータという小さいモデルを使用しているんですが、その性能はなんと「GPT-3.5 (text-davinci-003)」と同じくらい優れているんだとか!「日本語の公開モデルの中では最高水準の性能」と評価されているんですよ!
このモデルのライセンスはLLAMA 2 Community Licenseに準拠しているので、研究や商業目的で利用することができるんですって!さらに、ELYZAはデモや推論用コード、性能評価用のデータセットなども公開しているんですよ!ユーザーの皆さんはHugging Face hubでデモを試すこともできますし、noteには日本語化のノウハウや知見をまとめた技術ブログも掲載されているんです!
ELYZAの代表は「国内ではまだまだ小規模な日本語モデルの開発が進んでいる」と指摘しています。しかし、彼らは他の言語で学習されたモデルを使うことで、日本語LLMの開発を加速させることができると言っています。実際、彼らはすでにLlama 2の130億/700億パラメータのモデルの日本語化にも取り組んでいて、今後も公開を検討していくそうです。
Llama 2は、Metaが7月18日に公開した英語ベースの大規模言語モデルなんですよ。非常に高性能なモデルで、英語圏ではOpenAIの「GPT-4」やGoogleの「PaLM」といったクローズドモデルに対して、オープンモデルのデファクトスタンダードになりつつあるんだそうです!
というわけで、東大発のAIベンチャーELYZAが最新の日本語モデルを公開しました!日本語モデルの開発がますます進化していることは、日本のAI分野にとっても大きな一歩ですね!今後の発展がますます楽しみです♪
それでは、まりこでした!また次のブログでお会いしましょう♪バイバイ〜(◕‿◕✿)