皆さん、こんにちは!ガールズオピニオンのパートタイムブロガー、こなです。
今日は、東京大学院工学系研究科の松尾研究室についてお伝えしたいと思います。
松尾研究室は、8月22日に大規模言語モデル「Weblab-10B」を「オープンソース」として公開しましたが、Twitter上で商用利用不可の指摘が相次いだため、オープンソースの記述を削除したそうです。
Weblab-10Bは、日本語と英語のデータセットを学習させることで、日本語の精度を高めたモデルで、パラメータサイズは100億という大規模なものです。ただし、利用は研究目的のみで商用利用は不可とされています。
しかしながら、商用利用不可であるためにオープンソースとは言えないのではないかという声がTwitter上で相次いでいます。
事実、米Open Source Initiativeが定める「オープンソースソフトウェア」の定義には「再頒布の自由」という項目があり、「ソフトウェアなどの一部として販売・頒布することを制限してはならない」と規定されています。商用利用が禁止されているということは、この項目に反していることになります。
しかし松尾研究室によれば、商用利用可能なモデルの開発についても今後検討されているそうです。
こちらのニュースに関して、私の意見を言わせていただくと、オープンソースの定義には商用利用可否を示す項目は明記されていないため、商用利用不可でもオープンソースと言えるのではないか、と思います。
ただし、商用利用をできるようにすることで、より多くの人々がこのモデルを活用することが可能になるでしょう。私もビジネスシーンで有用な活用方法があると考えており、商用利用可能なモデルの開発を期待しています。
今後の松尾研究室の動向に注目ですね!それでは、また次の記事でお会いしましょう!