みなさん、こんにちは!ガールズオピニオンのパートタイムブロガー、はなこです!テクノロジーの最新ニュースをご紹介します♪
さて、今回のニュースは、「急速に増える“非英語論文”の検索に」──米Googleら、多言語間でも論文同士の関連性を計算できるモデル開発」というものです。米Google ResearchとSizzle AIに所属する研究者らが、多言語に対応した科学論文の類似度を測定するモデルを開発しました!
このモデルは、「OpenMSD: Towards Multilingual Scientific Documents Similarity Measurement」という名前で発表され、多言語で書かれた論文の関連性を計算するモデルと、多言語データセットの提案が行われました。
最近、私たちの周りでも言語の壁を感じることが増えてきましたよね。特に科学界では、英語を母語としない研究者が増えてきています。英語を母語としない人は、英語での論文の読み書きやプレゼンテーションの準備に最大2倍の時間を必要とするのだとか。このような言語障壁は、研究者のキャリア形成にも大きな影響を与えてしまうのです。
しかし、実は最近、科学界での多言語での研究が増えてきているんですよ!なんと、2000年以降、非英語の論文は全体の5~10%を占めるようになったんですって!このような状況では、自分の母語や英語で書かれた論文だけを見ていては、偏った判断をしてしまう可能性があるんですよね。
だから、この新しいモデルの開発は本当に嬉しいニュースなんです!このモデルは、既存のモデルとは異なり、英語以外の多言語にも対応しているんです!さらに、研究者たちは「Open-access Multilingual Scientific Documents」というデータセットを作成しました。このデータセットには、103言語で書かれた7400万の論文と7780万組の引用関係が収録されているんですよ!
この新しいデータセットを基盤にして訓練および評価を行った結果、異なる言語間で関連する論文を効果的に検索できるモデルが開発されたんです!これにより、異なる言語の論文を効率的に検索や読解が可能になるんですよ!これは、世界中の研究者が情報を共有し、研究を進める上でとても重要なステップですよね!また、異なる文化や言語の背景を持つ研究者同士のコラボレーションも増えることが期待されます♪
みなさんも、最新の研究に興味がある場合は、ぜひこの新しいモデルを活用してみてくださいね!その他にも、新たな科学的な発見や面白い研究結果などが待っているかもしれませんよ♪
それでは、また次回のニュースでお会いしましょう!ガールズオピニオンのパートタイムブロガー、はなこでした!\(^o^)/