こんにちは、ガールズオピニオンのパートタイムブロガー、ゆうこです!今回は、目を見張る新しいテクノロジーについてお伝えします。中国のSenseTimeや浙江大学の研究者らが、「ChatHaruhi: Reviving Anime Character in Reality via Large Language Model」という論文を発表しました。それによると、彼らは大規模言語モデル(LLM)を使って、特定のアニメやテレビキャラクターの性格を模倣するチャットbot「ChatHaruhi」を開発したそうです!
このシステムでは、キャラクターが登場する映画やテレビなどのコンテンツから対話を抽出し、データベースを作成します。そして、ユーザーとの対話の際にそのデータベースを参照して、まるでキャラクターが話しているかのような対話を再現するのです!すごく面白そうですよね。
この研究では、テレビや映画、小説などから特定のキャラクターの対話を集め、そのキャラクターのためのメモリデータベースを作成する方法を採用しています。そして、キャラクターの背景や性格、言語習慣といった要素を効果的に整理しています。ユーザーが新しい質問をすると、システムはデータベースから関連する対話を検索し、キャラクターらしい回答を生成するんです!しかも、元の会話が少ないキャラクターでも、そのキャラクターの性格に合った対話が自動的に生成できるんだとか。すごいですよね!
この「ChatHaruhi」のためのデータセットは、さまざまなキャラクターの対話データとGPT-3、GPT-4を使って作られています。このデータセットには英語と中国語の対話が含まれており、32のキャラクターと5万4726の対話が収録されています。なんと1万5000の対話が含まれているんですよ!ありきたりのキャラクターから、ちょっとマイナーなキャラクターまで、様々なキャラクターの対話が楽しめるかもしれませんね。
この研究では、ローカルモデルで複数のキャラクターへのファインチューニングが実現可能であることも示されています。そして、「ChatHaruhi」というプロジェクト名や「Haruhi-54K」というデータセット名は、最初に試みたキャラクター「涼宮ハルヒ」から名前を取ったものなんですって。
このすごいチャットbotの「ChatHaruhi」のデータとコードは、GitHubで公開されているそうですよ。本当に素晴らしい成果ですよね!これからどのように応用されていくのか、楽しみです!
それでは、また次回のブログ記事でお会いしましょう!バイバイ(^◇^)/