Search

JP-2026076740-A - 情報処理方法、プログラム及び情報処理装置

JP2026076740AJP 2026076740 AJP2026076740 AJP 2026076740AJP-2026076740-A

Abstract

【課題】言語学習者に行わせる対話タスクを好適に考案することができる情報処理方法等を提供する。 【解決手段】情報処理方法は、対象言語を学習する学習者が学習すべき内容を表す学習情報を取得し、前記学習情報を含む第1プロンプトを言語モデルに入力することで、学習者に行わせる対話タスクの仕様書を生成する処理をコンピュータが実行する。好適には、生成された前記仕様書を含む第2プロンプトを言語モデルに入力することで、前記対話タスクを学習者に指示する指示書と、前記対話タスクに応じた対話文の生成を言語モデルに指示する第3プロンプトとを生成する。 【選択図】図1

Inventors

  • 江口 政貴
  • ▲高▼津 弘明
  • 鈴木 駿吾
  • 松山 洋一

Assignees

  • 学校法人早稲田大学

Dates

Publication Date
20260512
Application Date
20241024

Claims (10)

  1. 対象言語を学習する学習者が学習すべき内容を表す学習情報を取得し、 前記学習情報を含む第1プロンプトを言語モデルに入力することで、学習者に行わせる対話タスクの仕様書を生成する 処理をコンピュータが実行する情報処理方法。
  2. 生成された前記仕様書を含む第2プロンプトを言語モデルに入力することで、前記対話タスクを学習者に指示する指示書と、前記対話タスクに応じた対話文の生成を言語モデルに指示する第3プロンプトとを生成する 請求項1に記載の情報処理方法。
  3. 前記第1プロンプトを言語モデルに複数回入力することで、複数の前記対話タスクそれぞれに対応する複数の前記仕様書を生成し、 前記複数の仕様書をそれぞれ含む複数の前記第2プロンプトを言語モデルに入力することで、前記複数の対話タスクそれぞれに対応する前記指示書と、前記第3プロンプトとを生成し、 前記複数の対話タスクを学習者に対して出力し、 前記複数の対話タスクからいずれかを選択する入力を受け付け、 選択された前記対話タスクに対応する前記指示書を学習者に対して出力し、 選択された前記対話タスクに対応する前記第3プロンプトを言語モデルに入力することで、前記対話タスクに応じた対話文を生成し、 生成された対話文を学習者に対して出力し、 対話文に対する応答文の入力を受け付ける 請求項2に記載の情報処理方法。
  4. 学習者に対して所定の質問を出力し、 前記質問に対する回答の入力を受け付け、 前記回答に基づき、学習者のプロフィールを生成し、 前記プロフィールに基づき、学習者が対象言語について学習すべき学習項目を前記学習情報として特定し、 特定された前記学習項目を含む前記第1プロンプトを言語モデルに入力することで、前記仕様書を生成する 請求項3に記載の情報処理方法。
  5. 前記プロフィール及び仕様書それぞれの特徴量を抽出し、 前記プロフィール及び仕様書それぞれの特徴量に基づき、前記複数の対話タスクのうち、学習者に推薦する前記対話タスクを決定し、 決定した前記対話タスクを学習者に対して出力する 請求項4に記載の情報処理方法。
  6. 前記プロフィール及び仕様書それぞれの特徴量を入力した場合に、学習者が前記対話タスクを達成できるタスク達成期待度を出力するよう学習済みの第1モデルに、抽出した前記プロフィール及び仕様書それぞれの特徴量を入力することで前記タスク達成期待度を出力し、 前記プロフィール及び仕様書それぞれの特徴量を入力した場合に、学習者が前記対話タスクを選択するタスク選択期待度を出力するよう学習済みの第2モデルに、抽出した前記プロフィール及び仕様書それぞれの特徴量を入力することで前記タスク選択期待度を出力し、 前記タスク達成期待度及びタスク選択期待度に基づき、学習者に推薦する前記対話タスクを決定する 請求項5に記載の情報処理方法。
  7. 前記応答文を入力した場合に、該応答文内の各箇所の発話の意図を示すダイアログアクトを特定するよう学習済みの第3モデルに、入力された前記応答文を入力することで、該応答文内の各箇所における前記ダイアログアクトを特定し、 前記学習項目に対応する前記ダイアログアクトが特定された箇所の前記応答文を抽出し、 前記応答文を入力した場合に、学習者の習熟度を出力するよう学習済みの第4モデルに、抽出された前記応答文を入力することで前記習熟度を出力し、 出力された前記習熟度に基づき、学習者が前記学習項目を達成したか否かを判定する 請求項6に記載の情報処理方法。
  8. 前記学習項目を達成したか否かの判定結果と、前記対話タスクの選択結果とに基づき、前記第1モデル及び第2モデルを更新する 請求項7に記載の情報処理方法。
  9. 対象言語を学習する学習者が学習すべき内容を表す学習情報を取得し、 前記学習情報を含む第1プロンプトを言語モデルに入力することで、学習者に行わせる対話タスクの仕様書を生成する 処理をコンピュータに実行させるプログラム。
  10. 制御部を備える情報処理装置であって、 前記制御部が、 対象言語を学習する学習者が学習すべき内容を表す学習情報を取得し、 前記学習情報を含む第1プロンプトを言語モデルに入力することで、学習者に行わせる対話タスクの仕様書を生成する 情報処理装置。

Description

本発明は、情報処理方法、プログラム及び情報処理装置に関する。 言語学習を支援する技術がある。例えば特許文献1では、トランスフォーマーベース言語モデルを用いて、言語テストにおけるリーディングパッセージなどを生成する方法等が開示されている。 欧州特許出願公開第4330947号明細書 言語学習システムの構成例を示す図である。サーバの構成例を示すブロック図である。実施の形態の概要を示す図である。学習項目の特定処理に関する説明図である。対話タスクの生成画面の一例を示す図である。対話タスクの生成画面の他例を示す図である。指示書及び第3プロンプトの生成画面の一例を示す図である。学習項目の特定処理の手順を示すフローチャートである。対話タスクの生成処理の手順を示すフローチャートである。対話処理の手順を示すフローチャートである。 以下、本発明をその実施の形態を示す図面に基づいて詳述する。 (実施の形態) 図1は、言語学習システムの構成例を示す図である。本実施の形態では、学習者がシステム(チャットボット)と対象言語(例えば英語)で対話を行うことにより言語学習を行う言語学習システムについて説明する。言語学習システムは、情報処理装置1、学習者端末2、作成者端末3を含む。各装置は、インターネット等のネットワークNを介して通信接続されている。 情報処理装置1は、種々の情報処理、情報の送受信が可能な情報処理装置であり、例えばサーバコンピュータ、パーソナルコンピュータ等である。本実施の形態では情報処理装置1がサーバコンピュータであるものとし、以下では簡潔のためサーバ1と読み替える。サーバ1は、学習者との間で対話を実施するチャットボットシステムとして機能し、後述するように、大規模言語モデル(Large Language Model、以下では簡潔のため「LLM」と記載する)を用いて対話文を生成し、音声出力して、学習者から応答文の音声入力を受け付ける。 なお、本実施の形態では音声による対話(英会話)を行うものとして説明するが、テキストによる対話(リーディング及びライティング)を行うシステムとして本実施の形態を適用してもよい。 本実施の形態においてサーバ1は、学習者及びLLMの間で行わせる対話タスクを半自動的に生成し、当該対話タスクに沿った対話を学習者に実施させる。具体的には後述するように、サーバ1は、所定のプロンプト(第1プロンプト)をLLMに入力することで対話タスクの仕様書(下記の表1参照)を生成し、当該仕様書を含むプロンプト(第2プロンプト)をLLMに入力することで、対話タスクを学習者に指示する指示書(表2参照)と、対話タスクに応じた対話文の生成を指示するプロンプト(第3プロンプト、表3参照)とを生成する。サーバ1は、生成されたプロンプトをLLMに入力することで対話タスクに応じた対話文を生成し、学習者との間で対話を実施する。 学習者端末2は、学習者が使用する端末装置であり、例えばパーソナルコンピュータ、スマートフォン、タブレット端末等である。サーバ1は、LLMを用いて生成した対話文を学習者端末2に出力して音声再生させ、学習者端末2を介して学習者から応答文の音声入力を受け付ける。 作成者端末3は、対話コンテンツを作成するコンテンツ作成者が使用する端末装置であり、例えばパーソナルコンピュータ等である。作成者端末3は、後述する対話コンテンツの作成画面(図5~図7参照)を表示し、コンテンツ作成者から必要な情報の設定入力を受け付ける。サーバ1は、当該画面の設定内容に基づいて、後述の対話タスクの仕様書、学習者への指示書、第3プロンプトなどを生成する。 図2は、サーバ1の構成例を示すブロック図である。サーバ1は、制御部11、主記憶部12、通信部13、及び補助記憶部14を備える。 制御部11は、一又は複数のCPU(Central Processing Unit)、MPU(Micro-Processing Unit)、GPU(Graphics Processing Unit)等の演算処理装置を有し、補助記憶部14に記憶されたプログラムPを読み出して実行することにより、種々の情報処理、制御処理等を行う。主記憶部12は、SRAM(Static Random Access Memory)、DRAM(Dynamic Random Access Memory)等の一時記憶領域であり、制御部11が演算処理を実行するために必要なデータを一時的に記憶する。通信部13は、通信に関する処理を行うための通信モジュールであり、外部と情報の送受信を行う。補助記憶部14は、ハードディスク、大容量メモリ等の不揮発性記憶領域であり、制御部11が処理を実行するために必要なプログラムP(プログラム製品)、その他のデータを記憶している。 なお、補助記憶部14はサーバ1に接続された外部記憶装置であってもよい。また、サーバ1は複数のコンピュータからなるマルチコンピュータであっても良く、ソフトウェアによって仮想的に構築された仮想マシンであってもよい。 また、本実施の形態においてサーバ1は上記の構成に限られず、例えば操作入力を受け付ける入力部、画像を表示する表示部等を含んでもよい。また、サーバ1は、CD(Compact Disk)-ROM、DVD(Digital Versatile Disc)-ROM等の可搬型記憶媒体1aを読み取る読取部を備え、可搬型記憶媒体1aからプログラムPを読み取って実行するようにしても良い。 図3は、実施の形態の概要を示す図である。図3に基づき、本実施の形態の概要を説明する。 サーバ1の制御部11はプログラムPを実行することにより、言語能力計測部31、ニーズ収集部32、プロフィール生成部33、学習項目特定部34、タスク生成部35、タスク品質評価部36、タスク推薦部37、タスク実施部38、達成度判定部39、推薦モデル更新部40、達成度出力部41として機能する。また、サーバ1は補助記憶部14に、学習者DB301、学習項目DB302、トピックDB303、タスクDB304、推薦モデル305を記憶している。 言語能力計測部31は、学習者との間で不定期に行われる対話データに基づき、学習者の対象言語の習熟度(言語能力)を計測する。習熟度は、学習者の言語能力を離散的及び/又は連続的な値で表現したデータであり、本実施の形態では、A1、A2、B1、B2、C1、C2の6段階で評価するCEFR(Common European Framework of Reference for Languages)レベルを用いる。CEFRではA1が最もレベルが低く、C2が最もレベルが高い。例えば言語能力計測部31は、システム側からの発話に対する学習者の応答(対話データ)を機械学習モデルで分析することにより、学習者の習熟度を計測(判定)する。計測された習熟度は、学習者DB301に記憶される。 学習者DB301は、学習者の情報を格納するデータベースである。学習者DB301は、上記の言語能力の計測結果のほかに、後述のニーズ収集結果(学習者のプロフィール、目標学習項目など)、対話学習結果(推薦タスク、選択タスク、学習項目の達成の可否など)、対話タスクの達成状況(過去に実施した全タスクの達成又は未達成の履歴、目標学習項目における達成又は未達成の状況など)を記憶する。 ニーズ収集部32は、学習者との間で不定期に対話を実施することで、学習者の対象言語に対する学習ニーズを収集する。プロフィール生成部33は、ニーズ収集部32が収集した学習ニーズ(学習者との間の対話データ)から学習者のプロフィールを生成する。学習項目特定部34は、プロフィール生成部33が生成したプロフィール、言語能力計測部31が計測した学習者の対象言語の習熟度等から、学習者が目標とすべき学習項目(例えばCan-Doステートメント)を特定する。 図4は、学習項目の特定処理に関する説明図である。図4に基づき、ニーズ収集部32、プロフィール生成部33、学習項目特定部34が行う処理について説明する。 サーバ1は、学習者の対象言語に対する学習ニーズを収集するため、学習者について問う所定の質問を出力し、学習者から回答の入力を受け付ける。図4上段の表には、システム(サーバ1)側からの質問文を図示している。サーバ1は、予め定められた複数の質問を学習者端末2に出力し、各質問に対する回答の入力を受け付ける。 次にサーバ1は、入力された回答に基づき、学習者のプロフィールを生成する。図4中段の表には、学習者のプロフィールの一例を図示している。例えばサーバ1は、学習者からの回答群をLLMに入力し、回答群を要約することで、学習者のプロフィールを生成する。 次にサーバ1は、生成されたプロフィールのほかに、学習者の対象言語の習熟度などに応じて、学習者が目標とすべき学習項目を特定する。学習項目は、対象言語を使って何ができるかを表す尺度であり、本実施の形態では学習項目としてCan-Doステートメントを用いる。例えば学習項目DB302には、習熟度(CEFRレベル)と対応付けて、当該習熟度の人物が行えるCan-Doステートメントが定義されている。サーバ1は学習項目DB302を参照して、学習者が目標とすべき学習項目を特定する。例えばサーバ1は、学習者の習熟度に近く、かつ、学習者のプロフィールと文章特徴量が類似するCan-Doステートメントを目標学習項目として特定する。あるいはサーバ1は、学習者のプロフィールからキーワード(図4の例では、例えば「hip-hop」)を抽出し、当該キーワードから学習者が関心を持つであろうトピック(例えば「音楽」)を特定し、当該トピックに関わる言語行為の学習項目を特定するなどしてもよい。図4下段の表には、特定された学習項目の一例を図示している。サーバ1は、学習者のプロフィール、習熟度などから、一又は複数の学習項目を特定する。 なお、本実施の形態では学習項目としてCan-Doステートメントを用いるが、後述するように、学習項目として文法項目や語彙項目、その他の言語項目を使用してもよく、それらの言語項目をCan-Doステートメントと統合した実装としてもよい。 図3に戻って説明を続ける。ニーズ収集部32、プロフィール生成部33、及び学習項目特定部34による処理は定期的に行われ、学習者の学習計画(目標学習項目)は更新される。ニーズの収集は、例えば現在目標としている学習項目のうち、達成した学習項目の割合が閾値(例えば9割)を超えた場合に行われる。あるいは、後述の如く対話タスクがシステムから推薦された場合に、「ニーズに当てはまらない」との選択を学習者が一定回数以上続けて行った場合にニーズの収集が行われる。あるいは、学習者が自身のニーズが変わったと自覚し、学習項目の変更を希望した場合にニーズの収集が行われる。あるいは、最適なニーズの収集タイミングを推定するための機械学習モデルを用意してもよい。 上述の如く、サーバ1は、質問に対する回答から学習者のプロフィールを生成し、目標とすべき学習項目を特定する。サーバ1は、特定された一又は複数の学習項目(目標学習項目リスト)、生成されたプロフィール、オリジナルの対話データ(質問及び回答)を学習者DB301に記憶する。 なお、例えばサーバ1は、上記で特定した学習項目の中から、学習者本人が達成したい学習項目を選択する入力を学習者から受け付け、選択された学習項目について対話タスクを生成するようにしてもよい。 タスク生成部35は、学習者に行わせる対話タスクを生成する。対話タスクとは、学習者に学習目標を達成させるために課すタスクであり、学習者の言語能力を診断するための評価や後述の達成度の評価に用いたり、上述のCan-Doステートメントを達成したり語彙や文法を練習したりすることを目的として生成される。具体的には、対話タスクは、例えば学習者に対して一定の対話状況を設定して対