JP-2026076740-A - 情報処理方法、プログラム及び情報処理装置

JP2026076740AJP 2026076740 AJP2026076740 AJP 2026076740AJP-2026076740-A

Abstract

【課題】言語学習者に行わせる対話タスクを好適に考案することができる情報処理方法等を提供する。【解決手段】情報処理方法は、対象言語を学習する学習者が学習すべき内容を表す学習情報を取得し、前記学習情報を含む第１プロンプトを言語モデルに入力することで、学習者に行わせる対話タスクの仕様書を生成する処理をコンピュータが実行する。好適には、生成された前記仕様書を含む第２プロンプトを言語モデルに入力することで、前記対話タスクを学習者に指示する指示書と、前記対話タスクに応じた対話文の生成を言語モデルに指示する第３プロンプトとを生成する。【選択図】図１

Inventors

江口政貴
▲高▼津弘明
鈴木駿吾
松山洋一

Assignees

学校法人早稲田大学

Dates

Publication Date: 20260512
Application Date: 20241024

Claims (10)

対象言語を学習する学習者が学習すべき内容を表す学習情報を取得し、前記学習情報を含む第１プロンプトを言語モデルに入力することで、学習者に行わせる対話タスクの仕様書を生成する処理をコンピュータが実行する情報処理方法。
生成された前記仕様書を含む第２プロンプトを言語モデルに入力することで、前記対話タスクを学習者に指示する指示書と、前記対話タスクに応じた対話文の生成を言語モデルに指示する第３プロンプトとを生成する請求項１に記載の情報処理方法。
前記第１プロンプトを言語モデルに複数回入力することで、複数の前記対話タスクそれぞれに対応する複数の前記仕様書を生成し、前記複数の仕様書をそれぞれ含む複数の前記第２プロンプトを言語モデルに入力することで、前記複数の対話タスクそれぞれに対応する前記指示書と、前記第３プロンプトとを生成し、前記複数の対話タスクを学習者に対して出力し、前記複数の対話タスクからいずれかを選択する入力を受け付け、選択された前記対話タスクに対応する前記指示書を学習者に対して出力し、選択された前記対話タスクに対応する前記第３プロンプトを言語モデルに入力することで、前記対話タスクに応じた対話文を生成し、生成された対話文を学習者に対して出力し、対話文に対する応答文の入力を受け付ける請求項２に記載の情報処理方法。
学習者に対して所定の質問を出力し、前記質問に対する回答の入力を受け付け、前記回答に基づき、学習者のプロフィールを生成し、前記プロフィールに基づき、学習者が対象言語について学習すべき学習項目を前記学習情報として特定し、特定された前記学習項目を含む前記第１プロンプトを言語モデルに入力することで、前記仕様書を生成する請求項３に記載の情報処理方法。
前記プロフィール及び仕様書それぞれの特徴量を抽出し、前記プロフィール及び仕様書それぞれの特徴量に基づき、前記複数の対話タスクのうち、学習者に推薦する前記対話タスクを決定し、決定した前記対話タスクを学習者に対して出力する請求項４に記載の情報処理方法。
前記プロフィール及び仕様書それぞれの特徴量を入力した場合に、学習者が前記対話タスクを達成できるタスク達成期待度を出力するよう学習済みの第１モデルに、抽出した前記プロフィール及び仕様書それぞれの特徴量を入力することで前記タスク達成期待度を出力し、前記プロフィール及び仕様書それぞれの特徴量を入力した場合に、学習者が前記対話タスクを選択するタスク選択期待度を出力するよう学習済みの第２モデルに、抽出した前記プロフィール及び仕様書それぞれの特徴量を入力することで前記タスク選択期待度を出力し、前記タスク達成期待度及びタスク選択期待度に基づき、学習者に推薦する前記対話タスクを決定する請求項５に記載の情報処理方法。
前記応答文を入力した場合に、該応答文内の各箇所の発話の意図を示すダイアログアクトを特定するよう学習済みの第３モデルに、入力された前記応答文を入力することで、該応答文内の各箇所における前記ダイアログアクトを特定し、前記学習項目に対応する前記ダイアログアクトが特定された箇所の前記応答文を抽出し、前記応答文を入力した場合に、学習者の習熟度を出力するよう学習済みの第４モデルに、抽出された前記応答文を入力することで前記習熟度を出力し、出力された前記習熟度に基づき、学習者が前記学習項目を達成したか否かを判定する請求項６に記載の情報処理方法。
前記学習項目を達成したか否かの判定結果と、前記対話タスクの選択結果とに基づき、前記第１モデル及び第２モデルを更新する請求項７に記載の情報処理方法。
対象言語を学習する学習者が学習すべき内容を表す学習情報を取得し、前記学習情報を含む第１プロンプトを言語モデルに入力することで、学習者に行わせる対話タスクの仕様書を生成する処理をコンピュータに実行させるプログラム。
制御部を備える情報処理装置であって、前記制御部が、対象言語を学習する学習者が学習すべき内容を表す学習情報を取得し、前記学習情報を含む第１プロンプトを言語モデルに入力することで、学習者に行わせる対話タスクの仕様書を生成する情報処理装置。

Description

本発明は、情報処理方法、プログラム及び情報処理装置に関する。言語学習を支援する技術がある。例えば特許文献１では、トランスフォーマーベース言語モデルを用いて、言語テストにおけるリーディングパッセージなどを生成する方法等が開示されている。欧州特許出願公開第４３３０９４７号明細書言語学習システムの構成例を示す図である。サーバの構成例を示すブロック図である。実施の形態の概要を示す図である。学習項目の特定処理に関する説明図である。対話タスクの生成画面の一例を示す図である。対話タスクの生成画面の他例を示す図である。指示書及び第３プロンプトの生成画面の一例を示す図である。学習項目の特定処理の手順を示すフローチャートである。対話タスクの生成処理の手順を示すフローチャートである。対話処理の手順を示すフローチャートである。以下、本発明をその実施の形態を示す図面に基づいて詳述する。（実施の形態）図１は、言語学習システムの構成例を示す図である。本実施の形態では、学習者がシステム（チャットボット）と対象言語（例えば英語）で対話を行うことにより言語学習を行う言語学習システムについて説明する。言語学習システムは、情報処理装置１、学習者端末２、作成者端末３を含む。各装置は、インターネット等のネットワークＮを介して通信接続されている。情報処理装置１は、種々の情報処理、情報の送受信が可能な情報処理装置であり、例えばサーバコンピュータ、パーソナルコンピュータ等である。本実施の形態では情報処理装置１がサーバコンピュータであるものとし、以下では簡潔のためサーバ１と読み替える。サーバ１は、学習者との間で対話を実施するチャットボットシステムとして機能し、後述するように、大規模言語モデル（Large Language Model、以下では簡潔のため「ＬＬＭ」と記載する）を用いて対話文を生成し、音声出力して、学習者から応答文の音声入力を受け付ける。なお、本実施の形態では音声による対話（英会話）を行うものとして説明するが、テキストによる対話（リーディング及びライティング）を行うシステムとして本実施の形態を適用してもよい。本実施の形態においてサーバ１は、学習者及びＬＬＭの間で行わせる対話タスクを半自動的に生成し、当該対話タスクに沿った対話を学習者に実施させる。具体的には後述するように、サーバ１は、所定のプロンプト（第１プロンプト）をＬＬＭに入力することで対話タスクの仕様書（下記の表１参照）を生成し、当該仕様書を含むプロンプト（第２プロンプト）をＬＬＭに入力することで、対話タスクを学習者に指示する指示書（表２参照）と、対話タスクに応じた対話文の生成を指示するプロンプト（第３プロンプト、表３参照）とを生成する。サーバ１は、生成されたプロンプトをＬＬＭに入力することで対話タスクに応じた対話文を生成し、学習者との間で対話を実施する。学習者端末２は、学習者が使用する端末装置であり、例えばパーソナルコンピュータ、スマートフォン、タブレット端末等である。サーバ１は、ＬＬＭを用いて生成した対話文を学習者端末２に出力して音声再生させ、学習者端末２を介して学習者から応答文の音声入力を受け付ける。作成者端末３は、対話コンテンツを作成するコンテンツ作成者が使用する端末装置であり、例えばパーソナルコンピュータ等である。作成者端末３は、後述する対話コンテンツの作成画面（図５～図７参照）を表示し、コンテンツ作成者から必要な情報の設定入力を受け付ける。サーバ１は、当該画面の設定内容に基づいて、後述の対話タスクの仕様書、学習者への指示書、第３プロンプトなどを生成する。図２は、サーバ１の構成例を示すブロック図である。サーバ１は、制御部１１、主記憶部１２、通信部１３、及び補助記憶部１４を備える。制御部１１は、一又は複数のＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro-Processing Unit）、ＧＰＵ（Graphics Processing Unit）等の演算処理装置を有し、補助記憶部１４に記憶されたプログラムＰを読み出して実行することにより、種々の情報処理、制御処理等を行う。主記憶部１２は、ＳＲＡＭ（Static Random Access Memory）、ＤＲＡＭ（Dynamic Random Access Memory）等の一時記憶領域であり、制御部１１が演算処理を実行するために必要なデータを一時的に記憶する。通信部１３は、通信に関する処理を行うための通信モジュールであり、外部と情報の送受信を行う。補助記憶部１４は、ハードディスク、大容量メモリ等の不揮発性記憶領域であり、制御部１１が処理を実行するために必要なプログラムＰ（プログラム製品）、その他のデータを記憶している。なお、補助記憶部１４はサーバ１に接続された外部記憶装置であってもよい。また、サーバ１は複数のコンピュータからなるマルチコンピュータであっても良く、ソフトウェアによって仮想的に構築された仮想マシンであってもよい。また、本実施の形態においてサーバ１は上記の構成に限られず、例えば操作入力を受け付ける入力部、画像を表示する表示部等を含んでもよい。また、サーバ１は、ＣＤ（Compact Disk）－ＲＯＭ、ＤＶＤ（Digital Versatile Disc）－ＲＯＭ等の可搬型記憶媒体１ａを読み取る読取部を備え、可搬型記憶媒体１ａからプログラムＰを読み取って実行するようにしても良い。図３は、実施の形態の概要を示す図である。図３に基づき、本実施の形態の概要を説明する。サーバ１の制御部１１はプログラムＰを実行することにより、言語能力計測部３１、ニーズ収集部３２、プロフィール生成部３３、学習項目特定部３４、タスク生成部３５、タスク品質評価部３６、タスク推薦部３７、タスク実施部３８、達成度判定部３９、推薦モデル更新部４０、達成度出力部４１として機能する。また、サーバ１は補助記憶部１４に、学習者ＤＢ３０１、学習項目ＤＢ３０２、トピックＤＢ３０３、タスクＤＢ３０４、推薦モデル３０５を記憶している。言語能力計測部３１は、学習者との間で不定期に行われる対話データに基づき、学習者の対象言語の習熟度（言語能力）を計測する。習熟度は、学習者の言語能力を離散的及び／又は連続的な値で表現したデータであり、本実施の形態では、Ａ１、Ａ２、Ｂ１、Ｂ２、Ｃ１、Ｃ２の６段階で評価するＣＥＦＲ（Common European Framework of Reference for Languages）レベルを用いる。ＣＥＦＲではＡ１が最もレベルが低く、Ｃ２が最もレベルが高い。例えば言語能力計測部３１は、システム側からの発話に対する学習者の応答（対話データ）を機械学習モデルで分析することにより、学習者の習熟度を計測（判定）する。計測された習熟度は、学習者ＤＢ３０１に記憶される。学習者ＤＢ３０１は、学習者の情報を格納するデータベースである。学習者ＤＢ３０１は、上記の言語能力の計測結果のほかに、後述のニーズ収集結果（学習者のプロフィール、目標学習項目など）、対話学習結果（推薦タスク、選択タスク、学習項目の達成の可否など）、対話タスクの達成状況（過去に実施した全タスクの達成又は未達成の履歴、目標学習項目における達成又は未達成の状況など）を記憶する。ニーズ収集部３２は、学習者との間で不定期に対話を実施することで、学習者の対象言語に対する学習ニーズを収集する。プロフィール生成部３３は、ニーズ収集部３２が収集した学習ニーズ（学習者との間の対話データ）から学習者のプロフィールを生成する。学習項目特定部３４は、プロフィール生成部３３が生成したプロフィール、言語能力計測部３１が計測した学習者の対象言語の習熟度等から、学習者が目標とすべき学習項目（例えばＣａｎ－Ｄｏステートメント）を特定する。図４は、学習項目の特定処理に関する説明図である。図４に基づき、ニーズ収集部３２、プロフィール生成部３３、学習項目特定部３４が行う処理について説明する。サーバ１は、学習者の対象言語に対する学習ニーズを収集するため、学習者について問う所定の質問を出力し、学習者から回答の入力を受け付ける。図４上段の表には、システム（サーバ１）側からの質問文を図示している。サーバ１は、予め定められた複数の質問を学習者端末２に出力し、各質問に対する回答の入力を受け付ける。次にサーバ１は、入力された回答に基づき、学習者のプロフィールを生成する。図４中段の表には、学習者のプロフィールの一例を図示している。例えばサーバ１は、学習者からの回答群をＬＬＭに入力し、回答群を要約することで、学習者のプロフィールを生成する。次にサーバ１は、生成されたプロフィールのほかに、学習者の対象言語の習熟度などに応じて、学習者が目標とすべき学習項目を特定する。学習項目は、対象言語を使って何ができるかを表す尺度であり、本実施の形態では学習項目としてＣａｎ－Ｄｏステートメントを用いる。例えば学習項目ＤＢ３０２には、習熟度（ＣＥＦＲレベル）と対応付けて、当該習熟度の人物が行えるＣａｎ－Ｄｏステートメントが定義されている。サーバ１は学習項目ＤＢ３０２を参照して、学習者が目標とすべき学習項目を特定する。例えばサーバ１は、学習者の習熟度に近く、かつ、学習者のプロフィールと文章特徴量が類似するＣａｎ－Ｄｏステートメントを目標学習項目として特定する。あるいはサーバ１は、学習者のプロフィールからキーワード（図４の例では、例えば「hip-hop」）を抽出し、当該キーワードから学習者が関心を持つであろうトピック（例えば「音楽」）を特定し、当該トピックに関わる言語行為の学習項目を特定するなどしてもよい。図４下段の表には、特定された学習項目の一例を図示している。サーバ１は、学習者のプロフィール、習熟度などから、一又は複数の学習項目を特定する。なお、本実施の形態では学習項目としてＣａｎ－Ｄｏステートメントを用いるが、後述するように、学習項目として文法項目や語彙項目、その他の言語項目を使用してもよく、それらの言語項目をＣａｎ－Ｄｏステートメントと統合した実装としてもよい。図３に戻って説明を続ける。ニーズ収集部３２、プロフィール生成部３３、及び学習項目特定部３４による処理は定期的に行われ、学習者の学習計画（目標学習項目）は更新される。ニーズの収集は、例えば現在目標としている学習項目のうち、達成した学習項目の割合が閾値（例えば９割）を超えた場合に行われる。あるいは、後述の如く対話タスクがシステムから推薦された場合に、「ニーズに当てはまらない」との選択を学習者が一定回数以上続けて行った場合にニーズの収集が行われる。あるいは、学習者が自身のニーズが変わったと自覚し、学習項目の変更を希望した場合にニーズの収集が行われる。あるいは、最適なニーズの収集タイミングを推定するための機械学習モデルを用意してもよい。上述の如く、サーバ１は、質問に対する回答から学習者のプロフィールを生成し、目標とすべき学習項目を特定する。サーバ１は、特定された一又は複数の学習項目（目標学習項目リスト）、生成されたプロフィール、オリジナルの対話データ（質問及び回答）を学習者ＤＢ３０１に記憶する。なお、例えばサーバ１は、上記で特定した学習項目の中から、学習者本人が達成したい学習項目を選択する入力を学習者から受け付け、選択された学習項目について対話タスクを生成するようにしてもよい。タスク生成部３５は、学習者に行わせる対話タスクを生成する。対話タスクとは、学習者に学習目標を達成させるために課すタスクであり、学習者の言語能力を診断するための評価や後述の達成度の評価に用いたり、上述のＣａｎ－Ｄｏステートメントを達成したり語彙や文法を練習したりすることを目的として生成される。具体的には、対話タスクは、例えば学習者に対して一定の対話状況を設定して対