Search

JP-2026077476-A - 情報処理方法

JP2026077476AJP 2026077476 AJP2026077476 AJP 2026077476AJP-2026077476-A

Abstract

【課題】クエリを選択する技術を改善する。 【解決手段】情報処理装置10が実行する方法は、検索対象の候補ごとに、対応するドメインキーワード及びターゲットフレーズを登録すること、入力された質問から特定された検索対象に対応するドメインキーワードを含むクエリを取得すること、クエリを検索エンジンに入力するステップと、検索結果を表示する画面上で検索対象に対応するターゲットフレーズを含む各スニペットを特定及びカウントするステップと、特定された1以上のスニペットに含まれるキーワードをクエリに追加するステップと、を含む検索処理を複数回実行すること、複数回実行された検索処理において、ターゲットフレーズを含むスニペットのカウント数が最も多かった回の検索結果に基づいて、質問に対する回答を取得すること、及び取得された回答を出力すること、を含む。 【選択図】図1

Inventors

  • 河合 英紀

Assignees

  • トヨタ自動車株式会社

Dates

Publication Date
20260513
Application Date
20241025

Claims (5)

  1. 情報処理装置が実行する方法であって、 検索対象の候補ごとに、対応するドメインキーワード及びターゲットフレーズを登録すること、 入力された質問から特定された前記検索対象に対応する前記ドメインキーワードを含むクエリを取得すること、 前記クエリを検索エンジンに入力するステップと、検索結果を表示する画面上で前記検索対象に対応する前記ターゲットフレーズを含む各スニペットを特定及びカウントするステップと、特定された1以上の前記スニペットに含まれるキーワードを前記クエリに追加するステップと、を含む検索処理を複数回実行すること、 複数回実行された前記検索処理において、前記ターゲットフレーズを含む前記スニペットのカウント数が最も多かった回の前記検索結果に基づいて、前記質問に対する回答を取得すること、及び 取得された前記回答を出力すること を含む、方法。
  2. 請求項1に記載の方法において、 前記ターゲットフレーズを含む前記スニペットのカウント数が最も多かった回に用いられた前記クエリで、前記ドメインキーワードを更新することをさらに含む、方法。
  3. 請求項1に記載の方法において、 前記検索処理において前記追加される前記キーワードは、前記ターゲットフレーズを含む前記スニペットにおいて出現頻度が高いキーワード、及び前記ターゲットフレーズを含む前記スニペットにのみ出現するキーワードのいずれか又は両方である、方法。
  4. 請求項1に記載の方法において、 前記検索処理は、前記クエリ内の前記ドメインキーワード及び追加された前記キーワードのうちの一部を前記クエリから削除するステップをさらに含む、方法。
  5. 請求項1に記載の方法において、 前記ターゲットフレーズを含む前記スニペットの出現割合が閾値以上である検索結果が得られた時点で前記検索処理の実行を終了することをさらに含む、方法。

Description

本開示は、情報処理方法に関する。 従来、ユーザの質問に対して回答を提供する対話システムに関する技術が知られている。例えば特許文献1には、与えられたドメインの文書に基づいて、大規模言語モデルを利用して当該ドメインに特化した対話ボットを生成する技術が開示されている。 特開2023-076413号公報 本開示の一実施形態に係るシステムの概略構成を示すブロック図である。情報処理装置の動作を示すフローチャートである。 以下、本開示の実施形態について説明する。 (実施形態の概要) 図1を参照して、本開示の実施形態に係るシステム1の概要について説明する。システム1は、情報処理装置10と、ドメインデータベース(ドメインDB)20と、端末装置30と、を備える。システム1は、例えばインターネット及び移動体通信網等を含むネットワーク50を介して、外部サーバ40と通信可能に接続される。システム1は例えば、自動車販売の事業者等による「中古車の査定金額を教えて」等の質問に対する回答を出力する対話システムを構築する。 情報処理装置10は、例えばサーバ装置等のコンピュータである。ドメインDB20は、各検索対象について検索エンジンへの入出力に関連する情報を格納するデータベースである。ドメインDB20は例えば、クラウド環境又はオンプレミス環境に設置されたサーバ等のコンピュータに設けられていてもよいし、又は情報処理装置10に設けられていてもよい。端末装置30は例えば、スマートフォン、携帯電話機、ウェアラブル機器、若しくはタブレットなどのモバイル機器、車両に搭載されるナビゲーション装置、PC(personal computer)などの汎用機器若しくは専用機器であるが、これらに限られない。 また、図1に示す外部サーバ40は、LLM(大規模言語モデル)41を提供する事業体のサーバである。LLM41は、大規模なデータを機械学習することによって構築された言語モデルである。LLM41は、ユーザが入力した質問に対する回答を出力する。外部サーバ40はさらに、RAG(検索拡張生成)42を備える。RAG42は、事業体毎のデータ又はリアルタイムで検索したデータを含む、LLMが未学習のデータをLLMに渡し、LLMが行う回答作成を支援する。なお、RAG42は、情報処理装置10の一部として構成されてもよい。 まず、本実施形態の概要について説明し、詳細については後述する。情報処理装置が実行する方法は、検索対象の候補ごとに、対応するドメインキーワード及びターゲットフレーズを登録し、入力された質問から特定された検索対象に対応するドメインキーワードを含むクエリを取得する。そして本方法は、クエリを検索エンジンに入力するステップと、検索結果を表示する画面上で検索対象に対応するターゲットフレーズを含む各スニペットを特定及びカウントするステップと、特定された1以上のスニペットに含まれるキーワードをクエリに追加するステップと、を含む検索処理を複数回実行する。さらに本方法は、複数回実行された検索処理において、ターゲットフレーズを含むスニペットのカウント数が最も多かった回の検索結果に基づいて、質問に対する回答を取得し、取得された回答を出力する。 このように、本実施形態によれば、検索エンジンを用いた検索結果の画面上でターゲットフレーズを含むスニペット数が増加するようにクエリが自動的に修正及び拡張されるので、例えば人手で選別した複数の適切なクエリを予め登録しておく手法と比較してユーザの負担を低減しつつ、質問に対する回答の精度を向上し得る。したがって、精度の高い回答の出力及び人的コストの低減という点で、適切なクエリを選択する技術が改善される。 次に、システム1の各構成について詳細に説明する。 (情報処理装置の構成) 図1に示すように、情報処理装置10は、通信部11と、記憶部12と、制御部13と、を備える。 通信部11は、ドメインDB20及びネットワーク50のそれぞれに接続する1つ以上の通信インタフェースを含む。当該通信インタフェースは、例えば移動体通信規格、有線LAN(Local Area Network)規格、又は無線LAN規格に対応するが、これらに限られず、任意の通信規格に対応してもよい。本実施形態において、情報処理装置10は、通信部11及びネットワーク50を介してドメインDB20、端末装置30及び外部サーバ40と通信する。 記憶部12は、1つ以上のメモリを含む。記憶部12に含まれる各メモリは、例えば主記憶装置、補助記憶装置、又はキャッシュメモリとして機能してもよい。記憶部12は、情報処理装置10の動作に用いられる任意の情報を記憶する。記憶部12は例えば、システムプログラム及びアプリケーションプログラム等を記憶してもよい。本実施形態において記憶部12は、webブラウザ及び任意の検索エンジンのアプリケーションプログラム及び検索エンジンに入力するクエリ等を記憶する。記憶部12に記憶された情報は、例えば通信部11を介してネットワーク50から取得される情報で更新可能であってもよい。 制御部13は、1つ以上のプロセッサ、1つ以上のプログラマブル回路、1つ以上の専用回路、又はこれらの組合せを含む。プロセッサは、例えばCPU(Central Processing Unit)若しくはGPU(Graphics Processing Unit)等の汎用プロセッサ、又は特定の処理に特化した専用プロセッサであるがこれらに限られない。プログラマブル回路は、例えばFPGA(Field-Programmable Gate Array)であるがこれに限られない。専用回路は、例えばASIC(Application Specific Integrated Circuit)であるがこれに限られない。制御部13は、情報処理装置10全体の動作を制御する。 (ドメインDBの構成) ドメインDB20は、各検索対象について検索エンジンへの入出力に関連する情報を格納するデータベースである。ドメインDB20は例えば、検索対象と、ドメインキーワードと、ターゲットフレーズと、を格納する。ドメインDB20のデータ構造の詳細については、後述する。 (端末装置30の構成) 図1に示すように、端末装置30は、通信部31と、記憶部32と、制御部33と、出力部34と、入力部35とを備える。通信部31と、記憶部32と、制御部33の構成は、情報処理装置10の通信部11と、記憶部12と、制御部13の構成と基本的に同一であるので、説明を簡略化する。 通信部31は、ネットワーク50に接続する1つ以上の通信インタフェースを含む。 記憶部32は、1つ以上のメモリを含む。本実施形態において記憶部32は、情報処理装置10を使用する事業者が提供する対話システムのアプリケーションプログラム、及びwebブラウザのアプリケーションプログラム等を記憶する。 制御部33は、1つ以上のプロセッサ、1つ以上のプログラマブル回路、1つ以上の専用回路、又はこれらの組合せを含む。制御部33は、記憶部32に記憶されたアプリケーションプログラムを実行可能である。 出力部34は、情報を出力する1つ以上の出力装置を含む。当該出力装置は、例えば情報を映像で出力するディスプレイ、又は情報を音声で出力するスピーカ等であるが、これらに限られない。 入力部35は、操作者による操作を受け付ける1つ以上の入力装置を含む。当該入力装置は、例えば物理キー、静電容量キー、静電容量パネル、ディスプレイと一体的に設けられたタッチスクリーン、又は音声入力を受け付けるマイクロフォン等であるが、これらに限られない。 (情報処理装置の動作フロー) 図2を参照して、本実施形態に係る情報処理装置10の動作について説明する。 ステップS100:制御部13は、検索対象の候補ごとに、対応するドメインキーワード及びターゲットフレーズを登録する。具体的には、検索対象と、検索対象ごとのドメインキーワード及びターゲットフレーズとが端末装置30の入力部35を介して事業者によって入力され、制御部33によって通信部31を介して情報処理装置10に送信され、情報処理装置10の制御部13によってドメインDB20内に記憶される。ここで、表1を参照してドメインDB20のデータ構造を説明する。検索対象は、事業者が入力した質問(例えば「中古車の査定金額を教えて」)から特定される、質問文のなかの一部分又は主要な単語(例えば「査定金額」)である。ドメインキーワードは、検索エンジンにクエリとして入力する1つ以上の単語(例えば「中古」、「査定」及び「金額」等の1つ以上の単語)であり、検索対象に対応付けて記憶される。ターゲットフレーズは、検索対象について検索した結果として取得したい情報の1つ以上の単語(例えば「円」、「¥」等の査定金額を表す単語又は「¥*~¥*」等の査定金額の範囲を表す単語の組合せ)である。 ステップS101:制御部13は、入力された質問から特定された検索対象に対応するドメインキーワードを含むクエリを取得する。具体的には、制御部13は、端末装置30の入力部35を介して事業者によって入力された質問(例えば「中古車の査定金額を教えて」)を端末装置30から通信部11を介して受信して、受信した質問から検索対象(例えば「査定金額」)を特定する。制御部13は、検索対象(例えば「査定金額」)に対応するドメインキーワード(例えば「中古 査定 金額」)を含むクエリをドメインDB20から取得する。 ステップS102:制御部13は、検索処理の一部として、クエリを検索エンジンに入力する。具体的には、制御部13は、ステップS101にて取得されたクエリ(例えば「中古 査定 金額」)を検索エンジンに入力する。ここで、検索エンジンは、Google(登録商標)等の任意の検索エンジンであってよい。 ステップS103:制御部13は、検索処理の一部として、検索結果を表示する画面(以下、結果画面ともいう。)上で検索対象に対応するターゲットフレーズを含む各スニペット(以下、優良スニペットともいう。)を特定及びカウントする。具体的には、制御部13は、ステップS102によって結果画面を取得する。制御部13は、検索対象(例えば「査定金額」)に対応するターゲットフレーズ(例えば「円 ¥」)をドメインDB20から取得する。制御部13は、結果画面内の1つ以上のスニペット(例えば、スニペットA「中古車相場表から一目瞭然!価格、走行距離、年式の組み合わせで中古車の相場が分かります。」、スニペットB「YYYY年MM月時点の買取査定相場は¥1000000~¥1500000です。」)がターゲットフレーズを含むか否かをスニペットの各々について判定することによって、優良スニペットを特定する(例えば、スニペットAは「円 ¥」をいずれも含まないので優良スニペットに該当しない。スニペットBは「¥」を含むので優良スニペットに該当する。)。制御部13はさらに、優良スニペット(例えば、スニペットB)の数をカウントする。ここで、スニペットとは、検索エンジンに単語又は文章を入力して検索を実行した結果を表示する画面上で、ウェブページのリンク又はタイトルとともに表示されてウェブページの内容を抜粋して説明する文字情報である。本実施形態において、結果画面は検索した結果を表示する画面の1ページ目であってよい。また、結果画面内のスニペットの表示件数は任意に設定されてよい。 ステップS104:制御部13は、検索処理の一部として、特定された1以上のスニペットに含まれるキーワード(以下、優良キーワードともいう。)をクエリに追加する。具体的には、制御部13は、優良スニペット(例えば、スニペットB)から優良キーワード(例えば「YYYY年MM月時点」)を抽出する。制御部13は優良キーワードをクエリに追加する。この結果例えば、クエリは「中古 査定