JP-2026077475-A - 情報処理装置
Abstract
【課題】自然言語の質問文から、特定のスペックに該当する製品を検索する技術を改善する。 【解決手段】情報処理装置20は、複数の車両について、1つ以上の属性と、属性の値である属性値と組み合わせてデータベースに登録し、自然言語で記述された質問文が入力されると、機械学習を用いて、属性に関連して質問文に示される検索条件を特定し、特定された検索条件に該当する車両をデータベースから選択するクエリを生成し、クエリによるデータベースの検索結果を出力する制御部21を備える。 【選択図】図1
Inventors
- 河合 英紀
Assignees
- トヨタ自動車株式会社
Dates
- Publication Date
- 20260513
- Application Date
- 20241025
Claims (5)
- 複数の車両について、1つ以上の属性を、前記属性の値である属性値と組み合わせてデータベースに登録し、 自然言語による質問文が入力されると、機械学習を用いて、前記属性に関連して前記質問文に示される検索条件を特定し、 特定された検索条件に該当する車両を前記データベースから選択するクエリを生成し、 前記クエリによる前記データベースの検索結果を出力する制御を行う制御部を備える、情報処理装置。
- 前記1つ以上の属性には、自動車の諸元が含まれ、 前記制御部は、前記検索条件として、前記諸元を定義するための1つ以上のキーワードを抽出する、請求項1に記載の情報処理装置。
- 前記制御部は、前記1つ以上のキーワードとして、車両の属性と、前記属性に対応付けられた参照値と、前記参照値との比較条件とを抽出し、 前記制御部は、抽出された参照値に対応付けられた属性に基づいて、当該参照値を調整する、請求項2に記載の情報処理装置。
- 前記制御部は、抽出された参照値に単位があるかどうかを判定し、単位がないと判定した場合に、前記属性と前記参照値の桁数に基づいて、前記参照値の単位を推定する、請求項3に記載の情報処理装置。
- 前記制御部は、前記参照値の単位を、前記データベースに登録されている単位に変換する、請求項3又は請求項4に記載の情報処理装置。
Description
本開示は、情報処理装置に関する。 特許文献1には、検索モデルに入力されたユーザの質問に対して、回答内容が含まれ得る文書を選定し、ユーザの質問に対する回答を出力する技術が開示されている。 特開2023-076413号公報 本開示の実施形態に係るシステムの構成を示すブロック図である。本開示の実施形態に係る情報処理装置の動作を示すフローチャートである。 以下、本開示の実施形態について、図を参照して説明する。 各図中、同一又は相当する部分には、同一符号を付している。本実施形態の説明において、同一又は相当する部分については、説明を適宜省略又は簡略化する。 図1を参照して、本実施形態に係るシステム10の構成を説明する。 システム10は、少なくとも1台の情報処理装置20と、少なくとも1台の外部デバイス30とを備える。 情報処理装置20は、ネットワーク40を介して外部デバイス30と通信可能である。 情報処理装置20は、データセンターなどの施設に設置された、クラウドコンピューティングシステム又はその他のコンピューティングシステムに属するサーバなどのコンピュータである。 外部デバイス30は、車両の販売を行う代理店等に設置された端末機器である。外部デバイス30は、例えば、携帯電話機、スマートフォン、タブレット、又はPCである。「PC」は、personal computerの略語である。 ネットワーク40は、インターネット、少なくとも1つのWAN、少なくとも1つのMAN、又はこれらの任意の組合せを含む。「WAN」は、wide area networkの略語である。「MAN」は、metropolitan area networkの略語である。 図1を参照して、本実施形態の概要を説明する。 例えばRAG等の情報検索技術を使った対話システムを用いて、車両の諸元表を読み込ませることで、特定車両のスペックを問い合わせる質問に回答することが行われている。「RAG」は、Retrieval-Augmented Generationの略語である。このような対話システムを使用して、例えば、商談中に、顧客が希望する条件に合致する車種を検索することができる。しかしながら、顧客が希望する条件を、ユーザとしてのスタッフが自然言語の質問文で問い合わせる場合、質問文の表現の曖昧さが原因となり、クエリとしての検索条件式が正しく生成されない場合がある。例えば、顧客が希望する「車高」、「タイヤ外幅」、「トレッド幅」等の諸元の具体的な数値を検索条件としたい場合に、実際の対話等ではその数値の単位が発話されないことがある。その結果、検索条件を正しく特定することができなかった。 本実施形態では、情報処理装置20は、複数の車両について、1つ以上の属性を、属性の値である属性値と組み合わせてデータベースに登録する。情報処理装置20は、自然言語による質問文が入力されると、機械学習を用いて、属性に関連して質問文に示される検索条件を特定する。機械学習としては任意のものを使用することができるが、例えば、大規模言語モデル、NLP、意図認識モデル、NER、及びセマンティック検索等から選択される任意の自然言語処理技術を単独又は組み合わせて用いることができる。「NLP」は、Natural Language Processingの略語である。「NER」は、Named Entity Recognitionの略語である。情報処理装置20は、特定された検索条件に該当する車両をデータベースから選択するクエリを生成する。情報処理装置20は、クエリによるデータベースの検索結果を出力する。 本実施形態によれば、情報処理装置20は、自然言語による質問文が入力されると、機械学習を用いて、属性に関連して質問文に示される検索条件を特定する。例えば、質問文から特定された属性が「車高」であり、「車高」に関連して特定された検索条件としての参照値(属性値を検索するために参照する基準の値)が「1.55」である場合に、当該参照値が「1.55m」に修正される。よって、質問文に含まれる数値の単位が発話されず、質問文に曖昧な表現が含まれる場合であっても、検索条件が正しく特定されやすくなる。よって、自然言語の質問文から、特定のスペックに該当する製品を検索する技術が改善される。 図1を参照して、本実施形態に係る情報処理装置20の構成を説明する。 情報処理装置20は、制御部21と、記憶部22と、通信部23とを備える。制御部21は、少なくとも1つのプロセッサ、少なくとも1つのプログラマブル回路、少なくとも1つの専用回路、又はこれらの任意の組合せを含み、所定の処理を実行する。 記憶部22は、少なくとも1つの半導体メモリ、少なくとも1つの磁気メモリ、少なくとも1つの光メモリ、又はこれらのうち少なくとも2種類の組合せを含む。記憶部22には、情報処理装置20の動作に用いられるデータと、情報処理装置20の動作によって得られたデータとが記憶される。本実施形態において、記憶部22には、データベースDBが記憶されている。データベースDBについては後述する。 通信部23は、少なくとも1つの通信用インタフェースを含む。通信部23は、情報処理装置20の動作に用いられるデータを受信し、情報処理装置20の動作によって得られるデータを送信する。本実施形態において、通信部23は、外部デバイス30と通信を行う。 情報処理装置20の機能は、本実施形態に係るプログラムを、制御部21としてのプロセッサで実行することにより実現される。すなわち、情報処理装置20の機能は、ソフトウェアにより実現される。プログラムは、情報処理装置20の動作をコンピュータに実行させることで、コンピュータを情報処理装置20として機能させる。すなわち、コンピュータは、プログラムに従って情報処理装置20の動作を実行することにより情報処理装置20として機能する。 図2を参照して、本実施形態に係る情報処理装置20の動作を説明する。この動作は、本実施形態に係る情報処理方法に相当する。すなわち、本実施形態に係る情報処理方法は、図2に示したS1からS7のステップを含む。以下、フローチャートの各ステップをSと数字で特定する。 S1において、情報処理装置20の制御部21は、複数の車両について、1つ以上の属性を、属性の値である属性値と組み合わせてデータベースDBに登録する。本実施形態において、1つ以上の属性には、自動車の諸元が含まれる。制御部21は、複数の車両の諸元表を読み込むか、又は公開されている公式情報等を参照し、自動車の諸元を車両ごとに登録することができる。制御部21は、例えば、属性として、「車高」、「タイヤ外幅」、「トレッド幅」等を、その属性値である数値と共にデータベースDBに登録する。制御部21は、さらに、諸元表にない属性とその属性値を算出して、データベースDBに登録してもよい。例えば、立体駐車場の重要な制約条件の一つに「タイヤ外幅」がある。しかしながら、車両のカタログの諸元表には、一般に、「タイヤ外幅」の記載はない。「タイヤ外幅」とは、車両の左右のタイヤの外側の幅である。この場合、制御部21は、諸元表にある「トレッド幅」、「タイヤ幅(フロント/リア)」に基づいて、「タイヤ外幅」を算出してもよい。「タイヤ外幅」は、トレッド幅+フロント/リアタイヤ幅の最大値で算出できる。 S2において、情報処理装置20の制御部21は、自然言語による質問文を受け付ける。本実施形態において、質問文は、外部デバイス30に入力される。質問文は音声で入力されてもよいし、テキストで入力されてもよい。例えば、質問文は、外部デバイス30の入力部としてのマイクロフォン等を介して録音された商談中の音声、あるいは、商談中にスタッフが外部デバイス30の入力部としてのキーボード又はタッチスクリーン等を介して書き込んだテキストである。外部デバイス30は、入力された質問文を情報処理装置20に送信する。情報処理装置20の制御部21は、外部デバイス30から送信された質問文を、通信部23を介して受信する。制御部21は、受信した質問文を解析する。質問文の解析には、例えば、形態素解析、構文解析、意味解析等の任意の手法を用いることができる。 S3において、情報処理装置20の制御部21は、機械学習を使用して、質問文に示される検索条件を特定する。具体的には、制御部21は、検索条件として、車両の諸元を定義するための1つ以上のキーワードを抽出する。制御部21は、1つ以上のキーワードとして、車両の属性と、属性に対応付けられた参照値と、参照値との比較条件とを抽出する。「車両の属性」として抽出されるキーワードの例としては、例えば、「車高」、「タイヤ外幅」、「トレッド幅」を挙げることができる。「参照値」として抽出されるキーワードは、任意の数値である。「比較条件」として抽出されるキーワードの例としては、「等しい」、「等しくない」、「以上」、「以下」、「未満」等を挙げることができる。 S4において、情報処理装置20の制御部21は、抽出された参照値に対応付けられた属性に基づいて、当該参照値を調整する。具体的には、制御部21は、抽出された参照値に単位があるかどうかを判定し、単位がないと判定した場合に、属性と参照値の桁数に基づいて、参照値の単位を推定する。例えば、制御部21は、属性が「車高」である場合において、参照値が4桁であるときは、その単位を[mm]、参照値が1桁であるときは、その単位を[m]と推定する。ここで、桁数は、小数点以下を切り捨てた桁数である。実例として、S2において、「車高1.55以下の車両を教えて」という質問文が入力されたとする。ここで、「実例」とは、本開示を限定するためではなく、本実施形態の理解を助けるための例のことである。この場合、情報処理装置20の制御部21は、S3において、検索条件として、「車高」、「1.55」、「以下」というキーワードを、車両の属性と、属性に対応付けられた参照値と、参照値との比較条件として抽出する。ここでは、「車高」という属性に対応付けられた参照値として「1.55」が抽出されている。この場合、制御部21は、参照値の「1.55」から小数点以下を切り捨てて桁数を1桁と判定し、参照値「1.55」の単位を「m」と推定する。あるいは、S2において、「車高1550以下の車両を教えて」という質問文が入力されたとする。この場合、情報処理装置20の制御部21は、S3において、検索条件として、「車高」、「1550」、「以下」というキーワードを、車両の属性と、属性に対応付けられた参照値と、参照値との比較条件として抽出する。ここでは、「車高」という属性に対応付けられた参照値として「1550」が抽出されている。この場合、制御部21は、参照値の桁数を4桁と判定し、参照値「1550」の単位を「mm」と推定する。 本実施形態の一変形例として、情報処理装置20の制御部21は、参照値の単位を、データベースDBに登録されている単位に変換してもよい。具体的には、データベースDBに「車高」に対する属性値がメートルで登録されており、S4で推定された参照値の単位が「mm」であるとする。この場合、制御部21は、当該参照値をメートルに換算してもよい。例えば、制御部21は、参照値「1550mm」を「1.55m」に換算してもよい。 S5において、情報処理装置20の制御部21は、特定された検索条件に該当する車両をデータベースDBから選択するクエリを生成する。具体的には、制御部21は、S3において特定された検索条件、及びS4において調整された参照値をもとに、データベースDBに対するSQLクエリを生成する。「SQL」は、Structured Query Languageの略語である。例えば、S3において、検索条件として、「車高」(車両の属性)、「1.55」(参照値)、「以下」(参照値との比較条件)というキーワードが抽出され