JP-2026076871-A - 回答生成方法及び回答生成プログラム
Abstract
【課題】非公開情報を外部流出することを防止しつつ、LLM又はRAGを活用する回答生成方法を提供する。 【解決手段】入力された質問が非公開情報に関する質問に該当するか否かを判定することと、前記入力された質問が非公開情報に関する質問に該当すると判定した場合、非公開情報の格納場所の情報を前記入力された質問に対する回答として取得することと、前記質問が非公開情報に関する質問に該当しないと判定した場合、複数の文書データが格納されたデータベースから前記質問に関連する1以上の文書データを取得し、対話型AIに入力するプロンプトを前記質問及び前記1以上の文書データに基づいて生成し、前記対話型AIに前記プロンプトを入力し、前記対話型AIの出力を前記入力された質問に対する回答として取得することと、取得した前記回答を表示することと、を含む。 【選択図】図1
Inventors
- 河合 英紀
Assignees
- トヨタ自動車株式会社
Dates
- Publication Date
- 20260512
- Application Date
- 20241024
Claims (5)
- 情報処理装置が実行する回答生成方法であって、 入力された質問が非公開情報に関する質問に該当するか否かを判定することと、 前記入力された質問が非公開情報に関する質問に該当すると判定した場合、非公開情報の格納場所の情報を前記入力された質問に対する回答として取得することと、 前記質問が非公開情報に関する質問に該当しないと判定した場合、 複数の文書データが格納されたデータベースから前記質問に関連する1以上の文書データを取得し、 対話型AIに入力するプロンプトを前記質問及び前記1以上の文書データに基づいて生成し、 前記対話型AIに前記プロンプトを入力し、 前記対話型AIの出力を前記入力された質問に対する回答として取得することと、 取得した前記回答を表示することと、 を含む、回答生成方法。
- 前記非公開情報の格納場所の情報は、前記データベースに集約されている、請求項1に記載の回答生成方法。
- 前記非公開情報の格納場所の情報を前記入力された質問に対する回答として取得することは、前記非公開情報の格納場所の情報を、前記情報処理装置が接続された社内システムから検索し、取得することを含む、請求項1に記載の回答生成方法。
- 前記対話型AIとの対話記録を記憶することと、 前記対話記録に基づいて前記質問を補完することと、 をさらに含む、請求項1に記載の回答生成方法。
- 回答生成プログラムであって、 情報処理装置に、 入力された質問が非公開情報に関する質問に該当するか否かを判定することと、 前記入力された質問が非公開情報に関する質問に該当すると判定した場合、非公開情報の格納場所の情報を前記入力された質問に対する回答として取得することと、 前記質問が非公開情報に関する質問に該当しないと判定した場合、 複数の文書データが格納されたデータベースから前記質問に関連する1以上の文書データを取得し、 対話型AIに入力するプロンプトを前記質問及び前記1以上の文書データに基づいて生成し、 前記対話型AIに前記プロンプトを入力し、 前記対話型AIの出力を前記入力された質問に対する回答として取得することと、 取得した前記回答を表示することと、 を含む処理を実行させる、回答生成プログラム。
Description
本開示は、回答生成方法及び回答生成プログラムに関する。 特許文献1には、与えられた技術分野に基づいて、大規模言語モデル(LLM:Large Language Models)を利用して当該技術分野に特化した対話ボットを生成する技術が開示されている。 特開2023-076413号公報 本開示の一実施形態に係る回答生成システムの構成を示すブロック図である。本開示の一実施形態に係る回答生成システムの動作例を示すフローチャートである。 以下、本開示の一実施形態について、図面を参照して説明する。各図面中、同一の構成又は機能を有する部分には、同一の符号を付している。本実施形態の説明において、同一の部分については、重複する説明を適宜省略又は簡略化する場合がある。 図1を参照して、本開示の一実施形態に係る回答生成システム1の構成を説明する。 回答生成システム1は、情報処理装置10と、第1サーバ20と、第2サーバ30と、を備える。 情報処理装置10は、制御部11と、記憶部12と、通信部13と、入力部14と、出力部15と、を備える。情報処理装置10は、例えばワークステーション、パソコン、スマートフォン、タブレット等のような汎用のコンピュータである。情報処理装置10は、ユーザからの質問を受け付け、当該質問が非公開情報に関するものであるか判定し、第1サーバ20及び第2サーバ30から適切な情報を受信した上で当該質問に対する回答を生成する。 制御部11は、1つ以上のプロセッサ、1つ以上の専用回路又はこれらの組合せを含み、所定の処理を実行する。プロセッサはCPU(Central Processing Unit)若しくはGPU(Graphics Processing Unit)などの汎用プロセッサ、又は特定の処理に特化した専用プロセッサである。専用回路は、例えば、FPGA(Field-Programmable Gate Array)又はASIC(Application Specific Integrated Circuit)である。制御部11は、情報処理装置10の動作に関わる種々の処理を実行するとともに、情報処理装置10の各部を制御する。 記憶部12は、少なくとも1つの半導体メモリ、少なくとも1つの磁気メモリ、少なくとも1つの光メモリ、又はこれらのうち少なくとも2種類の組合せを含む。記憶部12は、情報処理装置10の動作に用いられるデータと、情報処理装置10の動作によって得られたデータとを記憶する。本開示の一実施形態において、記憶部12は、情報処理装置10と第2サーバ30との対話記録を記憶する。また、記憶部12は、外部と通信を行わずに文章を生成する文章生成AIを記憶していてよい。 通信部13は、少なくとも1つの通信用インタフェースを含む。通信部13は、情報処理装置10の動作に用いられるデータを受信し、また情報処理装置10の動作によって得られるデータを送信する。本開示の一実施形態において、通信部13は、ネットワークを介して、第1サーバ20及び第2サーバ30と通信を行う。 入力部14は、1つ以上の入力用インタフェースを含む。入力用インタフェースは、例えば、物理キー、静電容量キー、ポインティングデバイス、ディスプレイと一体的に設けられたタッチスクリーン、又は音声入力を受け付けるマイクロフォンである。入力部14は、情報処理装置10の動作に用いられる情報を入力する操作を受け付ける。 出力部15は、1つ以上の出力用インタフェースを含む。出力用インタフェースは、例えば、情報を画像・映像として出力する外付け又は内蔵のディスプレイ又は外部の出力機器との接続インタフェースである。ディスプレイは、例えば、LCD(Liquid Crystal Display)又は有機EL(Electro Luminescence)ディスプレイである。出力部15は、情報処理装置10の動作によって得られる情報を出力する。 第1サーバ20は、例えばデータセンタ等に設置されるサーバ装置である。第1サーバ20は、例えば、外部に接続されていない社内システムであってもよい。第1サーバ20は、非公開情報を含む自社製品情報及び社内情報等を集約したデータベースを備える。第1サーバ20は、情報処理装置10からの要求に応じ、情報又は情報の格納場所の情報を情報処理装置10へ送信する。 第2サーバ30は、例えばデータセンタ等に設置されるサーバ装置である。第2サーバ30は、生成AIを備える。第2サーバ30は、情報処理装置10から受信した情報等を生成AIに入力し、回答となる文章を生成し、情報処理装置10へ送信する。生成AIは、例えばLLMを使用する任意の対話型AIを含む。 以下、本開示の一実施形態に係る回答生成方法を説明する。 情報処理装置10の制御部11は、入力部14を介して、ユーザからの質問を受け付けると、当該質問が非公開情報に関連する質問であるか判定する。判定方法は特に限定されないが、例えば質問文に非公開情報に関するキーワードが含まれているか否かを確認する方法でよい。 当該質問が非公開情報に関連する質問である場合、情報処理装置10の制御部11は、第1サーバ20が備えるデータベースから当該質問に関する情報を検索し、抽出する。制御部11は、抽出された情報の格納場所の情報を第1サーバ20から取得する。格納場所の情報は、例えばファイルパス、リンク、URL等である。その後、制御部11は、当該質問への回答が格納場所の情報であることを示す文章を生成し、当該質問への回答として出力部15に出力する。 当該質問が非公開情報に関連しない質問である場合、回答生成システム1は、RAGを活用して入力された質問に対する回答を生成する。具体的に、情報処理装置10の制御部11は、第1サーバ20が備えるデータベースから当該質問に関する情報を検索し、1以上の情報を抽出する。抽出される情報は、例えば文書データであるが、これに限られず、例えばテキストデータを含む画像データ等であってもよい。その後、制御部11は、質問を基に第2サーバ30の備える生成AIが対応可能なプロンプトを作成し、第1サーバ20から取得した情報とともに第2サーバ30へ送信する。第2サーバ30は、情報処理装置10から受信したプロンプト及び情報を基に、生成AIを用いて回答を生成する。情報処理装置10の制御部11は、第2サーバ30より受信した回答を出力部15に出力する。 以下、図2を参照して、本開示の一実施形態に係る回答生成システム1を用いた回答生成方法について説明する。図2は、本開示の一実施形態に係る回答生成システム1の動作例を示すフローチャートである。 ステップS1において、情報処理装置10の制御部11は、入力部14を介して、ユーザからの質問を受け付ける。制御部11は、通常の文章形式で質問を受け付けてもよいし、プロンプト形式で質問を受け付けてもよい。 ステップS2において、情報処理装置10の制御部11は、ステップS1で受け付けた質問が非公開情報に関連する質問であるか判定する。判定方法は、例えば受け付けた質問に、予め非公開情報に関するものとして設定されたキーワードが含まれている場合には、非公開情報に関連する質問であると判定してよい。制御部11が非公開情報に関連する質問であると判定した場合(ステップS2:Yes)、ステップS3に進む。制御部11が非公開情報に関連しない質問であると判定した場合(ステップS2:No)、ステップS6に進む。 ステップS3において、情報処理装置10の制御部11は、第1サーバ20が備えるデータベースから、ステップS1で受け付けた質問に関連する情報を検索及び抽出する。 ステップS4において、情報処理装置10の制御部11は、ステップS3で抽出した情報の格納場所の情報を第1サーバ20から取得する。 ステップS5において、情報処理装置10の制御部11は、ステップS1で受け付けた質問に対する回答がステップS4で取得した格納場所の情報であることを示す文章を生成し、当該文章を回答として出力部15に出力し、処理を終了する。回答として生成される文章は、例えば「非公開情報ですので、<格納場所の情報>をご確認ください。」などであってよい。 ステップS6において、情報処理装置10の制御部11は、第1サーバ20が備えるデータベースから、ステップS1で受け付けた質問に関連する情報を検索及び抽出する。 ステップS7において、情報処理装置10の制御部11は、ステップS3で抽出した情報を第1サーバ20から取得する。 ステップS8において、情報処理装置10の制御部11は、ステップS1で受け付けた質問を基に第2サーバ30の備える生成AIが対応可能なプロンプトを生成する。制御部11は、生成したプロンプトとステップS6で取得した情報を第2サーバ30へ送信する。第2サーバ30は、情報処理装置10から、プロンプト及び情報を受信する。 ステップS9において、第2サーバ30は、情報処理装置10から受信したプロンプト及び情報を生成AIに入力し、回答を生成する。第2サーバ30は、回答を生成すると、情報処理装置10へ送信する。 ステップS8で第2サーバ30が受信したプロンプト及び情報では回答の生成に不足する場合、第2サーバ30は、情報処理装置10に不足する情報等について問合せを行ってよい。情報処理装置10の制御部11は、サーバ装置30から問合せを受けると、質問を基に当該問合せの回答となるプロンプトを生成又は必要な情報を第1サーバから取得し、第2サーバ30に送信してよい。情報処理装置10の制御部11は、質問だけでは当該問合せの回答となるプロンプトの作成に必要な情報が不足する場合、出力部15に質問の補足を求める表示を出力してもよい。質問の補足が入力部14に入力されると、制御部11は、当該補足を基にプロンプトの生成又は必要な情報を第1サーバ20から取得し、第2サーバ30に送信してよい。 情報処理装置10の制御部11は、第2サーバ30が備えている対話型AIとの過去の対話記録に基づいて、質問を補完してもよい。補完のタイミングは特に限定されないが、例えば、情報処理装置10の制御部11は、第2サーバ30から問合せを受けたタイミングで質問の補完を行ってよい。 ステップS10において、情報処理装置10の制御部11は、第2サーバ30から回答を受信すると、当該回答を出力部15に出力し、処理を終了する。 以上の方法をとることにより、非公開情報に関連する質問に対しては、情報処理装置10と第1サーバ20の間の情報共有のみで回答の生成ができるため、生成AIの使用により非公開情報が外部へ流出するリスクを低減させることができる。一方、非公開情報に関連しない質問に対しては、RAGを活用することにより、的確な回答を短時間で生成することができる。 本開示は上述の実施形態に限定されるものではない。例えば、ブロック図に記載の複数のブロックを統合してもよいし、又は1つのブロックを分割してもよい。フローチャートに記載の複数のステップを記述に従って時系列に実行する代わりに、各ステップを実行する装置の処理能力に応じて、又は必要に応じて、並列的に又は異なる順序で実行してもよい。その他、本開示の趣旨を逸脱しない範囲での変更が可能である。 また、第1サーバが社内システムである場合、情報処理装置10の制御部11は、社内システムがデータベース外に格納している情報を検索及び抽出してもよい。