Search

JP-2026077224-A - 応答出力システムおよび応答出力装置

JP2026077224AJP 2026077224 AJP2026077224 AJP 2026077224AJP-2026077224-A

Abstract

【課題】より好適な人工知能応答出力技術を提供すること。本発明によれば、持続可能な開発目標(SDGs)の「9産業と技術革新の基盤をつくろう」、「11住み続けられるまちづくりを」に貢献する。 【解決手段】応答出力システムであって、大規模言語モデルと、ユーザ入力を受け付ける入力部と、ユーザ入力に基づいて大規模言語モデルに対する指示文を生成し、指示文に対して大規模言語モデルが生成する応答を取得する制御部と、制御部が取得した応答をユーザに向けて出力する出力部と、を備え、制御部は、ユーザ入力から取得されるユーザ感情を分類する感情タイプに関する情報を大規模言語モデルに送信し、大規模言語モデルは、感情タイプに応じて選択された応答モードに従って応答を生成し、出力部は、応答モードに応じた出力条件で、応答をユーザに向けて出力する。 【選択図】図7

Inventors

  • 下田 望
  • 清水 拓也
  • 鋪田 和夫

Assignees

  • マクセル株式会社

Dates

Publication Date
20260513
Application Date
20241025

Claims (20)

  1. 応答出力システムであって、 大規模言語モデルと、 ユーザ入力を受け付ける入力部と、 前記ユーザ入力に基づいて前記大規模言語モデルに対する指示文を生成し、前記指示文に対して前記大規模言語モデルが生成する応答を取得する制御部と、 前記制御部が取得した前記応答をユーザに向けて出力する出力部と、を備え、 前記制御部は、前記ユーザ入力から取得されるユーザ感情を分類する感情タイプに関する情報を前記大規模言語モデルに送信し、 前記大規模言語モデルは、前記感情タイプに応じて選択された応答モードに従って前記応答を生成し、 前記出力部は、前記応答モードに応じた出力条件で、前記応答を前記ユーザに向けて出力する、 応答出力システム。
  2. 請求項1に記載の応答出力システムにおいて、 前記応答モードの選択は、前記感情タイプと、前記ユーザにより指定される応答スタイルと、に基づいて行われる、 応答出力システム。
  3. 請求項1に記載の応答出力システムにおいて、 前記感情タイプに関する情報には、主感情タイプを示す情報と、前記主感情タイプをさらに分類する副感情タイプを示す情報と、が含まれ、 前記感情タイプは、前記主感情タイプと副感情タイプとの組み合わせによって判別される、 応答出力システム。
  4. 請求項1に記載の応答出力システムにおいて、 前記応答モードの選択は、前記大規模言語モデルにより前記応答が生成される毎に行われる、 応答出力システム。
  5. 請求項1に記載の応答出力システムにおいて、 前記応答モードの選択は、前記大規模言語モデルにより前記応答が生成された回数が、予め設定される設定回数に達する毎に行われる、 応答出力システム。
  6. 請求項1に記載の応答出力システムにおいて、 前記制御部は、前記ユーザ入力における感情語句および感情要素の少なくとも一方の評価値を取得し、 前記感情タイプは、前記評価値に基づいて判別される、 応答出力システム。
  7. 請求項6に記載の応答出力システムにおいて、 記憶部を有し、 前記評価値は、複数回の前記ユーザ入力が行われる間、前記記憶部に蓄積され、 前記応答モードの選択は、前記評価値が積算された積算評価値が予め設定される積算閾値に達したことを条件に行われる、 応答出力システム。
  8. 請求項6に記載の応答出力システムにおいて、 前記制御部は、前記評価値に基づいて前記感情タイプの判別を行い、前記感情タイプの判別結果の情報を、前記感情タイプに関する情報として前記大規模言語モデルに送信する、 応答出力システム。
  9. 請求項6に記載の応答出力システムにおいて、 前記制御部は、前記感情語句および前記感情要素についての評価値の情報を、前記感情タイプに関する情報として前記大規模言語モデルに送信し、 前記大規模言語モデルが、前記評価値に基づいて前記感情タイプの判別を行う、 応答出力システム。
  10. 請求項6に記載の応答出力システムにおいて、 前記制御部が、前記評価値に基づいて前記感情タイプの判別を行い、前記感情タイプに応じて前記応答モードを選択し、前記応答モードの選択結果の情報を、前記感情タイプに関する情報として前記大規模言語モデルに送信する、 応答出力システム。
  11. 請求項6に記載の応答出力システムにおいて、 前記大規模言語モデルは、前記応答モードのそれぞれに対応する複数の応答モデルを含む大規模言語モデル群として構成され、 前記制御部は、前記評価値に基づいて前記感情タイプの判別を行い、前記感情タイプに応じて前記応答モードを選択し、選択した前記応答モードに対応する前記応答モデルに前記指示文を送信する、 応答出力システム。
  12. 請求項1に記載の応答出力システムにおいて、 前記出力部は、前記大規模言語モデルにより生成される応答を前記ユーザに向けて音声出力し、 前記出力条件には、前記応答の読み上げ速度、読み上げ音声のトーン、または読み上げ音声の大きさの条件が含まれる、 応答出力システム。
  13. 請求項1に記載の応答出力システムにおいて、 前記出力条件には、前記入力部により前記ユーザ入力が受け付けられてから、前記出力部による出力が行われるまでの時間の条件が含まれる、 応答出力システム。
  14. 請求項1に記載の応答出力システムであって、 前記大規模言語モデルは、インターネットに接続されたサーバに格納され、 前記制御部は、前記サーバとは異なる装置に格納されるものであり、 前記大規模言語モデルと前記制御部とは、前記インターネットを介して情報の送受信を行う、 応答出力システム。
  15. 応答出力装置であって、 ユーザ入力を受け付ける入力部と、 前記ユーザ入力に基づいて大規模言語モデルに対する指示文を生成し、前記指示文に対して前記大規模言語モデルが生成する応答を取得する制御部と、 前記制御部が取得した前記応答をユーザに向けて出力する出力部と、を備え、 前記制御部は、前記ユーザ入力から取得されるユーザ感情を分類する感情タイプに関する情報を前記大規模言語モデルに送信し、前記感情タイプに応じて選択された応答モードに従って前記大規模言語モデルにより生成される前記応答を受信し、 前記出力部は、前記応答モードに応じた出力条件で、前記応答を前記ユーザに向けて出力する、 応答出力装置。
  16. 請求項15に記載の応答出力装置において、 前記制御部は、前記ユーザ入力における感情語句および感情要素の少なくとも一方の評価値を取得し、前記感情タイプに関する情報として、前記感情語句および前記感情要素についての評価値の情報を前記大規模言語モデルに送信する、 応答出力装置。
  17. 請求項15に記載の応答出力装置において、 前記制御部は、前記ユーザ入力における感情語句および感情要素の少なくとも一方の評価値を取得し、前記評価値に基づいて前記感情タイプの判別を行い、前記感情タイプの判別結果の情報を、前記感情タイプに関する情報として前記大規模言語モデルに送信する、 応答出力装置。
  18. 請求項15に記載の応答出力装置において、 前記制御部は、前記ユーザ入力における感情語句および感情要素の少なくとも一方の評価値を取得し、前記評価値に基づいて前記感情タイプの判別を行い、前記感情タイプに応じて前記応答モードを選択し、前記応答モードの選択結果の情報を、前記感情タイプに関する情報として前記大規模言語モデルに送信する、 応答出力装置。
  19. 請求項15に記載の応答出力装置において、 前記出力部は、前記応答を前記ユーザに向けて音声出力し、 前記出力条件には、前記応答の読み上げ速度、読み上げ音声のトーン、または読み上げ音声の大きさの条件が含まれる、 応答出力装置。
  20. 請求項15に記載の応答出力装置において、 前記出力条件には、前記入力部により前記ユーザ入力を受け付けてから、前記出力部による出力が行われるまでの時間の条件が含まれる、 応答出力装置。

Description

本発明は、応答出力システムおよび応答出力装置に関する。 言語モデルなどの人工知能を用いた応答出力技術については、例えば、特許文献1に開示されている。 特表2019―528512号公報 本発明の一実施例に係る人工知能応答出力装置およびシステムの一例を示す図である。本発明の一実施例に係る人工知能応答出力装置の一例を示す図である。本発明の一実施例に係る人工知能応答出力装置およびシステムの動作の一例を示す図である。本発明の一実施例に係るキャラクター会話装置およびキャラクター会話システムの一例の説明図である。本発明の一実施例に係るキャラクター会話装置およびキャラクター会話システムの動作の一例の説明図である。本発明の一実施例に係るキャラクター会話装置およびキャラクター会話システムの動作の一例の説明図である。本発明の一実施例に係るキャラクター会話装置およびキャラクター会話システムにける会話の一例の説明図である。本発明の一実施例に係るキャラクター会話装置およびキャラクター会話システムの動作の一例の説明図である。本発明の一実施例に係るキャラクター会話装置およびキャラクター会話システムの動作の一例の説明図である。本発明の一実施例に係るキャラクター会話装置およびキャラクター会話システムの動作の一例の説明図である。本発明の一実施例に係るキャラクター会話装置およびキャラクター会話システムの動作の一例の説明図である。本発明の一実施例に係るキャラクター会話装置およびキャラクター会話システムの動作の一例の説明図である。本発明の一実施例に係るキャラクター会話装置およびキャラクター会話システムの動作の一例の説明図である。本発明の一実施例に係るキャラクター会話装置およびキャラクター会話システムの動作の一例の説明図である。本発明の一実施例に係るキャラクター会話装置およびキャラクター会話システムの動作の一例の説明図である。本発明の一実施例に係るキャラクター会話装置およびキャラクター会話システムの一例の説明図である。本発明の一実施例に係るキャラクター会話装置およびキャラクター会話システムの動作の一例の説明図である。本発明の一実施例に係るキャラクター会話装置およびキャラクター会話システムの動作の一例の説明図である。本発明の一実施例に係るキャラクター会話装置およびキャラクター会話システムにける会話の一例の説明図である。本発明の一実施例に係るキャラクター会話装置およびキャラクター会話システムの動作の一例の説明図である。本発明の一実施例に係るキャラクター会話装置およびキャラクター会話システムの動作の一例の説明図である。本発明の一実施例に係るキャラクター会話装置およびキャラクター会話システムの動作の一例の説明図である。本発明の一実施例に係るキャラクター会話装置およびキャラクター会話システムの動作の一例の説明図である。本発明の一実施例に係るキャラクター会話装置およびキャラクター会話システムの動作の一例の説明図である。本発明の一実施例に係るキャラクター会話装置およびキャラクター会話システムの動作の一例の説明図である。本発明の一実施例に係るキャラクター会話装置およびキャラクター会話システムの動作の一例の説明図である。本発明の一実施例に係る人工知能応答出力装置の動作の一例の説明図である。本発明の一実施例に係る人工知能応答出力装置の表示例の一例の説明図である。本発明の一実施例に係る人工知能応答出力装置の表示例の一例の説明図である。本発明の一実施例に係る人工知能応答出力装置の表示例の一例の説明図である。本発明の一実施例に係る人工知能応答出力装置の応答生成処理の一例の説明図である。本発明の一実施例に係る人工知能応答出力装置およびシステムの一例の説明図である。本発明の一実施例に係る人工知能応答出力システムの構成の一例の説明図である。本発明の一実施例に係る人工知能応答出力システムの構成の一例の説明図である。本発明の一実施例に係る人工知能応答出力システムの構成の一例の説明図である。本発明の一実施例の説明に用いる会話例の一例の説明図である。本発明の一実施例の説明に用いる会話例の一例の説明図である。本発明の一実施例に係る人工知能応答出力システムの処理の一例を示すフローチャートである。本発明の一実施例に係る人工知能応答出力装置の一例の説明図である。本発明の一実施例に係る感情タイプの情報の一例を示す図である。本発明の一実施例に係る感情タイプの情報の一例を示す図である。本発明の一実施例に係る感情タイプの情報の一例を示す図である。本発明の一実施例に係る感情タイプの情報の一例を示す図である。本発明の一実施例に係る感情タイプの情報の一例を示す図である。本発明の一実施例に係る感情タイプの情報の一例を示す図である。本発明の一実施例に係る応答モードの情報の一例を示す図である。本発明の一実施例に係る出力条件の情報の一例を示す図である。本発明の一実施例に係る応答モードの情報の一例を示す図である。本発明の一実施例に係る感情タイプの情報の一例を示す図である。本発明の一実施例に係る人工知能応答出力装置およびシステムの一例の説明図である。本発明の一実施例に係る人工知能応答出力システムの処理の一例を示すフローチャートである。本発明の一実施例に係る人工知能システムにおける会話例の一例の説明図である。本発明の一実施例に係る人工知能システムにおける会話例の一例の説明図である。本発明の一実施例に係る人工知能システムにおける会話例の一例の説明図である。本発明の一実施例に係る人工知能応答出力システムの処理の一例を示すフローチャートである。本発明の一実施例に係る人工知能システムにおける会話例の一例の説明図である。本発明の一実施例に係る人工知能応答出力システムの処理の一例を示すフローチャートである。本発明の一実施例に係る人工知能応答出力システムの処理の一例を示すフローチャートである。本発明の一実施例に係る人工知能応答出力システムの処理で用いられる閾値の一例を示す図である。本発明の一実施例に係る応答モードの遷移の一例を説明する図である。本発明の一実施例に係る情報テーブルの一例の説明図である。 以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、本発明は実施例の説明に限定されるものではなく、本明細書に開示される技術的思想の範囲内において当業者による様々な変更および修正が可能である。また、本発明を説明するための全図において、同一の機能を有するものには、同一の符号を付与し、その繰り返しの説明は省略する場合がある。 なお、本発明の各実施例に係る人工知能応答出力装置が表示画面を有する場合は、表示装置と呼んでもよい。人工知能応答出力装置が音声出力機能を有する場合は、音声出力装置と呼んでもよい。人工知能応答出力装置は単に情報処理装置と呼んでもよい。人工知能応答出力装置と、大規模言語モデルを保持する大規模言語モデルサーバを含むシステムを人工知能応答出力システムと呼んでもよい。また、人工知能応答出力装置が人工知能である大規模言語モデルの応答サービスをユーザに提供し、ユーザの助力になる場合は、人工知能応答出力装置または人工知能応答出力装置の表示出力は、ユーザにとって人工知能(AI)アシスタントとなることができる。よって、この場合、人工知能応答出力装置はAIアシスタント装置またはAIアシスタント表示装置と呼んでもよい。同様に、この場合、人工知能応答出力装置と、大規模言語モデルを保持する大規模言語モデルサーバを含むシステムをAIアシスタントシステムまたはAIアシスタント表示システムと呼んでもよい。また、この場合、人工知能応答出力装置は、ユーザと人工知能の間のインタフェースとなるので、人工知能インタフェース装置と呼んでもよい。この場合、人工知能応答出力装置と、大規模言語モデルを保持する大規模言語モデルサーバを含むシステムを人工知能インタフェースシステムと呼んでもよい。 <実施例1> 本発明の実施例1として、大規模言語モデル人工知能からの応答を出力する人工知能応答出力装置およびそのシステムについて、説明する。 図1Aを用いて、本発明の人工知能応答出力装置10010の一例について説明する。また、当該人工知能応答出力装置10010が大規模言語モデルサーバ19001と通信などにより連携する場合について、人工知能応答出力装置10010が大規模言語モデルサーバ19001および/またはマルチモーダルな大規模言語モデルサーバ20001とを含むシステムの一例について説明する。 図1Aの例では、人工知能応答出力装置10010は、表示部10011を有する。図1Aの例では、表示部10011は、平面ディスプレイでもよく、背面から映像を投影するスクリーンでもよく、光学像を空中に結像する空中浮遊映像でもよい。表示部10011が平面ディスプレイの場合は、液晶パネルとバックライトを有する液晶ディスプレイでもよい。また、表示部10011は、プラズマディスプレイでもよい。表示部10011は、画素が自発光する有機ELディスプレイでもよい。また、表示部10011はタッチ操作入力センサを設け、タッチパネルとして構成してもよい。 図1Aの例では、人工知能応答出力装置10010が備える音声出力部1140はスピーカで構成されている。また、人工知能応答出力装置10010がマイク1139を備え、ユーザの声を収音できる。当該マイク1139からの音声入力や、後述する操作入力部を介したユーザの操作入力により、人工知能応答出力装置10010は、人工知能である大規模言語モデルへの指示文(プロンプト)の元となるユーザ入力を取得することができる。 人工知能応答出力装置10010は、人工知能応答出力装置10010にローカルの大規模言語モデルを備えてもよい。この場合、当該大規模言語モデルの応答を上記表示部10011の表示出力、および/または、音声出力部1140の音声出力として出力してもよい。 また、人工知能応答出力装置10010は、ローカルの大規模言語モデルを備えず、外部の大規模言語モデルサーバ19001と通信し、大規模言語モデルサーバ19001から受信する応答を上記表示部10011の表示出力、および/または、音声出力部1140の音声出力として出力してもよい。 または、人工知能応答出力装置10010は、ローカルの大規模言語モデルも備え、さらに、大規模言語モデルを有する外部の大規模言語モデルサーバ19001またはマルチモーダルな大規模言語モデルを有する外部の大規模言語モデルサーバ20001と通信するように構成してもよい。この場合、当該ローカルの大規模言語モデルの応答と、大規模言語モデルサーバ19001の大規模言語モデルまたはマルチモーダルな大規模言語モデルサーバ20001のマルチモーダルな大規模言語モデルから受信する応答とを、切り替えて、いずれか一方を、上記表示部10011の表示出力、および/または、音声出力部1140の音声出力として出力してもよい。または、当該ローカルの大規模言語モデルの応答と、大規模言語モデルサーバ19001の大規模言語モデルまたはマルチモーダルな大規模言語モデルサーバ20001のマルチモーダルな大規模言語モデルから受信する応答の両者にもとづいて生成した応答を、上記表示部10011の表示出力、および/または、音声出力部1140の音声出力として出力してもよい。 人工知能応答出力装置10010が外部の大規模言語モデルサーバ19001または大規模言語モデルサーバ20001と通信して連携する場合の構成は、以下のとおりである。人工知能応答出力装置10010は、通信部1132を介して、インターネット19000に接続された通信装置19011と通信可能である。図1Aの例では、通信部1132と通信装置19011との通信は無線の例を示しているが、有線通信でも構わない。通信部1132と通信装置19011までの通信経路にお