Search

JP-2026075710-A - システム、エッジデバイス、及びそれらの制御方法

JP2026075710AJP 2026075710 AJP2026075710 AJP 2026075710AJP-2026075710-A

Abstract

【課題】従来の技術では、それぞれ人工知能による推論機能を備えるエッジデバイス同士を連携する場合、回答を得るまでに時間がかかっていた。 【解決手段】 デバイスA106の判定部332は、クライアント端末105またはエッジデバイスA106の操作部206から質問データが入力された場合、該質問データに対する推論処理を、エッジデバイスA106の推論部333、デバイスB、及び、アプリケーションサービスA103のうち、いずれで行うべきかを判定し(S721)、デバイスBで推論処理を行うべきと判定した場合に、アプリケーションサービスA103を経ることなくデバイスBに対して前記質問データを送信し、デバイスBから受信した回答データを、前記質問データの入力元である前記クライアント端末105または操作部206を介してユーザに提示する(S725、S726)。 【選択図】図7C

Inventors

  • 北形 圭

Assignees

  • キヤノン株式会社

Dates

Publication Date
20260511
Application Date
20241023

Claims (14)

  1. 複数のエッジデバイスを含むシステムであって、 前記各エッジデバイスは、 ユーザ操作を受け付ける操作手段と、 ネットワークと接続する通信手段と、 機械学習モデルを用いて質問データに対する回答データの推論処理を行う推論手段と、を有し、 前記複数のエッジデバイスのうち少なくとも一つのエッジデバイスは、 ネットワークを介して通信可能なクライアント端末または前記操作手段から質問データが入力された場合、該質問データに対する推論処理を、前記推論手段、このエッジデバイスとは別の前記エッジデバイス、及び、このエッジデバイスに対してネットワークを介して推論機能を提供するサービスのうち、いずれで行うべきかを判定する判定手段と、 前記別のエッジデバイスで推論処理を行うべきと判定された場合に、前記サービスを経ることなく該別のエッジデバイスに対して前記質問データを送信する送信手段と、 前記別のエッジデバイスから受信した、該別のエッジデバイスにおいて推論処理された前記質問データに対する回答データを、前記質問データの入力元である前記クライアント端末または前記操作手段を介してユーザに提示する提示手段と、を有し、 前記別のエッジデバイスは、 他のエッジデバイスから質問データを受信した場合、該別のエッジデバイスが備える推論手段により該質問データに対する回答データを推論して、該回答データを前記他のエッジデバイスに応答する応答手段と、を有する、 ことを特徴とするシステム。
  2. 前記システムは、前記各エッジデバイスに関する情報を管理する管理サービスを含み、 前記少なくとも一つのエッジデバイスは、前記管理サービスから前記各エッジデバイスに関する情報を取得する取得手段を有し、 前記判定手段は、前記判定に、前記取得した前記各エッジデバイスに関する情報を用いる、ことを特徴とする請求項1に記載のシステム。
  3. 前記各エッジデバイスに関する情報には、前記各エッジデバイスが備える前記推論手段による推論処理の精度を示す情報が含まれ、 前記各エッジデバイスに関する情報に含まれる前記推論処理の精度を示す情報は、前記各エッジデバイスで定期的に実行される該エッジデバイスが備える前記推論手段を用いた推論処理の結果に基づき前記管理サービスに登録され、 前記判定手段は、前記別のエッジデバイスで推論処理を行うべきと判定する場合には、前記別のエッジデバイスのうち前記推論処理の精度を示す情報がより高いエッジデバイスを、推論処理を行うべきエッジデバイスとする、ことを特徴とする請求項2に記載のシステム。
  4. 前記クライアント端末から前記各エッジデバイスに関する情報であるデバイス情報を受信した場合、前記判定手段は、前記判定に、前記受信した前記各エッジデバイスに関する情報を用いる、ことを特徴とする請求項1に記載のシステム。
  5. 前記各エッジデバイスに関する情報には、前記各エッジデバイスが備える前記推論手段による推論処理の精度を示す情報が含まれ、 前記判定手段は、前記別のエッジデバイスで推論処理を行うべきと判定する場合には、前記別のエッジデバイスのうち前記推論処理の精度を示す情報がより高いエッジデバイスを、推論処理を行うべきエッジデバイスとし、 前記各エッジデバイスに関する情報に含まれる前記推論処理の精度を示す情報は、前記各エッジデバイスで定期的に実行される該エッジデバイスが備える前記推論手段を用いた推論処理の結果に基づく、ことを特徴とする請求項4に記載のシステム。
  6. 前記各エッジデバイスには、家電製品、事務機のいずれかが含まれることを特徴とする請求項1~5のいずれか1項に記載のシステム。
  7. エッジデバイスであって、 ユーザ操作を受け付ける操作手段と、 ネットワークと接続する通信手段と、 機械学習モデルを用いて質問データに対する回答データの推論処理を行う推論手段と、 ネットワークを介して通信可能なクライアント端末または前記操作手段から質問データが入力された場合、該質問データに対する推論処理を、前記推論手段、このエッジデバイスと通信可能な別のエッジデバイス、及び、このエッジデバイスに対してネットワークを介して推論機能を提供するサービスのうち、いずれで行うべきかを判定する判定手段と、 前記別のエッジデバイスで推論処理を行うべきと判定された場合に、前記サービスを経ることなく該別のエッジデバイスに対して前記質問データを送信する送信手段と、 前記別のエッジデバイスから受信した、該別のエッジデバイスにおいて推論処理された前記質問データに対する回答データを、前記質問データの入力元である前記クライアント端末または前記操作手段を介してユーザに提示する提示手段と、 を有することを特徴とするエッジデバイス。
  8. 前記エッジデバイスおよび前記別のエッジデバイスに関する情報を管理する管理サービスから前記各エッジデバイスに関する情報を取得する取得手段を有し、 前記判定手段は、前記判定に、前記取得した前記各エッジデバイスに関する情報を用いる、ことを特徴とする請求項7に記載のエッジデバイス。
  9. 前記各エッジデバイスに関する情報には、前記各エッジデバイスによる推論処理の精度を示す情報が含まれ、 前記各エッジデバイスに関する情報に含まれる前記推論処理の精度を示す情報は、前記各エッジデバイスで定期的に実行される該エッジデバイスが備える前記推論手段を用いた推論処理の結果に基づき前記管理サービスに登録され、 前記判定手段は、前記別のエッジデバイスで推論処理を行うべきと判定する場合には、前記別のエッジデバイスのうち前記推論処理の精度を示す情報がより高いエッジデバイスを、推論処理を行うべきエッジデバイスとする、ことを特徴とする請求項8に記載のエッジデバイス。
  10. 前記クライアント端末から前記各エッジデバイスに関する情報であるデバイス情報を受信した場合、前記判定手段は、前記判定に、前記受信した前記各エッジデバイスに関する情報を用いる、ことを特徴とする請求項7に記載のエッジデバイス。
  11. 前記各エッジデバイスに関する情報には、前記各エッジデバイスによる推論処理の精度を示す情報が含まれ、 前記判定手段は、前記別のエッジデバイスで推論処理を行うべきと判定する場合には、前記別のエッジデバイスのうち前記推論処理の精度を示す情報がより高いエッジデバイスを、推論処理を行うべきエッジデバイスとし、 前記各エッジデバイスに関する情報に含まれる前記推論処理の精度を示す情報は、前記各エッジデバイスで定期的に実行される該エッジデバイスによる推論処理の結果に基づく、ことを特徴とする請求項10に記載のエッジデバイス。
  12. 前記エッジデバイスは、家電製品、事務機のいずれかであることを特徴とする請求項6~11のいずれか1項に記載のエッジデバイス。
  13. ユーザ操作を受け付ける操作手段と、ネットワークと接続する通信手段と、機械学習モデルを用いて質問データに対する回答データの推論処理を行う推論手段を有する複数のエッジデバイスを含むシステムの制御方法であって、 前記複数のエッジデバイスのうち少なくとも一つのエッジデバイスにより実行される、 ネットワークを介して通信可能なクライアント端末または前記操作手段から質問データが入力された場合、該質問データに対する推論処理を、前記推論手段、このエッジデバイスとは別の前記エッジデバイス、及び、このエッジデバイスに対してネットワークを介して推論機能を提供するサービスのうち、いずれで行うべきかを判定する判定工程と、 前記別のエッジデバイスで推論処理を行うべきと判定された場合に、前記サービスを経ることなく該別のエッジデバイスに対して前記質問データを送信する送信工程と、 前記別のエッジデバイスから受信した、該別のエッジデバイスにおいて推論処理された前記質問データに対する回答データを、前記質問データの入力元である前記クライアント端末または前記操作手段を介してユーザに提示する提示工程と、 前記別のエッジデバイスにより実行される、 他のエッジデバイスから質問データを受信した場合、該別のエッジデバイスが備える推論手段により該質問データに対する回答データを推論して、該回答データを前記他のエッジデバイスに応答する応答工程と、 を有することを特徴とするシステムの制御方法。
  14. ユーザ操作を受け付ける操作手段と、ネットワークと接続する通信手段と、機械学習モデルを用いて質問データに対する回答データの推論処理を行う推論手段を有するエッジデバイスの制御方法であって、 ネットワークを介して通信可能なクライアント端末または前記操作手段から質問データが入力された場合、該質問データに対する推論処理を、前記推論手段、このエッジデバイスと通信可能な別のエッジデバイス、及び、このエッジデバイスに対してネットワークを介して推論機能を提供するサービスのうち、いずれで行うべきかを判定する判定工程と、 前記別のエッジデバイスで推論処理を行うべきと判定された場合に、前記サービスを経ることなく該別のエッジデバイスに対して前記質問データを送信する送信工程と、 前記別のエッジデバイスから受信した、該別のエッジデバイスにおいて推論処理された前記質問データに対する回答データを、前記質問データの入力元である前記クライアント端末または前記操作手段を介してユーザに提示する提示工程と、 を有することを特徴とするエッジデバイスの制御方法。

Description

本発明は、システム、エッジデバイス、及びそれらの制御方法に関する。 近年、デバイスへの人工知能(AI:Artificial Intelligence)技術の導入は、デバイスの価値と競争力を高める重要な手段になっている。AIが支援する範囲は、日に日に多種多様になり、デバイスを使った作業の自動化、効率化や品質の向上に寄与している。 従来、AIによる推論処理の実行には、相応のコンピューティングリソースを必要としていたため、ネットワークを介したクラウドサービス等のリモート環境での実行に限られることが多かった。 しかし、機械学習モデルの軽量化等のチューニング技術の進化に加え、情報機器の性能向上により、エッジデバイス単体でのAIによる推論処理の実行が現実的になってきている。さらに、従来のリモート環境での実行と、エッジデバイス上でのローカル実行とを組み合わせることで、応答性を求める場合はエッジデバイス上で、より精度と汎用性を求める場合にはリモート環境でAIによる推論処理を実行するデバイスも現実的になってきている。 特許文献1には、従来のリモート環境での実行と、エッジデバイス上でのローカル実行を同時並行で行い、それらの推論のアンサンブル結果を求めることにより、それぞれの推論を調和させた結果を出す技術が提案されている。 特開2023―507618号公報 本実施形態に係るデバイス推論システムの全体構成の一例を示す図。デバイスの一般的なハードウェア構成の一例を示すブロック図。端末の一般的なハードウェア構成の一例を示すブロック図。デバイス管理サービス、アプリケーションサービスの一般的なハードウェア構成の一例を示すブロック図。本実施形態に係る各構成要素のソフトウェア構成の一例を示すブロック図。本実施形態に係る各構成要素のソフトウェア構成の一例を示すブロック図。本実施形態に係るデバイス登録処理において端末の表示部に表示される一連の画面を示す図。デバイスをアプリケーションサービスへ登録するシーケンスを示す図。デバイスをデバイス管理サービスに登録するシーケンスを示す図。端末の表示部に表示される推論要求、推論結果表示画面の一例を示す図。端末の表示部に表示される推論要求、推論結果表示画面の一例を示す図。本実施形態において推論処理を行うシーケンスの一例を示す図。本実施形態において推論処理を行うシーケンスの一例を示す図。本実施形態において推論処理を行うシーケンスの一例を示す図。本実施形態において推論処理を行うシーケンスの一例を示す図。第2実施例における推論モデルの精度値計る処理の一例を示すフローチャート。 以下、本発明を実施するための形態について図面を用いて説明する。 〔第1実施形態〕 図1は、本発明の一実施形態に係るデバイス推論システムの全体構成の一例を示す図である。 ネットワーク100~101は、本システムの各構成要素を接続するネットワークである。ネットワーク100~101は、例えば、LAN(Local Area Network)、WAN(Wide Area Network)、電話回線、専用デジタル回線、ATMやフレームリレー回線、ケーブルテレビ回線、データ放送用無線回線等により実現される通信ネットワークである。ネットワーク100~101は、各構成要素間でのデータ送受信が可能(通信可能)であればその種類を問わない。 本実施形態においては、デバイス管理サービス102と、アプリケーションサービスA103、アプリケーションサービスB104との接続において、ネットワーク100はインターネットであるとして説明する。また、デバイスA106、デバイスB107と端末105との接続において、ネットワーク101はイントラネットであるとして説明する。 デバイスA106、デバイスB107は、ネットワーク101に接続する機能および機械学習モデルを利用した推論処理(人工知能(AI:Artificial Intelligence)による推論処理)を単体で実行する機能を持った装置である。 これらの装置は、家電製品や事務機などの装置であり、具体的には、家電製品であれば洗濯機や空調製品や冷蔵庫や、電子レンジやオーブンなどの調理家電などであり、事務機であれば画像形成装置などである。また、これらの装置は、スチールカメラやビデオカメラなどの撮影装置であってもよい。これらの装置は、装置本来の機能に加えて前述する機能を備えた装置である。具体的な機能としては、例えば、洗濯機では、洗濯の完了時間を推定する機能であり、空調製品では、洗濯物を乾燥させるのに部屋を最適な温度、湿度に調整する設定値を推論する機能などである。また、例えば、画像形成装置では、印刷対象の電子データとユーザ情報から、最適な出力になるような印刷設定を推論する機能などである。また、カメラなどでは、最適な撮影設定を推論する機能や、カメラで撮影されている被写体が何であるかを推論や分析を行う機能などである。なお、本実施形態においては、これらの装置が家電製品である場合を例に説明を行うが、前述したネットワーク接続機能と機械学習モデルを利用した推論処理を実行する機能(人口知能による推論機能)の2点を満たしていれば、装置の種類を限定するものではない。以下、これらの装置を、デバイスまたはエッジデバイスともいう。 また、本実施形態においてデバイスA106、デバイスB107と分けて記載しているが、これらは、装置としても異なるタイプの装置であり、異なる機能を備えた装置であるとする。これらの装置が、ネットワーク接続機能と機械学習モデルを利用した推論処理を実行する機能を、それぞれの装置で備えることを前提とする。さらに、このような装置として、デバイスA106、デバイスB107のみが図示されているが、デバイスA106、デバイスB107以外にも、このような装置が備えられていてもよい。 端末105は、ネットワーク100~101に接続する機能を有し、デバイスA106、デバイスB107、デバイス管理サービス102に接続するクライアント端末である。具体的には、例えばスマートフォンのような携帯端末やタブレット端末、PC(パーソナルコンピュータ)等である。また、端末105は、ネットワーク接続機能と、音声認識・音声操作が可能なAIアシスタントを搭載しているスピーカーであるスマートスピーカー等であってもよい。なお、本実施形態においては、端末105をスマートフォンとして説明を行うが、前述したネットワーク接続機能とユーザインターフェースの機能を備えていれば、装置の種類を限定するものではない。 デバイス管理サービス102は、デバイスA106、デバイスB107等のデバイスの情報を管理するサービスである。ユーザ操作により端末105が、デバイス管理サービス102に、デバイスA106、デバイスB107の情報や端末105の情報を登録する。それによってユーザが、デバイスの推論処理の実行を指示することが可能となる。また、アプリケーションサービスA103、アプリケーションサービスB104は、その登録情報を参照することで、対象の機器に対しての機能の提供可否を判断する。 アプリケーションサービスA103とアプリケーションサービスB104は、ネットワーク100に接続する機能、および、機械学習モデルを利用した推論処理を単体で実行する機能を持ったサービスである。これらのサービスは、デバイスに合わせて存在するため、デバイスAに対応したサービスをアプリケーションサービスA、デバイスBに対応したサービスをアプリケーションサービスBと分けて記載する。具体的には、例えば、調理家電製品、空調家電製品と種別の異なるデバイスが複数存在していた場合は、それぞれ調理家電製品に対応するアプリケーションサービスAと、空調家電製品に対応するアプリケーションサービスBとが存在し、それぞれの機能サービスをデバイスA106、デバイスB107に提供する。また、アプリケーションサービスは、デバイス管理サービス102においてデバイスと関連付けられた端末105に対しても、機能サービスを提供する。 図1において、本実施形態での説明を簡潔にするため各構成要素をそれぞれ1台構成として図示している。しかし、構成上各要素の台数を制限、限定する意図はない。各構成要素はそれぞれ1台以上の複数の要素によって構成されていたとしても構わない。 図2Aは、本実施形態に係るデバイスA106、デバイスB107の一般的なハードウェア構成の一例を示すブロック図である。 CPU200は、ROM201に格納されているブートプログラムによりOS(Operating System)を起動する。また、CPU200は、そのOS上で外部記憶装置203に格納されているアプリケーションプログラムを実行することで、各種処理を実行する。 RAM202は、CPU200の作業領域として用いられる。 外部記憶装置203は、後述する図3Aに示すデバイスアプリケーション330、デバイス制御340アプリケーションなどの各プログラム、推論実行部211や学習部212が使用する機械学習モデル、デバイスの設定や履歴情報などの各種データを格納する。外部記憶装置203としては、HDD(Hard Disk Drive)やSSD(Solid State Drive)が当てはまる。 ネットワーク部204は、ネットワーク100に接続し、本実施形態におけるデバイス推論システムを構成する各要素と通信を行う。 CPU200には、システムバス210を介して、ROM201、RAM202および外部記憶装置203と共に、ネットワーク部204、操作I/F(Interface)205、表示I/F207、機器制御部209、推論実行部211、学習部212が接続される。 操作I/F205は、デバイスと操作部206を接続するインターフェースである。 操作部206は、キーボードやハードウェアキー、マイクなどで受け付けたユーザ入力データを、操作I/F205を介してCPU200に送出する。 表示I/F207は、デバイスと表示部208を接続するインターフェースである。 表示部208は、ディスプレイやスピーカーなどで、CPU200から送出されたデータを、表示I/F207を介して出力する。また、タッチパネルのように操作部206と表示部208の両方の機能を兼ね備えたものも存在し、その場合にはI/F205、207の両方に接続される。 機器制御部209は、CPU200が実行するアプリケーションプログラムにより行われる各処理のために、デバイスの動作制御を行う。デバイスA106がオーブンレンジと仮定すると、例えばユーザが加熱機能を選択した場合、CPU200は加熱機能を実行するために必要な構成部位、具体的にはヒーター、ファン、センサー等に対して、機器制御部209を介して、制御指示を送信する。 推論実行部211は、CPU200が実行するアプリケーションプログラムにおける推論処理を実行する。推論実行部211は、NPU(Neural Processing Unit)やGPU(Graphics Processing Unit)のように機械学習モデルを使用した推論処理に適した装置である。機械学習モデルの規模によっては、推論実行部211ではなくCPU200によって推論処理が実行される場合もある。 学習部212は、推論実行部211で実行された推論処理の結果を取得し、外部記憶装置203に格納された機械学習モデルの再学習処理を実行する。 なお、本実施形態においては推論処理および機械学習モデルの再学習処理の詳細については言及しない。 図2Bは、本実施形態に係る端末105の一般的なハードウェア構成の一例を示すブロック図である。基本的な構成要素は、前述したデバイスA106、デバイスB107と同様のため重複する構成要素については説明を省略する。なお、端末105の外部記憶