JP-2026077666-A - 遠隔会議制御装置
Abstract
【課題】遠隔会議における会話音声の品質を保つ。 【解決手段】サーバ装置20は、第1の遠隔会議に参加している第1のユーザと、第2の遠隔会議に参加している第2のユーザとが共通の空間に居るか否かを判断する判断部224と、前記第1の遠隔会議に参加している第1のユーザと、前記第2の遠隔会議に参加している第2のユーザとが共通の空間に居ると判断された場合に、前記第1のユーザが発話している期間において、前記第2のユーザに対応するマイクによって収音された音声から、前記第1のユーザに対応するマイクによって収音された音声に応じた音声成分を減算する処理を行う減算処理部225とを備える。 【選択図】図7
Inventors
- 村上 真衣子
- 森下 真幸
- 合田 晶生
Assignees
- 株式会社NTTドコモ
Dates
- Publication Date
- 20260513
- Application Date
- 20260205
Claims (7)
- 第1の遠隔会議に参加している第1のユーザと、第2の遠隔会議に参加している第2のユーザとが共通の空間に居るか否かを判断する判断部と、 前記第1の遠隔会議に参加している第1のユーザと、前記第2の遠隔会議に参加している第2のユーザとが共通の空間に居ると判断された場合に、前記第1のユーザが発話している期間において、前記第2のユーザに対応するマイクによって収音された音声から、前記第1のユーザに対応するマイクによって収音された音声に応じた音声成分を減算する処理を行う減算処理部と を備えることを特徴とする遠隔会議制御装置。
- 前記第1のユーザ及び前記第2のユーザが同時に発話している場合において、 前記減算処理部は、前記第1のユーザに対応するマイクによって収音された音声のうち最大音量に対応する音声に応じた音声成分を、前記第2のユーザに対応するマイクによって収音された音声から減算する ことを特徴とする請求項1記載の遠隔会議制御装置。
- 前記第1のユーザ及び前記第2のユーザが、音声を無線で送受信するワイヤレスマイク又はワイヤレスイヤホン、及び、無線装置を用いている場合に、 前記減算処理部は、前記ワイヤレスマイク又はワイヤレスイヤホン、及び、無線装置間の距離に応じて前記減算を行う ことを特徴とする請求項1記載の遠隔会議制御装置。
- 前記第1のユーザ及び前記第2のユーザが同時に発話している場合において、 前記減算処理部は、前記第1のユーザに対応するマイクによって収音された音声のうち、前記第1のユーザと前記第2のユーザがそれぞれ遠隔会議に用いる端末間の距離に応じた大きさの音声成分を、前記第2のユーザに対応するマイクによって収音された音声から 減算する ことを特徴とする請求項1記載の遠隔会議制御装置。
- 前記判断部は、各々の前記ユーザが遠隔会議に用いる端末間において送受信される無線信号の受信レベルが閾値以上の場合に、複数の当該ユーザが共通の空間に居ると判断する ことを特徴とする請求項1記載の遠隔会議制御装置。
- 前記閾値を設定する閾値設定部を備える ことを特徴とする請求項5記載の遠隔会議制御装置。
- 前記閾値設定部は、各々の前記ユーザが遠隔会議に用いる端末間の測距を行った結果と、各々の前記ユーザが遠隔会議に用いる端末間において送受信される無線信号の受信レベルの測定結果とを用いて、前記閾値を設定する ことを特徴とする請求項6記載の遠隔会議制御装置。
Description
本発明は遠隔会議を行うための技術に関する。 近年において、遠隔地にいるユーザが電気通信システムを介して会話を行いながら情報を共有する遠隔会議システムの普及が進んでいる。この遠隔会議システムでは、遠隔会議に参加しているユーザの利用するマイクがスピーカの音を収音し、収音した音をスピーカから再び出力してしまうことで、ハウリングという問題が起こることがある。 また、或る遠隔会議に参加しているユーザの音声が、そのすぐ近くに居る、別の遠隔会議の参加者たるユーザの利用するマイクによって収音されることで、異なる遠隔会議の音声が混入してしまうという問題もある。 例えば単一の会議端末におけるハウリング抑制に関しては、特許文献1に、音声データから復号された音声信号とオ-ディオスイッチから供給される音声信号との間でエコ-キャンセリング処理を行い、通信中のハウリングの発生を防止する仕組みが開示されている。 特開平5-207452号公報 本発明の第1実施形態に係る遠隔会議システム1の構成の一例を示す図である。第1実施形態に係るユーザ端末10のハードウェア構成の一例を示すブロック図である。第1実施形態に係るサーバ装置20のハードウェア構成の一例を示すブロック図である。第1実施形態に係る遠隔会議システム1の機能構成の一例を示すブロック図である。第1実施形態に係るサーバ装置20の記憶部221が記憶するデータを例示する図である。第1実施形態に係るサーバ装置20の動作の一例を示すフローチャートである。第2実施形態に係る遠隔会議システム1の機能構成の一例を示すブロック図である。第2実施形態に係るサーバ装置20の動作の一例を示すフローチャートである。関係を説明する図である。 [第1実施形態] 図1は、本実施形態の遠隔会議システム1の一例を示す図である。この遠隔会議システム1は、例えばスマートホン、タブレット、ウェアラブル端末又はパーソナルコンピュータ等の、本発明に係る「端末」としてそれぞれ機能する複数のユーザ端末10a,10b,10c(以下、ユーザ端末10と総称する)と、本発明に係る「遠隔会議制御装置」として機能するサーバ装置20とを備える。ネットワーク2は、これらユーザ端末10及びサーバ装置20を相互に通信可能に接続する。ネットワーク2は、例えばLAN(Local Area Network)又はWAN(Wide Area Network)、若しくはこれらの組み合わせであり、有線区間又は無線区間を含んでいる。ネットワーク2は、低遅延が特徴である第5世代移動通信システムに準拠したネットワークであることが望ましいが、必ずしもこれに限らない。なお、図1には、ユーザ端末として、ユーザ端末10a,10b,10cの3つを示しているが、これらは4以上であってもよい。 遠隔会議システム1において、遠隔会議の参加者たる複数のユーザは互いに離れた場所で、ユーザ端末10間でネットワーク2を介して音声による会話や情報の共有を行うことができるようになっている。同一の遠隔会議(以下、同一会議という)の参加者たる複数のユーザがそれぞれ利用する各ユーザ端末10は、ユーザが発話した音声を収音して、その音声を示す音声データをネットワーク2経由でサーバ装置20に送信する。サーバ装置20は、同一会議に参加する或るユーザのユーザ端末10からネットワーク2経由で送信されてくる音声データを、同一会議に参加する他のユーザのユーザ端末10にネットワーク2経由で送信する。各ユーザ端末10は、サーバ装置20から送信されてくる音声データに応じた音声を出力する。これにより、各ユーザは音声による会話を行うことができるようになっている。 遠隔会議システムにおいては、或る遠隔会議に参加している複数のユーザのうち、いずれか2人以上のユーザが近傍に居る場合、一方のユーザの利用するユーザ端末(第1のユーザ端末)のマイクが、他方のユーザの利用するユーザ端末(第2のユーザ端末)のスピーカからの音声を収音し、収音した音をユーザ端末(第2のユーザ端末)のスピーカから再び出力してしまうことで、ハウリングという問題が発生し得る。 そこで、本発明の第1実施形態では、1の遠隔会議に参加している複数のユーザのうち2人以上のユーザが共通の空間に居るか否かを判断し、2人以上のユーザが共通の空間に居ると判断された場合には、その2人以上のユーザのうち、発話していないユーザに対応するマイクの収音を無効にすることで、このハウリングの問題を解消する。つまり、第1実施形態に係る遠隔会議システム1は、複数のユーザが同一場所で同一会議に参加している場合のハウリング防止を主たる目的としている。 図2は、第1実施形態に係るユーザ端末10のハードウェア構成の一例を示す図である。ユーザ端末10は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006及びこれらを接続するバスなどを含むコンピュータ装置として構成されている。なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。ユーザ端末10のハードウェア構成は、図に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。 ユーザ端末10における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることによって、プロセッサ1001が演算を行い、通信装置1004による通信を制御したり、メモリ1002及びストレージ1003におけるデータの読み出し及び書き込みの少なくとも一方を制御したりすることによって実現される。 プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)によって構成されてもよい。また、例えばベースバンド信号処理部や呼処理部などがプロセッサ1001によって実現されてもよい。 プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュール、データなどを、ストレージ1003及び通信装置1004の少なくとも一方からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、後述する動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。ユーザ端末10の機能ブロックは、メモリ1002に格納され、プロセッサ1001において動作する制御プログラムによって実現されてもよい。各種の処理は、1つのプロセッサ1001によって実行されてもよいが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップによって実装されてもよい。なお、プログラムは、電気通信回線を介してネットワーク2からユーザ端末10に送信されてもよい。 メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つによって構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本実施形態に係る方法を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。 ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD-ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu-ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つによって構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。 通信装置1004は、有線ネットワーク又は無線ネットワークの少なくとも一方を介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。通信装置1004は、例えば周波数分割複信(FDD:Frequency Division Duplex)及び時分割複信(TDD:Time Division Duplex)の少なくとも一方を実現するために、高周波スイッチ、デュプレクサ、フィルタ、周波数シンセサイザなどを含んで構成されてもよい。例えば、送受信アンテナ、アンプ部、送受信部、伝送路インターフェースなどは、通信装置1004によって実現されてもよい。送受信部は、送信部と受信部とで、物理的に、または論理的に分離された実装がなされてもよい。 入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キー、スイッチ、ボタン、センサなど)であり、少なくともマイクを含んでいる。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、LEDライトなど)であり、少なくともスピーカを含んでいる。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチスクリーン)であってもよい。 近距離無線通信装置1007は、例えばUWB(Ultra Wide Band)やBTLE(Bluetooth Low Energy/登録商標)等の通信規格に従って無線通信を行うハードウェア(送受信デバイス)である。これらの通信規格は、近距離無線通信装置1007間でお互いの位置までの距離を行う測距機能を備えている。第1実施形態では、この測距機能を用いてユーザ端末10間の距離を推測する。 プロセッサ1001、メモリ1002などの各装置は、情報を通信するためのバスによって接続される。バスは、単一のバスを用いて構成されてもよいし、装置間ごとに異なるバスを用いて構成されてもよい。 また、ユーザ端末10は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つを用いて実装されてもよい。 図3は、第1実施形態に係るサーバ装置20のハードウェア構成を示す図である。サーバ装置20のハードウェア構成は、図3に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。また、それぞれ筐体が異なる複数の装置が通信接続されて、サーバ装置20を構成してもよい。 サーバ装置20は、物理的には、プロセッサ2001、メモリ2002、ストレージ2003、通信装置2004、入力装置2005、出力装置2006、及びこれらを接続するバスなどを含むコンピュータ装置として構成されている。サーバ装置20における各機能は、プロセッサ2001、メモリ2002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることによって