JP-2026515033-A - 内視鏡画像の画質向上方法及びシステム
Abstract
本発明は内視鏡画像の画質向上方法及びシステムを開示する。この方法は複雑画質向上モデル、軽量画質向上モデル、原画内視鏡画像群及び低画質画像群を取得し、中間特徴損失、コントラスト損失及び再構成損失を組み合わせた総損失を計算し、軽量画質向上モデルを訓練する。この方法により訓練された軽量画質向上モデルは、内視鏡画像の解像度向上に対して強い処理能力と処理速度を持ち、医師の読影効率を大幅に向上させる。
Inventors
- 金 凡
- 張 皓
Assignees
- 安翰科技(武漢)股分有限公司
Dates
- Publication Date
- 20260513
- Application Date
- 20240430
- Priority Date
- 20230504
Claims (12)
- 内視鏡画像の画質向上方法であって、 複雑画質向上モデル、軽量画質向上モデル、原画内視鏡画像群及び低画質画像群を取得するステップであって、前記軽量画質向上モデルの中間ブロック数は前記複雑画質向上モデルの中間ブロック数より少なく、前記原画内視鏡画像群は内視鏡により取得された複数の消化管画像を含み、前記低画質画像群に属する各低画質画像には前記原画内視鏡画像群に対応する高画質画像が存在するステップと、 前記低画質画像群を前記複雑画質向上モデル及び前記軽量画質向上モデルに入力し、前記複雑画質向上モデルに第一画質向上内視鏡画像群を出力させ、前記軽量画質向上モデルに第二画質向上内視鏡画像群を出力させるステップと、 前記低画質画像群の画像をエッジ保持フィルタリングアルゴリズムにより処理して、ぼかし内視鏡画像群を生成するステップと、 前記複雑画質向上モデル及び前記軽量画質向上モデルのそれぞれにおいて、浅層から深層の順にn個の中間ブロックを選出し、前記複雑画質向上モデル及び前記軽量画質向上モデルのn個の中間ブロックが出力する中間特徴を順序に応じて一対一で対応させ、前記複雑画質向上モデルのn個の中間特徴と対応する前記軽量画質向上モデルの中間特徴との間の中間特徴損失を計算するステップと、 前記第一画質向上内視鏡画像群及び前記第二画質向上内視鏡画像群と前記ぼかし内視鏡画像群との間のコントラスト損失を計算するステップと、 前記第一画質向上内視鏡画像群及び前記第二画質向上内視鏡画像群と前記原画内視鏡画像群との間の再構成損失を計算するステップと、 前記中間特徴損失、前記コントラスト損失及び前記再構成損失により、総損失を計算するステップと、 前記総損失と前記複雑画質向上モデルに基づいて、前記軽量画質向上モデルを訓練するステップとを含む、 内視鏡画像の画質向上方法。
- 前記低画質画像群に属する各低画質画像は、前記原画内視鏡画像群中の画像に画像のぼかし、ノイズ注入及び画像圧縮を施すことにより得られる、 請求項1に記載の内視鏡画像の画質向上方法。
- 前記複雑画質向上モデル及び前記軽量画質向上モデルのそれぞれにおいて、浅層から深層の順にn個の中間ブロックを選出し、前記複雑画質向上モデル及び前記軽量画質向上モデルのn個の中間ブロックが出力する中間特徴を順序に応じて一対一で対応させるステップは、 前記複雑画質向上モデル及び前記軽量画質向上モデルの中間ブロックのそれぞれにおいて、浅層から深層の順にn個の中間ブロックを選出するステップであって、前記複雑画質向上モデルのn個の中間ブロック及び前記軽量画質向上モデルのn個の中間ブロックは、それぞれの中間ブロックの総数を基本的に等分割されたn個の部分群に分け、基本的に等しい間隔でn個の部分群からそれぞれ1つ選出された中間ブロックであるステップと、 各モデルの中間ブロックの順序に従って、前記複雑画質向上モデルにおいて選出された中間ブロックが出力する中間特徴と前記軽量画質向上モデルにおいて選出された中間ブロックが出力する中間特徴とを一対一で対応させ、順にn組の対応する中間特徴を生成するステップとを含む、 請求項1に記載の内視鏡画像の画質向上方法。
- 前記複雑画質向上モデルのn個の中間特徴と対応する前記軽量画質向上モデルの中間特徴との間の中間特徴損失を計算するステップは、 複雑画質向上モデルの中間特徴と前記軽量画質向上モデルの中間特徴に特徴変換を施し、同じ次元の特徴空間に変換するステップと、 n個の変換後の前記複雑画質向上モデルの中間特徴と、対応する前記軽量画質向上モデルの中間特徴との間の距離損失を計算するステップと、 n個の距離損失を加算して平均を求めることにより前記中間特徴損失を得るステップとを含む、 請求項1に記載の内視鏡画像の画質向上方法。
- 前記原画内視鏡画像群、前記第一画質向上内視鏡画像群、前記第二画質向上内視鏡画像群、及び前記ぼかし内視鏡画像群の画像の解像度は全て同じである、 請求項1に記載の内視鏡画像の画質向上方法。
- 前記低画質画像群の画像をエッジ保持フィルタリングアルゴリズムにより処理して、ぼかし内視鏡画像群を生成するステップは、 前記低画質画像群の画像を前記第二画質向上内視鏡画像群の解像度と一致するようにアップサンプリングするステップと、 アップサンプリング後の前記低画質画像群をぼかし処理してぼかし内視鏡画像群を生成するステップとを含む、 請求項5に記載の内視鏡画像の画質向上方法。
- 前記第一画質向上内視鏡画像群及び前記第二画質向上内視鏡画像群と前記ぼかし内視鏡画像群との間のコントラスト損失を計算するステップは、 VGG19ネットワークを潜在特徴空間のマッピング関数として用いるステップを含み、 前記コントラスト損失L CL の計算式は、 であり、 ここで、Nはサンプル数、Mは潜在特徴空間のマッピング関数が出力する特徴数、λ j は第j個の特徴の重み、φは潜在特徴空間のマッピング関数、Kは前記ぼかし内視鏡画像群の画像数、O T 、O S 、O Neg はそれぞれ前記第一画質向上内視鏡画像群、前記第二画質向上内視鏡画像群及び前記ぼかし内視鏡画像群の画像、dは距離関数を表す、 請求項5に記載の内視鏡画像の画質向上方法。
- 前記第一画質向上内視鏡画像群及び前記第二画質向上内視鏡画像群と前記原画内視鏡画像群との間の再構成損失を計算するステップにおいて、 前記再構成損失Lrecの計算式は、 であり、 ここで、Nは前記原画内視鏡画像群の画像数、O T 、O S 、O GT はそれぞれ前記第一画質向上内視鏡画像群、前記第二画質向上内視鏡画像群及び前記原画内視鏡画像群の画像、dは距離関数を表す、 請求項5に記載の内視鏡画像の画質向上方法。
- 前記中間特徴損失、前記コントラスト損失及び前記再構成損失により、総損失を計算するステップにおいて、 前記総損失の計算式は、 L= Lrec +αL fea +βL CL であり、 ここで、L rec は前記再構成損失、L fea は前記中間特徴損失、L CL は前記コントラスト損失、α及びβはそれぞれ中間特徴損失とコントラスト損失の重みを表す、 請求項5に記載の内視鏡画像の画質向上方法。
- 内視鏡画像の画質向上システムであって、 複雑画質向上モデル、軽量画質向上モデル、原画内視鏡画像群及び低画質画像群を取得するように構成された取得装置であって、前記軽量画質向上モデルの中間ブロック数は前記複雑画質向上モデルの中間ブロック数より少なく、前記原画内視鏡画像群は内視鏡により取得された複数の消化管画像を含み、前記低画質画像群に属する各低画質画像には前記原画内視鏡画像群に対応する高画質画像が存在する取得装置と、 前記低画質画像群を前記複雑画質向上モデル及び軽量画質向上モデルに入力し、前記複雑画質向上モデルが第一画質向上内視鏡画像群を出力し、前記軽量画質向上モデルが第二画質向上内視鏡画像群を出力するように構成された出力装置と、 前記低画質画像群の画像をエッジ保持フィルタリングアルゴリズムにより処理して、ぼかし内視鏡画像群を生成するように構成されたネガティブサンプル生成装置と、 前記複雑画質向上モデル及び前記軽量画質向上モデルのそれぞれにおいて、浅層から深層の順にn個の中間ブロックを選出し、前記複雑画質向上モデル及び前記軽量画質向上モデルのn個の中間ブロックが出力する中間特徴を順序に応じて一対一で対応させ、前記複雑画質向上モデルのn個の中間特徴と対応する前記軽量画質向上モデルの中間特徴との間の中間特徴損失を計算するように構成された中間特徴損失計算装置と、 前記第一画質向上内視鏡画像群及び前記第二画質向上内視鏡画像群と前記ぼかし内視鏡画像群との間のコントラスト損失を計算するように構成されたコントラスト損失計算装置と、 前記第一画質向上内視鏡画像群及び前記第二画質向上内視鏡画像群と前記原画内視鏡画像群との間の再構成損失を計算するように構成された再構成損失計算装置と、 前記中間特徴損失、前記コントラスト損失及び前記再構成損失により、総損失を計算するように構成された総損失計算装置と、 前記総損失と前記複雑画質向上モデルに基づいて、前記軽量画質向上モデルを訓練するように構成された訓練装置と、 を含む内視鏡画像の画質向上システム。
- 電子装置であって、 コンピュータプログラムを格納するメモリと、 前記コンピュータプログラムを実行することにより、請求項1に記載の内視鏡画像の画質向上方法の各ステップを実現するプロセッサと、 を含む電子装置。
- コンピュータプログラムが格納された読み取り可能な記憶媒体であって、該コンピュータプログラムがプロセッサにより実行されることにより、請求項1に記載の内視鏡画像の画質向上方法の各ステップを実現する、 読み取り可能な記憶媒体。
Description
優先権主張 本出願は、2023年5月4日に出願された中国特許出願第202310484368.9号(発明の名称:「内視鏡画像の画質向上方法及び装置」)の優先権を主張し、その全内容を引用により本願に組み込む。 本発明は内視鏡医療処理分野に関し、特に内視鏡画像の画質向上方法及びシステムに関する。 内視鏡は、消化管内の画像を撮影するための装置であり、例えば人体内で撮影を行う。一回の内視鏡検査で通常数万枚の画像が生成され、これらの画像を全て高画質画像として出力すると、帯域幅の占有が大きく、伝送時間が長くなるため、通常は低解像度に圧縮される。また、消化管内の撮影環境が比較的劣悪であるため、これらの低解像度画像の識別がさらに困難となり、医師の画像読影に影響を及ぼしている。 既存の深層ニューラルネットワークに基づく画質向上モデルを用いてこれらの画像の解像度を向上させる場合、データ量が大きくモデルの実行速度が遅いため、医師は長時間の待機を強いられる。また、既存の画質向上モデルは内視鏡画像に特化したモデルではないため、医師の読影効率を向上させることができない。 このため、内視鏡画像の出力速度を大幅に向上させ、かつ画像の解像度向上効果が優れた方法を提供し、医師の読影効率を向上させる必要がある。 上記の従来技術の課題の少なくとも一つを解決するために、本発明の目的は、出力速度が速く、出力画質が優れた内視鏡画像の画質向上方法及びシステムを提供することにある。 上記発明の目的を達成するために、本発明の一実施形態は、内視鏡画像の画質向上方法を提供する。この方法は、 複雑画質向上モデル(complex image quality enhancement model)、軽量画質向上モデル(lightweight image quality enhancement model)、原画内視鏡画像群(original endoscopic image group)及び低画質画像群(low-definition image group)を取得するステップであって、前記軽量画質向上モデルの中間ブロック数は前記複雑画質向上モデルの中間ブロック数より少なく、前記原画内視鏡画像群は内視鏡により取得された複数の消化管画像を含み、前記低画質画像群に属する各低画質画像には前記原画内視鏡画像群に対応する高画質画像が存在するステップと、 前記低画質画像群を前記複雑画質向上モデル及び前記軽量画質向上モデルに入力し、前記複雑画質向上モデルに第一画質向上内視鏡画像群を出力させ、前記軽量画質向上モデルに第二画質向上内視鏡画像群を出力させるステップと、 前記低画質画像群の画像をエッジ保持フィルタリングアルゴリズムにより処理して、ぼかし内視鏡画像群を生成するステップと、 前記複雑画質向上モデル及び前記軽量画質向上モデルのそれぞれにおいて、浅層から深層の順でn個の中間ブロックを選出し、前記複雑画質向上モデル及び前記軽量画質向上モデルのn個の中間ブロックが出力する中間特徴を順序に応じて一対一で対応させ、前記複雑画質向上モデルのn個の中間特徴と対応する前記軽量画質向上モデルの中間特徴との間の中間特徴損失を計算するステップと、 前記第一画質向上内視鏡画像群及び前記第二画質向上内視鏡画像群と前記ぼかし内視鏡画像群との間のコントラスト損失を計算するステップと、 前記第一画質向上内視鏡画像群及び前記第二画質向上内視鏡画像群と前記原画内視鏡画像群との間の再構成損失を計算するステップと、 前記中間特徴損失、前記コントラスト損失及び前記再構成損失により、総損失を計算するステップと、 前記総損失と前記複雑画質向上モデルに基づいて、前記軽量画質向上モデルを訓練するステップとを含む。 本発明の一実施例による内視鏡画像の画質向上方法のフローチャートである。図1のステップS40の具体的なステップのフローチャートである。本発明の一実施例による内視鏡画像の画質向上モデルのネットワーク構造フレームワーク図である。本発明の一実施例による内視鏡画像の画質向上システムの構造ブロック図である。 本発明の一実施例は、出力速度が速く、出力画質が優れた内視鏡画像の画質向上方法及びシステムを提供する。内視鏡画像は、ユーザーが内視鏡検査を受ける際に、カプセル状の内視鏡が消化管内を移動し、内視鏡上の撮像モジュールが撮影した画像であり、これらの画像を人体外の装置に伝送して保存、解析し、医師が読影するために提供される。 図1~図3を参照して、本発明の一実施例による内視鏡画像の画質向上方法について説明する。本願が提供する以下の実施形態やフローチャートに示される方法操作ステップにおいて、論理的に必然的な因果関係のないステップについては、それらのステップの実行順序は本願の実施形態で提供される実行順序に限定されない。例えば、以下のステップS20、S30及びS40の取得順序は任意に調整可能であり、時間的な前後関係は区別されない。 具体的に、本実施例の内視鏡画像の画質向上方法は、図1及び図2に示すように、画質向上モデルは図3に示すように、以下のステップを含む。 ステップS10:複雑画質向上モデル10、軽量画質向上モデル20、原画内視鏡画像群OGT及び低画質画像群LRを取得する。 ここでは画像群とモデルの二つの側面から説明する。 (1)画像群 画内視鏡画像群OGTと低画質画像群LRは、予め作成され、マッチングされた内視鏡画像のデータセットであり、前記原画内視鏡画像群OGTは内視鏡により取得された複数の消化管画像を含み、前記低画質画像群LRの各低画質画像は前記原画内視鏡画像群OGTに対応する高画質画像が存在し、低画質画像群LRは原画内視鏡画像群OGTから劣化させて得られ、対応する低画質-高画質画像ペアを形成する。 さらに、本実施例では、内視鏡画像特有の画像形成プロセスをシミュレートした。前記低画質画像群LRの各低画質画像は、画像劣化ユニットにより、以下の劣化方式で形成される。すなわち、前記原画内視鏡画像群OGTの画像に画像のぼかし、ノイズ注入及び画像圧縮を施し、高画質画像から対応する低画質画像を生成する。 具体的に、画像劣化ユニットは画像ぼかしユニット、ノイズ注入ユニット及び画像圧縮ユニットを含む。 画像ぼかしユニットは、レンズのぼけをシミュレートするように構成され、点拡散関数によりカメラレンズのぼけカーネルを計算し、ガウシアンぼけカーネルによりレンズ振動によるぼけプロセスをシミュレートする。ノイズ注入ユニットは、信号ノイズをシミュレートするように構成され、暗室での露光撮影によりカメラの暗電流ノイズと信号ガウシアンノイズを較正する。画像圧縮ユニットは、圧縮プロセスの画像圧縮を行うように構成され、OpenCVライブラリのcv2.encode関数とcv2.decode関数を用いてJPEG(Joint Photographic Experts Group)圧縮を実現する。 (2)モデル 複雑画質向上モデル10は、予め訓練された画像画質向上モデルであり、画質向上モデルにより内視鏡画像の画質を向上させるために用いられる。まずL1損失を用いて生成器ネットワークを訓練し、上記で得られた原画内視鏡画像群OGTと低画質画像群LRを用いて初期化モデルを訓練し、次に予備訓練段階でGAN(Generative Adversarial Network)ネットワークを用いて初期化モデルを敵対的に訓練し、L1損失、知覚損失及びGAN損失を組み合わせて共同訓練を行い、性能の優れた複雑画質向上モデル10を得る。これは画質向上のための複雑な大規模モデルである。 本実施例では、複雑画質向上モデル10のネットワークの主要構造は密結合畳み込みネットワークRRDB(Residual in Residual Dense Block)に基づき、中間特徴チャネル数は64、中間ブロック数は23である。 画質向上モデルの産業用コンピュータ上での実行速度を向上させるため、本実施例では複雑画質向上モデル10を軽量画質向上モデル20に圧縮する。軽量画質向上モデル20の主要構造は複雑画質向上モデル10のネットワークと一致し、前記軽量画質向上モデル20の中間ブロック数は前記複雑画質向上モデル10より少なく、実験により異なる中間ブロック数を試行して最適案を決定することができる。本実施例では、軽量画質向上モデル20の主要構造は中間特徴チャネル数が64、中間ブロック数が11のRRDBネットワークである。軽量画質向上モデル20の中間ブロック数が11であるため、軽量画質向上モデル20のネットワークパラメータ量は複雑画質向上モデル10のネットワークパラメータ量の約半分に減少する。 ステップS20:前記低画質画像群LRを複雑画質向上モデル10と軽量画質向上モデル20に入力し、前記複雑画質向上モデル10は第一画質向上内視鏡画像群OTを出力し、前記軽量画質向上モデル20は第二画質向上内視鏡画像群OSを出力する。 複雑画質向上モデル10と軽量画質向上モデル20の構造フレームワーク図は、図3に示すように、いずれも複数の中間ブロック11、アップサンプリングブロック12及び畳み込み層13を含み、低画質画像を第一層の中間ブロック11に入力し、順次より深い層の中間ブロック11を経て、アップサンプリングブロック12を経て、最終的に畳み込み層13から高画質画像を出力する。 低画質画像群LRが複雑画質向上モデル10を経て、畳み込み層13は第一画質向上内視鏡画像群OT及び複数の中間ブロック11が出力する中間特徴を出力する。低画質画像群LRが軽量画質向上モデル20を経て、畳み込み層13は第二画質向上内視鏡画像群OS及び複数の中間ブロック11が出力する中間特徴を出力する。 ステップS30:前記低画質画像群LRの画像をエッジ保持フィルタリングアルゴリズムにより処理して、ぼかし内視鏡画像群ONegを生成する。 ぼかし内視鏡画像群ONegはネガティブサンプルとして、モデル最適化空間の下界を向上させるために用いられ、軽量画質向上モデル20は入力低解像度画像を出力高解像度画像に変換することを学習する必要があり、かつぼかし画像と高解像度画像との差異を区別できるべきである。ぼかし内視鏡画像群ONegは、軽量画質向上モデル20が画像中の細部やテクスチャなどの特徴をより良く捕捉することを助け、それにより画質向上モデルの性能とロバスト性を向上させ、画質向上問題をより良く解決することができる。 本実施例では、前記低画質画像群LRから生成されるネガティブサンプルにより軽量画質向上モデル20の探索空間を制約し、軽量画質向上モデル20が大域的最適解に収束することに有利である。関連する低画質画像群LRから生成されるネガティブサンプルと軽量画質向上モデル20の出力結果との差異がより近いため、それらは潜在特徴空間での距離がより近く、ネガティブサンプルの参考意義が大きく、軽量画質向上モデル20が有用な情報を学習することに有利である。 ぼかし内視鏡画像群ONegは期待される鮮明な画像の反対標的として、期待される画像の全体的な構造フレームワークを含み、高周波情報(細部テクスチャ)を無視する必要がある。ここでは図3と図4を参照してステップS30をさらに説明する。ステップS30はネガティブサンプル生成装置130により実現され、ネガティブサンプル生成装置130はぼかしブロック15を含み、各種のエッジ保持フィルタリング関数をぼかしブロック15のメイン関数として使用できる。 ステップS30は具体的に以下を含む。 ステップS31:前記低画質画像群LRの画像を前記第二画質向上内視鏡画像群OSの解像度と一致するようにアップサンプリングする。 ステップS32:アップサンプリング後の前記低画質画像群LRをぼかし処理してぼかし内視鏡画像群ONegを生成する。 ス