JP-2026077649-A - 動きベクトルの精緻化のための制限されたメモリアクセスウィンドウ

JP2026077649AJP 2026077649 AJP2026077649 AJP 2026077649AJP-2026077649-A

Abstract

【課題】本開示は、動きベクトルの精緻化に関する。【解決手段】第1のステップとして、初期動きベクトルが、取得される。次いで、初期動きベクトルの精緻化が、探索空間におけるバイラテラルマッチングによって決定される。探索空間は、初期動きベクトルによって与えられる位置にあり、1つ以上の分数サンプル位置を含み、探索空間に属する分数サンプル位置の各々が、ウィンドウ内の整数サンプルのみを評価する予め定義されたタップサイズのフィルタを用いる補間フィルタリングによって得られ、前記ウィンドウが、前記探索空間におけるバイラテラルマッチングのためにアクセス可能な整数サンプルによって形成される。【選択図】図１４

Inventors

セミフ・エセンリク
アナンド・メヘル・コトラ
ジジエ・ジャオ
ハン・ガオ

Assignees

ホアウェイ・テクノロジーズ・カンパニー・リミテッド

Dates

Publication Date: 20260513
Application Date: 20260202
Priority Date: 20171009

Claims (20)

予測ブロックに関する動きベクトルの決定のための装置であって、前記予測ブロックに関する初期動きベクトルおよびテンプレートを取得し、探索空間において前記テンプレートとのテンプレートマッチングによって前記初期動きベクトルの精緻化を決定するように構成された処理回路を含み、前記探索空間が、前記初期動きベクトルによって与えられる位置にあり、1つ以上の分数サンプル位置を含み、前記探索空間に属する前記分数サンプル位置の各々が、ウィンドウ内の整数サンプルのみを評価する予め定義されたタップサイズのフィルタを用いる補間フィルタリングによって得られ、前記ウィンドウが、前記探索空間における前記テンプレートマッチングのためにアクセス可能な整数サンプルによって形成される、装置。
前記ウィンドウが、前記予測ブロックの初期動きベクトルに対してN整数サンプル列およびM整数サンプル行として定義され、NおよびMの少なくとも一方が、非ゼロの整数値である請求項1に記載の装置。
前記処理回路が、最も新しい反復において探索空間のより多くの最も一致する位置のうちの1つによって与えられる方向に反復的に拡張される前記探索空間における前記テンプレートとのテンプレートマッチングによって前記初期動きベクトルの前記精緻化を決定するように構成され、前記ウィンドウが、前記反復の予め定義された最大回数によって定義される請求項1または2に記載の装置。
前記探索空間が、サブウィンドウ内の各分数サンプルの補間フィルタリングのためにアクセスされるすべての整数サンプルが前記予め定義されたタップサイズの前記補間フィルタに関して前記ウィンドウ内にあるような前記ウィンドウの矩形の前記サブウィンドウを含む請求項1から3のいずれか一項に記載の装置。
前記探索空間が、前記ウィンドウの矩形の探索サブウィンドウを含み、前記初期動きベクトルの前記精緻化が、前記探索サブウィンドウ内の各分数サンプルの補間フィルタリングのためにアクセスされる前記整数サンプルが前記予め定義されたタップサイズの前記補間フィルタに関して前記ウィンドウ内にあるような前記矩形の探索サブウィンドウにおける前記テンプレートとのテンプレートマッチングによって決定される請求項1または2に記載の装置。
前記処理回路が、最も新しい反復において探索空間のより多くの最も一致する位置のうちの1つによって与えられる方向に反復的に拡張される前記探索空間における前記テンプレートとのテンプレートマッチングによって前記初期動きベクトルの前記精緻化を決定するように構成され、前記反復が、前記最も新しい反復の前記探索空間内の少なくとも1つのサンプルが前記探索サブウィンドウの外にあるときに終了される請求項5に記載の装置。
前記補間フィルタが、前記分数位置が整数サンプルのそれぞれの水平方向のラインまたは垂直方向のライン上にあるとき、K個の水平方向または垂直方向の何れの整数サンプルも評価する1次元フィルタである請求項4に記載の装置。
前記探索空間が、 - 前記サブウィンドウの上もしくは下に隣接し、整数サンプルの水平方向のライン上にあるか、または - 前記サブウィンドウの左側もしくは右側に隣接し、整数サンプルの垂直方向のライン上にあるかの何れの、前記サブウィンドウの外にある分数位置をさらに含む請求項5に記載の装置。
予測ブロックに分割されたビデオ画像をビットストリームに符号化するための符号化装置であって、請求項1から8のいずれか一項に記載の予測ブロックに関する動きベクトルの決定のための装置と、前記予測ブロックと決定された動きベクトルに基づく位置に予測ブロックによって与えられるプレディクタとの間の差を符号化するため、ならびに符号化された差および前記初期動きベクトルを含むビットストリームを生成するための符号化回路とを含む、符号化装置。
予測ブロックに分割されたビデオ画像をビットストリームから復号するための復号装置であって、初期動きベクトル、および予測ブロックと精緻化された動きベクトルによって指定される位置に予測ブロックによって与えられるプレディクタとの間の符号化された差を、前記ビットストリームから解析するための解析ユニットと、請求項1から8のいずれか一項に記載の前記予測ブロックに関する前記精緻化された動きベクトルの決定のための装置と、解析された差と、前記精緻化された動きベクトルによって指定される前記位置に前記予測ブロックによって与えられる前記プレディクタとの和として前記予測ブロックを再構築するための復号回路とを含む、復号装置。
予測ブロックに関する動きベクトルの決定のための方法であって、前記予測ブロックに関する初期動きベクトルおよびテンプレートを取得するステップ、探索空間において前記テンプレートとのテンプレートマッチングによって前記初期動きベクトルの精緻化を決定するステップを含み、前記探索空間が、前記初期動きベクトルによって与えられる位置にあり、1つ以上の分数サンプル位置を含み、前記探索空間に属する前記分数サンプル位置の各々が、ウィンドウ内の整数サンプルのみを評価する予め定義されたタップサイズのフィルタを用いる補間フィルタリングによって得られ、前記ウィンドウが、前記探索空間における前記テンプレートマッチングのためにアクセス可能な整数サンプルによって形成される、方法。
前記ウィンドウが、前記予測ブロックの初期動きベクトルに対してN整数サンプル列およびM整数サンプル行として定義され、NおよびMが、非ゼロの整数値である請求項11に記載の方法。
前記初期動きベクトルの前記精緻化が、最も新しい反復において探索空間のより多くの最も一致する位置のうちの1つによって与えられる方向に反復的に拡張される前記探索空間における前記テンプレートとのテンプレートマッチングによって決定され、前記ウィンドウが、前記反復の予め定義された最大回数によって定義される請求項11または12に記載の方法。
前記探索空間が、サブウィンドウ内の各分数サンプルの補間フィルタリングのためにアクセスされるすべての整数サンプルが前記予め定義されたタップサイズの前記補間フィルタに関して前記ウィンドウ内にあるような前記ウィンドウの矩形の前記サブウィンドウを含む請求項11から13のいずれか一項に記載の方法。
前記探索空間が、前記ウィンドウの矩形の探索サブウィンドウを含み、前記初期動きベクトルの前記精緻化が、前記探索サブウィンドウ内の各分数サンプルの補間フィルタリングのためにアクセスされる前記整数サンプルが前記予め定義されたタップサイズの前記補間フィルタに関して前記ウィンドウ内にあるような前記矩形の探索サブウィンドウにおける前記テンプレートとのテンプレートマッチングによって決定される請求項11または12に記載の方法。
前記初期動きベクトルの前記精緻化が、最も新しい反復において探索空間のより多くの最も一致する位置のうちの1つによって与えられる方向に反復的に拡張される前記探索空間における前記テンプレートとのテンプレートマッチングによって決定され、前記反復が、前記最も新しい反復の前記探索空間内の少なくとも1つのサンプルが前記探索サブウィンドウの外にあるときに終了される請求項15に記載の方法。
前記補間フィルタが、前記分数位置が整数サンプルのそれぞれの水平方向のラインまたは垂直方向のライン上にあるとき、K個の水平方向または垂直方向の何れの整数サンプルを評価する1次元フィルタである請求項14に記載の方法。
前記探索空間が、 - 前記サブウィンドウの上もしくは下に隣接し、整数サンプルの水平方向のライン上にあるか、または - 前記サブウィンドウの左側もしくは右側に隣接し、整数サンプルの垂直方向のライン上にあるかの何れの、前記サブウィンドウの外にある分数位置をさらに含む請求項17に記載の方法。
予測ブロックに分割されたビデオ画像をビットストリームに符号化するための符号化方法であって、請求項11から18のいずれか一項に記載の予測ブロックに関する動きベクトルを決定するステップと、前記予測ブロックと決定された動きベクトルに基づく位置に予測ブロックによって与えられるプレディクタとの間の差を符号化し、符号化された差および前記初期動きベクトルを含むビットストリームを生成するステップとを含む、符号化方法。
予測ブロックに分割されたビデオ画像をビットストリームから復号するための復号方法であって、初期動きベクトル、および予測ブロックと精緻化された動きベクトルによって指定される位置に予測ブロックによって与えられるプレディクタとの間の符号化された差を、前記ビットストリームから解析するステップと、請求項11から18のいずれか一項に記載の前記予測ブロックに関する前記精緻化された動きベクトルを決定するステップと、解析された差と、前記精緻化された動きベクトルによって指定される前記位置に前記予測ブロックによって与えられる前記プレディクタとの和として前記予測ブロックを再構築するステップとを含む、復号方法。

Description

本発明は、ビデオの符号化および復号中に使用されてもよい動きベクトルの決定および精緻化に関する。現在のハイブリッドビデオコーデックは、予測符号化を使用する。ビデオシーケンスのピクチャは、ピクセルのブロックに下位分割され、次いで、これらのブロックが、符号化される。ブロックをピクセル毎に符号化する代わりに、ブロック全体が、ブロックの空間的または時間的に近い既に符号化されたピクセルを使用して予測される。エンコーダは、ブロックとそのブロックの予測との間の差のみをさらに処理する。さらなる処理は、概して、変換領域におけるブロックピクセルの係数への変換を含む。次いで、ビットストリームを形成するために、係数が、量子化によってさらに圧縮され、エントロピー符号化によってさらにコンパクトにされてもよい。ビットストリームは、デコーダが符号化されたビデオを復号することを可能にする任意のシグナリング情報をさらに含む。たとえば、シグナリングは、入力ピクチャのサイズ、フレームレート、量子化ステップインジケーション、ピクチャのブロックに適用される予測などのエンコーダ設定に関する設定を含んでもよい。時間的予測は、ビデオのフレームとも呼ばれるピクチャの間の時間的相関を利用する。時間的予測はインター予測とも呼ばれるが、それは異なるビデオフレームの間(インター) の依存関係を使用する予測であるからである。したがって、現在のブロックとも呼ばれる符号化されているブロックは、参照ピクチャと呼ばれる1つ以上の既に符号化されたピクチャから予測される。参照ピクチャは、ビデオシーケンスの表示順序で、現在のブロックがある現在のピクチャよりも先のピクチャであるとは限らない。エンコーダは、表示順序とは異なる符号化順序でピクチャを符号化してもよい。現在のブロックの予測として、参照ピクチャ内の同一位置のブロックが、決定されてもよい。同一位置のブロックは、参照ピクチャ内で、現在のピクチャ内の現在のブロックと同じ位置にあるブロックである。そのような予測は、動きのないピクチャの領域、つまり、ピクチャ毎に動かないピクチャの領域に関しては正確である。動きを考慮に入れるプレディクタ、つまり、動き補償されたプレディクタを得るために、現在のブロックの予測を決定するとき、概して、動き推定が使用される。したがって、現在のブロックは、同一位置のブロックの位置から動きベクトルによって与えられた距離にある参照ピクチャ内のブロックによって予測される。デコーダが現在のブロックの同じ予測を決定することを可能にするために、動きベクトルが、ビットストリーム内でシグナリングされてもよい。ブロックの各々に関する動きベクトルをシグナリングすることによって引き起こされるシグナリングのオーバーヘッドをさらに削減するために、動きベクトルそれ自身が、推定されてもよい。動きベクトルの推定は、空間および/または時間領域において隣接するブロックの動きベクトルに基づいて実行されてもよい。現在のブロックの予測は、2つ以上の参照ピクチャから得られた予測を重み付けすることによって1つの参照ピクチャを使用して計算されてもよい。参照ピクチャは、隣接するピクチャ、つまり、表示順序で現在のピクチャの直前のピクチャおよび/または直後のピクチャが現在のピクチャに類似している可能性が最も高いので、隣接するピクチャであってもよい。しかし、概して、参照ピクチャは、表示順序で現在のピクチャの前または後およびビットストリーム(復号順序)で現在のピクチャの前の任意のその他のピクチャであってもよい。これは、たとえば、ビデオコンテンツにおける遮蔽および/または非線形の動きの場合に利点をもたらしてもよい。したがって、参照ピクチャの識別情報も、ビットストリーム内でシグナリングされてもよい。インター予測の特別なモードは、2つの参照ピクチャが現在のブロックの予測を生成する際に使用されるいわゆる双方向予測である。特に、それぞれの2つの参照ピクチャにおいて決定された2つの予測が、現在のブロックの予測信号へと組み合わされる。双方向予測は、単方向予測、つまり、単一の参照ピクチャのみを使用する予測よりも現在のブロックのより正確な予測をもたらしてもよい。より正確な予測は、現在のブロックおよび予測のピクセルの間のより小さな差(「残差」とも呼ばれる)につながり、それらの差は、より効率的に符号化される、つまり、より短いビットストリームへと圧縮されてもよい。概して、2つより多くの参照ピクチャが、現在のブロックを予測するためにそれぞれの2つより多くの参照ブロックを発見するために使用されてもよく、つまり、多参照インター予測が、適用されうる。したがって、多参照予測という用語は、双方向予測および2つより多くの参照ピクチャを使用する予測を含む。より正確な動き推定を提供するために、参照ピクチャの解像度は、ピクセル間のサンプルを補間することによって高められてもよい。分数ピクセル補間が、最も近いピクセルの加重平均によって実行されうる。半ピクセルの解像度の場合、たとえば、概して、双一次補間が使用される。その他の分数ピクセルは、それぞれの最も近いピクセルと予測されているピクセルとの間の距離の逆数によって重み付けされた最も近いピクセルの平均として計算される。動きベクトルの推定は、現在のブロックと参照ピクチャ内で候補動きベクトルによって指し示される対応する予測ブロックとの間で類似性が計算される計算が複雑なタスクである。概して、探索領域は、画像のM×Mサンプルを含み、M×M個の候補位置のうちのサンプル位置の各々が、テストされる。テストは、N×Nの参照ブロックCと探索領域のテストされる候補位置にあるブロックRとの間の類似性の尺度の計算を含む。その単純さから、差分絶対値和(SAD)は、この目的で頻繁に使用される尺度であり、によって与えられる。上の式において、xおよびyは、探索領域内の候補位置を定義し、一方、インデックスi およびjは、参照ブロックCおよび候補ブロックR内のサンプルを表す。候補位置は、多くの場合、ブロックの変位またはオフセットと呼ばれ、これは、ブロックマッチングを、探索領域内で参照ブロックをシフトし、参照ブロックCと探索領域の重なり合う部分との間の類似性を計算することとして表現することを反映する。複雑さを減らすために、通常、候補動きベクトルの数が、候補動きベクトルを特定の探索空間に制限することによって削減される。探索空間は、たとえば、現在の画像内の現在のブロックの位置に対応する参照ピクチャ内の位置の周りのピクセルの数および/または位置によって定義されてもよい。M ×M個すべての候補位置xおよびyに関してSADを計算した後、最も一致するブロックRは、参照ブロックCとの最も高い類似性に対応する最も低いSADをもたらす位置のブロックである。一方、候補動きベクトルは、隣接するブロックの動きベクトルによって形成された候補動きベクトルのリストによって定義されてもよい。通常、動きベクトルは、エンコーダ側で少なくとも部分的に決定され、符号化されたビットストリーム内でデコーダにシグナリングされる。しかし、動きベクトルは、デコーダにおいても導出されてもよい。そのような場合、現在のブロックは、デコーダにおいて利用可能でなく、参照ピクチャ内で候補動きベクトルが指し示すブロックとの類似性を計算するために使用されることができない。したがって、現在のブロックの代わりに、既に復号されたブロックのピクセルから構築されるテンプレートが使用される。たとえば、現在のブロックに隣接する既に復号されたピクセルが、使用されてもよい。そのような動き推定は、シグナリングを削減するという利点をもたらし、つまり、動きベクトルは、エンコーダとデコーダとの両方において同じ方法で導出され、したがって、シグナリングは、必要とされない。一方、そのような動き推定の正確性は、より低くてもよい。正確さとシグナリングのオーバーヘッドとの間の折り合いをつけるために、動きベクトルの推定は、2つのステップ、つまり、動きベクトルの導出および動きベクトルの精緻化に分割されてもよい。たとえば、動きベクトルの導出は、候補のリストからの動きベクトルの選択を含んでもよい。そのような選択された動きベクトルは、たとえば、探索空間内の探索によってさらに精緻化されてもよい。探索領域内の探索は、各候補動きベクトルに関して、つまり、候補動きベクトルが指し示すブロックの各候補位置に関してコスト関数を計算することに基づく。文献JVET-D0029: Decoder-Side Motion Vector Refinement Based on Bilateral Templ ate Matching、X. Chen、J. An、J. Zheng(文献は、http://phenix.it-sudparis.eu/jvet /のサイトにおいて見つけられうる)は、整数ピクセルの解像度の第1の動きベクトルが発見され、第1の動きベクトルの周りの探索空間内の半ピクセルの解像度による探索によってさらに精緻化される動きベクトルの精緻化を示す。動きベクトルの精緻化を実行するためには、少なくとも、現在のブロックが精緻化を実行するために必要なサンプル、つまり、探索空間に対応するサンプルおよび探索空間におけるテンプレートマッチングが実行されるときにアクセスされうるサンプルをメモリに記憶する必要がある。外部メモリアクセスは、現在のハードウェアのアーキテクチャおよび/またはソフトウェアの実装の重要な設計パラメータである。これは、外部メモリアクセスが内部メモリ利用に比べて処理を遅くするという事実に原因がある。一方、チップ上の内部メモリは、たとえば、チップサイズの実装が原因で制限される。動きベクトルの導出および精緻化が使用されてもよいエンコーダの例示的な構造を示すブロック図である。動きベクトルの導出および精緻化が使用されてもよいデコーダの例示的な構造を示すブロック図である。双方向予測に好適な例示的なテンプレートマッチングを示す概略図である。単方向および双方向予測に好適な例示的なテンプレートマッチングを示す概略図である。ビットストリーム内で精緻化される初期動きベクトルを提供することなく動作する動きベクトルの導出の段階を示すブロック図である。本発明の実施形態を実装するための例示的なハードウェアを示すブロック図である。符号化ブロックに関して、アクセスされるために利用可能であるべきサンプルをともなう例示的なウィンドウを示す概略図である。反復的な探索空間を示す概略図である。補間フィルタリングによる水平方向のメモリアクセスウィンドウの拡張を示す概略図である。分数サンプル位置に関するサブウィンドウの定義を示す概略図である。メモリアクセスウィンドウの例示的な定義を示す概略図である。動きベクトルの精緻化のための探索空間の位置を形成することを許される分数位置を含む例示的な位置を示す概略図である。動きベクトルの精緻化のための探索空間の位置を形成することを許されない例示的な分数位置を示す概略図である。探索空間のどの位置が動きベクトルの精緻化のためにテンプレートマッチングによってテストされることを許されるかを決定するための方法を示す流れ図である。動きベクトルの精緻化のための探索空間の位置を形成することを許される分数位置を含む例示的な位置を示す概略図である。メモリアクセスウィンドウにおける反復的な精緻化プロセスを示す流れ図である。探索サブウィンドウにおける反復的な精緻化プロセスを示す流れ図である。本開示は、参照ピクチャ内の分数位置を取得するた