Search

JP-2026077997-A - マージモードに基づくインター予測方法及び装置

JP2026077997AJP 2026077997 AJP2026077997 AJP 2026077997AJP-2026077997-A

Abstract

【課題】空間的/時間的マージ候補のみならず、組み合わせマージ候補を用いることにより、動き情報の精度を向上させるインター予測方法及び装置を提供する。 【解決手段】方法は、現在ブロックのマージ候補リストを構成するステップと、マージ候補リストから現在ブロックの動き情報を導出するステップと、動き情報を用いて現在ブロックのインター予測を行うステップと、を含む。マージ候補リストは、空間的マージ候補、時間的マージ候補または組み合わせマージ候補のうち少なくとも1つを含み、組み合わせマージ候補は、マージ候補リストに属しているn個のマージ候補を組み合わせて導出される。 【選択図】図6

Inventors

  • キム、ギベク

Assignees

  • オッポ広東移動通信有限公司

Dates

Publication Date
20260513
Application Date
20260310
Priority Date
20180630

Claims (8)

  1. 現在ブロックのマージ候補リストを構築するステップと、 前記マージ候補リストから前記現在ブロックの動き情報を導出するステップであって、前記動き情報は、予測方向のフラグ、参照ピクチャインデックスまたは動きベクトルのうちの少なくとも一つを含む、ステップと、 前記動き情報を用いて、現在ブロックのインター予測を行うステップと、 を含み、 前記マージ候補リストが組み合わせマージ候補を含み、前記組み合わせマージ候補が、マージ候補リストに属しているn個のマージ候補を組み合わせて導出され、 前記n個のマージ候補が、第1のマージ候補及び第2のマージ候補を含み、前記組み合わせマージ候補の動き情報が、前記第1のマージ候補の動き情報と前記第2のマージ候補の動き情報を加重平均して導出され、 前記第1のマージ候補が第1の単方向予測動きベクトルに対応し、前記第2のマージ候補が第2の単方向予測動きベクトルに対応し、前記第1の単方向予測動きベクトル及び前記第2の単方向予測動きベクトルの方向が同じであり、 前記組み合わせマージ候補の参照ピクチャインデックスが、前記第1のマージ候補の参照ピクチャインデックスとして導出され、 前記動き情報を用いて、現在ブロックのインター予測を行うステップは、 前記現在ブロックの参照ピクチャインデックスに基づいて、参照ピクチャリストから参照ピクチャを選択することと、 前記現在ブロックの動きベクトルに基づいて、前記参照ピクチャ内の参照ブロックを特定することと、 前記特定された参照ブロックの再構成画素を用いて、現在ブロックの予測画素を生成することと、を含み、 前記n個のマージ候補が、前記マージ候補リストにおける0から(n-1)のインデックスに対応するマージ候補であり、 前記組み合わせマージ候補のインデックスが、時間的マージ候補のインデックスよりも大きい、ビデオ信号の復号化方法。
  2. 前記加重平均の重みが、[1:1]、[1:2]、[1:3]または[2:3]のいずれか1つである、請求項1に記載のビデオ信号の復号化方法。
  3. 前記方法は、ビットストリームによりシグナリングされる残差係数に逆量子化または逆変換の少なくとも一方を行って前記残差画素を得ることを含む、請求項1に記載のビデオ信号の復号化方法。
  4. インター予測を行うためのプログラムを格納するためのメモリと、 前記プログラムを実行して請求項1から3のいずれか一項に記載のビデオ信号の復号化方法を実行するためのプロセッサと、を備える、ビデオ信号の復号化装置。
  5. 現在ブロックのマージ候補リストを構築するステップと、 前記マージ候補リストから前記現在ブロックの動き情報を導出するステップであって、前記動き情報は、予測方向のフラグ、参照ピクチャインデックスまたは動きベクトルのうちの少なくとも一つを含む、ステップと、 前記動き情報を用いて、現在ブロックのインター予測を行うステップと、 を含み、 前記マージ候補リストが組み合わせマージ候補を含み、 前記組み合わせマージ候補が、マージ候補リストに属しているn個のマージ候補を組み合わせて導出され、 前記n個のマージ候補が、第1のマージ候補及び第2のマージ候補を含み、前記組み合わせマージ候補の動き情報が、前記第1のマージ候補の動き情報と前記第2のマージ候補の動き情報を加重平均して導出され、 前記第1のマージ候補が第1の単方向予測動きベクトルに対応し、前記第2のマージ候補が第2の単方向予測動きベクトルに対応し、前記第1の単方向予測動きベクトル及び前記第2の単方向予測動きベクトルの方向が同じであり、 前記組み合わせマージ候補の参照ピクチャインデックスが、前記第1のマージ候補の参照ピクチャインデックスとして導出され、 前記動き情報を用いて、現在ブロックのインター予測を行うステップは、 前記現在ブロックの参照ピクチャインデックスに基づいて、参照ピクチャリストから参照ピクチャを選択することと、 前記現在ブロックの動きベクトルに基づいて、前記参照ピクチャ内の参照ブロックを特定することと、 前記特定された参照ブロックの再構成画素を用いて、現在ブロックの予測画素を生成することと、を含み、 前記n個のマージ候補が、前記マージ候補リストにおける0から(n-1)のインデックスに対応するマージ候補であり、 前記組み合わせマージ候補のインデックスが、時間的マージ候補のインデックスよりも大きい、ビデオ信号の符号化方法。
  6. 前記加重平均の重みが、[1:1]、[1:2]、[1:3]または[2:3]のいずれか1つである、請求項1に記載のビデオ信号の符号化方法。
  7. インター予測を行うためのプログラムを格納するためのメモリと、 前記プログラムを実行して請求項5または6に記載のビデオ信号の符号化方法を実行するためのプロセッサと、を備える、ビデオ信号の符号化装置。
  8. コンピュータ可読記憶媒体であって、コンピュータプログラムおよびビットストリームが記憶されており、前記コンピュータプログラムがプロセッサによって実行されるときに、前記ビットストリームを生成するために前記プロセッサに以下の操作を実施させ、前記操作は、 現在ブロックのマージ候補リストを構築するステップと、 前記マージ候補リストから前記現在ブロックの動き情報を導出するステップであって、前記動き情報は、予測方向のフラグ、参照ピクチャインデックスまたは動きベクトルのうちの少なくとも一つを含む、ステップと、 前記動き情報を用いて、現在ブロックのインター予測を行うステップと、 を含み、 前記マージ候補リストが組み合わせマージ候補を含み、 前記組み合わせマージ候補が、マージ候補リストに属しているn個のマージ候補を組み合わせて導出され、 前記n個のマージ候補が、第1のマージ候補及び第2のマージ候補を含み、前記組み合わせマージ候補の動き情報が、前記第1のマージ候補の動き情報と前記第2のマージ候補の動き情報を加重平均して導出され、 前記第1のマージ候補が第1の単方向予測動きベクトルに対応し、前記第2のマージ候補が第2の単方向予測動きベクトルに対応し、前記第1の単方向予測動きベクトル及び前記第2の単方向予測動きベクトルの方向が同じであり、 前記組み合わせマージ候補の参照ピクチャインデックスが、前記第1のマージ候補の参照ピクチャインデックスとして導出され、 前記動き情報を用いて、現在ブロックのインター予測を行うステップは、 前記現在ブロックの参照ピクチャインデックスに基づいて、参照ピクチャリストから参照ピクチャを選択することと、 前記現在ブロックの動きベクトルに基づいて、前記参照ピクチャ内の参照ブロックを特定することと、 前記特定された参照ブロックの再構成画素を用いて、現在ブロックの予測画素を生成することと、を含み、 前記n個のマージ候補が、前記マージ候補リストにおける0から(n-1)のインデックスに対応するマージ候補であり、 前記組み合わせマージ候補のインデックスが、時間的マージ候補のインデックスよりも大きい、コンピュータ可読記憶媒体。

Description

本発明は、インター予測方法及び装置に関する。 近年では、高精細度(HD;High Definition)画像及び超高精細度(UHD;Ultra High Definition)画像などの高解像度、高品質の画像への需要が様々な応用分野において増えており、それに伴い、高効率の画像圧縮技術が検討されている。 画像圧縮技術として、現在ピクチャの前または後のピクチャから現在ピクチャに含まれている画素値を予測するインター予測技術、現在ピクチャ内の画素情報を用いて、現在ピクチャに含まれている画素値を予測するイントラ予測技術、出現頻度の高い値に短い符号を割り当て、出現頻度の低い値に長い符号を割り当てるエントロピー符号化技術などの様々な技術が存在し、このような画像圧縮技術を用いて、画像データを効果的に圧縮して伝送または格納することができる。 本発明の一実施形態に係る画像符号化装置のブロック図である。本発明の一実施形態に係る画像復号化装置のブロック図である。木ベースのブロックの形状を示す例示図である。本発明のブロック分割部において取得可能な様々なブロックの形状を示す例示図である。本発明の一実施形態に係るブロック分割過程を示す図である。本発明が適用される一実施形態であって、ブロック単位のマージモードに基づくインター予測を行う方法を示す図である。本発明が適用される一実施形態であって、アフィンモデルに基づくインター予測方法を示す図である。本発明が適用される一実施形態であって、空間的/時間的隣接ブロックの制御点ベクトルからアフィン候補を導出する方法を示す図である。本発明が適用される一実施形態であって、空間的/時間的隣接ブロックの動きベクトルの組み合わせに基づいて、構成された候補を導出する方法を示す図である。本発明が適用される一実施形態であって、サブブロックに基づく時間的候補の動き情報を導出する方法を示す図である。本発明が適用される一実施形態であって、ERPプロジェクションフォーマットにおけるインター予測方法を示す図である。本発明が適用される一実施形態であって、CMPプロジェクションフォーマットにおけるインター予測方法を示す図である。本発明が適用される一実施形態であって、CMPプロジェクションフォーマットにおけるインター予測方法を示す図である。本発明が適用される一実施形態であって、CMPプロジェクションフォーマットにおけるインター予測方法を示す図である。本発明が適用される一実施形態であって、CMPプロジェクションフォーマットにおけるインター予測方法を示す図である。 本発明に係るビデオ符号化/復号化方法及び装置は、現在ブロックのマージ候補リストを構成し、前記マージ候補リストから前記現在ブロックの動き情報を導出し、前記動き情報を用いて、現在ブロックのインター予測を行ってもよい。 本発明に係るビデオ符号化/復号化方法及び装置において、前記マージ候補リストは、空間的マージ候補、時間的マージ候補または組み合わせマージ候補のうち少なくとも1つを含んでいてもよい。 本発明に係るビデオ符号化/復号化方法及び装置において、前記組み合わせマージ候補は、マージ候補リストに属しているn個のマージ候補を組み合わせて導出されてもよい。 本発明に係るビデオ符号化/復号化方法及び装置において、前記n個のマージ候補は、前記マージ候補リストにおける0から(n-1)のインデックスに対応するマージ候補であってもよい。 本発明に係るビデオ符号化/復号化方法及び装置において、前記組み合わせマージ候補のインデックスは、前記時間的マージ候補のインデックスよりも大きくてもよい。 本発明に係るビデオ符号化/復号化方法及び装置において、前記n個のマージ候補は、第1のマージ候補と第2のマージ候補を含み、前記組み合わせマージ候補の動き情報は、前記第1のマージ候補の予測方向と前記第2のマージ候補の予測方向を考慮して導出されてもよい。 本発明に係るビデオ符号化/復号化方法及び装置において、前記組み合わせマージ候補の動き情報は、前記第1のマージ候補の動き情報と前記第2のマージ候補の動き情報を加重平均して導出されてもよい。 本発明に係るビデオ符号化/復号化方法及び装置において、前記加重平均の重みは、[1:1]、[1:2]、[1:3]または[2:3]のいずれか1つであってもよい。 本発明に係るビデオ符号化/復号化方法及び装置は、現在ブロックの動き情報を予測するための候補リストを生成し、前記候補リストと候補インデックスに基づいて、前記現在ブロックの制御点ベクトルを導出し、前記現在ブロックの制御点ベクトルに基づいて、前記現在ブロックの動きベクトルを導出し、前記動きベクトルを用いて、前記現在ブロックに対してインター予測を行ってもよい。 本発明に係るビデオ符号化/復号化装置において、前記候補リストは、複数のアフィン候補を含んでいてもよい。 本発明に係るビデオ符号化/復号化装置において、前記アフィン候補は、空間的候補、時間的候補または構成された候補のうち少なくとも1つを含んでいてもよい。 本発明に係るビデオ符号化/復号化装置において、前記現在ブロックの動きベクトルは、前記現在ブロックのサブブロックの単位で導出されてもよい。 本発明に係るビデオ符号化/復号化装置において、前記空間的候補は、前記現在ブロックの境界が符号化木ブロックの境界(CTU boundary)に接するか否かを考慮して決定されてもよい。 本発明に係るビデオ符号化/復号化装置において、前記構成された候補は、前記現在ブロックの各隅部に対応する制御点ベクトルのうち少なくとも2つの組み合わせに基づいて決定されてもよい。 本発明に係るビデオ符号化/復号化方法及び装置は、インター予測のための参照領域が参照ピクチャの境界または不連続的な表面間の境界を含む場合、相関性のある領域のデータを用いて、参照領域の全部または一部の画素を取得してもよい。 本発明は、様々な変更を加えることができ、また種々の実施形態を有することができるが、特定の実施形態を図面に例示し、詳しく説明する。しかしながら、これは、本発明を特定の実施形態に限定するためのものではなく、本発明の思想及び技術範囲に含まれるあらゆる変更、均等物乃至代替物を含むものとして理解されるべきである。 「第1の」、「第2の」、「A」、「B」などの用語は、様々な構成要素を説明する上で使用可能であるが、前記構成要素は、前記用語によって何ら限定されない。前記の用語は、ある構成要素を他の構成要素から区別する目的のみで用いられる。例えば、本発明の権利範囲を逸脱しない範囲内において第1の構成要素は第2の構成要素と命名されてもよく、同様に、第2の構成要素もまた第1の構成要素と命名されてもよい。及び/またはという用語は、複数の関連する記載項目の組み合わせまたは複数の関連する記載項目のうちのいずれか一つの項目を含む。 ある構成要素が他の構成要素と「連結」されているとか、「接続」されていると言及される場合、その他の構成要素に直接的に連結されたり接続されたりしている場合もあるが、間に別の構成要素が存在することもあると理解されるべきである。これに対し、ある構成要素が他の構成要素と「直接的に連結」されているとか、「直接的に接続されている」と言及されたときには、間に別の構成要素が存在しないものと理解されるべきである。 また、本出願において用いる用語は、単に特定の実施形態を説明するために用いられたものであり、本発明を限定しようとする意図はない。単数形の表現は、コンテキストからみて明らかに他の意味を有さない限り、複数形の言い回しを含む。本出願における「含む」または「有する」などの用語は、明細書に記載された特徴、数字、段階、動作、構成要素、部品またはこれらを組み合わせたものが存在することを指定するものに過ぎず、一つまたはそれ以上の他の特徴や数字、段階、動作、構成要素、部品またはこれらを組み合わせたものの存在または付加の可能性を予め排除しないものとして理解されるべきである。 特に断りのない限り、技術的用語及び科学的用語をはじめとするここで用いられる全ての用語は、本発明が属する技術分野において通常の知識を有する者にとって一般的に理解されるものと同様の意味を有する。一般に用いられる、辞書に定義されているような用語は、関連技術のコンテキスト上有する意味と一致する意味を有するものと解釈されるべきであり、本出願において明らかに定義しない限り、理想的な意味として、または過度に形式的な意味として解釈してはならない。 画像符号化装置及び復号化装置は、パソコン(PC;Personal Computer)、ノート型パソコン、個人情報端末(PDA;Personal Digital Assistant)、携帯型マルチメディアプレーヤー(PMP;Portable Multimedia Player)、プレイステーションポータブル(PSP;PlayStation Portable)、無線通信端末(Wireless Communication Terminal)、スマートフォン(Smart Phone)、TV、仮想現実デバイス(Virtual Reality;VR)、拡張現実デバイス(Augmented Reality;AR)、複合現実デバイス(Mixed Reality;MR)、頭部装着ディスプレイ(Head Mounted Display;HMD)、スマートグラス(Smart Glasses)などのユーザー端末であるか、あるいは応用サーバとサービスサーバなどのサーバ端末であってもよく、各種の機器もしくは有無線通信網と通信を行うための通信モデムなどの通信装置、画像を符号化もしくは復号化し、符号化もしくは復号化のためにイントラ(Intra)またはインター(Inter)予測を行うための各種のプログラムとデータを格納するためのメモリ(Memory)、プログラムを起動して演算及び制御するためのプロセッサ(Processor)などを有する様々な装置を備えていてもよい。なお、画像符号化装置によりビットストリームで符号化された画像は、リアルタイムまたは非リアルタイムにてインターネット、近距離無線通信網、無線LAN網、ワイブロ(WiBro)網、移動通信網などの有無線通信網(Network)などを介して、もしくは、ケーブル、汎用直列バス(USB;Universal Serial Bus)などの様々な通信インターフェースを介して画像復号化装置に伝送され、画像復号化装置において復号化されて画像に復元され且つ再生されてもよい。 また、画像符号化装置によりビットストリームで符号化された画像は、コンピュータにて読み取り可能な記録媒体を介して符号化装置から復号化装置へと受け渡されてもよい。 前述した画像符号化装置と画像復号化装置は、それぞれ別々の装置であってもよいが、必要に応じて、1台の画像符号化/復号化装置として作製されてもよい。その場合、画像符号化装置の一部の構成は、画像復号化装置の一部の構成と実質的に同じ技術的な要素であって、少なくとも同じ構造を含むか、あるいは、少なくとも同じ機能を行うように実現されてもよい。 従って、以下において技術要素とこれらの作動原理などについての詳細な説明を行うに当たっては、対応する技術要素の重複する説明を省略する。 そして、画像復号化装置は、画像符号化装置において行われる画像符号化方法を復号化に適用するコンピューティング装置に対応するため、以下の説明においては、画像符号化装置に重点をおいて説明する。 コンピューティング装置は、画像符号化方法及び/または画像復号化方法を実現するプログラムやソフトウェアモジュールを格納するメモリと、メモリに接続されてプログラムを実行するプロセッサと、を備えていてもよい。なお、画像符号化装置は符号化器と称され、画像