JP-2026514770-A - 画像エンコーディング/デコーディング方法及び装置、並びにビットストリームを保存した記録媒体
Abstract
本開示に係る画像デコーディング/エンコーディング方法及び装置は、現在ブロックを第1パーティション及び第2パーティションを含む複数のパーティションに分割し、第1パーティションの第1予測ブロックを誘導し、第2パーティションの第2予測ブロックを誘導し、第1予測ブロック及び第2予測ブロックに基づいて現在ブロックの予測ブロックを誘導することができる。ここで、第1予測ブロック又は第2予測ブロックのうち少なくとも一つは両方向予測によって誘導されてよい。 【選択図】 図4
Inventors
- アン ヨンチョ
- イム チェヒョン
- パク ネリ
- ナム チョンハク
- チャン ヒョンムン
Assignees
- エルジー エレクトロニクス インコーポレイティド
Dates
- Publication Date
- 20260513
- Application Date
- 20240419
- Priority Date
- 20230419
Claims (15)
- 現在ブロックを複数のパーティションに分割する段階であって、前記複数のパーティションは、第1パーティション及び第2パーティションを含む、段階と、 前記第1パーティションの第1予測ブロックを誘導する段階と、 前記第2パーティションの第2予測ブロックを誘導する段階と、 前記第1予測ブロック及び前記第2予測ブロックに基づいて前記現在ブロックの予測ブロックを誘導する段階と、を含み、 前記第1予測ブロック又は前記第2予測ブロックのうち少なくとも一つは、両方向予測によって誘導される、画像デコーディング方法。
- 前記第1パーティションが前記両方向予測を行う場合に、前記第1パーティションに対してL0予測ブロック及びL1予測ブロックが誘導され、 前記第1予測ブロックは、前記L0予測ブロックと前記L1予測ブロックとの加重和に基づいて誘導される、請求項1に記載の画像デコーディング方法。
- 前記加重和のための加重値は、予め定義された加重値セットに属する複数の加重値候補のいずれか一つに基づいて決定される、請求項2に記載の画像デコーディング方法。
- 前記第1予測ブロックを誘導する段階は、 前記第1パーティションの動きベクトルに基づいて所定の探索領域を決定する段階と、 前記探索領域内の探索位置のそれぞれに対してコスト(cost)を算出する段階と、 前記算出されたコストのうち最小コストを持つ探索位置に基づいて、前記第1パーティションのL0予測ブロック及びL1予測ブロックを誘導する段階と、を含む、請求項1に記載の画像デコーディング方法。
- 前記コストは、前記探索位置の加重されたL0ブロックと前記加重されたL0ブロックに対応する加重されたL1ブロックとのSAD(sum of absolute difference)と算出される、請求項4に記載の画像デコーディング方法。
- 前記第1予測ブロックを誘導する段階は、 前記第1パーティションのL0予測ブロックに第1照明補償パラメータを適用して照明補償されたL0予測ブロックを生成する段階であって、前記第1照明補償パラメータは、前記現在ブロックの周辺領域及び前記L0予測ブロックの周辺領域に基づいて誘導される、段階と、 前記第1パーティションのL1予測ブロックに第2照明補償パラメータを適用して照明補償されたL1予測ブロックを生成する段階であって、前記第2照明補償パラメータは、前記現在ブロックの周辺領域及び前記L1予測ブロックの周辺領域に基づいて誘導される、段階と、 前記照明補償されたL0予測ブロックと前記照明補償されたL1予測ブロックとの加重和に基づいて前記第1予測ブロックを誘導する段階と、を含む、請求項1に記載の画像デコーディング方法。
- 前記加重和のための加重値は、予め定義された加重値セットに属する複数の加重値候補のいずれか一つに基づいて決定される、請求項6に記載の画像デコーディング方法。
- 前記第1予測ブロックのサンプルの値は、前記第1パーティションのL0予測ブロックに属するサンプルの値、前記第1パーティションのL1予測ブロックに属するサンプルの値、又は所定のオフセット、のうち少なくとも一つに基づいて誘導され、 前記オフセットは、前記L0予測ブロックに属するサンプルの位置における水平及び垂直方向の勾配、又は前記L1予測ブロックに属するサンプルの位置における水平及び垂直方向の勾配、のうち少なくとも一つに基づいて誘導される、請求項1に記載の画像デコーディング方法。
- 前記第1パーティション及び前記第2パーティションのそれぞれは、マージモード、IBC(intra block copy)モード、又はTMP(template matching-based prediction)モード、のいずれか一つで符号化されたブロックである、請求項1に記載の画像デコーディング方法。
- 前記第1パーティション及び前記第2パーティションのそれぞれに対してBCWインデックスが取得され、 前記BCWインデックスは、予め定義された加重値セットに属する複数の加重値候補のいずれか一つを特定する、請求項1に記載の画像デコーディング方法。
- 前記現在ブロックは、第1領域、第2領域、及びブレンディング領域に区分され、 前記ブレンディング領域には、前記第1パーティションのBCWインデックス又は前記第2パーティションのBCWインデックスのいずれか一つが選択的に保存される、請求項10に記載の画像デコーディング方法。
- 前記第1予測ブロック及び前記第2予測ブロックは、内部ビット深度と同じビット精度を有し、前記現在ブロックの予測ブロックは、出力ビット深度と同じビット精度を有する、請求項1に記載の画像デコーディング方法。
- 現在ブロックを複数のパーティションに分割する段階であって、前記複数のパーティションは、第1パーティション及び第2パーティションを含む、段階と、 前記第1パーティションの第1予測ブロックを誘導する段階と、 前記第2パーティションの第2予測ブロックを誘導する段階と、 前記第1予測ブロック及び前記第2予測ブロックに基づいて前記現在ブロックの予測ブロックを誘導する段階と、を含み、 前記第1予測ブロック又は前記第2予測ブロックのうち少なくとも一つは、両方向予測によって誘導される、画像エンコーディング方法。
- 画像エンコーディング方法によって生成されたビットストリームを保存するコンピュータ可読記録媒体であって、前記画像エンコーディング方法は、 現在ブロックを複数のパーティションに分割する段階であって、前記複数のパーティションは、第1パーティション及び第2パーティションを含む、段階と、 前記第1パーティションの第1予測ブロックを誘導する段階と、 前記第2パーティションの第2予測ブロックを誘導する段階と、 前記第1予測ブロック及び前記第2予測ブロックに基づいて前記現在ブロックの予測ブロックを誘導する段階と、を含み、 前記第1予測ブロック又は前記第2予測ブロックのうち少なくとも一つは、両方向予測によって誘導される、コンピュータ可読記録媒体。
- 画像情報に対するビットストリームを取得する段階であって、前記ビットストリームは、現在ブロックを第1パーティション及び第2パーティションを含む複数のパーティションに分割する段階、前記第1パーティションの第1予測ブロックを誘導する段階、前記第2パーティションの第2予測ブロックを誘導する段階、及び前記第1予測ブロック及び前記第2予測ブロックに基づいて前記現在ブロックの予測ブロックを誘導する段階に基づいて生成される、段階と、 前記ビットストリームを含むデータを伝送する段階と、を含み、 前記第1予測ブロック又は前記第2予測ブロックのうち少なくとも一つは、両方向予測によって誘導される、データ伝送方法。
Description
本発明は、画像エンコーディング/デコーディング方法及び装置、並びにビットストリームを保存した記録媒体に関する。 近年、HD(High Definition)画像及びUHD(Ultra High Definition)画像のような高解像度、高品質の画像に対する需要が様々な応用分野で増加しており、これにより、高効率の画像圧縮技術が議論されている。 画像圧縮技術として、現在ピクチャーの以前又は以後のピクチャーから、現在ピクチャーに含まれた画素値を予測するインター予測技術、現在ピクチャー内の画素情報を用いて現在ピクチャーに含まれた画素値を予測するイントラ予測技術、出現頻度の高い値に短い符号を割り当て、出現頻度の低い値に長い符号を割り当てるエントロピー符号化技術などの様々な技術が存在し、かかる画像圧縮技術を用いて画像データを効果的に圧縮し、伝送又は保存することができる。 本開示に係るビデオ/画像コーディングシステムを示す図である。本開示の実施例の適用が可能であり、ビデオ/画像信号のエンコーディングが行われるエンコーディング装置の概略ブロック図である。本開示の実施例の適用が可能であり、ビデオ/画像信号のデコーディングが行われるデコーディング装置の概略ブロック図である。本開示に係る一実施例であり、デコーディング装置300によって行われるインター予測方法を示す図である。本開示に係るインター予測方法を行うインター予測部332の概略構成を示す図である。本開示に係る一実施例であり、エンコーディング装置(200)によって行われるインター予測方法を示す図である。本開示に係るインター予測方法を行うインター予測部(221)の概略構成を示す図である。本開示の実施例の適用が可能なコンテンツストリーミングシステムの例を示す図である。 本開示は、様々な変更を加えることができ、様々な実施例を有し得るところ、特定の実施例を図面に例示し、詳細に説明する。ただし、これは、本開示を特定の実施の形態に対して限定しようとするものではなく、本開示の思想及び技術範囲に含まれる全ての変更、均等物又は代替物を含むものと理解されるべきである。各図の説明において、類似の参照符号を類似の構成要素に対して使用する。 第1、第2などの用語は、様々な構成要素を説明するために使われてよいが、これらの構成要素は当該用語によって限定されてはならない。これらの用語は、一つの構成要素を他の構成要素から区別する目的で使われるだけである。例えば、本開示の権利範囲を逸脱することなく第1構成要素は第2構成要素と命名でき、同様に第2構成要素も第1構成要素と命名できる。「及び/又は」という用語は、複数の関連した記載項目の組合せ又は複数の関連した記載項目のいずれかの項目を含む。 ある構成要素が他の構成要素に「連結されて」いる又は「接続されて」いると言及されたとき、他の構成要素に直接連結されている又は直接接続されていてもよく、中間にさらに他の構成要素が存在してもよいと理解されるべきである。一方、ある構成要素が他の構成要素に「直接連結されて」いる又は「直接接続されて」いると言及されたときには、中間にさらに他の構成要素が存在しないと理解されるべきであろう。 本出願で使われる用語は、単に特定の実施例を説明するためのもので、本開示を限定しようとする意図ではない。単数の表現は、文脈において別に断らない限り、複数の表現をも含む。本出願において、「含む」又は「有する」などの用語は、明細書上に記載された特徴、数字、段階、動作、構成要素、部品又はこれらを組み合わせたものが存在することを指定しようとするもので、1つ又はそれ以上の他の特徴、数字、段階、動作、構成要素、部品又はそれらを組み合わせたものの存在又は付加の可能性をあらかじめ排除しないものと理解されるべきである。 本開示は、ビデオ/画像コーディングに関する。例えば、本明細書に開示の方法/実施例は、VVC(versatile video coding)標準に開示される方法に適用されてよい。また、この明細書に開示の方法/実施例は、EVC(essential video coding)標準、AV1(AOMedia Video 1)標準、AVS2(2nd generation of audio video coding standard)、又は次世代ビデオ/画像コーディング標準(例えば、H.267又はH.268など)に開示される方法に適用されてよい。 この明細書は、ビデオ/画像コーディングに関する様々な実施例を提示し、特に言及がない限り、上記の実施例は互いに組み合わせて行われてよい。 この明細書において、ビデオ(video)は、時間の流れによる一連の画像(image)の集合を意味できる。ピクチャー(picture)は、一般に、特定時間帯の1つの画像を示す単位を意味し、スライス(slice)/タイル(tile)は、コーディングにおいてピクチャーの一部を構成する単位である。スライス/タイルは、1つ以上のCTU(coding tree unit)を含んでよい。1つのピクチャーは1つ以上のスライス/タイルで構成されてよい。1つのタイルは、1つのピクチャーの特定タイル列と特定タイル行における複数のCTUで構成された長方形の領域である。タイル列は、ピクチャーの高さと同じ高さと、ピクチャーパラメータセットのシンタックス要求によって指定された幅とを有するCTUの長方形の領域である。タイル行は、ピクチャーパラメータセットによって指定された高さと、ピクチャーの幅と同じ幅とを有するCTUの長方形の領域である。1つのタイル内のCTUは、CTUラスタースキャンによって連続して配列される一方、1つのピクチャー内のタイルは、タイルのラスタースキャンによって連続して配列されてよい。1つのスライスは、単一NALユニットに排他的に含まれ得るピクチャーのタイル内で整数個の完全なタイル又は整数個の連続した完全なCTU行を含んでよい。一方、1つのピクチャーは、2つ以上のサブピクチャーに区分されてよい。サブピクチャーは、ピクチャーにおける1つ以上のスライスの長方形の領域であってよい。 画素、ピクセル(pixel)又はペル(pel)は、1つのピクチャー(又は、画像)を構成する最小の単位を意味できる。また、ピクセルに対応する用語として「サンプル(sample)」が使われてよい。サンプルは一般に、ピクセル又はピクセルの値を示すことができ、輝度(luma)成分のピクセル/ピクセル値のみを示してもよく、色差(chroma)成分のピクセル/ピクセル値のみを示してもよい。 ユニット(unit)は、画像処理の基本単位を意味できる。ユニットは、ピクチャーの特定領域及び当該領域に関連した情報のうち少なくとも1つを含んでよい。1つのユニットは、1つのルマブロック及び2つのクロマ(例えば、cb、cr)ブロックを含んでよい。ユニットは、場合によって、ブロック(block)又は領域(area)などの用語と同じ意味で使われてよい。一般的には、MxNブロックは、M個の列とN個の行からなるサンプル(又は、サンプルアレイ)又は変換係数(transform coefficient)の集合(又は、アレイ)を含んでよい。 本明細書において「A又はB(A or B)」は、「Aのみ」、「Bのみ」又は「AとB両方」を意味できる。言い換えると、本明細書において「A又はB(A or B)」は、「A及び/又はB(A and/or B)」と解釈されてよい。例えば、本明細書において「A、B又はC(A,B or C)」は、「Aのみ」、「Bのみ」、「Cのみ」、又は「A、B及びCの任意の全ての組合(any combination of A,B and C)」を意味できる。 本明細書で使われるスラッシュ(/)又はコンマ(comma)は、「及び/又は(and/or)」を意味できる。例えば、「A/B」は、「A及び/又はB」を意味できる。これにより、「A/B」は、「Aのみ」、「Bのみ」、又は「AとB両方」を意味できる。例えば、「A、B、C」は、「A、B又はC」を意味できる。 本明細書において「少なくとも1つのA及びB(at least one of A and B)」は、「Aのみ」、「Bのみ」又は「AとB両方」を意味できる。また、本明細書において「少なくとも1つのA又はB(at least one of A or B)」又は「少なくとも1つのA及び/又はB(at least one of A and/or B)」という表現は、「少なくとも1つのA及びB(at least one of A and B)」と同一に解釈されてよい。 また、本明細書において「少なくとも1つのA、B及びC(at least one of A,B and C)」は、「Aのみ」、「Bのみ」、「Cのみ」、又は「A、B及びCの任意の全ての組合(any combination of A,B and C)」を意味できる。また、「少なくとも1つのA、B又はC(at least one of A,B or C)」又は「少なくとも1つのA、B及び/又はC(at least one of A,B and/or C)」は、「少なくとも1つのA、B及びC(at least one of A,B and C)」を意味できる。 また、本明細書で使われる括弧は、「例えば(for example)」を意味できる。具体的には、「予測(イントラ予測)」と表示された場合に、「予測」の一例として「イントラ予測」が提案されたものであってよい。言い換えると、本明細書の「予測」は、「イントラ予測」に制限(limit)されず、「イントラ予測」が「予測」の一例として提案されたものであってもよい。また、「予測(すなわち、イントラ予測)」と表示された場合にも、「予測」の一例として「イントラ予測」が提案されたものであってよい。 本明細書において、同一図面中に個別的に説明される技術的特徴は、個別的に具現されてもよく、同時に具現されてもよい。 図1は、本開示に係るビデオ/画像コーディングシステムを示す図である。 図1を参照すると、ビデオ/画像コーディングシステムは、第1装置(ソースデバイス)及び第2装置(受信デバイス)を含んでよい。 ソースデバイスは、エンコードされたビデオ(video)/画像(image)情報又はデータをファイル又はストリーミングの形態で、デジタル記憶媒体又はネットワークを通じて受信デバイスに伝達できる。前記ソースデバイスは、ビデオソース、エンコーディング装置、及び伝送部を含んでよい。前記受信デバイスは、受信部、デコーディング装置、及びレンダラーを含んでよい。前記エンコーディング装置は、ビデオ/画像エンコーディング装置と呼ばれてもよく、前記デコーディング装置は、ビデオ/画像デコーディング装置と呼ばれてもよい。送信機はエンコーディング装置に含まれてよい。受信機はデコーディング装置に含まれてよい。レンダラーは、ディスプレイ部を含んでもよく、ディスプレイ部は、別個のデバイス又は外部コンポーネントで構成されてもよい。 ビデオソースは、ビデオ/画像のキャプチャー、合成又は生成過程などを通じてビデオ/画像を取得できる。ビデオソースは、ビデオ/画像キャプチャーデバイス及び/又はビデオ/画像生成デバイスを含んでよい。ビデオ/画像キャプチャーデバイスは、1つ以上のカメラ、以前にキャプチャーされたビデオ/画像を含むビデオ/画像アーカイブなどを含んでよい。ビデオ/画像生成デバイスは、コンピュータ、タブレット及びスマートフォンなどを含んでよく、(電子的に)ビデオ/画像を生成できる。例えば、コンピュータなどを通じて仮