JP-2026514634-A - サブブロック・レベルでのイントラ・テンプレート・マッチング予測のためのブロック・ベクトル精密化
Abstract
ビデオ復号化装置は処理回路を含む。処理回路は、カレント・ブロックのコーディングされた情報を受信するように更に構成されている。コーディングされた情報は、カレント・ブロックがイントラ・テンプレート・マッチング予測(intraTMP)モードでコーディングされていることを示す。処理回路は、カレント・ブロックの第1のサブブロックに対する第1の探索範囲内で第1の複数の候補ブロック・ベクトル(BV)を決定するように構成されている。第1の探索範囲はカレント・ブロックのBVに基づいて決定される。複数の候補BVは、カレント・ブロックの第1のサブブロックに対する複数の候補予測サブブロックを示す。処理回路は、intraTMPモードに基づいて、第1の探索範囲内で決定される複数の候補BVから、第1のサブブロックの精密BVを決定するように構成されている。処理回路は、第1のサブブロックの精密BVに基づいて、第1のサブブロックを再構成するように構成されている。
Inventors
- ワン,ビヤオ
- ジャオ,シン
- チェルニャク,ロマン
- リウ,シャン
- チェン,リン-フェイ
- ペリンガッセリー クリシュナン,マドゥ
Assignees
- テンセント・アメリカ・エルエルシー
Dates
- Publication Date
- 20260513
- Application Date
- 20240424
- Priority Date
- 20230426
Claims (15)
- 視覚的メディア・データを処理する方法であって: フォーマット・ルールに従って前記視覚的メディア・データのビットストリームを処理するステップを含み、 前記ビットストリームは、カレント・ピクチャ内のカレント・ブロックのコーディングされた情報を含み、前記コーディングされた情報は、前記カレント・ブロックが、イントラ・テンプレート・マッチング予測(intraTMP)モードでコーディングされることを示し; 前記フォーマット・ルールは: 前記カレント・ブロックの予測ブロックは、前記intraTMPモードでコーディングされた前記カレント・ブロックに基づいて初期探索範囲内で定義される複数の候補予測ブロックから予測され、前記予測ブロックは、前記カレント・ブロックのブロック・ベクトル(BV)によって参照されること; 第1の複数の候補BVは前記カレント・ブロックの第1のサブブロックに対する第1の探索範囲内で決定され、第2の複数の候補BVは前記カレント・ブロックの第2のサブブロックに対する第2の探索範囲内で決定されること; 前記初期探索範囲、前記第1の探索範囲、及び前記第2の探索範囲は異なる探索領域を含むこと; 前記第1の探索範囲と前記第2の探索範囲は前記カレント・ブロックのBVに基づいて決定されること; 前記第1のサブブロックの前記第1の複数の候補BVは、前記第1のサブブロックに対する複数の候補予測サブブロックを示すこと; 前記第2のサブブロックの前記第2の複数の候補BVは、前記第2のサブブロックに対する複数の候補予測サブブロックを示すこと; 前記第1のサブブロックの精密BVは、前記intraTMPモードに基づいて前記第1の複数の候補BVから決定されること; 前記第2のサブブロックの精密BVは、前記intraTMPモードに基づいて前記第2の複数の候補BVから決定されること; 前記第1のサブブロックは、前記第1のサブブロックの精密BVに基づいて処理されること;及び 前記第2のサブブロックは、前記第2のサブブロックの精密BVに基づいて処理されること; を規定している、方法。
- 請求項1に記載の方法において、前記フォーマット・ルールは: 前記第1のサブブロックのテンプレートと前記第1のサブブロックの複数の候補予測サブブロック各々のテンプレートとの間でコスト値が決定されること;及び 前記第1のサブブロックの第1の複数の候補BVに対応する複数の候補予測サブブロックのテンプレートと前記第1のサブブロックのテンプレートとの間のコスト値のうちの最小コスト値に対応する第1のサブブロックの精密BVとして、前記第1のサブブロックの第1の複数の候補BVのうちの1つが決定されること; を規定している、方法。
- 請求項1に記載の方法において、前記フォーマット・ルールは: 前記カレント・ブロックのBVは、第1の成分BVx及び第2の成分BVyにより定義されること; 前記第1の探索範囲は、左上座標(BVx-OffsetL1,BV1y-OffsetT1)及び右下座標(BVx+OffsetR1,BVy+OffsetB1)により定義され、OffsetL1,OffsetT1,OffestR1,及びOffsetB1は、事前に定義された定数であること; 前記第2の探索範囲は、左上座標(BVx-OffsetL2,BVy-OffsetT2)及び右下座標(BVx+OffsetR2,BVy+OffsetB2)により定義され、OffsetL2,OffsetT2,OffestR2,及びOffsetB2は、事前に定義された定数であること; OffsetL2,OffsetT2,OffestR2,及びOffsetB2は、前記第1の探索範囲の少なくとも1つの対応するオフセットと相違していること; を規定している、方法。
- 請求項1ないし3のうちの何れか一項に記載の方法において: 前記第1の探索範囲の境界は、前記初期探索範囲の境界を越えていない又は越えている、方法。
- ビデオ符号化方法であって: イントラ・テンプレート・マッチング予測(intraTMP)モードに基づいて、初期探索範囲内で定義される複数の候補予測ブロックから、カレント・ピクチャ内のカレント・ブロックの予測ブロックを決定するステップであって、前記予測ブロックは、前記カレント・ブロックのブロック・ベクトル(BV)によって参照される、ステップ; 前記カレント・ブロックの第1のサブブロックに対する第1の探索範囲内で第1の複数の候補BVを決定するステップであって、前記初期探索範囲と前記第1の探索範囲は異なる探索領域を含み、前記第1の探索範囲は前記カレント・ブロックのBVに基づいて決定され、前記第1のサブブロックの前記第1の複数の候補BVは、前記第1のサブブロックに対する複数の候補予測サブブロックを示す、ステップ; 前記intraTMPモードに基づいて、前記第1の複数の候補BVから、前記第1のサブブロックの精密BVを決定するステップ;及び 前記第1のサブブロックの精密BVに基づいて、前記第1のサブブロックをビットストリームに符号化するステップ; を含む方法。
- 請求項5に記載の方法において、前記精密BVを決定するステップは、更に: 前記第1のサブブロックのテンプレートと前記複数の候補予測サブブロック各々のテンプレートとの間のコスト値を決定するステップ;及び 前記第1のサブブロックの第1の複数の候補BVに対応する複数の候補予測サブブロックのテンプレートと前記第1のサブブロックのテンプレートとの間のコスト値のうちの最小コスト値に対応する第1のサブブロックの精密BVとして、前記第1のサブブロックの第1の複数の候補BVのうちの1つを決定するステップ; を含む方法。
- 請求項5又は6に記載の方法において: 前記カレント・ブロックのBVは、第1の成分BVx及び第2の成分BVyにより定義され; 前記第1の探索範囲は、左上座標(BVx-OffsetL1,BV1y-OffsetT1)及び右下座標(BVx+OffsetR1,BVy+OffsetB1)により定義され、OffsetL1,OffsetT1,OffestR1,及びOffsetB1は、事前に定義された定数である、方法。
- 処理回路を備えるビデオ復号化装置であって、前記処理回路は: カレント・ピクチャ内のカレント・ブロックのコーディングされた情報を含むビットストリームを受信するステップであって、前記コーディングされた情報は、前記カレント・ブロックが、イントラ・テンプレート・マッチング予測(intraTMP)モードに基づいてコーディングされることを示し、intraTMPモードにおいては、前記カレント・ブロックの予測ブロックは、前記カレント・ブロックのテンプレートと前記予測ブロックのテンプレートとの間のコスト値に基づいて決定され、前記予測ブロックは、前記カレント・ブロックのブロック・ベクトル(BV)によって参照される、ステップ; 前記カレント・ブロックの第1のサブブロックに対する第1の探索範囲内で第1の複数の候補BVを決定するステップであって、前記第1の探索範囲は前記カレント・ブロックのBVに基づいて決定され、前記第1の複数の候補BVは、前記カレント・ブロックの第1のサブブロックに対する複数の候補予測サブブロックを示す、ステップ; 前記intraTMPモードに基づいて、前記第1の複数の候補BVから、前記第1のサブブロックの精密BVを決定するステップ;及び 前記第1のサブブロックの精密BVに基づいて、前記第1のサブブロックを再構成するステップ; を行うように構成されている、装置。
- 請求項8に記載の装置において、前記処理回路は: 前記第1のサブブロックのテンプレートと前記複数の候補予測サブブロック各々のテンプレートとの間のコスト値を決定するステップ;及び 前記第1のサブブロックの第1の複数の候補BVに対応する複数の候補予測サブブロックのテンプレートと前記第1のサブブロックのテンプレートとの間のコスト値のうちの最小コスト値に対応する第1のサブブロックの精密BVとして、前記第1のサブブロックの第1の複数の候補BVのうちの1つを決定するステップ; を行うように構成されている、装置。
- 請求項8に記載の装置において、前記処理回路は: 前記カレント・ブロックの第2のサブブロックに対する第2の探索範囲内で第2の複数の候補BVを決定するステップであって、前記第2の探索範囲は前記カレント・ブロックのBVに基づいて決定される、ステップ;及び 前記intraTMPモードに基づいて、前記第2の複数の候補BVから、前記第2のサブブロックの精密BVを決定するステップであって、前記第2の探索範囲は、前記第1の探索範囲とは異なる、ステップ; を行うように構成されている、装置。
- 請求項10に記載の装置において: 前記カレント・ブロックのBVは、第1の成分BVx及び第2の成分BVyにより定義され; 前記第1の探索範囲は、左上座標(BVx-OffsetL1,BV1y-OffsetT1)及び右下座標(BVx+OffsetR1,BVy+OffsetB1)により定義され、OffsetL1,OffsetT1,OffestR1,及びOffsetB1は、事前に定義された定数であり;及び 前記第2の探索範囲は、左上座標(BVx-OffsetL2,BVy-OffsetT2)及び右下座標(BVx+OffsetR2,BVy+OffsetB2)により定義され、OffsetL2,OffsetT2,OffestR2,及びOffsetB2は、事前に定義された定数であり、及び、前記第1の探索範囲の少なくとも1つの対応するオフセットと相違している、装置。
- 請求項8ないし11のうちの何れか一項に記載の装置において: 前記カレント・ブロックのBVは、前記intraTMPモードに従って初期探索範囲で定義される前記カレント・ブロックの複数の候補BVから決定され;及び 前記第1の探索範囲の境界は、前記初期探索範囲の境界を越えているか、又は前記初期探索範囲の境界を越えていない、装置。
- 請求項8ないし11のうちの何れか一項に記載の装置において: 前記カレント・ブロックのBVの精度は、第1の整数pel及び第1のsub-pelのうちの何れかにおけるものであり; 前記第1のサブブロックのBVの精度は、第2の整数pel及び第2のsub-pelのうちの何れかにおけるものであり; 前記第1の整数pelは、1-pel,2-pel,4-pel,及び8-pelのうちの何れかを含み、前記第1のsub-pelは、1/2-pel,1/4-pel,及び1/8-pelのうちの何れかを含み;及び 前記第2の整数pelは、1-pel,2-pel,4-pel,及び8-pelのうちの何れかを含み、前記第2のsub-pelは、1/2-pel,1/4-pel,及び1/8-pelのうちの何れかを含む、装置。
- 請求項8ないし11のうちの何れか一項に記載の装置において、前記処理回路は: 前記複数の候補予測サブブロックから、前記第1のサブブロックの予測サブブロックを決定するステップであって、前記第1のサブブロックの予測サブブロックは、前記精密BVにより示される、ステップ;及び (i)前記第1のサブブロックの予測サブブロックのサンプルとして、又は(ii)フィルタ係数に基づいてフィルタリングされる予測サブブロックのフィルタリングされたサンプルとして、前記第1のサブブロックの再構成されたサンプルを決定するステップ; を行うように構成されている、装置。
- 請求項8ないし11のうちの何れか一項に記載の装置において、前記処理回路は: (i)前記第1のサブブロックの精密BV、及び(ii)前記第1のサブブロックの精密BVと前記第2のサブブロックの精密BVとの重み付けされた結合のうちの何れかとして、前記カレント・ピクチャ内の別のブロックのBVを決定するステップであって、前記第1のサブブロックは、前記カレント・ブロックのサブブロックのうちの、前記別のブロックに最も近いサブブロックである、ステップ;及び 前記決定ステップで決定された前記別のブロックのBVによって示される前記別のブロックの予測ブロックを決定するステップ; を行うように構成されている、装置。
Description
[0001] 関連出願 本件出願は、2023年4月26日付で出願された米国仮出願第63/462,233号「サブブロック・レベルでのイントラ・テンプレート・マッチング予測のためのブロック・ベクトル精密化」に対する優先権の利益を主張しており、その仮出願全体は参照により本件に援用される。 [0002] 技術分野 本開示は一般にビデオ・コーディングに関連する態様を述べている。 [0003] 本件で行われる背景の説明は、本開示の状況を一般的に提示するためのものである。目下の発明者名の下になされる仕事は、その仕事がこの背景のセクションだけでなく、別の方法で出願時における先行技術としての適格性を付与されない可能性のある記述の態様で説明される範囲において、本開示に対する先行技術として、明示的にも暗示的にも認められていない。 [0004] 画像/ビデオ圧縮は、最小限の品質劣化とともに、様々なデバイス、ストレージ、及びネットワークを介して画像/ビデオ・データを伝送することに役立つ可能性がある。一部の例において、ビデオ・コーデック技術は、空間的及び時間的な冗長性に基づいてビデオを圧縮することが可能である。一例では、ビデオ・コーデックは、空間冗長性に基づいて、画像を圧縮することが可能なイントラ予測と呼ばれる技術を使用することが可能である。例えば、イントラ予測は、サンプル予測のために再構成中のカレント・ピクチャ(current picture)からの参照データを使用することが可能である。別の例では、ビデオ・コーデックは、時間冗長性に基づいて、画像を圧縮することが可能なインター予測と呼ばれる技術を使用することが可能である。例えば、インター予測は、動き補償を用いて、以前に再構成されたピクチャから、カレント・ピクチャ内のサンプルを予測することが可能である。動き補償は、動きベクトル(motion vector,MV)によって示されることが可能である。 [0005] 本開示の態様は、ビデオ符号化/復号化のためのビットストリーム、方法、及び装置を含む。一部の例では、ビデオ符号化/復号化のための装置は、処理回路を含む。 [0006] 本開示の態様によれば、視覚的メディア・データを処理する方法が提供される。本方法において、視覚的メディア・データのビットストリームは、フォーマット・ルールに従って処理される。一例において、ビットストリームは、カレント・ピクチャ内のカレント・ブロックのコーディングされた情報を含む。コーディングされた情報は、カレント・ブロックが、イントラ・テンプレート・マッチング予測(intra template matching prediction,intraTMP)モードでコーディングされることを示す。フォーマット・ルールは以下を規定している:カレント・ブロックの予測ブロックは、カレント・ブロックがintraTMPモードでコーディングされていることに基づいて、初期探索範囲内で定義される複数の候補予測ブロックから予測される。予測ブロックは、カレント・ブロックのブロック・ベクトル(BV)によって参照される。第1の複数の候補BVはカレント・ブロックの第1のサブブロックに対する第1の探索範囲内で決定され、第2の複数の候補BVはカレント・ブロックの第2のサブブロックに対する第2の探索範囲内で決定される。フォーマット・ルールは、初期探索範囲、第1の探索範囲、及び第2の探索範囲は異なる探索領域を含むことを規定している。フォーマット・ルールは、第1の探索範囲と第2の探索範囲はカレント・ブロックのBVに基づいて決定されることを規定している。フォーマット・ルールは、第1のサブブロックの第1の複数の候補BVは、第1のサブブロックに対する複数の候補予測サブブロックを示すことを規定している。フォーマット・ルールは、第2のサブブロックの第2の複数の候補BVは、第2のサブブロックに対する複数の候補予測サブブロックを示すことを規定している。フォーマット・ルールは、第1のサブブロックの精密BV(refined BV)は、intraTMPモードに基づいて第1の複数の候補BVから決定されることを規定している。フォーマット・ルールは、第2のサブブロックの精密BVは、intraTMPモードに基づいて第2の複数の候補BVから決定されることを規定している。フォーマット・ルールは、第1のサブブロックは第1のサブブロックの精密BVに基づいて処理されること、及び、第2のサブブロックは第2のサブブロックの精密BVに基づいて処理されることを規定している。 [0007] 一例では、フォーマット・ルールは、第1のサブブロックのテンプレートと第1のサブブロックの複数の候補予測サブブロック各々のテンプレートとの間でコスト値が決定されることを規定している。フォーマット・ルールは、第1のサブブロックの第1の複数の候補BVに対応する複数の候補予測サブブロックのテンプレートと第1のサブブロックのテンプレートとの間のコスト値のうちの最小コスト値に対応する第1のサブブロックの精密BVとして、第1のサブブロックの第1の複数の候補BVのうちの1つが決定されることを規定している。 [0008] 一例において、フォーマット・ルールは、カレント・ブロックのBVは、第1の座標成分BVx及び第2の座標成分BVyにより定義されることを規定している。フォーマット・ルールは、第1の探索範囲は、左上座標(BVx-OffsetL1,BV1y-OffsetT1)及び右下座標(BVx+OffsetR1,BVy+OffsetB1)により定義され、OffsetL1,OffsetT1,OffestR1,及びOffsetB1は、事前に定義された定数であることを規定している。フォーマット・ルールは、第2の探索範囲は、左上座標(BVx-OffsetL2,BVy-OffsetT2)及び右下座標(BVx+OffsetR2,BVy+OffsetB2)により定義され、OffsetL2,OffsetT2,OffestR2,及びOffsetB2は、事前に定義された定数であることを規定している。フォーマット・ルールは、OffsetL2,OffsetT2,OffestR2,及びOffsetB2は、第1の探索範囲の少なくとも1つの対応するオフセットと相違していることを規定している。 [0009] 一例において、第1の探索範囲の境界は、初期探索範囲の境界の内側にある。 [0010] 一例において、第1の探索範囲の境界は、初期探索範囲の境界を越えている。 [0011] 本開示の別の態様によれば、ビデオ符号化方法が提供される。一例では、intraTMPモードに基づいて、初期探索範囲内で定義される複数の候補予測ブロックから、カレント・ピクチャ内のカレント・ブロックの予測ブロックが決定される。予測ブロックは、カレント・ブロックのBVによって参照される。カレント・ブロックの第1のサブブロックに対する第1の探索範囲内で、第1の複数の候補BVが決定される。初期探索範囲と第1の探索範囲は異なる探索領域を含む。第1の探索範囲はカレント・ブロックのBVに基づいて決定される。第1のサブブロックの第1の複数の候補BVは、第1のサブブロックに対する複数の候補予測サブブロックを示す。intraTMPモードに基づいて、第1の複数の候補BVから、第1のサブブロックの精密BVが決定される。第1のサブブロックの精密BVに基づいて、第1のサブブロックはビットストリームに符号化される。 [0012] 一例において、第1のサブブロックのテンプレートと複数の候補予測サブブロック各々のテンプレートとの間のコスト値が決定される。第1のサブブロックの第1の複数の候補BVに対応する複数の候補予測サブブロックのテンプレートと第1のサブブロックのテンプレートとの間のコスト値のうちの最小コスト値に対応する第1のサブブロックの精密BVとして、第1のサブブロックの第1の複数の候補BVのうちの1つが決定される。 [0013] 一例において、カレント・ブロックのBVは、第1の座標成分BVx及び第2の座標成分BVyにより定義される。第1の探索範囲は、左上座標(BVx-OffsetL1,BV1y-OffsetT1)及び右下座標(BVx+OffsetR1,BVy+OffsetB1)により定義される。OffsetL1,OffsetT1,OffestR1,及びOffsetB1は、事前に定義された定数である。 [0014] 一例において、カレント・ブロックの第2のサブブロックに対する第2の探索範囲内で、第2の複数の候補BVが決定される。第2の探索範囲はカレント・ブロックのBVに基づいて決定される。intraTMPモードに基づいて、第2の複数の候補BVから、第2のサブブロックの精密BVが決定される。第2の探索範囲は第1の探索範囲と相違する。 [0015] 本開示の更に別の態様によれば、ビデオ復号化装置が提供される。装置は処理回路を含む。処理回路は、カレント・ピクチャ内のカレント・ブロックのコーディングされた情報を含むビットストリームを受信するように構成されている。コーディングされた情報は、カレント・ブロックが、intraTMPモードに基づいてコーディングされることを示し、その場合、カレント・ブロックの予測ブロックは、カレント・ブロックのテンプレートと予測ブロックのテンプレートとの間のコスト値に基づいて決定され、予測ブロックは、カレント・ブロックのBVによって参照されるものである。処理回路は、カレント・ブロックの第1のサブブロックに対する第1の探索範囲内で第1の複数の候補BVを決定するように構成されている。第1の探索範囲はカレント・ブロックのBVに基づいて決定される。第1の複数の候補BVは、カレント・ブロックの第1のサブブロックに対する複数の候補予測サブブロックを示す。処理回路は、intraTMPモードに基づいて、第1の複数の候補BVから、第1のサブブロックの精密BVを決定するように構成されている。処理回路は、第1のサブブロックの精密BVに基づいて、第1のサブブロックを再構成するように構成されている。 [0016] 一例において、処理回路は、第1のサブブロックのテンプレートと複数の候補予測サブブロック各々のテンプレートとの間のコスト値を決定するように構成されている。処理回路は、第1のサブブロックの第1の複数の候補BVに対応する複数の候補予測サブブロックのテンプレートと第1のサブブロックのテンプレートとの間のコスト値のうちの最小コスト値に対応する第1のサブブロックの精密BVとして、第1のサブブロックの第1の複数の候補BVのうちの1つを決定するように構成されている。 [0017] 一例において、カレント・ブロックのBVは、第1の座標成分BVx及び第2の座標成分BVyにより定義され、第1の探索範囲は、左上座標(BVx-OffsetL1,BV1y-OffsetT1)及び右下座標(BVx+OffsetR1,BVy+OffsetB1)により定義される。OffsetL1,OffsetT1,OffestR1,及びOffsetB1は、事前に定義された定数である。 [0018] 一例において、処理回路は、カレント・ブロックの第2のサブブロックに対する第2の探索範囲内で、第2の複数の候補BVを決定するように構成されており、第2の探索範囲はカレント・ブロックのBVに基づいて決定される。処理回路は、intraTMPモードに基づいて、第2の複数の候補BVから、第2のサブブロックの精密BVを決定するように構成されており、第2の探索範囲は第1の探索範囲と相違する。 [0019] 一例において、第2の探索範囲は、左上座標(BVx-OffsetL2,BVy-OffsetT2)及び右下座標(BVx+OffsetR2,BVy+Of