Search

JP-2026514631-A - 勾配及び位置を用いたフィルタードイントラブロックコピー

JP2026514631AJP 2026514631 AJP2026514631 AJP 2026514631AJP-2026514631-A

Abstract

本開示の態様は、映像復号符号化方法及び映像復号符号化装置と映像媒体データを処理する方法とを含む。フィルタードイントラブロックコピー(FIBC)モードを用いて現在ピクチャ中の現在ブロックが予測されることを示すコーディングされた情報を受け取り、IBCモードとイントラテンプレートマッチング(IntraTMP)モードとの一方を用いて予測された予測サンプルに線形フィルタを適用することによって現在ブロック中の現在サンプルの線形予測値を決定し、少なくとも1つの勾配フィルタを用いて現在サンプルに関連する勾配値を決定し、線形予測値と、勾配値を含む少なくとも1つの修正値との合計に基づいて現在サンプルの予測値を決定するように構成される処理回路を含む映像復号装置。FIBCモードのFIBCフィルタが線形フィルタと少なくとも1つの勾配フィルタとを含む。

Inventors

  • ビャオ・ワン
  • リェン-フェイ・チェン
  • ロマン・チェルニャク
  • シン・ジャオ

Assignees

  • テンセント・アメリカ・エルエルシー

Dates

Publication Date
20260513
Application Date
20240423
Priority Date
20230426

Claims (15)

  1. 映像媒体データを処理する方法であって、前記方法は、 フォーマット規則にしたがって前記映像媒体データのビットストリームを処理するステップ を備え、 前記ビットストリームは、フィルタードイントラブロックコピー(FIBC)モードを用いて現在ピクチャ中の現在ブロックが予測されることを示すシンタックス要素を含み、 前記フォーマット規則は、 イントラブロックコピーIBCモードとイントラテンプレートマッチング(IntraTMP)モードとの一方を用いて予測されたサンプルに線形フィルタを適用することによって前記現在ブロック中の現在サンプルの線形予測値が決定されることと、 少なくとも1つの勾配フィルタを用いて前記現在ブロック中の前記現在サンプルに関連する勾配値が決定されることと、 前記現在サンプルと前記現在サンプルの近傍のサンプルとの少なくとも一方から、非線形値と、前記現在サンプル及び前記近傍のサンプルの前記少なくとも一方の値との間の非線形関係を用いて前記現在サンプルに関連する非線形値が決定されることと、 位置値が前記線形フィルタの中央にある中央のサンプルの位置に基づくことと、 前記現在サンプルの予測値が前記線形予測値と、前記勾配値、前記非線形値及び前記位置値を含む少なくとも1つの修正値との合計に基づき、前記FIBCモードのFIBCフィルタが前記線形フィルタと前記少なくとも1つの勾配フィルタと前記非線形値の係数と前記位置の係数とを含むことと、 前記現在サンプルが前記現在サンプルの前記予測値から処理されることと を指定する、方法。
  2. 前記線形フィルタはバイアス項を含む、請求項1に記載の方法。
  3. 前記線形フィルタは前記現在ブロックの平均値を加算するように構成され、前記IBCモードと前記IntraTMPモードとの前記一方を用いて予測された前記サンプルの各々から前記現在ブロックの前記平均値を除く、請求項1又は2に記載の方法。
  4. イントラブロックコピー(IBC)モードとイントラテンプレートマッチング(IntraTMP)モードとの一方を用いて予測された予測サンプルに線形フィルタを適用することによって現在ブロック中の現在サンプルの線形予測値を決定するステップであって、前記現在ブロックはフィルタードIBC(FIBC)モードを用いて予測される、ステップと、 少なくとも1つの勾配フィルタを用いて前記現在ブロック中の前記現在サンプルに関連する勾配値を決定するステップと、 前記現在サンプルと前記現在サンプルの近傍のサンプルとの少なくとも一方から、非線形値と、前記現在サンプル及び前記近傍のサンプルの前記少なくとも一方の値との間の非線形関係を用いて前記現在サンプルに関連する非線形値を決定するステップと、 前記線形予測値と、前記勾配値及び前記非線形値を含む少なくとも1つの修正値との合計に基づいて前記現在サンプルの予測値を決定するステップであって、前記FIBCモードのFIBCフィルタが前記線形フィルタと前記少なくとも1つの勾配フィルタと前記非線形値の係数とを含む、ステップと、 前記現在サンプルの前記予測値から前記現在サンプルを符号化するステップと を備える映像符号化方法。
  5. 前記線形フィルタの中心にある中央のサンプルの位置を用いて位置値を決定するステップと、 前記線形予測値と、前記勾配値、前記非線形値及び前記位置値を含む前記少なくとも1つの修正値との前記合計に基づいて前記現在サンプルの前記予測値を決定するステップであって、前記FIBCモードの前記FIBCフィルタは前記線形フィルタと前記少なくとも1つの勾配フィルタと前記非線形値の前記係数と前記位置の係数とを含む、ステップと をさらに備える請求項4に記載の方法。
  6. 前記線形フィルタはバイアス項を含む、又は 前記線形フィルタは、前記現在ブロックの平均値を加算し、前記IBCモードと前記IntraTMPモードとの前記一方を用いて予測された前記サンプルの各々から前記現在ブロックの前記平均値を除くように構成される、 請求項4又は5に記載の方法。
  7. フィルタードイントラブロックコピー(FIBC)モードを用いて現在ピクチャ中の現在ブロックが予測されることを示すコーディングされた情報を受け取ることと、 IBCモードとイントラテンプレートマッチング(IntraTMP)モードとの一方を用いて予測された予測サンプルに線形フィルタを適用することによって前記現在ブロック中の現在サンプルの線形予測値を決定することと、 少なくとも1つの勾配フィルタを用いて前記現在ブロック中の前記現在サンプルに関連する勾配値を決定することと、 前記線形予測値と、前記勾配値を含む少なくとも1つの修正値との合計に基づいて前記現在サンプルの予測値を決定することであって、前記FIBCモードのFIBCフィルタが前記線形フィルタと前記少なくとも1つの勾配フィルタとを含む、ことと、 前記現在サンプルの前記予測値から前記現在サンプルを再構成することと を行なうように構成される処理回路 を備える映像復号装置。
  8. 前記処理回路は、 前記線形フィルタの中心にある中央のサンプルの位置を用いて位置値を決定することと、 前記線形予測値と、前記勾配値及び前記位置値を含む前記少なくとも1つの修正値との合計に基づいて前記現在サンプルの前記予測値を決定することであって、前記FIBCモードの前記FIBCフィルタは前記線形フィルタと前記少なくとも1つの勾配フィルタと前記位置の係数とを含む、ことと を行なうように構成される、請求項7に記載の装置。
  9. 前記処理回路は、 前記現在サンプルと前記現在サンプルの近傍のサンプルとの少なくとも一方から、前記非線形値と、前記現在サンプル及び前記近傍のサンプルの前記少なくとも一方の値との間の非線形関係を用いて前記現在サンプルに関連する非線形値を決定することと、 前記線形予測値と、前記勾配値及び前記非線形値を含む前記少なくとも1つの修正値との合計に基づいて前記現在サンプルの前記予測値を決定することであって、前記FIBCモードの前記FIBCフィルタは前記線形フィルタと前記少なくとも1つの勾配フィルタと前記非線形値の係数とを含む、ことと を行なうように構成される、請求項7に記載の装置。
  10. 前記線形フィルタはバイアス項を含む、請求項7から9のいずれか1項に記載の装置。
  11. 前記線形フィルタは前記現在ブロックの平均値を加算し、前記IBCモードと前記IntraTMPモードとの前記一方を用いて予測された前記サンプルの各々から前記現在ブロックの前記平均値を除く、請求項7から10のいずれか1項に記載の装置。
  12. 前記処理回路は前記現在サンプルの前記予測値を切り取るように構成される、請求項7から11のいずれか1項に記載の装置。
  13. 前記処理回路は、前記現在ブロックの現在テンプレートと、前記現在ブロックのブロックベクトルによって示される参照ブロックの参照テンプレートとから前記FIBCモードの前記FIBCフィルタの係数を決定するように構成される、請求項7から12のいずれか1項に記載の装置。
  14. 前記線形フィルタは、 (i)オフセットが(0,0)である前記線形フィルタの中央のサンプルと、オフセットが(0,-1)である北のサンプルNと、オフセットが(0,1)である南のサンプルSと、オフセットが(1,0)である東のサンプルEと、オフセットが(-1,0)である西のサンプルWとを含む5つのサンプルであって、前記線形フィルタ中の前記5つのサンプルの前記オフセットは前記中央のサンプルを基準とする、5つのサンプル又は (ii)オフセットが(0,0)である前記線形フィルタの中央のサンプルと、オフセットがそれぞれ(0,-1)及び(0,-2)である2つの北のサンプルと、オフセットがそれぞれ(0,1)及び(0,2)である2つの南のサンプルと、オフセットがそれぞれ(1,0)及び(2,0)である2つの東のサンプルと、オフセットがそれぞれ(-1,0)及び(-2,0)である2つの西のサンプルとを含む9つのサンプルであって、前記線形フィルタ中の前記9つのサンプルの前記オフセットは前記中央のサンプルを基準とする、9つのサンプル を含む十字形状を持つ、請求項7から13のいずれか1項に記載の装置。
  15. 前記線形フィルタが前記5つのサンプルを有する場合、前記現在サンプルが前記5つのサンプルのそれぞれの位置である5つの位置の1つに位置し、 前記線形フィルタが前記9つのサンプルを有する場合、前記現在サンプルが前記9つのサンプルのそれぞれの位置である9つの位置の1つに位置する、 請求項14に記載の装置。

Description

関連する出願 本出願は、2023年4月26日に出願された米国仮出願第63/462,235号“Gradient and Location based Filtered Intra Block Copy”の優先権の利益を主張するものであり、本米国仮出願の全体が参照により本開示に援用される。 本開示では概して映像コーディングに関する態様を説明する。 以下に記載されている背景の説明は本開示の背景を概略的に示すためのものである。背景に関する本記載で説明されている範囲において、本願において氏名が掲載されている発明者が行なったものと、その他、出願時の先行技術としての地位を獲得し得ない説明の態様とは、本開示に対する先行技術として明示的にも黙示的にも自認されるものではない。 画像/映像圧縮により、品質劣化を最小にしつつ異なるデバイス、ストレージやネットワークにわたって画像/映像データを伝送するのを容易にすることができる。いくつかの例では、映像コーデック技術により空間的及び時間的冗長性に基づいて映像を圧縮することができる。一例では、映像コーデックで、空間的冗長性に基づいて画像を圧縮することができるイントラ予測と称される手法を用いることができる。たとえば、イントラ予測では、サンプル予測のために再構成中の現在ピクチャから得られる参照データを用いることができる。別の例では、映像コーデックで、時間的冗長性に基づいて画像を圧縮することができるインタ予測と称される手法を用いることができる。たとえば、インタ予測では、動き補償を用いて以前に再構成されたピクチャから現在ピクチャ中のサンプルを予測することができる。動き補償を動きベクトル(MV)によって表わすことができる。 通信システム(100)のブロック図の一例の概略図である。デコーダのブロック図の一例の概略図である。エンコーダのブロック図の一例の概略図である。本開示の一態様に係る畳込みフィルタの一例を示す。本開示の一態様に係るフィルタ係数を導出するのに用いられる参照領域の例を示す。本開示の一態様に係る勾配及び位置を用いた畳込み成分間モデル(GL-CCCM)に用いられる空間サンプルの例を示す。本開示の一態様に係るイントラテンプレートマッチング予測(IntraTMP)モードの例を示す。本開示の一態様に係るフィルタードイントラブロックコピー(FIBC)モデルの修正の例を示す。本開示の一態様に係るFIBCモードで利用可能なフィルタの例を示す。本開示の一態様に係るFIBCモードで利用可能なフィルタの例を示す。本開示の一態様に係るFIBCモードで利用可能なフィルタの例を示す。本開示の一態様に係る勾配を計算するのに用いられる入力サンプルCの近傍のサンプルの例を示す。本開示の一態様に係る勾配計算方法を選択する例を示す。本開示の一態様に係るサンプルC、A、L及びALそれぞれの位置の例を示す。本開示のいくつかの態様に係る復号処理を概略的に示すフローチャートを示す。本開示のいくつかの態様に係る符号化処理を概略的に示すフローチャートを示す。一態様に係るコンピュータシステムの概略図である。 図1はいくつかの例の映像処理システム(100)のブロック図を示す。映像処理システム(100)は開示されている保護対象、ストリーミング環境における映像エンコーダ及び映像デコーダの適用の例である。開示されている保護対象は、たとえば、ビデオ会議、デジタルTV、ストリーミングサービス、CD、DVD、メモリスティックなどのデジタル媒体に圧縮映像を記憶するものなどを含む映像に対応する他の適用例にも同様に適用可能であるものであることが可能である。 映像処理システム(100)は、たとえば圧縮されていない映像ピクチャのストリーム(102)を作成する映像ソース(101)、たとえばデジタルカメラを含むことができる撮像サブシステム(113)を含む。一例では、映像ピクチャのストリーム(102)はデジタルカメラによって撮られるサンプルを含む。符号化された映像データ(104)(すなわちコーディングされた映像ビットストリーム)と比較する場合にデータ量が多いことを強調するために映像ピクチャのストリーム(102)を太線で示しているが、その映像ピクチャのストリーム(102)を、映像ソース(101)に接続されている映像エンコーダ(103)を含む電子デバイス(120)によって処理することができる。映像エンコーダ(103)は、以降で詳細に説明されている、開示されている保護対象の態様を可能にしたり実施したりするハードウェア、ソフトウェア又はこれらの組合せを含むことができる。映像ピクチャのストリーム(102)と比較する場合にデータ量が少ないことを強調するために、符号化された映像データ(104)(すなわち符号化された映像ビットストリーム)を細線で示しているが、この符号化された映像データ(104)を、後の使用のためにストリーミングサーバ(105)に記憶することができる。図1のクライアントサブシステム(106)及び(108)などの1つ以上のストリーミングクライアントサブシステムはストリーミングサーバ(105)にアクセスして、符号化された映像データ(104)の複製(107)及び(109)を取得することができる。クライアントサブシステム(106)は、たとえば電子デバイス(130)中にある映像デコーダ(110)を含むことができる。映像デコーダ(110)は符号化された映像データの複製(107)を入力して復号し、ディスプレイ(112)(たとえば、表示画面)又はその他描画するデバイス(図示せず)に描画することができる映像ピクチャの出力ストリーム(111)を作成する。いくつかのストリーミングシステムでは、符号化された映像データ(104),(107)及び(109)(たとえば映像ビットストリーム)を特定の映像コーディング/圧縮標準にしたがって符号化することができる。このような標準の例にはITU-T勧告H.265が含まれる。一例では、開発中の映像コーディング標準が非公式にはVersatile Video Coding(VVC)として知られている。開示されている保護対象をVVCを前提として用いてもよい。 電子デバイス(120)及び(130)が他の構成要素(図示せず)を含むことができることに留意する。たとえば、電子デバイス(120)が映像デコーダ(図示せず)を含むことができ、同様に、電子デバイス(130)が映像エンコーダ(図示せず)を含むことができる。 図2は映像デコーダ(210)のブロック図の例を示す。映像デコーダ(210)を電子デバイス(230)に含ませることができる。電子デバイス(230)は受信器(231)(たとえば受信回路)を含むことができる。映像デコーダ(210)を図1の例の映像デコーダ(110)の代わりに用いることができる。 受信器(231)は、映像デコーダ(210)によって復号されることになる1つ以上のコーディングされた映像シーケンス(たとえばビットストリームに含まれる)を受信してもよい。一態様では、一度に1つのコーディングされた映像シーケンスを受信し、その際、コーディングされた各映像シーケンスの復号が他のコーディングされた映像シーケンスの復号とは独立する。コーディングされた映像シーケンスをチャンネル(201)から受信してもよく、チャンネル(201)は、符号化された映像データを記憶する記憶デバイスにつなげられたハードウェア/ソフトウェアであってもよい。受信器(231)は他のデータ、たとえばコーディングされた音声データ及び/又は付属データストリームとともに符号化された映像データを受信してもよく、当該他のデータを、それに対応する所用のもの(図示せず)に転送してもよい。受信器(231)はコーディングされた映像シーケンスを他のデータから分離してもよい。ネットワークジッタに対処するために、受信器(231)とエントロピデコーダ/パーサ(220)(以下「パーサ(220)」)との間にバッファメモリ(215)を接続してもよい。いくつかの適用例では、バッファメモリ(215)は映像デコーダ(210)の一部である。他の例では、バッファメモリ(215)は映像デコーダ(210)外に存在することが可能である(図示せず)。さらに他の例では、たとえばネットワークのジッタに対処するために、映像デコーダ(210)外にバッファメモリ(図示せず)が存在することが可能であり、これに加えて、たとえばプレイアウトのタイミングを処理するために、映像デコーダ(210)内に別のバッファメモリ(215)が存在することが可能である。受信器(231)が十分な帯域幅及び制御性を持つ記憶/転送デバイスやアイソクロナスネットワークからデータを受信するものである場合、バッファメモリ(215)を要さずともよいし、バッファメモリ(215)が小規模であることが可能である。インターネットなどのベストエフォートパケットネットワークに用いる場合には、バッファメモリ(215)を要する場合があり、バッファメモリ(215)は比較的大規模であることが可能であり、かつ最適なサイズのメモリであることが可能であることが有効であり、バッファメモリ(215)を映像デコーダ(210)外のオペレーティングシステムや同様の要素(図示せず)で少なくとも部分的に実施してもよい。 映像デコーダ(210)は、コーディングされた映像シーケンスからシンボル(221)を再構成するパーサ(220)を含んでもよい。このようなシンボルのカテゴリには映像デコーダ(210)の動作を管理するのに用いられる情報が含まれ、図2に示されているように、電子デバイス(230)の一体部分ではなく、電子デバイス(230)に接続されることが可能である描画デバイス(212)(たとえば表示画面)などの描画するデバイスを制御する情報が含まれる場合がある。1つ以上の描画するデバイスに用いる制御情報はSupplemental Enhancement Information(SEI)メッセージやVideo Usability Information(VUI)パラメータセットフラグメント(図示せず)の形態をとってもよい。パーサ(220)は、受信されたコーディングされた映像シーケンスをパース/エントロピ復号することができる。当該コーディングされた映像シーケンスのコーディングは映像コーディング技術や標準に準拠することが可能であり、可変長符号化、ハフマン符号化、文脈依存を用いたり用いなかったりする算術符号化などを含む様々な原理にしたがうことができる。パーサ(220)は、コーディングされた映像シーケンスから、映像デコーダ中にある画素の部分群の少なくとも1つについての部分群パラメータの集合を、群に対応する少なくとも1つのパラメータに基づいて抽出してもよい。部分群は、Group of Picture(GOP)、ピクチャ、タイル、スライス、マクロブロック、Coding Unit(CU)、ブロック、Transform Unit(TU)、Prediction Unit(PU)などを含むことができる。パーサ(220)は、変換係数、クオンタイザパラメータ値、動きベクトルなどのコーディングされた映像シーケンス情報からも抽出を行なってもよい。 パーサ(220)は、バッファメモリ(215)から受け取った映像シーケンスにエントロピ復号/パーサ動作を実行することでシンボル(221)を作成してもよい。 シンボル(221)の再構成には、コーディングされた映像ピクチャ又はその部分のタイプ(たとえばピクチャ間及びピクチャ内、ブロック間及びブロック内)と他の因子とに応じて複数の異なる部位を関与させることができる。どの部位を関与させ、どのように関与させるのかを、コーディングされた映像シーケンスからパーサ(220)によってパースされた部分群制御情報によって制御することができる。明確