JP-2026514633-A - ビデオコーディングのための方法、コンピューティングシステム、及びコンピュータ読み取り可能記憶媒体
Abstract
ここに記載される様々な実装は、映像をコーディングするための方法及びシステムを含む。一態様において、ビデオビットストリームは、現在コーディングブロックを有する現在画像フレームを含むとともに、残差テンプレートクロスコンポーネント残差モデル(RT-CCRM)モードについての第1のシンタックス要素をシグナリングする。RT-CCRMモードが有効にされるとき、コンピューティングシステムは、現在コーディングブロック内で、第1のクロマサンプルと、該第1のクロマサンプルに対応する1つ以上のルマサンプルとを特定し、現在コーディングブロック内の該1つ以上のルマサンプルの1つ以上の残差を決定し、RT-CCRMモードに対応する残差フィルタを適用して、該1つ以上のルマサンプルの残差に基づいて第1のクロマサンプルの第1の残差を生成する。コンピューティングシステムは、少なくとも第1の残差を用いて予測クロマサンプルを補償して第1のクロマサンプルを再構成することによって、現在画像フレームを再構成する。
Inventors
- チェン,リン-フェイ
- ジャオ,シン
- チェルニャク,ロマン
- シュー,シャオジョン
- リウ,シャン
Assignees
- テンセント・アメリカ・エルエルシー
Dates
- Publication Date
- 20260513
- Application Date
- 20240424
- Priority Date
- 20240423
Claims (20)
- デコーダが実行する、ビデオデータを復号するための方法であって、 現在画像フレームと、残差テンプレートクロスコンポーネント残差モデル(RT-CCRM)モードについての第1のシンタックス要素と、を含むビデオビットストリームを受信するステップと、 前記現在画像フレームの現在コーディングブロックの第1のクロマサンプルの第1の残差を、前記現在コーディングブロック内の前記第1のクロマサンプルに対応する1つ以上のルマサンプルの1つ以上の残差に基づいて生成するように、前記RT-CCRMモードが有効にされること、を前記第1のシンタックス要素に基づいて決定するステップと、 前記RT-CCRMモードが有効にされるとき、 前記現在コーディングブロック内で、前記第1のクロマサンプルと、前記第1のクロマサンプルに対応する前記1つ以上のルマサンプルとを特定し、 前記現在コーディングブロック内の前記1つ以上のルマサンプルの前記1つ以上の残差を決定し、 前記RT-CCRMモードに対応する残差フィルタを適用して、前記1つ以上のルマサンプルの前記1つ以上の残差に基づいて前記第1のクロマサンプルの前記第1の残差を生成する、ステップと、 少なくとも前記第1の残差を用いて予測クロマサンプルを補償して前記第1のクロマサンプルを再構成することによって、前記現在画像フレームを再構成するステップと、 を有する方法。
- 前記RT-CCRMモードについての前記第1のシンタックス要素は、第1のフラグ及び第2のフラグを含み、前記第1のフラグは、青色差(Cb)クロマサンプルの青クロマ残差を生成するために前記RT-CCRMモードが有効にされるかを示し、前記第2のフラグは、赤色差(Cr)クロマサンプルの赤クロマ残差を生成するために前記RT-CCRMモードが有効にされるかを示し、前記第1のクロマサンプルは、前記Cbクロマサンプル及び前記Crクロマサンプルを含む、請求項1に記載の方法。
- 前記現在コーディングブロックがマージモードに基づいて予測されることを決定するステップと、 前記マージモードに従って、ベクトルに基づいてマージ候補を決定するステップと、 前記ベクトルに基づいて、前記マージ候補に関連する参照テンプレートを特定するステップと、 前記現在コーディングブロックに関連付けられた現在テンプレートを特定するステップと、 前記参照テンプレートと前記現在テンプレートとに基づいて前記残差フィルタの複数のフィルタ係数を決定するステップと、 を更に有する請求項1に記載の方法。
- 前記マージモードは、インターマージモード、アフィンマージモード、及びイントラブロックコピー(IBC)モードのうちの1つである、請求項3に記載の方法。
- 前記マージモードは双予測での予測に対応し、 前記マージ候補は、第1の参照リストから選択された第1の候補、及び第2の参照リストから選択された第2の候補を含み、 前記参照テンプレートは、前記第1の候補に対応する第1の参照テンプレートと前記第2の候補に対応する第2の参照テンプレートとの加重平均である、 請求項3に記載の方法。
- 局所強度補償(LIC)についてのフラグが前記マージ候補に対して有効にされるとき、前記参照テンプレートに局所強度補償を適用するステップ、 を更に有する請求項3に記載の方法。
- アドバンスト動きベクトル予測(AMVP)モードにおいて、 前記マージ候補の動きベクトル予測子(MVP)及び動きベクトル差分(MVD)に基づいて前記マージ候補の前記ベクトルを決定すること、及び 前記マージ候補のブロックベクトル予測子(BVP)及びブロックベクトル差分(BVD)に基づいて前記マージ候補の前記ベクトルを決定すること、 のうちの一方を実施するステップ、を更に有する請求項3に記載の方法。
- 前記現在テンプレートは、再構成済みの上隣接領域、再構成済みの左隣接領域、及びL字形の再構成済みのL字隣接領域から選択される、請求項3に記載の方法。
- 前記現在テンプレートは、インター予測モード、intraTMPモード、マルチモデル線形モデル(MMLM)モード、クロスコンポーネント線形モデル(CCLM)モード、畳み込みクロスコンポーネントイントラ予測モデル(CCCM)、及び勾配線形モデル(GLM)モードのうちの1つに対応する第1のフィルタを決定するために適用されるフィルタテンプレートを含む、請求項3に記載の方法。
- 前記参照テンプレート及び前記現在テンプレートは各々、それぞれの上テンプレート及びそれぞれの左テンプレートを含み、前記それぞれの上テンプレートは、少なくとも1つの行を持ち、前記それぞれの左テンプレートは、少なくとも1つの列を持つ、請求項3に記載の方法。
- 前記現在コーディングブロックがイントラテンプレートマッチング予測(IntraTMP)モードで予測されることを決定するステップと、 ブロックベクトルに基づいてマージ候補を決定するステップと、 前記ブロックベクトルに基づいて、前記マージ候補に関連する参照テンプレートを特定するステップであり、該参照テンプレートは、参照ルマテンプレート及び参照クロマテンプレートを含む、ステップと、 前記現在コーディングブロックに関連付けられた現在テンプレートを特定するステップと、 前記参照テンプレートと前記現在テンプレートとに基づいて前記残差フィルタの複数のフィルタ係数を決定するステップと、 を更に有する請求項1に記載の方法。
- マルチモデル線形モデル(MMLM)モード、クロスコンポーネント線形モデル(CCLM)モード、畳み込みクロスコンポーネントイントラ予測モデル(CCCM)、及び勾配線形モデル(GLM)モードのうちの1つに対応する代替フィルタを用いて前記現在コーディングブロックが予測されることを決定するステップと、 前記代替フィルタが複数の第1のフィルタ係数を持つことを決定するステップと、 前記代替フィルタの前記複数の第1のフィルタ係数に基づいて前記残差フィルタの複数のフィルタリング係数を決定するステップと、 を更に有する請求項1に記載の方法。
- 前記残差フィルタは、青色差(Cb)クロマサンプル及び赤色差(Cr)クロマサンプルのうちの第1の一方に対する第1の残差フィルタを含み、当該方法は更に、 MMLMモード、CCLMモード、CCCM、及びGLMモードのうちの2つの異なるモードに対応する第1の代替フィルタ及び第2の代替フィルタを用いて前記現在コーディングブロックが予測されることを決定するステップと、 前記第1の代替フィルタが複数の第1のフィルタ係数を持つこと及び前記第2の代替フィルタが複数の第2のフィルタ係数を持つことを決定するステップと、 前記第1の代替フィルタの前記複数の第1のフィルタ係数に基づいて前記第1の残差フィルタの複数のフィルタ係数を決定するステップと、 前記第2の代替フィルタの前記複数の第2のフィルタ係数に基づいて第2の残差フィルタの複数のフィルタ係数を決定するステップであり、該第2の残差フィルタが、前記Cbクロマサンプル及び前記Crクロマサンプルのうちの第2の異なる一方の残差を生成するために適用される、ステップと、 を有する、請求項1に記載の方法。
- 第1の残差値と該第1の残差値よりも大きい第2の残差値との間で定義されるダイナミックレンジ内に、前記第1のクロマサンプルの前記残差をクリッピングするステップ、 を更に有する請求項1に記載の方法。
- 前記ビデオビットストリームは更に、前記第1のクロマサンプルの第2の残差を含み、前記現在画像フレームを再構成することは、前記第1の残差及び前記第2の残差の両方を用いて前記予測クロマサンプルを補償して前記第1のクロマサンプルを再構成することを含む、請求項1に記載の方法。
- コンピューティングシステムであって、 制御回路と、 前記制御回路によって実行されるように構成された1つ以上のプログラムを格納したメモリと、 を有し、前記1つ以上のプログラムは、 現在画像フレームを有するビデオデータを受信するステップと、 現在コーディングブロックを含む前記現在画像フレームを符号化するステップと、 前記現在画像フレームの現在コーディングブロックの第1のクロマサンプルの第1の残差を、前記現在コーディングブロック内の1つ以上のルマサンプルの1つ以上の残差に基づいて生成するように、残差テンプレートクロスコンポーネント残差モデル(RT-CCRM)が有効にされるか、を決定するステップと、 前記符号化された現在画像フレームを、ビデオビットストリームを介して送信するステップと、 前記現在画像フレームの前記現在コーディングブロックの前記第1のクロマサンプルの前記第1の残差を、前記現在コーディングブロック内の前記1つ以上のルマサンプルの前記1つ以上の残差に基づいて生成するように、前記RT-CCRMモードが有効にされるか、を示すための第1のシンタックス要素を、前記ビデオビットストリームを介してシグナリングするステップと、 のための命令を有する、 コンピューティングシステム。
- 前記1つ以上のプログラムは更に、 インター予測モード、イントラブロックコピー(IBC)モード、及びイントラテンプレートマッチング予測(IntraTMP)モードのうちの1つで前記現在コーディングブロックが符号化されることを決定するステップ、 のための命令を有し、 前記第1のシンタックス要素は、前記インター予測モード、前記IBCモード、及び前記IntraTMPモードのうちの前記1つで前記現在コーディングブロックが符号化される場合にシグナリングされる、 請求項16に記載のコンピューティングシステム。
- 前記1つ以上のプログラムは更に、 前記1つ以上のルマサンプルに対応する再構成ルマサンプルからの前記第1のクロマサンプルの予測を中止するために前記クロスコンポーネント残差モデル(CCRM)モードが無効にされることを決定するステップ、 のための命令を有し、 前記第1のシンタックス要素は、前記インター予測モード、前記IBCモード、及び前記IntraTMPモードのうちの前記1つで前記現在コーディングブロックが符号化される場合且つ前記CCRMが無効にされる場合にシグナリングされる、 請求項17に記載のコンピューティングシステム。
- 前記1つ以上のプログラムは更に、 前記RT-CCRMモードが無効にされることを前記第1のシンタックス要素が示すときに、前記1つ以上のルマサンプルに対応する再構成ルマサンプルから前記第1のクロマサンプルが予測されるかを示すCCRMモードについての第2のシンタックス要素をシグナリングするステップ、 のための命令を有する、請求項17に記載のコンピューティングシステム。
- コンピューティングシステムの制御回路による実行のための1つ以上のプログラムを格納したコンピュータ読み取り可能記憶媒体であって、前記1つ以上のプログラムは、 現在画像フレームの現在コーディングブロックを含むソースビデオシーケンスを取得するステップと、 前記ソースビデオシーケンスとビデオビットストリームとの間の変換を実行するステップと、 のための命令を有し、 前記ビデオビットストリームは、 前記現在画像フレームと、 前記現在画像フレームの現在コーディングブロックの第1のクロマサンプルの第1の残差を、前記現在コーディングブロックの1つ以上のルマサンプルの1つ以上の残差に基づいて生成すべきかを示す、残差テンプレートクロスコンポーネント残差モデル(RT-CCRM)モードについての第1のシンタックス要素と、 を含み、 前記RT-CCRMモードが有効にされることを前記第1のシンタックス要素が示すとの決定に従って、前記1つ以上のルマサンプルの前記1つ以上の残差に基づいて前記第1のクロマサンプルの前記第1の残差を生成するために、前記RT-CCRMモードに対応する残差フィルタが適用される、 コンピュータ読み取り可能記憶媒体。
Description
この出願は、“Cross-Component Residual Prediction by Using Residual Template”と題して2023年4月24日に出願された米国仮特許出願第63/461,581号に対する優先権を主張するものであり、また、“Cross-Component Residual Prediction by Using Residual Template”と題して2024年4月23日に出願された米国特許出願第18/643,953号の継続出願であって、それに対する優先権を主張するものである。 開示される実施形態は、概してビデオコーディングに関し、以下に限られないが、クロスコンポーネント残差を用いてビデオデータを処理するためのシステム及び方法を含む。 デジタル映像は、例えばデジタルテレビ、ラップトップ若しくはデスクトップコンピュータ、タブレットコンピュータ、デジタルカメラ、デジタル記録機器、デジタルメディアプレーヤ、ビデオゲームコンソール、スマートフォン、ビデオ遠隔会議機器、ビデオストリーミング機器などの様々な電子機器によってサポートされている。それらの電子機器は、通信ネットワークを横切ってデジタルビデオデータを送受信したり、その他の方法で通信したりして、デジタルビデオデータをストレージデバイスに格納する。通信ネットワークの限られた帯域幅容量及びストレージデバイスの限られたメモリリソースに起因して、ビデオデータが通信又は格納される前に、1つ以上のビデオコーディング標準に従ってビデオデータを圧縮するために、ビデオコーディングが使用され得る。ビデオコーディングは、電子/クライアントデバイス上又はクラウドサービスを提供するサーバ上のハードウェア及び/又はソフトウェアによって実行され得る。 ビデオコーディングは、一般に、ビデオデータに生来的に備わる冗長性を活用する予測法(例えば、インター予測、イントラ予測、又はこれらに類するもの)を利用する。ビデオコーディングは、ビデオ品質への劣化を回避又は最小限に抑えながら、より低いビットレートを使用する形態へとビデオデータを圧縮することを狙いとする。複数のビデオコーデック標準が開発されてきた。例えば、ハイエフィシェンシービデオコーディング(HEVC/H.265)は、MPEG-Hプロジェクトの一部として設計されたビデオ圧縮標準である。ITU-T及びISO/IECは、HEVC/H.265標準を2013年(バージョン1)、2014年(バージョン2)、2015年(バージョン3)、及び2016年(バージョン4)に公開した。バーサタイルビデオコーディング(VVC/H.266)は、HEVCの後継として意図されたビデオ圧縮標準である。ITU-T及びISO/IECは、VVC/H.266標準を2020年(バージョン1)及び2022年(バージョン2)に公開した。AOMediaビデオ1(AV1)は、HEVCの代替として設計されたオープンビデオコーディングフォーマットである。2019年1月8日に、仕様の正誤表付きの認証バージョン1.0.0がリリースされた。 上述のように、符号化(圧縮)は、帯域幅及び/又は記憶空間要求を減少させる。詳細に後述するように、可逆圧縮及び非可逆圧縮の両方が使用され得る。可逆圧縮は、圧縮された原信号から復号プロセスを介して原信号の正確なコピーを再構成することはできる技術を指す。不可逆圧縮は、元の映像情報がコーディング中に完全には保持されず、復号中に完全には復元可能でないコーディング/復号プロセスを指す。非可逆圧縮を用いるとき、再構成信号が原信号とは同じでないことがあるが、原信号と再構成信号との間の歪みは、再構成信号を意図された用途に有用にするのに十分な小ささにされる。許容可能な歪みの量は用途に依存する。例えば、ある特定の消費者向けビデオストリーミングアプリケーションのユーザは、映画又はテレビ放送アプリケーションのユーザよりも高い歪みを許容し得る。特定のコーディングアルゴリズムによって達成可能な圧縮率は、様々な歪み許容度を反映するように選択又は調整されることができ、より高い許容歪みは、一般に、より高い損失及びより高い圧縮率をもたらすコーディングアルゴリズムを許容する。 本開示は、ビデオビットストリームの画像フレームを再構成するために、残差テンプレートクロスコンポーネント残差モデル(residual template cross-component residual model;RT-CCRM)を用いて、クロマサンプルの残差を、関連するルマサンプルの残差から生成する映像圧縮方法を記述する。クロスコンポーネントフィルタリングを残差ドメインで適用して、関連するルマサンプルの残差を用いてクロマサンプルの残差を予測し、これは、局所照明補償を提供し、ビデオコンテンツのコーディング効率を向上させる。具体的には、一部の実施形態において、現在画像フレームの現在コーディングブロックは、現在ルマテンプレートと現在クロマテンプレートとを含む現在テンプレートを持つ。現在コーディングブロックは、例えば現在画像フレーム上又は別の参照画像フレーム上に位置するものである1つ以上の参照コーディングブロック436に対応する。各参照コーディングブロック436が、参照ルマテンプレートと参照クロマテンプレートとを含むそれぞれの参照テンプレートを持つ。参照ルマテンプレート、参照クロマテンプレート、現在ルマテンプレート、及び現在クロマテンプレートが、ルマサンプル及びクロマサンプルの残差データを決定するために適用される。これらのテンプレートのルマサンプル及びクロマサンプルの残差データは更に、RT-CCRMで適用される残差フィルタのフィルタ係数を決定するために適用される。フィルタ係数を持つ残差フィルタを用いて、現在コーディングブロックのルマサンプルの残差データに基づいて現在コーディングブロックのクロマサンプルの残差データを決定する。クロマサンプルの決定された残差データに基づいて現在コーディングブロックが再構成される。 一部の実施形態によれば、映像復号の方法が提供される。当該方法は、現在画像フレームと、残差テンプレートクロスコンポーネント残差モデル(RT-CCRM)モードについての第1のシンタックス要素と、を含むビデオビットストリームを受信することを含む。当該方法は更に、現在画像フレームの現在コーディングブロックの第1のクロマサンプルの第1の残差を、現在コーディングブロック内の1つ以上のルマサンプルの1つ以上の残差に基づいて生成するように、RT-CCRMモードが有効にされること、を第1のシンタックス要素に基づいて決定することを含む。当該方法は更に、RT-CCRMモードが有効にされるときに、現在コーディングブロック内で、第1のクロマサンプルと、第1のクロマサンプルに対応する1つ以上のルマサンプルとを特定し、現在コーディングブロック内の1つ以上のルマサンプルの1つ以上の残差を決定し、RT-CCRMモードに対応する残差フィルタを適用して、1つ以上のルマサンプルの1つ以上の残差に基づいて第1のクロマサンプルの第1の残差を生成することを含む。当該方法は更に、少なくとも、第1の残差を用いて予測クロマサンプルを補償して第1のクロマサンプルを再構成することによって、現在画像フレームを再構成することを含む。 一部の実施形態によれば、映像符号化の方法が提供される。当該方法は、現在画像フレームを有するビデオデータを受信することと、現在コーディングブロックを含む現在画像フレームを符号化することと、現在画像フレームの現在コーディングブロックの第1のクロマサンプルの第1の残差を、現在コーディングブロック内の1つ以上のルマサンプルの1つ以上の残差に基づいて生成するように、残差テンプレートクロスコンポーネント残差モデル(RT-CCRM)が有効にされるか、を決定することとを含む。当該方法は更に、符号化された現在画像フレームを、ビデオビットストリームを介して送信することと、現在画像フレームの現在コーディングブロックの第1のクロマサンプルの第1の残差を、現在コーディングブロック内の1つ以上のルマサンプルの1つ以上の残差に基づいて生成するように、RT-CCRMモードが有効にされるか、を示すための第1のシンタックス要素を、ビデオビットストリームを介してシグナリングすることとを含む。 一部の実施形態によれば、ビットストリーム変換の方法が提供される。当該方法は、現在画像フレームの現在コーディングブロックを含むソースビデオシーケンスを取得することと、ソースビデオシーケンスとビデオビットストリームとの間の変換を実行することとを含む。該ビデオビットストリームは、現在画像フレームと、現在画像フレームの現在コーディングブロックの第1のクロマサンプルの第1の残差を、現在コーディングブロックの1つ以上のルマサンプルの1つ以上の残差に基づいて生成すべきかを示す、残差テンプレートクロスコンポーネント残差モデル(RT-CCRM)モードについての第1のシンタックス要素と、を含む。RT-CCRMモードが有効にされることを第1のシンタックス要素が示すとの決定に従って、1つ以上のルマサンプルの1つ以上の残差に基づいて第1のクロマサンプルの第1の残差を生成するために、RT-CCRMモードに対応する残差フィルタが適用される。 一部の実施形態によれば、例えばストリーミングシステム、サーバシステム、パーソナルコンピュータシステム、又は他の電子機器などのコンピューティングシステムが提供される。当該コンピューティングシステムは、制御回路と、1つ以上の命令セットを格納したメモリとを含む。該1つ以上の命令セットは、ここに記載される方法のうちのいずれかを実行するための命令を含む。一部の実施形態において、当該コンピューティングシステムは、エンコーダコンポーネント及びデコーダコンポーネント(例えば、トランスコーダ)を含む。 一部の実施形態によれば、非一時的コンピュータ読み取り可能記憶媒体が提供される。当該非一時的コンピュータ読み取り可能記憶媒体は、コンピューティングシステムによる実行のための1つ以上の命令セットを格納する。該1つ以上の命令セットは、ここに記載される方法のうちのいずれかを実行するための命令を含む。 従って、映像を符号化及び復号するための方法とともに機器及びシステムが開示される。そのような方法、機器、及びシステムは、映像符号化/復号のための従来の方法、機器、及びシステムを補完したり置き換えたりすることができる。本明細書に記載される特徴及び利点は必ずしも包括的なわけではなく、特に、この開示にて提供される図面、明細書、及び特許請求の範囲に鑑みて当業者には幾つかの追加の特徴及び利点が明らかになる。また、留意されたいことには、本明細書で使用される言葉は、主に読みやすさ及び教示目的のために選択されており、必ずしもここで説明される主題を線引きしたり境界付けたりするために選択されているわけではない。 より詳細に本開示が理解され得るように、様々な実施形態の特徴を参照することによって、より具体的な説明が行われ、それら実施形態のうちの一部が添付の図面に示される。しかしながら、添付の図面は、本開示の関連する特徴を単に例示するものであり、従って、必ずしも限定するものと見なされるべきではなく、説明のために、当業者がこの開示を読んで理解することになるような他の有効な特徴を認めることがある。 一部の実施形態に従った通信システムの一例を示すブロック図である。 一部の実施形態に従ったエンコーダコンポーネントの要素例を示すブロック図である。 一部の実施形態に従ったデコーダコンポーネントの要素例を示すブロック図である。