JP-2026077956-A - 指数関数的分割の方法およびシステム

JP2026077956AJP 2026077956 AJP2026077956 AJP 2026077956AJP-2026077956-A

Abstract

【課題】指数関数的分割の方法およびシステムの提供。【解決手段】デコーダは、ビットストリームを受け取ることと、指数関数的分割モードが有効にされているかどうかを決めることと、曲線に従ってブロックを第一の領域と第二の領域とへと分割することと、該ブロックのピクセルデータを、該曲線を用いて再構築することであって、該第一の領域および該第二の領域は非長方形である、こととを行うように構成されている回路を含む。一実施形態では、該指数関数的分割モードは該ビットストリーム内で信号伝達される。【選択図】図７

Inventors

ハリカルバ
ボリヴォイェファート

Assignees

オーピーソリューションズ，エルエルシー

Dates

Publication Date: 20260513
Application Date: 20260306
Priority Date: 20181001

Claims (4)

映像信号を表すビットストリームをエンコードするための映像エンコーダであって、前記映像エンコーダは、映像信号を受け取る回路と、前記映像信号を受け取り、符号化されたピクチャを含む符号化されたビットストリームを生成する回路とを備え、前記符号化されたピクチャは、符号化ツリーユニットと信号伝達情報とを含み、前記符号化ツリーユニットは、複数の符号化ユニットを備え、前記信号伝達情報は、前記符号化ツリーユニット内の非直線分割の境界の開始点を決定するための第１のインデックスと前記符号化ツリーユニット内の前記非直線分割の境界の終了点を決定するための第２のインデックスとを含み、前記符号化ツリーユニット内の前記非直線分割の境界は、少なくとも前記符号化ツリーユニット内の非長方形の第１の領域および非長方形の第２の領域を画定し、前記ビットストリームは、前記第１のインデックスおよび前記第２のインデックスを使用して前記符号化ツリーユニットを復号化することによって復号化されるように構成されており、前記符号化ツリーユニットを復号化することは、前記第１のインデックスを使用して、前記符号化ツリーユニット内の非直線非長方形分割の境界の開始点を決定することであって、前記開始点は、前記符号化ツリーユニットの第１の隅から第１のオフセット距離にある前記符号化ツリーユニットの第１のエッジ上に配置されている、ことと、前記第２のインデックスを使用して、前記符号化ツリーユニット内の前記非直線非長方形分割の境界の終了点を決定することであって、前記終了点は、前記符号化ツリーユニットの第２の隅から第２のオフセット距離にある前記符号化ツリーユニットの第２のエッジ上に配置されている、ことと、前記非長方形の第１の領域における第１の予測ピクセル値を生成することと、前記非長方形の第２の領域における第２の予測ピクセル値を生成することと、残差ピクセル値を前記第１の予測ピクセル値および前記第２の予測ピクセル値に追加することとによって行われる、映像エンコーダ。
前記符号化されたピクチャは、イントラ予測ピクセルの符号化ユニットを含み、前記デコーダは、前記イントラ予測ピクセルのブロックを復号化するためのイントラ予測プロセッサを含む、請求項１に記載の映像エンコーダ。
映像デコーダであって、前記映像デコーダは、符号化されたピクチャを含む符号化されたビットストリームを受け取るように構成されている回路と、前記符号化されたビットストリームを復号化する方法を実行するように構成されている回路とを備え、前記符号化されたピクチャは、符号化ツリーユニットと信号伝達情報とを含み、前記符号化ツリーユニットは、複数の符号化ユニットを備え、前記信号伝達情報は、非直線分割の境界の開始点を決定するための第１のインデックスと前記非直線分割の境界の終了点を決定するための第２のインデックスとを含み、前記非直線分割の境界は、少なくとも前記符号化ツリーユニット内の非長方形の第１の領域および非長方形の第２の領域を画定し、前記符号化されたビットストリームを復号化する前記方法は、前記第１のインデックスを使用して、前記符号化ツリーユニット内の非直線分割の境界の開始点を決定することであって、前記開始点は、前記符号化ツリーユニットの第１の隅から第１のオフセット距離にある前記符号化ツリーユニットの第１のエッジ上に配置されている、ことと、前記第２のインデックスを使用して、前記符号化ツリーユニット内の前記非直線分割の境界の終了点を決定することであって、前記終了点は、前記符号化ツリーユニットの第２の隅から第２のオフセット距離にある前記符号化ツリーユニットの第２のエッジ上に配置されている、ことと、前記非長方形の第１の領域における第１の予測ピクセル値を生成することと、前記非長方形の第２の領域における第２の予測ピクセル値を生成することと、前記非直線分割の境界を横断して前記第１の予測ピクセル値および前記第２の予測ピクセル値を平滑化することと、残差ピクセル値を前記平滑化された第１の予測ピクセル値および前記平滑化された第２の予測ピクセル値に追加することとを含む、映像デコーダ。
前記符号化されたピクチャは、イントラ予測ピクセルの符号化ユニットを含み、前記デコーダは、前記イントラ予測ピクセルのブロックを復号化するためのイントラ予測プロセッサを含む、請求項３に記載の映像デコーダ。

Description

（関連出願の相互参照）この出願は、２０１８年１０月１日に出願された、“ＥＸＰＯＮＥＮＴＩＡＬＰＡＲＴＩＴＩＯＮＩＮＧ”と題する米国仮特許出願第６２／７３９，４４６号と、２０１８年１０月１日に出願された、“ＰＲＥＤＩＣＴＩＮＧＥＸＰＯＮＥＮＴＩＡＬＰＡＲＴＩＴＩＯＮＩＮＧＰＡＲＡＭＥＴＥＲＳ”と題する米国仮特許出願第６２／７３９，６７７号と、２０１８年１０月１日に出願された、“ＳＨＡＰＥＡＤＡＰＴＩＶＥＤＩＳＣＲＥＴＥＣＯＳＩＮＥＴＲＡＮＳＦＯＲＭＡＴＩＯＮＦＯＲＥＸＰＯＮＥＮＴＩＡＬＬＹＰＡＲＴＩＴＩＯＮＥＤＢＬＯＣＫＳ”と題する米国仮特許出願第６２／７３９，５３１号とに対する優先権の利益を主張し、これらの出願の各々は、それらの全体が参照によって本明細書に援用される。（発明の分野）本発明は、一般に、デコーディングおよびエンコーディングを含む、デジタル映像を圧縮および解凍する技術分野に関連する。特に、本発明は、符号化単位の指数関数的分割のための方法およびシステムに向けられる。（背景）映像コーデックは、デジタル映像を圧縮または解凍する電子回路またはソフトウェアを含み得る。それは、圧縮されていない映像を圧縮された形式に変換し得、またはその逆があり得る。映像圧縮の文脈では、映像を圧縮する（および／またはその何らかの機能を果たす）デバイスは、通常、エンコーダと呼ばれ得、映像を解凍する（および／またはその何らかの機能を果たす）デバイスは、デコーダと呼ばれ得る。圧縮されたデータの形式は、標準的な映像圧縮の仕様に従い得る。圧縮された映像が、もとの映像内に存在する何らかの情報を失っている点において、圧縮は非可逆であり得る。これの帰結は、解凍された映像が、もとの映像を正確に再構築するためには不十分な情報しかないので、もとの圧縮されていない映像より低い品質を有し得ることを含み得る。映像品質と、映像を表現することに用いられる（例えばビットレートによって定められる）データの量と、エンコーディングアルゴリズムおよびデコーディングアルゴリズムの複雑性と、データ損失および誤差への感度と、編集の容易さと、ランダムアクセスと、エンドツーエンド遅延（例えばレイテンシ）と、同様のものとには、複雑な関係があり得る。（図面の説明）図１は、ピクセルのブロック分割の例を図示した図である。図２は、幾何学分割の例を図示した図である。図３Ａは、圧縮効率を増大させ得る本主題のいくつかの側面に従った指数関数的分割の例を図示した図である。図３Ｂは、例となるテンプレートの指数関数的分割を図示した一連の図である。図３Ｃは、例となる指数関数を定義し得る４つのあらかじめ定義された係数に関連付けられた例となる曲線を図示している。図３Ｄは、長方形ブロックを分割する、異なる開始Ｐ１インデックスおよび終了Ｐ２インデックスを示した別の例となるブロックを図示している。図４は、指数関数的分割を実行することが可能な例となる映像エンコーダを図示したシステムブロック図である。図５Ａは、圧縮効率を増大させながらエンコーディング複雑性を低減させ得る本主題のいくつかの側面に従った、指数関数的分割を伴って映像をエンコードすることの例となるプロセスを図示したプロセスフロー図である。図５Ｂは、本主題のいくつかの側面に従った、指数関数的分割を伴って、分割パラメータを用いて映像をエンコードすることの例となるプロセスを図示したプロセスフロー図である。図５Ｃは、本主題のいくつかの側面に従った、指数関数的分割を伴って、形適応離散コサイン変換を用いて映像をエンコードすることの例となるプロセスを図示したプロセスフロー図である。図６は、指数関数的分割を用いてビットストリームをデコードすることが可能な例となるデコーダを図示したシステムブロック図である。図７は、指数関数的分割を用いてビットストリームをデコードすることの例となるプロセスを図示したプロセスフロー図である。図８は、フレームのクアッドツリープラスバイナリツリー分割の例を図示している。図９は、図８に図示されているクアッドツリープラスバイナリツリーのＣＵレベルでの指数関数的分割の例を図示している。図１０は、直線線分によって効率的に分割されないことがある、林檎を含有する画像を図示している。図１１は、指数関数的分割に従って分割された別の例となるブロックを図示している。図１２は、カレントブロックによる空間的に隣接するブロックからの指数関数的分割パラメータの引き継ぎを図示した図である。図１３は、カレントブロックに対する、空間的に隣接するブロックの例を図示している。図１４は、カレントブロックが指数関数的分割パラメータを引き継ぐ、時間的に隣接するブロックを伴う例となるカレントブロックを図示している。様々な図面における同様の参照記号は、同様の要素を指し示している。（詳細な説明）本主題のいくつかの実装形態は、指数関数的分割に関連する。指数関数的分割では、長方形ブロックは、直線線分と比較して、曲線を伴う非長方形領域へと分割され得る。ブロックを分割するために曲線を用いることは、より低い動き補償予測誤差と、より小さな残差と、従って改善された圧縮効率とに帰着する、より精密に対象境界を追跡する分割を可能とし得る。いくつかの実装形態では、曲線は、指数関数によって特徴付けられ得る。曲線（例えば指数関数）は、デコーダ用のビットストリーム内で信号伝達され得る、あらかじめ定義された係数および／またはテンプレートを用いて、決められ得る。いくつかの実装形態では、指数関数的分割は、８×８ルマサンプルより大きいまたは８×８ルマサンプルに等しいものに使用可能であり得る。曲線を伴う長方形ブロックを分割することによって、幾何学分割を伴う等、直線線分分割に限定された技術より大きな圧縮効率が、特定の対象に対して達成され得る。また、本主題のいくつかの実装形態は、空間的および／または時間的な参照ブロックを用いて、指数関数的分割パラメータを予測することに関連する。いくつかの実装形態では、与えられたカレントブロックに対して、指数関数的分割マージ変数が信号伝達され得、与えられたカレントブロックが、別のブロックからのこれらの指数関数的分割パラメータの全てまたはいくつかを引き継ぎ得ることを指し示す。この別のブロックは、空間的または時間的に隣接し得る。ブロックが、他のブロックから指数関数的分割パラメータを引き継ぐことを可能とすることによって、ビットストリーム内部の信号の量は低減され得、より大きな圧縮効率を達成し得る。さらに、本主題のいくつかの実装形態は、直線線分と比較して、曲線を伴う非長方形領域へと分割されている領域（例えばブロック）上で、形適応離散コサイン変換（ＳＡＤＣＴ）を実行することを含み得る。ブロックが指数関数的分割されているところでは、結果として生じる領域（例えば分割）は、低い予測誤差を有する１つの領域および高い予測誤差を有する別の領域に帰着することが十分に考えられる。従って、本主題は、低い予測誤差を有する領域に対してＳＡＤＣＴを実行することを含み得る。低い予測誤差を有する領域に対してＳＡＤＣＴを実行することによって、圧縮効率は改善され得る。そして、いくつかの実装形態では、デコーディングの間中、逆ＳＡＤＣＴは、指数関数的分割によって分割された１つの領域に対して実行され得る。いくつかの実装形態では、逆ＳＡＤＣＴは、低い予測誤差を伴う区分に対するフルブロック離散コサイン変換（ＤＣＴ）に加えた変換の選択肢として、ビットストリーム内で信号伝達され得る。いくつかの実装形態では、逆ＳＡＤＣＴは、指数関数的分割パラメータに基づいて、および逆ＳＡＤＣＴが実行されることとなるビットストリーム内で明確に信号伝達することを必要とせずに、実行され得る。動き補償は、以前および／または未来のフレームが与えられたとき、カメラおよび／または映像内の対象の動きを把握することによって、映像フレームまたはその一部を予測する手法を含み得る。それは、映像圧縮のための映像データのエンコーディングおよびデコーディング、例えばＭｏｔｉｏｎＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐ（ＭＰＥＧ）－２（ａｄｖａｎｃｅｄｖｉｄｅｏｃｏｄｉｎｇ（ＡＶＣ）とも称される）標準規格において採用され得る。動き補償は、参照ピクチャのカレントピクチャへの変換の観点から、ピクチャを説明し得る。参照ピクチャは、カレントピクチャと比較したときに、時間において以前または未来からであり得る。画像が、以前に送信および／または記憶された画像から正確に合成され得るとき、圧縮効率は改善され得る。ブロック分割は、映像符号化における類似した動きの領域を見つけるための方法に言及し得る。ブロック分割の何らかの方式が、ＭＰＥＧ－２と、Ｈ．２６４（ＡＶＣまたはＭＰＥＧ－４Ｐａｒｔ１０とも称される）と、Ｈ．２６５（ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ（ＨＥＶＣ）とも称される）とを含む映像コーデック標準規格において見出され得る。例となるブロック分割の手法では、映像フレームの重なり合っていないブロックは、類似した動きを伴うピクセルを含有するブロック分割を見つけるために、長方形サブブロックへと分割され得る。この手法は、ブロック分割の全てのピクセルが類似した動きを有するとき、うまく働き得る。ブロック内のピクセルの動きは、以前に符号化されたフレームに関連して決められ得る。図１は、実施形態に従った、ピクセルのブロック分割の例を図示した図である。それ自体がサブブロック（例えば符号化ツリー内部のノード）であり得る初めの長方形ピクチャまたはブロック１００は、長方形サブブロックへと分割され得る。例えば、１１０では、ブロック１００は、２つの長方形サブブロック１１０ａおよび１１０ｂへと分割される。サブブロック１１０ａおよび１１０ｂは、それから別々に処理され得る。別の例として、１２０では、ブロック１００は、４つの長方形サブブロック１２０ａ、１２０ｂ、１２０ｃ、および１２０ｄへと分割される。サブブロックは、サブブロック内部のピクセルが同一の動きを共有していること、最小ブロックサイズが達せられていること、または他の基準が判定されるまで、それら自身がさらに分けられ得る。サブブロック内のピクセルが類似した動きを有するとき、動きベクトルは、その領域内の全てのピクセルの動きを説明し得る。映像符号化のいくつかの手法は、（例えば図１において図示されているような）長方形ブロックが、直線線分によって非長方形であり得る２つの領域へとさらに分けられる幾何学分割を含み得る。例えば、図２は、幾何学分割の例を図示した図である。例となる長方形ブロック２００（Ｍ×Ｎピクセルのように表される、Ｍピクセルの幅およびＮピクセルの高さを有し得る）は、直線線分Ｐ１Ｐ２２０５に沿って２つの領域（領域０および領域１）へと分けられ得る。領域内０のピクセルが類似した動きを有するとき、動きベクトルは、その領域内の全てのピクセルの動きを説明し得る。動きベクトルは、領域０を圧縮するために用いられ得る。同様に、領域１内のピクセルが類似した動きを有しているとき、関連付けられる動きベクトルは、領域１内のピクセルの動きを説明し得る。このような幾何学分割は、映像ビットストリーム内のエンコーディング位置Ｐ１およびＰ２（または位置Ｐ１およびＰ２に代わるもの）によって、受信機（例えばデコーダ）へと信号伝達され得る。幾何学分割を利用して映像データをエンコードするとき、直線線分２０５（または、より具体的にはＰ１およびＰ２）が、決められ得る。しかし、直線線分は、対象境界を反映するやり方ではブロックを分割できないことがあ