JP-2026077956-A - 指数関数的分割の方法およびシステム
Abstract
【課題】指数関数的分割の方法およびシステムの提供。 【解決手段】デコーダは、ビットストリームを受け取ることと、指数関数的分割モードが有効にされているかどうかを決めることと、曲線に従ってブロックを第一の領域と第二の領域とへと分割することと、該ブロックのピクセルデータを、該曲線を用いて再構築することであって、該第一の領域および該第二の領域は非長方形である、こととを行うように構成されている回路を含む。一実施形態では、該指数関数的分割モードは該ビットストリーム内で信号伝達される。 【選択図】図7
Inventors
- ハリ カルバ
- ボリヴォイェ ファート
Assignees
- オーピー ソリューションズ, エルエルシー
Dates
- Publication Date
- 20260513
- Application Date
- 20260306
- Priority Date
- 20181001
Claims (4)
- 映像信号を表すビットストリームをエンコードするための映像エンコーダであって、前記映像エンコーダは、 映像信号を受け取る回路と、 前記映像信号を受け取り、符号化されたピクチャを含む符号化されたビットストリームを生成する回路と を備え、 前記符号化されたピクチャは、符号化ツリーユニットと信号伝達情報とを含み、前記符号化ツリーユニットは、複数の符号化ユニットを備え、前記信号伝達情報は、前記符号化ツリーユニット内の非直線分割の境界の開始点を決定するための第1のインデックスと前記符号化ツリーユニット内の前記非直線分割の境界の終了点を決定するための第2のインデックスとを含み、前記符号化ツリーユニット内の前記非直線分割の境界は、少なくとも前記符号化ツリーユニット内の非長方形の第1の領域および非長方形の第2の領域を画定し、 前記ビットストリームは、前記第1のインデックスおよび前記第2のインデックスを使用して前記符号化ツリーユニットを復号化することによって復号化されるように構成されており、 前記符号化ツリーユニットを復号化することは、 前記第1のインデックスを使用して、前記符号化ツリーユニット内の非直線非長方形分割の境界の開始点を決定することであって、前記開始点は、前記符号化ツリーユニットの第1の隅から第1のオフセット距離にある前記符号化ツリーユニットの第1のエッジ上に配置されている、ことと、 前記第2のインデックスを使用して、前記符号化ツリーユニット内の前記非直線非長方形分割の境界の終了点を決定することであって、前記終了点は、前記符号化ツリーユニットの第2の隅から第2のオフセット距離にある前記符号化ツリーユニットの第2のエッジ上に配置されている、ことと、 前記非長方形の第1の領域における第1の予測ピクセル値を生成することと、 前記非長方形の第2の領域における第2の予測ピクセル値を生成することと、 残差ピクセル値を前記第1の予測ピクセル値および前記第2の予測ピクセル値に追加することと によって行われる、映像エンコーダ。
- 前記符号化されたピクチャは、イントラ予測ピクセルの符号化ユニットを含み、前記デコーダは、前記イントラ予測ピクセルのブロックを復号化するためのイントラ予測プロセッサを含む、請求項1に記載の映像エンコーダ。
- 映像デコーダであって、前記映像デコーダは、 符号化されたピクチャを含む符号化されたビットストリームを受け取るように構成されている回路と、 前記符号化されたビットストリームを復号化する方法を実行するように構成されている回路と を備え、 前記符号化されたピクチャは、符号化ツリーユニットと信号伝達情報とを含み、前記符号化ツリーユニットは、複数の符号化ユニットを備え、前記信号伝達情報は、非直線分割の境界の開始点を決定するための第1のインデックスと前記非直線分割の境界の終了点を決定するための第2のインデックスとを含み、前記非直線分割の境界は、少なくとも前記符号化ツリーユニット内の非長方形の第1の領域および非長方形の第2の領域を画定し、 前記符号化されたビットストリームを復号化する前記方法は、 前記第1のインデックスを使用して、前記符号化ツリーユニット内の非直線分割の境界の開始点を決定することであって、前記開始点は、前記符号化ツリーユニットの第1の隅から第1のオフセット距離にある前記符号化ツリーユニットの第1のエッジ上に配置されている、ことと、 前記第2のインデックスを使用して、前記符号化ツリーユニット内の前記非直線分割の境界の終了点を決定することであって、前記終了点は、前記符号化ツリーユニットの第2の隅から第2のオフセット距離にある前記符号化ツリーユニットの第2のエッジ上に配置されている、ことと、 前記非長方形の第1の領域における第1の予測ピクセル値を生成することと、 前記非長方形の第2の領域における第2の予測ピクセル値を生成することと、 前記非直線分割の境界を横断して前記第1の予測ピクセル値および前記第2の予測ピクセル値を平滑化することと、 残差ピクセル値を前記平滑化された第1の予測ピクセル値および前記平滑化された第2の予測ピクセル値に追加することと を含む、映像デコーダ。
- 前記符号化されたピクチャは、イントラ予測ピクセルの符号化ユニットを含み、前記デコーダは、前記イントラ予測ピクセルのブロックを復号化するためのイントラ予測プロセッサを含む、請求項3に記載の映像デコーダ。
Description
(関連出願の相互参照) この出願は、2018年10月1日に出願された、“EXPONENTIAL PARTITIONING”と題する米国仮特許出願第62/739,446号と、2018年10月1日に出願された、“PREDICTING EXPONENTIAL PARTITIONING PARAMETERS”と題する米国仮特許出願第62/739,677号と、2018年10月1日に出願された、“SHAPE ADAPTIVE DISCRETE COSINE TRANSFORMATION FOR EXPONENTIALLY PARTITIONED BLOCKS”と題する米国仮特許出願第62/739,531号とに対する優先権の利益を主張し、これらの出願の各々は、それらの全体が参照によって本明細書に援用される。 (発明の分野) 本発明は、一般に、デコーディングおよびエンコーディングを含む、デジタル映像を圧縮および解凍する技術分野に関連する。特に、本発明は、符号化単位の指数関数的分割のための方法およびシステムに向けられる。 (背景) 映像コーデックは、デジタル映像を圧縮または解凍する電子回路またはソフトウェアを含み得る。それは、圧縮されていない映像を圧縮された形式に変換し得、またはその逆があり得る。映像圧縮の文脈では、映像を圧縮する(および/またはその何らかの機能を果たす)デバイスは、通常、エンコーダと呼ばれ得、映像を解凍する(および/またはその何らかの機能を果たす)デバイスは、デコーダと呼ばれ得る。 圧縮されたデータの形式は、標準的な映像圧縮の仕様に従い得る。圧縮された映像が、もとの映像内に存在する何らかの情報を失っている点において、圧縮は非可逆であり得る。これの帰結は、解凍された映像が、もとの映像を正確に再構築するためには不十分な情報しかないので、もとの圧縮されていない映像より低い品質を有し得ることを含み得る。 映像品質と、映像を表現することに用いられる(例えばビットレートによって定められる)データの量と、エンコーディングアルゴリズムおよびデコーディングアルゴリズムの複雑性と、データ損失および誤差への感度と、編集の容易さと、ランダムアクセスと、エンドツーエンド遅延(例えばレイテンシ)と、同様のものとには、複雑な関係があり得る。 (図面の説明) 図1は、ピクセルのブロック分割の例を図示した図である。 図2は、幾何学分割の例を図示した図である。 図3Aは、圧縮効率を増大させ得る本主題のいくつかの側面に従った指数関数的分割の例を図示した図である。 図3Bは、例となるテンプレートの指数関数的分割を図示した一連の図である。 図3Cは、例となる指数関数を定義し得る4つのあらかじめ定義された係数に関連付けられた例となる曲線を図示している。 図3Dは、長方形ブロックを分割する、異なる開始P1インデックスおよび終了P2インデックスを示した別の例となるブロックを図示している。 図4は、指数関数的分割を実行することが可能な例となる映像エンコーダを図示したシステムブロック図である。 図5Aは、圧縮効率を増大させながらエンコーディング複雑性を低減させ得る本主題のいくつかの側面に従った、指数関数的分割を伴って映像をエンコードすることの例となるプロセスを図示したプロセスフロー図である。 図5Bは、本主題のいくつかの側面に従った、指数関数的分割を伴って、分割パラメータを用いて映像をエンコードすることの例となるプロセスを図示したプロセスフロー図である。 図5Cは、本主題のいくつかの側面に従った、指数関数的分割を伴って、形適応離散コサイン変換を用いて映像をエンコードすることの例となるプロセスを図示したプロセスフロー図である。 図6は、指数関数的分割を用いてビットストリームをデコードすることが可能な例となるデコーダを図示したシステムブロック図である。 図7は、指数関数的分割を用いてビットストリームをデコードすることの例となるプロセスを図示したプロセスフロー図である。 図8は、フレームのクアッドツリープラスバイナリツリー分割の例を図示している。 図9は、図8に図示されているクアッドツリープラスバイナリツリーのCUレベルでの指数関数的分割の例を図示している。 図10は、直線線分によって効率的に分割されないことがある、林檎を含有する画像を図示している。 図11は、指数関数的分割に従って分割された別の例となるブロックを図示している。 図12は、カレントブロックによる空間的に隣接するブロックからの指数関数的分割パラメータの引き継ぎを図示した図である。 図13は、カレントブロックに対する、空間的に隣接するブロックの例を図示している。 図14は、カレントブロックが指数関数的分割パラメータを引き継ぐ、時間的に隣接するブロックを伴う例となるカレントブロックを図示している。 様々な図面における同様の参照記号は、同様の要素を指し示している。 (詳細な説明) 本主題のいくつかの実装形態は、指数関数的分割に関連する。指数関数的分割では、長方形ブロックは、直線線分と比較して、曲線を伴う非長方形領域へと分割され得る。ブロックを分割するために曲線を用いることは、より低い動き補償予測誤差と、より小さな残差と、従って改善された圧縮効率とに帰着する、より精密に対象境界を追跡する分割を可能とし得る。いくつかの実装形態では、曲線は、指数関数によって特徴付けられ得る。曲線(例えば指数関数)は、デコーダ用のビットストリーム内で信号伝達され得る、あらかじめ定義された係数および/またはテンプレートを用いて、決められ得る。いくつかの実装形態では、指数関数的分割は、8×8ルマサンプルより大きいまたは8×8ルマサンプルに等しいものに使用可能であり得る。曲線を伴う長方形ブロックを分割することによって、幾何学分割を伴う等、直線線分分割に限定された技術より大きな圧縮効率が、特定の対象に対して達成され得る。 また、本主題のいくつかの実装形態は、空間的および/または時間的な参照ブロックを用いて、指数関数的分割パラメータを予測することに関連する。いくつかの実装形態では、与えられたカレントブロックに対して、指数関数的分割マージ変数が信号伝達され得、与えられたカレントブロックが、別のブロックからのこれらの指数関数的分割パラメータの全てまたはいくつかを引き継ぎ得ることを指し示す。この別のブロックは、空間的または時間的に隣接し得る。ブロックが、他のブロックから指数関数的分割パラメータを引き継ぐことを可能とすることによって、ビットストリーム内部の信号の量は低減され得、より大きな圧縮効率を達成し得る。 さらに、本主題のいくつかの実装形態は、直線線分と比較して、曲線を伴う非長方形領域へと分割されている領域(例えばブロック)上で、形適応離散コサイン変換(SADCT)を実行することを含み得る。ブロックが指数関数的分割されているところでは、結果として生じる領域(例えば分割)は、低い予測誤差を有する1つの領域および高い予測誤差を有する別の領域に帰着することが十分に考えられる。従って、本主題は、低い予測誤差を有する領域に対してSADCTを実行することを含み得る。低い予測誤差を有する領域に対してSADCTを実行することによって、圧縮効率は改善され得る。そして、いくつかの実装形態では、デコーディングの間中、逆SADCTは、指数関数的分割によって分割された1つの領域に対して実行され得る。いくつかの実装形態では、逆SADCTは、低い予測誤差を伴う区分に対するフルブロック離散コサイン変換(DCT)に加えた変換の選択肢として、ビットストリーム内で信号伝達され得る。いくつかの実装形態では、逆SADCTは、指数関数的分割パラメータに基づいて、および逆SADCTが実行されることとなるビットストリーム内で明確に信号伝達することを必要とせずに、実行され得る。 動き補償は、以前および/または未来のフレームが与えられたとき、カメラおよび/または映像内の対象の動きを把握することによって、映像フレームまたはその一部を予測する手法を含み得る。それは、映像圧縮のための映像データのエンコーディングおよびデコーディング、例えばMotion Picture Experts Group(MPEG)-2(advanced video coding(AVC)とも称される)標準規格において採用され得る。動き補償は、参照ピクチャのカレントピクチャへの変換の観点から、ピクチャを説明し得る。参照ピクチャは、カレントピクチャと比較したときに、時間において以前または未来からであり得る。画像が、以前に送信および/または記憶された画像から正確に合成され得るとき、圧縮効率は改善され得る。 ブロック分割は、映像符号化における類似した動きの領域を見つけるための方法に言及し得る。ブロック分割の何らかの方式が、MPEG-2と、H.264(AVCまたはMPEG-4 Part 10とも称される)と、H.265(High Efficiency Video Coding(HEVC)とも称される)とを含む映像コーデック標準規格において見出され得る。例となるブロック分割の手法では、映像フレームの重なり合っていないブロックは、類似した動きを伴うピクセルを含有するブロック分割を見つけるために、長方形サブブロックへと分割され得る。この手法は、ブロック分割の全てのピクセルが類似した動きを有するとき、うまく働き得る。ブロック内のピクセルの動きは、以前に符号化されたフレームに関連して決められ得る。 図1は、実施形態に従った、ピクセルのブロック分割の例を図示した図である。それ自体がサブブロック(例えば符号化ツリー内部のノード)であり得る初めの長方形ピクチャまたはブロック100は、長方形サブブロックへと分割され得る。例えば、110では、ブロック100は、2つの長方形サブブロック110aおよび110bへと分割される。サブブロック110aおよび110bは、それから別々に処理され得る。別の例として、120では、ブロック100は、4つの長方形サブブロック120a、120b、120c、および120dへと分割される。サブブロックは、サブブロック内部のピクセルが同一の動きを共有していること、最小ブロックサイズが達せられていること、または他の基準が判定されるまで、それら自身がさらに分けられ得る。サブブロック内のピクセルが類似した動きを有するとき、動きベクトルは、その領域内の全てのピクセルの動きを説明し得る。 映像符号化のいくつかの手法は、(例えば図1において図示されているような)長方形ブロックが、直線線分によって非長方形であり得る2つの領域へとさらに分けられる幾何学分割を含み得る。例えば、図2は、幾何学分割の例を図示した図である。例となる長方形ブロック200(M×Nピクセルのように表される、Mピクセルの幅およびNピクセルの高さを有し得る)は、直線線分P1 P2 205に沿って2つの領域(領域0および領域1)へと分けられ得る。領域内0のピクセルが類似した動きを有するとき、動きベクトルは、その領域内の全てのピクセルの動きを説明し得る。動きベクトルは、領域0を圧縮するために用いられ得る。同様に、領域1内のピクセルが類似した動きを有しているとき、関連付けられる動きベクトルは、領域1内のピクセルの動きを説明し得る。このような幾何学分割は、映像ビットストリーム内のエンコーディング位置P1およびP2(または位置P1およびP2に代わるもの)によって、受信機(例えばデコーダ)へと信号伝達され得る。 幾何学分割を利用して映像データをエンコードするとき、直線線分205(または、より具体的にはP1およびP2)が、決められ得る。しかし、直線線分は、対象境界を反映するやり方ではブロックを分割できないことがあ