JP-2026077504-A - メッシュ復号装置、メッシュ復号方法及びプログラム
Abstract
【課題】算術復号を用いた変位量の復号において、ランダムアクセスによる並列処理による高速化やレート制御を可能とすること。 【解決手段】本発明に係るメッシュ復号装置200の変位量復号部205は、変位量ビットストリームにおいて、並列処理可能な単位である各変位量IDに対応する変位量ビットストリームに単一のLoD値が含まれるか否かについて判別する含有LoD種別判別部205Aと、変位量IDに対応する変位量ビットストリームが単一のLoD値で構成されている場合、単一のLoD値を取得するLoD値取得部205Bと、変位量IDに対応する変位量ビットストリームごとに算術復号を行うことによって係数レベル値を生成する変位量算術復号部205Fとを備える。 【選択図】図11
Inventors
- 明堂 絵美
- 海野 恭平
- 西村 仁志
- 河村 圭
- 加藤 晴久
Assignees
- KDDI株式会社
Dates
- Publication Date
- 20260513
- Application Date
- 20241025
Claims (6)
- メッシュ復号装置であって、 変位量ビットストリームを復号して変位量を生成して出力する変位量復号部を備え、 前記変位量復号部は、 前記変位量ビットストリームにおいて、並列処理可能な単位である各変位量IDに対応する変位量ビットストリームに単一のLoD値が含まれるか否かについて判別する含有LoD種別判別部と、 前記変位量IDに対応する変位量ビットストリームが単一のLoD値で構成されている場合、前記単一のLoD値を取得するLoD値取得部と、 前記変位量IDに対応する変位量ビットストリームごとに算術復号を行うことによって係数レベル値を生成する変位量算術復号部と、を備えることを特徴とするメッシュ復号装置。
- 前記変位量復号部は、前記変位量IDに対応する変位量ビットストリームに含まれるLoD値の範囲を指定する含有LoD値範囲指定部を備えることを特徴とする請求項1に記載のメッシュ復号装置。
- 前記変位量復号部は、 復号をスキップするLoD値を指定することができるLoDスキップ指定部と、 復号するLoD値が存在するか否かについて判別する復号有無判定部と、を備え、 前記復号有無判別部によって前記復号するLoD値が存在しないと判別された場合に、前記変位量算術復号部は、前記係数レベル値を生成する処理をスキップすることを特徴とする請求項1又は2に記載のメッシュ復号装置。
- 前記LoD値は、前記変位量IDの示すヘッダー内にあることを特徴とする請求項1に記載のメッシュ復号装置。
- メッシュ復号方法であって、 変位量ビットストリームを復号して変位量を生成して出力する工程を有し、 前記工程は、 前記変位量ビットストリームにおいて、並列処理可能な単位である各変位量IDに単一のLoD値が含まれるか否かについて判別する工程と、 前記変位量IDに対応する変位量ビットストリームが単一のLoD値で構成されている場合、前記単一のLoD値を取得する工程と、 前記変位量IDに対応する変位量ビットストリームごとに算術復号を行うことによって係数レベル値を生成する工程と、を有することを特徴とするメッシュ復号方法。
- コンピュータを、メッシュ復号装置として機能させるプログラムであって、 前記メッシュ復号装置は、変位量ビットストリームを復号して変位量を生成して出力する変位量復号部を備え、 前記変位量復号部は、 前記変位量ビットストリームにおいて、並列処理可能な単位である各変位量IDに対応する変位量ビットストリームに単一のLoD値が含まれるか否かについて判別する含有LoD種別判別部と、 前記変位量IDに対応する変位量ビットストリームが単一のLoD値で構成されている場合、前記単一のLoD値を取得するLoD値取得部と、 前記変位量IDに対応する変位量ビットストリームごとに算術復号を行うことによって係数レベル値を生成する変位量算術復号部と、を備えることを特徴とするプログラム。
Description
本発明は、メッシュ復号装置、メッシュ復号方法及びプログラムに関する。 非特許文献1には、メッシュを大まかな基本メッシュと詳細な変位量とに分けて復号し、変位量について2次元映像に変換した後で映像コーデックによって復号する技術について開示されている。 非特許文献2には、非特許文献1における映像コーデックの代替え手段として、変位量を算術復号によって復号する技術について開示されている。 Khaled Mammou, Jungsun Kim, Alexis Tourapis, Dimitri Podborski, Krasimir Kolarov, “[V-CG] Apple’s Dynamic Mesh Coding CfP Response,” ISO/IEC JTC 1/SC 29/WG 7 m5928, April 2022.Study of technologies for Video-based mesh coding,” ISO/IEC JTC 1/SC 29/WG7 N00960, July 2024 図1は、一実施形態に係るメッシュ処理システム1の構成の一例を示す図である。図2は、一実施形態に係るメッシュ復号装置200の機能ブロックの一例を示す図である。図3は、入力されるビットストリームの一例を示す図である。図4は、変位量ビットストリームの構成の一例を示す図である。図5は、第1実施形態に係るDSPSのシンタックス構成の一例を示す図である。図6は、第1実施形態に係るDHのシンタックス構成の一例を示す図である。図7は、第1実施形態に係るDDUのシンタックス構成の一例を示す図である。図8は、第1実施形態に係るASPSのシンタックス構成の一例を示す図である。図9は、第1実施形態に係るMDUのシンタックス構成の一例を示す図である。図10は、第1実施形態に係るIMDUのシンタックス構成の一例を示す図である。図11は、第1実施形態に係る変位量復号部205の機能ブロックの一例を示す図である。図12は、第1実施形態に係る変位量復号部205の変位量算術復号部205Fの機能ブロックの一例を示す図である。図13は、第1実施形態に係る変位量復号部205の動作の一例について示すフローチャートである。図14は、第2実施形態に係るDHのシンタックス構成の一例を示す図である。図15は、第2実施形態に係るDDUの一部であるDDのシンタックス構成の一例を示す図である。図16は、第2実施形態に係るDDUの一部であるDSDUのシンタックス構成の一例を示す図である。図17は、第2実施形態に係る変位量復号部205の機能ブロックの一例を示す図である。図18は、第2実施形態に係る変位量復号部205の動作の一例について示すフローチャートである。図19は、第2実施形態に係る変位量復号部205の動作の一例について示すフローチャートである。図20は、第2実施形態に係る変位量復号部205の動作の一例について示すフローチャートである。図21は、第2実施形態に係る変位量復号部205の動作の一例について示すフローチャートである。 以下、本発明の実施の形態について、図面を参照しながら説明する。なお、以下の実施形態における構成要素は、適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組み合わせを含む様々なバリエーションが可能である。したがって、以下の実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。 <第1実施形態> 以下、図1~図13を参照して、本実施形態に係るメッシュ処理システム1について説明する。 図1は、本実施形態に係るメッシュ処理システム1の構成の一例を示す図である。図1に示すように、メッシュ処理システム1は、メッシュ符号化装置100及びメッシュ復号装置200を備えている。 図2は、本実施形態に係るメッシュ復号装置200の機能ブロックの一例を示す図である。 図2に示すように、メッシュ復号装置200は、多重分離部201と、アトラス復号部202と、基本メッシュ復号部203と、テクスチャ復号部204と、変位量復号部205と、メッシュ再構成部206とを有する。 多重分離部201は、多重化されたビットストリームを、基本メッシュビットストリームと変位量ビットストリームとテクスチャビットストリームとアトラスビットストリームに分離するように構成されている。 アトラスデータ復号部202は、アトラスビットストリームを復号するように構成されている。 基本メッシュ復号部203は、基本メッシュビットストリームを復号し、基本メッシュを生成して出力するように構成されている。 テクスチャ復号部204は、映像符号化によってテクスチャを復号して出力するように構成されている。例えば、テクスチャ復号部204は、HEVCを用いてもよい。 変位量復号部205は、変位量ビットストリームを復号して変位量を生成して出力するように構成されている。 メッシュ再構成部206は、復号メッシュを生成して出力するように構成されている。メッシュ再構成部206は、後述する変位量ID(又は、変位量IDとLoD値のセット)に対応付けられた基本メッシュのサブメッシュやアトラスから出力されるパッチより、メッシュを再構成することができる。 (ビットストリーム) 図3に、入力されるビットストリームの一例を示す。図3に示すように、かかるビットストリームは、V3Cパラメータセット、アトラスビットストリーム、基本メッシュビットストリーム、変位量ビットストリーム及びテクスチャビットストリームを含む。 (変位量ビットストリーム) 以下、図4を参照して、変位量ビットストリームの構成の一例について説明する。図4は、変位量ビットストリームの構成の一例について示す図である。 図4に示すように、第1に、変位量ビットストリームは、変位量の復号に関する制御情報の集合であるDSPS(Displacement Sequence Parameter Set:ディスプレイスメントシーケンスパラメータセット)及びDFPS(Displacement Frame Parameter Set:ディスプレイスメントフレームパラメータセット)を含んでいてもよい。 第2に、変位量ビットストリームは、フレームに対応する制御情報の集合であるDFH(Displacement Frame Header:ディスプレイスメントフレームヘッダ)を含んでいてもよい。 第3に、変位量ビットストリームは、DFHの次に、フレームに対応する符号化された変位量であるDDU(Displacement Data Unit:ディスプレイスメントデータユニット)を含んでいてもよい。 (DSPS) 図5に、ディスプレイスメントシーケンスパラメータセット(DSPS)のシンタックス構成の一例を示す。 フレーム内の変位量は、複数の変位量のまとまりに分けられてもよい。変位量は、頂点の集合で分けられてもよい。これをサブメッシュと呼ぶ。また、変位量は、後述するLoD値によって分けられてもよい。それぞれの変位量のまとまりに重複しないIDが割り当てられ、それを変位量IDと呼ぶ。LoD値によって後述するDDUが分けられるが、サブメッシュごとに変位量IDを割り当てる場合は、変位量IDとLoD値(後述するdh_lod_idxやdu_lod_idx)のセットで識別できる。その場合、LoD値が異なっても変位量IDは厳密には同じ値となるが、変位量IDとLoD値のセットも以下では代表して変位量IDと呼ぶ。変位量IDは、DDUを識別可能な単一の値、またはセットの値を以下では示すものとする。また、変位量ID(変位量IDとLoD値のセット)に対応する変位量ビットストリームのことを略し、単に変位量IDと呼ぶ場合もある。 DSPSは、各変位量IDに対応する変位量ビットストリームが、詳細度を示すLoD(Level of Ditail)の値であるLoD値をどのように含むかを示す含有LoD種別を判別するdsps_lod_displacement_ids_enable_flagを含んでもよい。 dsps_lod_displacement_ids_enable_flagが1の場合、各変位量IDに対応する変位量ビットストリームに単一のLoD値のデータが含まれていることを示し、dsps_lod_displacement_ids_enable_flagが0の場合、各変位量IDに対応する変位量ビットストリームに全てのLoD値のデータが含まれていることを示してもよい。データは、係数レベル値に関してもよい。 (DH) 図6に、ディスプレイスメントヘッダ(DH)のシンタックス構成の一例を示す。 図6に示すように、DHは、変位量IDであるdh_idを含んでもよい。また、displIDに、dh_idの値が代入されてもよい。 また、DHは、処理対象となっている変位量IDに対応する変位量ビットストリームに含まれるLoD値を示すdh_lod_idx[displID]を含んでもよい。dh_lod_idx[displID]は、LoD値を示してもよい。 例えば、dsps_lod_displacement_ids_enable_flagが1の場合、dh_lod_idx[displID]は、単一のLoD値を示してもよい。 ディスプレイスメントデータユニット(DDU)でなく、ディスプレイスメントヘッダ(DH)内に、dh_lod_idx[displID]があることで、算術符号化されているDDUを全く復号することなく、後述するLoDスキップを行うことができるという利点がある。一方、DHのビット量を減らすために、dh_lod_idx[displID]でなく、DDUに含まれても良い。その場合、ddu_lod_idx[displID]となる。 dsps_od_displacement_ids_enable_flagが0の場合、dh_lod_idx[displID]は、0を示してもよい。 (DDU) 図7に、ディスプレイスメントデータユニット(DDU)のシンタックス構成の一例を示す。 DDUは、変位量IDに対応する変位量ビットストリームに含有されるLoD値の範囲を指定してもよい。 dsps_lod_displacement_ids_enable_flagが0の場合、ddu_lod_count[displID]に、全てのLoDの数(細分割したレベルの数)が格納されてもよい。 dsps_lod_displacement_ids_enable_flagが1の場合、dh_lod_idxで指定された単一又は一部のLoD値における係数レベル値のみ復号されてもよい。 dsps_lod_displacement_ids_enable_flagが0の場合、全てのLoD値における係数レベル値が復号されてもよい。 以上のように復号するため、DDUは、対象の変位量IDに対応する変位量ビットストリームが含有するLoD値や範囲を指定してもよい。 例えば、dsps_lod_displacement_ids_enable_flagが1の場合、startLevel=dh_lod_idx[displID],endLevel=dh_lod_idx[displID]+1とし、dsps_lod_displacement_ids_enable_flagが0の場合、startLevel=0,endLevel=ddu_lod_count[displID]として範囲を指定する。 図7に示すように、startLevel以上、endLevel未満でループ処理を行い、変位量を復号することで、1つの記述で指定した範囲の復号をしてもよい。 ループ処理では、LoD値のループが外側、次元のループが内側となっているが、外側と内側とを交換しても全く問題ない。 (アトラスシー