KR-102961993-B1 - 스케일링 리스트 데이터 기반 영상 또는 비디오 코딩

KR102961993B1KR 102961993 B1KR102961993 B1KR 102961993B1KR-102961993-B1

Abstract

본 문서의 개시에 따르면, APS(adaptation parameter set)에서 전달되는 스케일링 리스트 데이터가 계층적 구조를 통해 시그널링될 수 있고, 또한 APS에서 전달되는 스케일링 리스트 데이터에 대한 제한을 둠으로써, 비디오/영상 코딩을 위하여 시그널링되어야 하는 데이터량을 줄이고, 구현 상의 용이함을 줄 수 있다.

Inventors

파루리시탈
김승환
자오지에

Assignees

엘지전자 주식회사

Dates

Publication Date: 20260506
Application Date: 20200708
Priority Date: 20190708

Claims (19)

디코딩 장치에 의하여 수행되는 영상 디코딩 방법에 있어서, 비트스트림으로부터 레지듀얼 정보를 포함하는 영상 정보를 획득하는 단계; 상기 레지듀얼 정보를 기반으로 현재 블록에 대한 양자화된 변환 계수들을 도출하는 단계; 상기 양자화된 변환 계수들을 기반으로 변환 계수들을 도출하는 단계; 상기 변환 계수들을 기반으로 레지듀얼 샘플들을 도출하는 단계; 및 상기 레지듀얼 샘플들을 기반으로 복원 샘플들을 생성하는 단계를 포함하며, 상기 영상 정보는 스케일링 리스트 데이터를 포함하는 APS(adaptation parameter set)를 포함하고, 상기 APS는 APS ID 정보 및 APS 타입 정보를 포함하고, 상기 APS ID 정보를 기반으로 상기 APS가 식별되고, 상기 APS 타입 정보를 기반으로 상기 APS가 상기 스케일링 리스트 데이터를 포함하고, 상기 APS가 상기 스케일링 리스트 데이터에 관한 APS임을 나타내는 APS 타입 정보를 기반으로 상기 APS ID 정보가 특정한 범위 내 값을 가지고, 상기 특정한 범위는 상기 APS가 상기 스케일링 리스트 데이터에 관한 APS임을 나타내는 APS 타입 정보에 대하여 미리 정해지고, 상기 APS ID 정보의 값에 관한 상기 특정한 범위는 0에서 3의 범위를 포함하는 것을 특징으로 하는 영상 디코딩 방법.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
인코딩 장치에 의하여 수행되는 영상 인코딩 방법에 있어서, 현재 블록에 대한 레지듀얼 샘플들을 도출하는 단계; 상기 레지듀얼 샘플들을 기반으로 변환 계수들을 도출하는 단계; 상기 변환 계수들에 대한 양자화 과정을 적용하여 양자화된 변환 계수들을 도출하는 단계; 상기 양자화된 변환 계수들에 대한 정보를 포함하는 레지듀얼 정보를 생성하는 단계; 및 상기 레지듀얼 정보를 포함하는 영상 정보를 인코딩하는 단계를 포함하며, 상기 영상 정보는 스케일링 리스트 데이터를 포함하는 APS(adaptation parameter set)를 포함하고, 상기 APS는 APS ID 정보 및 APS 타입 정보를 포함하고, 상기 APS ID 정보를 기반으로 상기 APS가 식별되고, 상기 APS 타입 정보를 기반으로 상기 APS가 상기 스케일링 리스트 데이터를 포함하고, 상기 APS가 상기 스케일링 리스트 데이터에 관한 APS임을 나타내는 APS 타입 정보를 기반으로 상기 APS ID 정보가 특정한 범위 내 값을 가지고, 상기 특정한 범위는 상기 APS가 상기 스케일링 리스트 데이터에 관한 APS임을 나타내는 APS 타입 정보에 대하여 미리 정해지고, 상기 APS ID 정보의 값에 관한 상기 특정한 범위는 0에서 3의 범위를 포함하는 것을 특징으로 하는 영상 인코딩 방법.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
컴퓨터 판독 가능한 비일시적 디지털 저장 매체로서, 상기 비일시적 디지털 저장 매체는 영상 인코딩 방법에 의하여 생성된 비트스트림을 저장하고, 상기 영상 인코딩 방법은, 현재 블록에 대한 레지듀얼 샘플들을 도출하는 단계; 상기 레지듀얼 샘플들을 기반으로 변환 계수들을 도출하는 단계; 상기 변환 계수들에 대한 양자화 과정을 적용하여 양자화된 변환 계수들을 도출하는 단계; 상기 양자화된 변환 계수들에 대한 정보를 포함하는 레지듀얼 정보를 생성하는 단계; 및 상기 레지듀얼 정보를 포함하는 영상 정보를 인코딩하여 상기 비트스트림을 생성하는 단계를 포함하며, 상기 영상 정보는 스케일링 리스트 데이터를 포함하는 APS(adaptation parameter set)를 포함하고, 상기 APS는 APS ID 정보 및 APS 타입 정보를 포함하고, 상기 APS ID 정보를 기반으로 상기 APS가 식별되고, 상기 APS 타입 정보를 기반으로 상기 APS가 상기 스케일링 리스트 데이터를 포함하고, 상기 APS가 상기 스케일링 리스트 데이터에 관한 APS임을 나타내는 APS 타입 정보를 기반으로 상기 APS ID 정보가 특정한 범위 내 값을 가지고, 상기 특정한 범위는 상기 APS가 상기 스케일링 리스트 데이터에 관한 APS임을 나타내는 APS 타입 정보에 대하여 미리 정해지고, 상기 APS ID 정보의 값에 관한 상기 특정한 범위는 0에서 3의 범위를 포함하는 것을 특징으로 하는 비일시적 디지털 저장 매체.
영상에 대한 데이터의 전송 방법에 있어서, 상기 영상에 대한 비트스트림을 획득하되, 상기 비트스트림은, 현재 블록에 대한 레지듀얼 샘플들을 도출하는 단계, 상기 레지듀얼 샘플들을 기반으로 변환 계수들을 도출하는 단계, 상기 변환 계수들에 대한 양자화 과정을 적용하여 양자화된 변환 계수들을 도출하는 단계, 상기 양자화된 변환 계수들에 대한 정보를 포함하는 레지듀얼 정보를 생성하는 단계, 상기 레지듀얼 정보를 포함하는 영상 정보를 인코딩하는 단계를 기반으로 생성되는 단계; 및 상기 비트스트림을 포함하는 상기 데이터를 전송하는 단계를 포함하고, 상기 영상 정보는 스케일링 리스트 데이터를 포함하는 APS(adaptation parameter set)를 포함하고, 상기 APS는 APS ID 정보 및 APS 타입 정보를 포함하고, 상기 APS ID 정보를 기반으로 상기 APS가 식별되고, 상기 APS 타입 정보를 기반으로 상기 APS가 상기 스케일링 리스트 데이터를 포함하고, 상기 APS가 상기 스케일링 리스트 데이터에 관한 APS임을 나타내는 APS 타입 정보를 기반으로 상기 APS ID 정보가 특정한 범위 내 값을 가지고, 상기 특정한 범위는 상기 APS가 상기 스케일링 리스트 데이터에 관한 APS임을 나타내는 APS 타입 정보에 대하여 미리 정해지고, 상기 APS ID 정보의 값에 관한 상기 특정한 범위는 0에서 3의 범위를 포함하는 것을 특징으로 하는 전송 방법.

Description

스케일링 리스트 데이터 기반 영상 또는 비디오 코딩 본 기술은 비디오 또는 영상 코딩에 관한 것이며, 예를 들어 스케일링 리스트 데이터 기반 코딩 기술에 관한 것이다. 최근 4K 또는 8K 이상의 UHD(Ultra High Definition) 영상/비디오와 같은 고해상도, 고품질의 영상/비디오에 대한 수요가 다양한 분야에서 증가하고 있다. 영상/비디오 데이터가 고해상도, 고품질이 될수록 기존의 영상/비디오 데이터에 비해 상대적으로 전송되는 정보량 또는 비트량이 증가하기 때문에 기존의 유무선 광대역 회선과 같은 매체를 이용하여 영상 데이터를 전송하거나 기존의 저장 매체를 이용해 영상/비디오 데이터를 저장하는 경우, 전송 비용과 저장 비용이 증가된다. 또한, 최근 VR(Virtual Reality), AR(Artificial Realtiy) 컨텐츠나 홀로그램 등의 실감 미디어(Immersive Media)에 대한 관심 및 수요가 증가하고 있으며, 게임 영상과 같이 현실 영상과 다른 영상 특성을 갖는 영상/비디오에 대한 방송이 증가하고 있다. 이에 따라, 상기와 같은 다양한 특성을 갖는 고해상도 고품질의 영상/비디오의 정보를 효과적으로 압축하여 전송하거나 저장하고, 재생하기 위해 고효율의 영상/비디오 압축 기술이 요구된다. 또한, 압축 효율을 향상시키고 주관적/객관적 비주얼 품질을 높이기 위하여 스케일링 과정에서의 적응적 주파수별 가중 양자화(adaptive frequency weighting quantization) 기술에 관한 논의가 있다. 이러한 기술을 효율적으로 적용하기 위하여 관련된 정보를 시그널링하는 방법이 필요하다. 도 1은 본 문서의 실시예들에 적용될 수 있는 비디오/영상 코딩 시스템의 예를 개략적으로 나타낸다. 도 2는 본 문서의 실시예들이 적용될 수 있는 비디오/영상 인코딩 장치의 구성을 개략적으로 설명하는 도면이다. 도 3은 본 문서의 실시예들이 적용될 수 있는 비디오/영상 디코딩 장치의 구성을 개략적으로 설명하는 도면이다. 도 4는 본 문서의 실시예들이 적용 가능한 개략적인 비디오/영상 인코딩 방법의 일 예를 나타낸다. 도 5는 본 문서의 실시예들이 적용 가능한 개략적인 비디오/영상 디코딩 방법의 일 예를 나타낸다. 도 6은 코딩된 영상/비디오에 대한 계층 구조를 예시적으로 나타낸다. 도 7 및 도 8은 본 문서의 실시예(들)에 따른 비디오/영상 인코딩 방법 및 관련 컴포넌트의 일 예를 개략적으로 나타낸다. 도 9 및 도 10은 본 문서의 실시예(들)에 따른 비디오/영상 디코딩 방법 및 관련 컴포넌트의 일 예를 개략적으로 나타낸다. 도 11은 본 문서에서 개시된 실시예들이 적용될 수 있는 컨텐츠 스트리밍 시스템의 예를 나타낸다. 본 문서는 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 본 문서를 특정 실시예에 한정하려고 하는 것이 아니다. 본 문서에서 상용하는 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 문서의 기술적 사상을 한정하려는 의도로 사용되는 것은 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 문서에서 "포함하다" 또는 "가지다" 등의 용어는 문서상에 기재된 특징, 숫자, 단계, 동작, 구성 요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성 요소, 부품 도는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다. 한편, 본 문서에서 설명되는 도면상의 각 구성들은 서로 다른 특징적인 기능들에 관한 설명의 편의를 위해 독립적으로 도시된 것으로서, 각 구성들이 서로 별개의 하드웨어나 별개의 소프트웨어로 구현된다는 것을 의미하지는 않는다. 예컨대, 각 구성 중 두 개 이상의 구성이 합쳐져 하나의 구성을 이룰 수도 있고, 하나의 구성이 복수의 구성으로 나뉘어질 수도 있다. 각 구성이 통합 및/또는 분리된 실시예도 본 문서의 본질에서 벗어나지 않는 한 본 문서의 권리범위에 포함된다. 본 문서에서 "A 또는 B(A or B)"는 "오직 A", "오직 B" 또는 "A와 B 모두"를 의미할 수 있다. 달리 표현하면, 본 문서에서 "A 또는 B(A or B)"는 "A 및/또는 B(A and/or B)"으로 해석될 수 있다. 예를 들어, 본 문서에서 "A, B 또는 C(A, B or C)"는 "오직 A", "오직 B", "오직 C", 또는 "A, B 및 C의 임의의 모든 조합(any combination of A, B and C)"를 의미할 수 있다. 본 문서에서 사용되는 슬래쉬(/)나 쉼표(comma)는 "및/또는(and/or)"을 의미할 수 있다. 예를 들어, "A/B"는 "A 및/또는 B"를 의미할 수 있다. 이에 따라 "A/B"는 "오직 A", "오직 B", 또는 "A와 B 모두"를 의미할 수 있다. 예를 들어, "A, B, C"는 "A, B 또는 C"를 의미할 수 있다. 본 문서에서 "적어도 하나의 A 및 B(at least one of A and B)"는, "오직 A", "오직 B" 또는 "A와 B 모두"를 의미할 수 있다. 또한, 본 문서에서 "적어도 하나의 A 또는 B(at least one of A or B)"나 "적어도 하나의 A 및/또는 B(at least one of A and/or B)"라는 표현은 "적어도 하나의 A 및 B(at least one of A and B)"와 동일하게 해석될 수 있다. 또한, 본 문서에서 "적어도 하나의 A, B 및 C(at least one of A, B and C)"는, "오직 A", "오직 B", "오직 C", 또는 "A, B 및 C의 임의의 모든 조합(any combination of A, B and C)"를 의미할 수 있다. 또한, "적어도 하나의 A, B 또는 C(at least one of A, B or C)"나 "적어도 하나의 A, B 및/또는 C(at least one of A, B and/or C)"는 "적어도 하나의 A, B 및 C(at least one of A, B and C)"를 의미할 수 있다. 또한, 본 문서에서 사용되는 괄호는 "예를 들어(for example)"를 의미할 수 있다. 구체적으로, "예측(인트라 예측)"로 표시된 경우, "예측"의 일례로 "인트라 예측"이 제안된 것일 수 있다. 달리 표현하면 본 문서의 "예측"은 "인트라 예측"으로 제한(limit)되지 않고, "인트라 예측"이 "예측"의 일례로 제안될 것일 수 있다. 또한, "예측(즉, 인트라 예측)"으로 표시된 경우에도, "예측"의 일례로 "인트라 예측"이 제안된 것일 수 있다. 본 문서는 비디오/영상 코딩에 관한 것이다. 예를 들어 본 문서에서 개시된 방법/실시예는 VVC (versatile video coding) 표준에 개시되는 방법에 적용될 수 있다. 또한, 본 문서에서 개시된 방법/실시예는 EVC (essential video coding) 표준, AV1 (AOMedia Video 1) 표준, AVS2 (2nd generation of audio video coding standard) 또는 차세대 비디오/영상 코딩 표준(ex. H.267 or H.268 등)에 개시되는 방법에 적용될 수 있다. 본 문서에서는 비디오/영상 코딩에 관한 다양한 실시예들을 제시하며, 다른 언급이 없는 한 상기 실시예들은 서로 조합되어 수행될 수도 있다. 본 문서에서 비디오(video)는 시간의 흐름에 따른 일련의 영상(image)들의 집합을 의미할 수 있다. 픽처(picture)는 일반적으로 특정 시간대의 하나의 영상을 나타내는 단위를 의미하며, 슬라이스(slice)/타일(tile)은 코딩에 있어서 픽처의 일부를 구성하는 단위이다. 슬라이스/타일은 하나 이상의 CTU(coding tree unit)을 포함할 수 있다. 하나의 픽처는 하나 이상의 슬라이스/타일로 구성될 수 있다. 타일은 픽너 내 특정 타일 열 및 특정 타일 열 이내의 CTU들의 사각 영역이다(A tile is a rectangular region of CTUs within a particular tile column and a particular tile row in a picture). 상기 타일 열은 CTU들의 사각 영역이고, 상기 사각 영역은 상기 픽처의 높이와 동일한 높이를 갖고, 너비는 픽처 파라미터 세트 내의 신택스 요소들에 의하여 명시될 수 있다(The tile column is a rectangular region of CTUs having a height equal to the height of the picture and a width specified by syntax elements in the picture parameter set). 상기 타일 행은 CTU들의 사각 영역이고, 상기 사각 영역은 픽처 파라미터 세트 내의 신택스 요소들에 의하여 명시되는 너비를 갖고, 높이는 상기 픽처의 높이와 동일할 수 있다(The tile row is a rectangular region of CTUs having a height specified by syntax elements in the picture parameter set and a width equal to the width of the picture). 타일 스캔은 픽처를 파티셔닝하는 CTU들의 특정 순차적 오더링을 나타낼 수 있고, 상기 CTU들은 타일 내 CTU 래스터 스캔으로 연속적으로 정렬될 수 있고, 픽처 내 타일들은 상기 픽처의 상기 타일들의 래스터 스캔으로 연속적으로 정렬될 수 있다(A tile scan is a specific sequential ordering of CTUs partitioning a picture in which the CTUs are ordered consecutively in CTU raster scan in a tile whereas tiles in a picture are ordered consecutively in a raster scan of the tiles of the p