KR-20260062030-A - METHOD AND APPARATUS FOR ENCODING/DECODING POINT CLOUD BASED ON HYPERPRIOR MODEL
Abstract
본 개시에 따른 포인트 클라우드 복호화 방법은, 복호화된 초기 좌표 정보에 대한 다운샘플링을 수행하여 제1 좌표 정보를 획득하는 단계; 상기 제1 좌표 정보 및 복호화된 제1 피쳐 정보에 기반하여 제1 텐서를 생성하는 단계; 생성된 상기 제1 텐서에 대해 업샘플링을 수행하는 단계; 업샘플링된 상기 제1 텐서가 포함하는 제2 좌표 정보의 정렬 순서에 기반하여 제2 피쳐 정보를 추출하는 단계; 초사전분포 엔트로피 모델에 기반하여 상기 제2 피쳐 정보로부터 초사전분포 피쳐 정보를 유도하는 단계; 상기 초사전분포 피쳐 정보에 기반하여 제2 텐서를 생성하는 단계; 및 상기 제2 텐서에 기반하여 포인트 클라우드를 복원하는 단계를 포함할 수 있다.
Inventors
- 김준식
- 방건
- 김수웅
- 도지훈
- 배성준
- 이하현
- 강정원
- 최진수
Assignees
- 한국전자통신연구원
Dates
- Publication Date
- 20260506
- Application Date
- 20250911
- Priority Date
- 20241028
Claims (20)
- 복호화된 초기 좌표 정보에 대한 다운샘플링을 수행하여 제1 좌표 정보를 획득하는 단계; 상기 제1 좌표 정보 및 복호화된 제1 피쳐 정보에 기반하여 제1 텐서를 생성하는 단계; 생성된 상기 제1 텐서에 대해 업샘플링을 수행하는 단계; 업샘플링된 상기 제1 텐서가 포함하는 제2 좌표 정보의 정렬 순서에 기반하여 제2 피쳐 정보를 추출하는 단계; 초사전분포 엔트로피 모델에 기반하여 상기 제2 피쳐 정보로부터 초사전분포 피쳐 정보를 유도하는 단계; 상기 초사전분포 피쳐 정보에 기반하여 제2 텐서를 생성하는 단계; 및 상기 제2 텐서에 기반하여 포인트 클라우드를 복원하는 단계를 포함하는, 포인트 클라우드 복호화 방법.
- 제1항에 있어서, 상기 다운샘플링을 수행함에 있어, 복호화된 상기 초기 좌표 정보 및 상기 제1 좌표 정보 간의 연결 관계 정보가 생성되는, 포인트 클라우드 복호화 방법.
- 제2항에 있어서, 상기 연결 관계 정보는, 소정의 픽셀 또는 복셀의 연결 관계를 표현하는 방식에 의해 결정되되, 상기 방식은, 대응 관계를 추적하는 좌표 벡터, 인덱스 맵 또는 인접 리스트 방식 중 적어도 하나를 포함하는, 포인트 클라우드 복호화 방법.
- 제2항에 있어서, 상기 연결 관계 정보는, 지정된 다운샘플링 방식을 고려하여 생성되는, 포인트 클라우드 복호화 방법.
- 제2항에 있어서, 상기 연결 관계 정보에 기반하여 상기 제1 텐서에 대한 상기 업샘플링이 수행되는, 포인트 클라우드 복호화 방법.
- 제1항에 있어서, 상기 제1 텐서는, 상기 제1 좌표 정보 및 복호화된 제1 피쳐 정보를 연결하여 생성되고, 및 상기 연결은, 상기 제1 좌표 정보의 정렬 순서에 기반하여 수행되는, 포인트 클라우드 복호화 방법.
- 제1항에 있어서, 상기 제2 텐서는, 복호화된 상기 초기 좌표 정보 및 초사전분포 피쳐 정보를 연결하여 생성되고, 및 상기 연결은, 복호화된 상기 초기 좌표 정보의 정렬 순서에 기반하여 수행되는, 포인트 클라우드 복호화 방법.
- 제1항에 있어서, 상기 제2 좌표 정보의 상기 정렬 순서는, 소정의 좌표 정보 정렬 방식에 의해 결정되되, 상기 방식은, 공간 채움 알고리즘 또는 직교 좌표계 기준 정렬 방식 중 적어도 하나를 포함하고, 및 상기 공간 채움 알고리즘은 모톤 코드 또는 힐베르트 곡선 중 적어도 하나를 포함하는, 포인트 클라우드 복호화 방법.
- 제1항에 있어서, 복호화된 상기 초기 좌표 정보에 대한 다운샘플링 수행 여부를 나타내는 정보가 시그날링되는, 포인트 클라우드 복호화 방법.
- 제1항에 있어서, 상기 초사전분포 피쳐 정보를 유도할지 여부를 나타내는 정보가 시그날링되는, 포인트 클라우드 복호화 방법.
- 하나 이상의 송수신기; 하나 이상의 메모리; 및 하나 이상의 프로세서를 포함하고, 상기 하나 이상의 프로세서는: 복호화된 초기 좌표 정보에 대한 다운샘플링을 수행하여 제1 좌표 정보를 획득하고; 상기 제1 좌표 정보 및 복호화된 제1 피쳐 정보에 기반하여 제1 텐서를 생성하고; 생성된 상기 제1 텐서에 대해 업샘플링을 수행하고; 업샘플링된 상기 제1 텐서가 포함하는 제2 좌표 정보의 정렬 순서에 기반하여 상기 텐서에서 제2 피쳐 정보를 추출하고; 초사전분포 엔트로피 모델에 기반하여 상기 제2 피쳐 정보로부터 초사전분포 피쳐 정보를 유도하고; 상기 초사전분포 피쳐 정보에 기반하여 제2 텐서를 생성하고; 및 상기 제2 텐서에 기반하여 포인트 클라우드를 복원하도록 설정되는, 포인트 클라우드 복호화 장치.
- 포인트 클라우드의 초기 텐서를 부호화하는 단계; 부호화된 상기 초기 텐서에 대해 다운샘플링을 수행하는 단계; 다운샘플링된 상기 초기 텐서가 포함하는 제1 좌표 정보의 정렬 순서에 기반하여 제1 피쳐 정보를 추출하는 단계; 상기 제1 좌표 정보 및 상기 제1 피쳐 정보에 기반하여 제1 텐서를 생성하는 단계; 생성된 상기 제1 텐서에 대해 업샘플링을 수행하는 단계; 업샘플링된 상기 제1 텐서가 포함하는 제2 좌표 정보의 정렬 순서에 기반하여 제2 피쳐 정보를 추출하는 단계; 및 상기 제2 피쳐 정보로부터 유도된 초사전분포 피쳐 정보에 대해 산술 부호화를 수행하는 단계를 포함하는, 포인트 클라우드 부호화 방법.
- 제12항에 있어서, 상기 다운샘플링을 수행함에 있어, 상기 초기 텐서가 포함하는 초기 좌표 정보 및 상기 제1 좌표 정보 간의 연결 관계 정보가 생성되는, 포인트 클라우드 부호화 방법.
- 제13항에 있어서, 상기 연결 관계 정보는, 소정의 픽셀 또는 복셀의 연결 관계를 표현하는 방식에 의해 결정되되, 상기 방식은, 대응 관계를 추적하는 좌표 벡터, 인덱스 맵 또는 인접 리스트 방식 중 적어도 하나를 포함하는, 포인트 클라우드 부호화 방법.
- 제13항에 있어서, 상기 연결 관계 정보는, 지정된 다운샘플링 방식을 고려하여 생성되는, 포인트 클라우드 부호화 방법.
- 제13항에 있어서, 상기 연결 관계 정보에 기반하여 상기 제1 텐서에 대한 상기 업샘플링이 수행되는, 포인트 클라우드 부호화 방법.
- 제12항에 있어서, 상기 제1 텐서는, 상기 제1 좌표 정보 및 상기 제1 피쳐 정보를 연결하여 생성되고, 및 상기 연결은, 상기 제1 좌표 정보의 상기 정렬 순서에 기반하여 수행되는, 포인트 클라우드 부호화 방법.
- 제12항에 있어서, 상기 제2 좌표 정보의 상기 정렬 순서는, 소정의 좌표 정보 정렬 방식에 의해 결정되되, 상기 방식은, 공간 채움 알고리즘 또는 직교 좌표계 기준 정렬 방식 중 적어도 하나를 포함하고, 및 상기 공간 채움 알고리즘은 모톤 코드 또는 힐베르트 곡선 중 적어도 하나를 포함하는, 포인트 클라우드 부호화 방법.
- 제12항에 있어서, 상기 초사전분포 피쳐 정보를 유도할지 여부를 나타내는 정보가 시그날링되는, 포인트 클라우드 부호화 방법.
- 하나 이상의 송수신기; 하나 이상의 메모리; 및 하나 이상의 프로세서를 포함하고, 상기 하나 이상의 프로세서는: 포인트 클라우드의 초기 텐서를 부호화하고; 부호화된 상기 초기 텐서에 대해 다운샘플링을 수행하고; 다운샘플링된 상기 초기 텐서가 포함하는 제1 좌표 정보의 정렬 순서에 기반하여 제1 피쳐 정보를 추출하고; 상기 제1 좌표 정보 및 상기 제1 피쳐 정보에 기반하여 제1 텐서를 생성하고; 생성된 상기 제1 텐서에 대해 업샘플링을 수행하고; 업샘플링된 상기 제1 텐서가 포함하는 제2 좌표 정보의 정렬 순서에 기반하여 제2 피쳐 정보를 추출하고; 및 상기 제2 피쳐 정보로부터 유도된 초사전분포 피쳐 정보에 대해 산술 부호화를 수행하도록 설정되는, 포인트 클라우드 부호화 장치.
Description
초사전분포(Hyperprior) 모델 기반 포인트 클라우드 부/복호화 방법{METHOD AND APPARATUS FOR ENCODING/DECODING POINT CLOUD BASED ON HYPERPRIOR MODEL} 본 발명은 인공지능 기반 포인트 클라우드 부/복호화 방법에 관한 것이다. 보다 상세하게는, 본 발명은 초사전분포(Hyperprior) 모델 기반 포인트 클라우드 부/복호화 방법 및 이를 수행하기 위한 장치에 관한 것이다. 인공지능 기반 포인트 클라우드 압축은 뉴럴 네트워크 모델을 이용하여 포인트 클라우드의 부/복호화를 수행하는 기술이다. 인공지능 기반 이미지(영상) 압축 분야에서 널리 이용되는 변형 오토인코더(Variational Autoencoder, VAE)의 구조를 기본으로 3차원 데이터 처리에 필요한 점유 확률 계산, 가지치기(Pruning) 등의 기법들을 활용될 수 있다. 인공지능 기반 포인트 클라우드 부/복호화 시에, 부호화기에서 출력되는 잠재 피쳐(latent feature)는 가우시안 분포를 갖는 것을 가정하고 산술 부호화 모델을 통해 압축될 수 있다. 이때, 산술 부호화 모델로는 팩토라이즈된 사전분포 모델(factorized prior model)이 사용될 수 있다. 팩토라이즈된 사전분포 모델은 잠재 피쳐 내에 통계적 종속성이 존재할 경우, 최적의 압축 성능을 도출할 수 없다는 특성이 있다. 이를 해결하기 위해 도입된 초사전분포 모델을 통해 더 높은 압축 성능을 기대할 수 있다. 다만, 초사전분포 모델에서는 출력되는 잠재 피쳐들의 해상도가 서로 달라 포인트 클라우드 데이터에 적용하기 어려운 문제가 발생할 수 있다. 도 1은, 본 개시의 일 실시예에 따른, 초사전분포 엔트로피 모델의 구조를 예시하는 도면이다. 도 2는, 본 개시의 일 실시예에 따른, 초사전분포 모델 기반 포인트 클라우드 부호화 장치를 예시하는 도면이다. 도 3은, 본 개시의 일 실시예에 따른, 초사전분포 모델 기반 포인트 클라우드 복호화 장치를 예시하는 도면이다. 도 4는, 본 개시의 일 실시예에 따른, 초사전분포 모델 기반 포인트 클라우드 부호화 방법의 흐름도이다. 도 5는, 본 개시의 일 실시예에 따른, 초사전분포 모델 기반 포인트 클라우드 복호화 방법의 흐름도이다. 도 6은, 본 개시의 실시예에 따른 장치를 예시하는 블록도이다. 본 개시는 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 개시를 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 개시의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다. 도면에서의 요소들의 형상 및 크기 등은 보다 명확한 설명을 위해 과장될 수 있다. 후술하는 예시적 실시예들에 대한 상세한 설명은, 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 실시예를 실시할 수 있기에 충분하도록 상세히 설명된다. 다양한 실시예들은 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예에 관련하여 본 개시의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 실시예의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 예시적 실시예들의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 본 개시에서 제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 개시의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다. 본 개시의 어떤 구성 요소가 다른 구성 요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성 요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있으나, 중간에 다른 구성 요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어"있다거나 "직접 접속되어"있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 본 개시의 실시예에 나타나는 구성부들은 서로 다른 특징적인 기능들을 나타내기 위해 독립적으로 도시되는 것으로, 각 구성부들이 분리된 하드웨어나 하나의 소프트웨어 구성단위로 이루어짐을 의미하지 않는다. 즉, 각 구성부는 설명의 편의상 각각의 구성부로 나열하여 포함한 것으로 각 구성부 중 적어도 두개의 구성부가 합쳐져 하나의 구성부로 이루어지거나, 하나의 구성부가 복수 개의 구성부로 나뉘어져 기능을 수행할 수 있고 이러한 각 구성부의 통합된 실시예 및 분리된 실시예도 본 개시의 본질에서 벗어나지 않는 한 본 개시의 권리범위에 포함된다. 본 개시에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 개시를 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 개시에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다. 즉, 본 개시에서 특정 구성을 "포함"한다고 기술하는 내용은 해당 구성 이외의 구성을 배제하는 것이 아니며, 추가적인 구성이 본 개시의 실시 또는 본 개시의 기술적 사상의 범위에 포함될 수 있음을 의미한다. 본 개시의 일부의 구성 요소는 본 개시에서 본질적인 기능을 수행하는 필수적인 구성 요소는 아니고 단지 성능을 향상시키기 위한 선택적 구성 요소일 수 있다. 본 개시는 단지 성능 향상을 위해 사용되는 구성 요소를 제외한 본 개시의 본질을 구현하는데 필수적인 구성부만을 포함하여 구현될 수 있고, 단지 성능 향상을 위해 사용되는 선택적 구성 요소를 제외한 필수 구성 요소만을 포함한 구조도 본 개시의 권리범위에 포함된다. 이하, 도면을 참조하여 본 개시의 실시 형태에 대하여 구체적으로 설명한다. 본 명세서의 실시예를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 명세서의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략하고, 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다. 먼저, 본 출원에서 사용되는 용어를 간략히 설명하면 다음과 같다. 포인트 클라우드는, 3차원 공간 상의 포인트들의 집합을 의미할 수 있다. 포인트 클라우드는 기하 정보 및/또는 속성 정보로 나타내어질 수 있다. 기하 정보는 좌표 정보로 대체되어 이해될 수 있다. 속성 정보는 피쳐(feature) 정보로 대체되어 이해될 수 있다. 포인트 클라우드의 좌표 정보는, 3차원 공간 상에서 포인트의 위치 정보를 나타낼 수 있다. 포인트 클라우드의 좌표 정보는, 특정 좌표계(예를 들어, 직교 좌표계, 구면 좌표계 등)에 기반하여 정의될 수 있다. 포인트 클라우드의 피쳐 정보는, 포인트에 해당하는 속성을 수치화하여 나타낸 정보를 나타낼 수 있다. 색상, 투명도, 반사율, 법선 벡터, 구면 조화 함수 중 적어도 하나의 정보를 포함할 수 있다. 잠재 피쳐는, 데이터를 뉴럴 네트워크에 입력함으로써 모델 내부에서 추출되거나 학습된 특성 값을 의미할 수 있다. 도 1은, 본 개시의 일 실시예에 따른, 초사전분포 엔트로피 모델의 구조를 예시하는 도면이다. 도 1을 참조하면, 초사전분포 엔트로피 모델(또는, 초사전분포 모델이라고도 함)은 입력 데이터 x를 가우시안 분포를 갖는 y 및 z로 변환할 수 있다. y는 양자화부(116)를 거쳐 양자화되고, 산술 부호화부(118)를 거쳐 산술 부호화될 수 있다. z는 y의 평균(μ) 및 스케일(θ)을 결정할 수 있다. 양자화부(122)에서 z에 대해 양자화(Quantization, Q)가 수행됨에 따라 가 도출될 수 있다. 산술 부호화부(124)에서 에 대해 산술 부호화(Arithmetic Encoding, AE)가 수행될 수 있다. 입력 데이터 x는 부호화기(110)와 하이퍼 부호화기(120)를 순차적으로 거침에 따라 해상도가 감소될 수 있다. 이에 따라, y 및 z는 서로 다른 해상도를 가질 수 있다. 산술 복호화부(126)에서는 의 비트스트림에 대해 산술 복호화(Arithmetic Decoding, AD)가 수행될 수 있다. 의 산술 코딩은 팩토라이즈된 엔트로피 모델(125)에 기반하여 수행될 수 있다. 산술 복호화된 는 하이퍼 복호화기(130)를 거침에 따라 ψ로 도출될 수 있다. 여기서, ψ는 와 동일한 해상도를 가질 수 있다. ψ가 초사전분포 엔트로피 모델에 입력됨에 따라 잠재 피쳐가 μ 및 θ를 갖도록 학습될 수 있다. 산술 부호화된 는 산술 복호화부(119)에서 μ 및 θ를 기반으로 산술 복호화될 수 있다. 최종적으로, 는 복호화기(140)를 거쳐 원본 해상도를 갖는 복원된 로 출력될 수 있다. 초사전분포 엔트로피 모델은 의 확률 분포에 μ 및 θ를 고려하여 압축을 수행하므로 높은 압축률을 달성할 수 있다. μ 및 θ를 결정하는 는 에 비해 낮은 해상도를 갖고 있어 의 비트스트림 크기 또한 높은 압축률을 나타낼 수 있다. 하지만 포인트 클라우드 압축의 경우, 2D 영상과 달리 해상도 공간(Bounding Box