KR-20260061102-A - IMAGE ENCODING/DECODING METHOD AND APPARATUS FOR PERFORMING INTRA PREDICTION USING A PLURALITY OF PREDICTION MODE CANDIDATES
Abstract
복수의 예측 모드 후보군을 사용하여 화면내 예측을 수행하는 영상 복호화 방법이 개시된다. 여기서 복수의 예측 모드 후보군을 사용하여 화면내 예측을 수행하는 영상 복호화 방법은, 복원된 현재 블록의 크기 정보를 확인하는 단계, 블록의 가로/세로 중 최대 길이에 기초한 예측 모드 후보군을 선택하는 단계, 블록의 가로/세로 길이 비에 따라 방향성 예측 모드 구성을 결정하는 단계, 예측 모드 후보군 구성을 완료하는 단계, 화면내 예측 모드 복호화 단계, 화면내 예측을 수행하여 예측 블록을 획득하는 단계를 포함한다.
Inventors
- 김기백
Assignees
- 주식회사 비원영상기술연구소
Dates
- Publication Date
- 20260506
- Application Date
- 20260406
- Priority Date
- 20180115
Claims (7)
- 영상 복호화 방법에서, 현재 블록에 인접한 주변 블록의 화면내 예측 모드에 기반하여 상기 현재 블록의 화면내 예측 모드를 유도하는 단계; 상기 현재 블록의 화면내 예측을 위한 참조 샘플들을 구성하는 단계; 및 상기 참조 샘플들과 상기 현재 블록의 화면내 예측 모드에 기반하여 상기 현재 블록에 대한 화면내 예측을 수행함으로써 상기 현재 블록의 예측 블록을 생성하는 단계를 포함하고, 상기 참조 샘플들을 구성하는 단계에 있어서, 상기 현재 블록의 색 성분 및 크기 정보에 기반하여 상기 참조 샘플들에 대한 제1 필터링이 허용될 때, 상기 참조 샘플들에 대한 제1 필터링이 수행되고, 상기 현재 블록의 예측 블록을 생성하는 단계에 있어서, 상기 현재 블록에 상기 참조 샘플들을 보간 필터링하는 제2 필터링이 허용될 때, 상기 참조 샘플들에 대한 제2 필터링이 수행되고, 상기 제2 필터링은, 상기 현재 블록의 색성분에 따라, 고정적인 필터링 및 적응적인 필터링 중 하나에 의하여 수행되며, 상기 고정적인 필터링이 선택될 경우, 하나의 보간 필터 타입에만 기반하여 제2 필터링이 수행되고, 상기 적응적인 필터링이 선택될 경우, 복수의 보간 필터 타입들 중 선택된 보간 필터 타입에 기반하여 제2 필터링이 수행되는 것을 특징으로 하는 영상 복호화 방법.
- 제1항에 있어서, 상기 제1 필터링에 사용되는 필터는 필터 계수가 [1, 2, 1]인 3탭 필터인 영상 복호화 방법.
- 제1항에 있어서, 상기 적응적인 필터링에 적용되는 복수의 보간 필터 타입들은 복수의 4탭 필터 타입들을 포함하는 것을 특징으로 하는 영상 복호화 방법.
- 제3 항에 있어서, 상기 복수의 4탭 필터 타입들은 4탭 DCT 보간 필터 타입을 포함하는 것을 특징으로 하는 영상 복호화 방법.
- 제1 항에 있어서, 상기 현재 블록의 색성분에 따라 지원되는 보간 필터 타입의 필터 탭의 수가 서로 상이한 것을 특징으로 하는 영상 복호화 방법.
- 영상 부호화 방법에서, 현재 블록의 화면내 예측 모드를 결정하는 단계; 상기 현재 블록의 화면내 예측을 위한 참조 샘플들을 구성하는 단계; 및 상기 참조 샘플들과 상기 현재 블록의 화면내 예측 모드에 기반하여 상기 현재 블록에 대한 화면내 예측을 수행함으로써 상기 현재 블록의 예측 블록을 생성하는 단계를 포함하고, 상기 참조 샘플들을 구성하는 단계에 있어서, 상기 현재 블록의 색 성분 및 크기 정보에 기반하여 상기 참조 샘플들에 대한 제1 필터링이 허용될 때, 상기 참조 샘플들에 대한 제1 필터링이 수행되고, 상기 현재 블록의 예측 블록을 생성하는 단계에 있어서, 상기 현재 블록에 상기 참조 샘플들을 보간 필터링하는 제2 필터링이 허용될 때, 상기 참조 샘플들에 대한 제2 필터링이 수행되고, 상기 제2 필터링은, 상기 현재 블록의 색성분에 따라, 고정적인 필터링 및 적응적인 필터링 중 하나에 의하여 수행되며, 상기 고정적인 필터링이 선택될 경우, 하나의 보간 필터 타입에만 기반하여 제2 필터링이 수행되고, 상기 적응적인 필터링이 선택될 경우, 복수의 보간 필터 타입들 중 선택된 보간 필터 타입에 기반하여 제2 필터링이 수행되는 것을 특징으로 하는 영상 부호화 방법.
- 영상 부호화 방법에 의해 생성된 비트스트림을 저장한 컴퓨터로 판독 가능한 기록 매체로서, 상기 영상 부호화 방법은, 현재 블록의 화면내 예측 모드를 결정하는 단계; 상기 현재 블록의 화면내 예측을 위한 참조 샘플들을 구성하는 단계; 및 상기 참조 샘플들과 상기 현재 블록의 화면내 예측 모드에 기반하여 상기 현재 블록에 대한 화면내 예측을 수행함으로써 상기 현재 블록의 예측 블록을 생성하는 단계를 포함하고, 상기 참조 샘플들을 구성하는 단계에 있어서, 상기 현재 블록의 색 성분 및 크기 정보에 기반하여 상기 참조 샘플들에 대한 제1 필터링이 허용될 때, 상기 참조 샘플들에 대한 제1 필터링이 수행되고, 상기 현재 블록의 예측 블록을 생성하는 단계에 있어서, 상기 현재 블록에 상기 참조 샘플들을 보간 필터링하는 제2 필터링이 허용될 때, 상기 참조 샘플들에 대한 제2 필터링이 수행되고, 상기 제2 필터링은, 상기 현재 블록의 색성분에 따라, 고정적인 필터링 및 적응적인 필터링 중 하나에 의하여 수행되며, 상기 고정적인 필터링이 선택될 경우, 하나의 보간 필터 타입에만 기반하여 제2 필터링이 수행되고, 상기 적응적인 필터링이 선택될 경우, 복수의 보간 필터 타입들 중 선택된 보간 필터 타입에 기반하여 제2 필터링이 수행되는 것을 특징으로 하는 컴퓨터 판독 가능한 기록 매체.
Description
복수의 예측 모드 후보군을 사용하여 화면내 예측을 수행하는 영상 부호화/복호화 방법 및 장치 {IMAGE ENCODING/DECODING METHOD AND APPARATUS FOR PERFORMING INTRA PREDICTION USING A PLURALITY OF PREDICTION MODE CANDIDATES} 본 발명은 복수의 예측 모드 후보군을 사용하는 화면내 예측에 관한 영상 부호화/복호화 방법 및 장치에 관한 것으로, 더욱 상세하게는 블록의 크기, 형태 등에 기반하여 화면내 예측을 위한 적응적인 예측 모드 후보군을 지원하고, 지원되는 예측 모드 후보군을 사용하여 화면내 예측을 수행함으로써 부호화 성능을 향상시키는 방법 및 장치에 관한 것이다. 인터넷과 휴대 단말의 보급과 정보 통신 기술의 발전에 따라 멀티미디어 데이터에 대한 이용이 급증하고 있다. 따라서, 각종 시스템에서 영상 예측을 통해 다양한 서비스나 작업을 수행하기 위하여 영상 처리 시스템의 성능 및 효율 개선에 대한 필요성이 상당히 증가하고 있으나, 이러한 분위기에 호응할 수 있는 연구 개발 결과가 미흡한 실정이다. 이와 같이, 종래 기술의 영상 부호화 복호화 방법 및 장치에서는 영상 처리 특히 영상 부호화 또는 영상 복호화에 대한 성능 개선이 요구되고 있는 실정이다. 도 1은 본 발명의 실시예에 따른 영상 부호화 및 복호화 시스템에 대한 개념도이다. 도 2는 본 발명의 일 실시예에 따른 영상 부호화 장치에 대한 블록 구성도이다. 도 3은 본 발명의 일 실시예에 따른 영상 복호화 장치에 대한 블록 구성도이다. 도 4는 본 발명의 일 실시예에 따른 화면내 예측 모드를 나타낸 예시도이다. 도 5는 본 발명의 일 실시예에 따른 화면내 예측에 사용되는 참조 화소 구성을 설명하기 위한 예시도이다. 도 6은 본 발명의 일 실시예에 따른 예측 모드 후보군 구성에 기초하여 구성되는 참조 화소를 설명하기 위한 예시도이다. 도 7은 본 발명의 일 실시예에 따른 예측 모드 후보군 구성에 기초하여 구성되는 참조 화소를 설명하기 위한 예시도이다. 도 8은 본 발명의 일 실시예에 따른 화면내 예측의 대상 블록과 인접한 블록을 나타내는 개념도이다. 도 9는 본 발명의 일 실시예에 따른 영상 부호화 장치의 일 예를 간략하게 나타낸 블록 구성도이다. 도 10은 본 발명의 일 실시예에 따른 영상 복호화 장치의 일 예를 간략하게 나타낸 블록 구성도이다. 도 11은 본 발명의 일 실시예에 따른 영상 부호화 장치의 화면내 예측 과정을 설명하기 위한 순서도이다. 도 12는 본 발명의 일 실시예에 따른 영상 복호화 장치의 화면내 예측 과정을 설명하기 위한 순서도이다. 본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다. 어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 본 발명에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 발명에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다. 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 것을 의미한다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 것으로 해석되어야 하며, 본 발명에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다. 통상적으로 영상의 컬러 포맷(Color Format)에 따라 하나 이상의 컬러 공간으로 구성될 수 있다. 컬러 포맷에 따라 일정 크기를 갖는 1개 이상의 픽쳐 또는 다른 크기를 갖는 1개 이상의 픽쳐로 구성될 수 있다. 일 예로, YCbCr 컬러 구성에서 4:4:4, 4:2:2, 4:2:0, Monochrome(Y로만 구성) 등의 컬러 포맷이 지원될 수 있다. 일 예로, YCbCr 4:2:0인 경우 1개의 휘도 성분(본 예에서, Y)과 2개의 색차 성분(본 예에서, Cb/Cr)으로 구성될 수 있으며, 이때 색차 성분과 휘도 성분의 구성 비는 가로, 세로 1:2를 가질 수 있다. 일 예로, 4:4:4인 경우 가로, 세로 동일한 구성 비를 가질 수 있다. 상기 예처럼 하나 이상의 컬러 공간으로 구성이 되는 경우 픽쳐는 각 컬러 공간으로의 분할을 수행할 수 있다. 영상은 영상 타입(예를 들어, 픽쳐 타입, 슬라이스 타입, 타일 타입 등)에 따라 I, P, B 등으로 분류할 수 있는데, I 영상 타입은 참조 픽쳐를 사용하지 않고 자체적으로 부/복호화되는 영상을 의미할 수 있고, P 영상 타입은 참조 픽쳐를 사용하여 부/복호화를 하되 전방향 예측만을 허용하는 영상을 의미할 수 있으며, B 영상 타입은 참조 픽쳐를 사용하여 부/복호화를 하며 전/후방향 예측을 허용하는 영상을 의미할 수 있으나, 부/복호화 설정에 따라 상기 타입의 일부가 결합(P와 B를 결합)되거나 다른 구성의 영상 타입이 지원될 수도 있다. 도 1은 본 발명의 실시예에 따른 영상 부호화 및 복호화 시스템에 대한 개념도이다. 도 1을 참조하면, 영상 부호화 장치(105) 및 복호화 장치(100)는 개인용 컴퓨터(PC:Personal Computer), 노트북 컴퓨터, 개인 휴대 단말기(PDA: Personal Digital Assistant), 휴대형 멀티미디어 플레이어(PMP: Portable Multimedia Player), 플레이스테이션 포터블(PSP: PlayStation Portable), 무선 통신 단말기(Wireless Communication Terminal), 스마트폰(Smart Phone) 또는 TV 등과 같은 사용자 단말기이거나 응용 서버와 서비스 서버 등 서버 단말기일 수 있으며, 각종 기기 또는 유무선 통신망과 통신을 수행하기 위한 통신 모뎀 등의 통신 장치, 영상을 부호화 또는 복호화를 위해 인터 또는 인트라 예측하기 위한 각종 프로그램과 데이터를 저장하기 위한 메모리(memory, 120, 125) 또는 프로그램을 실행하여 연산 및 제어하기 위한 프로세서(processor, 110, 115) 등을 구비하는 다양한 장치를 포함할 수 있다. 또한, 영상 부호화 장치(105)에 의해 비트스트림으로 부호화된 영상은 실시간 또는 비실시간으로 인터넷, 근거리 무선 통신망, 무선랜망, 와이브로망 또는 이동통신망 등의 유무선 통신망(Network) 등을 통하거나 케이블 또는 범용 직렬 버스(USB: Universal Serial Bus) 등과 같은 다양한 통신 인터페이스를 통해 영상 복호화 장치(100)로 전송되어 영상 복호화 장치(100)에서 복호화되어 영상으로 복원되고 재생될 수 있다. 또한, 영상 부호화 장치(105)에 의해 비트스트림으로 부호화된 영상은 컴퓨터 판독 가능한 기록 매체를 통하여 영상 부호화 장치(105)에서 영상 복호화 장치(100)로 전달될 수 있다. 전술한 영상 부호화 장치와 영상 복호화 장치는 각각 별도의 장치들일 수 있으나, 구현에 따라서 하나의 영상 부호화/복호화 장치로 만들어질 수 있다. 그 경우, 영상 부호화 장치의 일부 구성은 영상 복호화 장치의 일부 구성과 실질적으로 동일한 기술요소로서 적어도 동일한 구조를 포함하거나 적어도 동일한 기능을 수행하도록 구현될 수 있다. 따라서, 이하의 기술요소들과 이들의 작동 원리 등에 대한 상세 설명에서는 대응 기술요소들의 중복되는 설명을 생략하기로 한다. 또한, 영상 복호화 장치는 영상 부호화 장치에서 수행되는 영상 부호화 방법을 복호화에 적용하는 컴퓨팅 장치에 대응하므로, 이하의 설명에서는 영상 부호화 장치를 중심으로 설명하기로 한다. 컴퓨팅 장치는 영상 부호화 방법 및/또는 영상 복호화 방법을 구현하는 프로그램이나 소프트웨어 모듈을 저장하는 메모리와 메모리에 연결되어 프로그램을 수행하는 프로세서를 포함할 수 있다. 여기서, 영상 부호화 장치는 부호화기로, 영상 복호화 장치는 복호화기로 각각 지칭될 수 있다. 도 2는 본 발명의 일 실시예에 따른 영상 부호화 장치에 대한 블록 구성도이다. 도 2를 참조하면, 영상 부호화 장치(20)는 예측부(200), 감산부(205), 변환부(210), 양자화부(215), 역양자화부(220), 역변환부(225), 가산부(230), 필터부(235), 부호화 픽쳐 버퍼(240) 및 엔트로피 부호화부(245)를 포함할 수 있다. 예측부(200)는 소프트웨어 모듈인 예측 모듈(prediction module)을 이용하여 구현될 수 있고,