비디오 압축 이미지 유형

Video compression picture types

비디오 압축 분야에서 비디오 프레임은 주로 데이터 압축량을 중심으로 장단점이 다른 다른 알고리즘을 사용하여 압축됩니다.이러한 비디오 프레임의 다른 알고리즘을 화상 타입 또는 프레임 타입이라고 부릅니다.다른 비디오 알고리즘에서 사용되는 세 가지 주요 이미지 유형은 I, P B입니다.이러한 특징은 다음과 같습니다.

  • I-프레임은 압축성이 가장 낮지만 디코딩하는 데 다른 비디오 프레임이 필요하지 않습니다.
  • P 프레임은 이전 프레임의 데이터를 사용하여 압축을 해제할 수 있으며 I 프레임보다 압축성이 높습니다.
  • B 프레임은 이전 프레임과 앞으로 프레임을 모두 데이터 참조용으로 사용하여 가장 많은 양의 데이터 압축을 얻을 수 있습니다.

요약

2개의 키 프레임(I), 1개의 순방향 예측 프레임(P) 및 1개의 쌍방향 예측 프레임(B)으로 이루어진 일련의 비디오 프레임.

비디오 압축에는 I, P 및 B 프레임의 3종류의 사진(또는 프레임)이 사용됩니다.

I 프레임(내부 코드화된 사진)은 JPG 또는 BMP 이미지 파일과 같은 전체 이미지입니다.

P 프레임(예측된 사진)에는 이전 프레임의 이미지 변경 내용만 저장됩니다.예를 들어, 차량이 정지해 있는 배경을 가로질러 이동하는 장면에서는 차량의 움직임만 부호화하면 됩니다.인코더는 변하지 않는 배경 픽셀을 P 프레임에 저장할 필요가 없으므로 공간을 절약할 수 있습니다.P 프레임은 델타 프레임이라고도 합니다.

B프레임(양방향 예측 화면)은 현재 프레임과 이전 및 후속 프레임 간의 차이를 사용하여 콘텐츠를 지정함으로써 더 많은 공간을 절약합니다.

P 프레임과 B 프레임은 Inter frames라고도 불립니다.I, P, B 프레임이 정렬된 순서를 그림 그룹이라고 합니다.

사진/프레임

"프레임"과 "픽처"라는 용어는 종종 서로 바꾸어 사용되지만, 사진은 프레임 또는 필드일 수 있기 때문에 더 일반적인 개념입니다.프레임은 완전한 이미지이며 필드는 부분 이미지를 구성하는 홀수 또는 짝수 스캔 라인의 세트입니다.예를 들어, HD 1080 화상의 픽셀은 1080 행(행)입니다.홀수 필드는 라인 1, 3, 5…1079의 화소 정보로 구성됩니다.짝수 필드는 2, 4, 6…1080행의 화소 정보를 가진다.인터레이스드 스캔 형식으로 비디오를 송신하는 경우, 각 프레임은 홀수 행의 필드와 짝수 행의 필드의 2 개의 필드로 송신됩니다.

다른 프레임을 예측하기 위한 참조로 사용되는 프레임을 참조 프레임이라고 합니다.

다른 프레임에서 정보를 얻지 않고 부호화된 프레임을 I-프레임이라고 부릅니다.1개의 선행 참조 프레임(또는 각 영역의 예측에1개의 프레임)으로부터의 예측을 사용하는 프레임을 P 프레임이라고 부릅니다.B 프레임은 앞의 프레임과 후속 프레임의 2개의 참조 프레임의 평균(가중치가 있을 가능성이 있음)으로부터의 예측을 사용합니다.

슬라이스

H.264/MPEG-4 AVC 규격에서는 예측 타입의 입도가 「슬라이스 레벨」까지 내려갑니다.슬라이스는 같은 프레임 내의 다른 영역과는 별도로 부호화된 프레임의 공간적으로 구별되는 영역입니다.I-슬라이스, P-슬라이스 및 B-슬라이스가 I, P 및 B 프레임을 대체합니다.

매크로 블록

일반적으로 그림(프레임)은 매크로 블록으로 분할되며, 다음과 같이 전체 그림에 대해 동일하지 않고 매크로 블록 기준으로 개별 예측 유형을 선택할 수 있습니다.

  • I 프레임은 매크로 블록 내만 포함할 수 있습니다.
  • P 프레임은 내부 매크로 블록과 예측 매크로 블록을 모두 포함할 수 있습니다.
  • B 프레임에는 인트라, 예측 및 바이프레딕트 매크로 블록을 포함할 수 있습니다.

또, H.264 비디오 부호화 규격에서는, 프레임을 슬라이스라고 불리는 매크로 블록의 시퀀스로 분할할 수 있어 I, B, P 프레임 타입의 선택을 사용하는 대신에, 인코더는 각 슬라이스 마다 예측 스타일을 명확하게 선택할 수 있다.또, H.264 에서는, 몇개의 추가 타입의 프레임/슬라이스가 있습니다.

  • SI 프레임/슬라이스(스위칭 I):코드화된 스트림 간의 전환을 용이하게 합니다.SI 매크로 블록(특수 유형의 코드화된 매크로 블록)이 포함되어 있습니다.
  • SP 프레임/슬라이스(스위칭 P):코드화된 스트림 간의 전환을 용이하게 합니다.P 및/또는 I-macroblock을 포함합니다.
  • 멀티프레임 모션 추정(최대 16개의 기준 프레임 또는 32개의 기준 필드)

멀티프레임 모션 추정은 동일한 압축률을 허용하면서 비디오의 품질을 향상시킵니다.SI 및 SP 프레임(확장 프로파일용으로 정의됨)은 오류 수정을 개선합니다.이러한 프레임을 스마트 디코더와 함께 사용하면 손상된 DVD의 브로드캐스트 스트림을 복구할 수 있습니다.

인트라 코드(I) 프레임/슬라이스(키 프레임)

  • I-프레임은 전체 이미지를 포함합니다.이들 프레임은 (일부) 이외의 다른 프레임과는 관계 없이 코드화되어 있습니다.
  • 랜덤 액세스포인트를 작성하기 위해 인코더에 의해 생성될 수 있습니다(디코더가 해당 이미지 위치에서 처음부터 올바르게 디코딩을 시작할 수 있습니다).
  • 이미지 상세 차이로 인해 효과적인 P 또는 B 프레임이 생성되지 않는 경우에도 생성될 수 있습니다.
  • 일반적으로 부호화에는 다른 프레임타입보다 많은 비트가 필요합니다.

I-프레임은 임의 액세스에 사용되며 다른 사진의 디코딩을 위한 참조로 사용되는 경우가 많습니다.디지털 텔레비전 방송이나 DVD 스토리지등의 애플리케이션에서는, 0.5초의 갱신 시간이 일반적입니다.환경에 따라서는 갱신 기간이 길어질 수 있습니다.예를 들어, 화상 회의 시스템에서는, I-프레임을 송신하는 빈도가 매우 낮은 것이 일반적입니다.

예측(P) 프레임/슬라이스

  • 디코딩하려면 다른 사진을 미리 디코딩해야 합니다.
  • 영상 데이터와 움직임 벡터 변위 및 두 가지 조합을 모두 포함할 수 있습니다.
  • 이전 사진을 디코딩 순서로 참조할 수 있습니다.
  • 오래된 표준 설계(MPEG-2 등)에서는 디코딩 중에 이전에 디코딩된 1개의 사진만 참조로 사용하며, 이 사진 역시 표시 순서로 P 사진 앞에 와야 합니다.
  • H.264에서는 디코딩 중에 이전에 디코딩된 여러 이미지를 참조로 사용할 수 있으며 예측에 사용된 그림과 관련된 임의의 표시 순서 관계를 가질 수 있습니다.
  • 일반적으로 사진에 비해 인코딩에 필요한 비트 수가 적습니다.

양방향 예측(B) 프레임/슬라이스(매크로블록)

  • 후속 프레임의 이전 디코딩을 표시해야 합니다.
  • 영상 데이터 및/또는 움직임 벡터 변위를 포함할 수 있습니다.이전 표준에서는 전체 프레임에 대해 단일 전역 움직임 보정 벡터 또는 매크로 블록당 단일 움직임 보정 벡터만 허용합니다.
  • 이전에 디코딩된 두 개의 서로 다른 기준 영역을 사용하여 얻은 예측을 평균화하여 움직임 영역(예: 매크로 블록 또는 더 작은 영역)의 예측을 구성하는 일부 예측 모드를 포함합니다.일부 표준에서는 매크로 블록당 2개의 움직임 보정 벡터를 사용할 수 있습니다(바이플렉션).
  • MPEG-2와 같은 오래된 표준에서는 B-프레임은 다른 그림을 예측하기 위한 참조로 사용되지 않습니다.그 결과, 이러한 B프레임에는, 보다 낮은 품질의 부호화(스페이스를 필요로 하는 것)를 사용할 수 있습니다.이것은, 상세한 내용이 없어져도, 이후의 화상의 예측 품질이 저하되지 않기 때문입니다.
  • H.264는 이 제한을 완화하고 B 프레임을 인코더 재량에 따라 다른 프레임을 디코딩하기 위한 참조로 사용할 수 있도록 합니다.
  • MPEG-2와 같은 오래된 규격에서는 디코딩 시 이전에 디코딩된 사진 2장을 참조로 사용하고 있으며, 이러한 사진 중 하나는 표시 순서로 B 프레임 앞에, 다른 하나는 B 프레임 뒤에 와야 합니다.
  • H.264는 디코딩 중에 1개, 2개 또는 2개 이상의 이전에 디코딩된 사진을 참조로 사용할 수 있으며 예측에 사용된 그림과 관련된 임의의 표시 순서 관계를 가질 수 있습니다.
  • 정보 검색의 유연성이 높아짐에 따라 일반적으로 B 프레임은 I 프레임 또는 P 프레임보다 부호화에 필요한 비트가 적습니다.

「 」를 참조해 주세요.

레퍼런스

외부 링크