절대차이의 합계

Sum of absolute differences

디지털 화상 처리에서 SAD(절대차이의 합계)는 화상 블록 간의 유사도를 나타내는 척도입니다.이 값은 원래 블록의 각 픽셀과 비교에 사용되는 블록의 해당 픽셀 간의 절대 차이를 취하여 계산됩니다.이러한 차이는 블록 유사성의 단순한 메트릭, 즉 차분 이미지의 L 노름1 또는 두 이미지 블록 사이의 맨해튼 거리를 생성하기 위해 합산됩니다.

절대 차이의 합계는 객체 인식, 스테레오 이미지시차생성비디오 압축의 움직임 추정과 같은 다양한 목적으로 사용될 수 있습니다.

이 예에서는 절대 차이의 합계를 사용하여 검색 이미지 중 템플릿 이미지와 가장 유사한 부분을 식별합니다.이 예에서는 템플릿이미지의 크기는 3x3픽셀이지만 검색 이미지의 크기는 3x5픽셀입니다.각 화소는 0 ~9 의 1 의 정수로 표시됩니다.

템플릿 검색 이미지 2 5 5 2 7 5 5 8 6 4 0 7 1 7 4 2 7 5 9 4 6 8 5

템플릿이 들어갈 수 있는 검색 이미지에는 이미지의 왼쪽, 이미지의 중앙, 이미지의 오른쪽 등 정확히 세 가지 고유한 위치가 있습니다.SAD 값을 계산하려면 대응하는 각 픽셀 쌍 간의 차이의 절대값이 사용됩니다. 즉, 2와 2의 차이는 0, 4와 1의 차이는 3, 7과 8은 1입니다.

가능한 3개의 템플릿 위치에 대해 각 픽셀의 절대 차이 값을 계산하면 다음과 같은 결과가 나옵니다.

왼쪽 중앙 02 05 03 3 1 3 7 3 3 3 3 3 3 3 5 0 2 0 1 3 1 1 1 3 3 3 4

이들 3개의 이미지 패치 각각에 대해 9개의 절대차가 더해져 각각 20, 25 및 17의 SAD 값이 부여됩니다.이러한 SAD 값으로부터, 검색 화상의 오른쪽이 템플릿 화상과 가장 유사하다고 단언할 수 있다.이것은, 다른 2개소에 비해 절대적인 차이가 가장 작기 때문이다.

다른 지표와의 비교

객체 인식

절대 차이의 합계는 이미지 내의 객체 검색을 자동화하는 간단한 방법을 제공하지만 조명, 색상, 보기 방향, 크기 또는 모양 변경과 같은 컨텍스트적 요소의 영향으로 인해 신뢰성이 떨어질 수 있습니다.SAD는 결과의 신뢰성을 향상시키기 위해 에지 검출과 같은 다른 객체 인식 방법과 함께 사용할 수 있습니다.

비디오 압축

SAD는 단순성으로 인해 매우 빠른 메트릭이며 블록 내의 모든 픽셀을 고려하는 가장 간단한 메트릭입니다.따라서 여러 블록의 광범위한 모션 검색에 매우 효과적입니다.또한 SAD는 각 픽셀을 개별적으로 분석하기 때문ARM NEON이나 x86 SSE2 의 명령으로 쉽게 구현할 수 있습니다.예를 들어, SSE는 이 목적을 위해 특별히 절대 차분 명령(PSADBW)의 합계를 정리했습니다.일단 후보 블록이 발견되면, 움직임 추정 프로세스의 최종적인 개선은 종종 인간의 인식을 더 잘 고려하는 더 느리지만 더 정확한 다른 메트릭으로 이루어진다.여기에는 절대 변환 차분(SATD), 차분 제곱합(SSD), 환율 왜곡 최적화가 포함됩니다.

「 」를 참조해 주세요.

레퍼런스

  • E. G. Richardson, Iain (2003). H.264 and MPEG-4 Video Compression: Video Coding for Next-generation Multimedia. Chichester: John Wiley & Sons Ltd.