움직임 추정

이미지의

(\displaystyle

z

)

평면으로의

z

이동과 오른쪽 하단의 횡방향 이동으로 인한 움직임 벡터.MPEG 무비를 압축하기 위해 수행되는 모션 추정의 시각화입니다.

움직임 추정은 한 2D 이미지에서 다른 2D 이미지로의 변환을 설명하는 움직임 벡터를 결정하는 과정입니다. 보통 비디오 시퀀스의 인접 프레임에서 이루어집니다.모션이 3차원으로 되어 있기 때문에 위치가 잘못된 문제이지만, 이미지는 3D 장면을 2D 평면에 투영한 것입니다.움직임 벡터는 전체 영상(글로벌 움직임 추정) 또는 직사각형 블록, 임의 모양 패치 또는 픽셀 단위와 같은 특정 부품과 관련될 수 있습니다.움직임 벡터는 실제 비디오 카메라의 움직임(예: 3차원에서의 회전과 변환 및 줌)에 근사할 수 있는 번역 모델 또는 다른 많은 모델로 나타낼 수 있습니다.

알고리즘

움직임 벡터를 찾는 방법은 픽셀 기반 방법("직접")과 피쳐 기반 방법("간접")으로 분류할 수 있습니다.한 유명한 토론에서 결론을 ^[4]^[5]도출하기 위해 반대파로부터 두 개의 논문이 생산되었다.

직접적 방법

블록 매칭 알고리즘
위상 상관 및 주파수 영역 방식
픽셀 재귀 알고리즘
광학적 흐름

간접적인 방법

간접 메서드에서는 코너 검출 등의 기능을 사용하여 프레임 간에 대응하는 기능을 대조합니다.보통 로컬 또는 글로벌 영역에 적용되는 통계 기능을 사용합니다.통계 함수의 목적은 실제 움직임과 일치하지 않는 일치 항목을 제거하는 것입니다.

성공적으로 사용된 통계 함수로는 LANSAC이 있습니다.

분류에 대한 추가 참고 사항

거의 모든 방법이 일치 기준의 정의를 필요로 한다고 주장할 수 있다.차이점은 먼저 로컬 영상 영역에 대해 요약한 다음 요약(예: 피쳐 기반 방법)을 비교하는지 아니면 각 픽셀을 먼저 비교(예: 차이를 제곱)한 다음 로컬 영상 영역에 대해 요약하는지(블록 기본 모션 및 필터 기반 모션) 여부입니다.새로운 종류의 일치기준은 (라플라시안 변환과 같은 일부 특징 변환을 통해) 모든 픽셀 위치에 대해 먼저 로컬 이미지 영역을 요약하고, 각 요약된 픽셀을 비교하여 ^[6]로컬 이미지 영역에 대해 다시 요약한다.어떤 일치기준은 좋은 일치점수를 만들어 내더라도 실제로 서로 일치하지 않는 점수를 제외할 수 있는 능력이 있고, 다른 일치기준은 그렇지 않지만 여전히 일치기준이다.

적용들

모션 보간 기능이 있는 비디오 프레임

비디오 코딩

다음 영상으로의 변환을 합성하기 위해 영상에 움직임 벡터를 적용하는 것을 움직임 ^[7]보상이라고 합니다.코딩은 ^[8]블록 단위로 실행되기 때문에 Discrete Cosine Transform(DCT; 이산 코사인 변환) 기반의 비디오 코딩 표준에 가장 쉽게 적용됩니다.

시간적 용장성을 이용하는 방법으로서 움직임 추정과 보상은 비디오 압축의 중요한 부분입니다.거의 모든 비디오 코딩 표준은 최신 HEVC를 포함한 MPEG 시리즈와 같은 블록 기반 모션 추정 및 보상을 사용합니다.

3D 재구성

동시 위치 결정 및 매핑에서는, 움직이는 ^[9]카메라로부터의 영상을 사용해 씬의 3D 모델을 재구성한다.

「」를 참조해 주세요.

레퍼런스

^ John X. Liu (2006). Computer Vision and Robotics. Nova Publishers. ISBN 978-1-59454-357-9.
^ H .264/MPEG-4 AVC Archived 2004-07-23의 최신 작업 초안.2008-02-29에 취득.
^ hhi.fraunhofer.de의 H.264/MPEG-4 AVC의 최신 작업 초안.^{[영구 데드링크]}
^ 필립 H.Torr와 Andrew Zisserman:구조 및 동작 추정을 위한 기능 기반 방법, 비전 알고리즘에 관한 ICCV 워크숍, 278-294, 1999 페이지
^ 미할 이라니와 P.Anandan: 직접 방법에 대하여, 비전 알고리즘에 관한 ICCV 워크숍, 267-277페이지, 1999.
^ Rui Xu, David Taubman & Aous Thabit Naman, '상호정보 및 적응형 멀티스케일 임계값에 기초한 모션 추정', 이미지 처리, vol.25, no.3, 페이지 1095-1108, 2016년 3월.
^ Borko Furht; Joshua Greenberg; Raymond Westwater (6 December 2012). Motion Estimation Algorithms for Video Compression. Springer Science & Business Media. ISBN 978-1-4615-6241-2.
^ Swartz, Charles S. (2005). Understanding Digital Cinema: A Professional Handbook. Taylor & Francis. p. 143. ISBN 9780240806174.
^ Kerl, Christian, Yurgen Sturm, Daniel Cremers."RGB-D 카메라용 고밀도 비주얼 SLAM." 2013 IEEE/RSJ 인텔리전트 로봇 및 시스템 국제회의.IEEE, 2013.

[Liu2006-1] John X. Liu (2006). Computer Vision and Robotics. Nova Publishers. ISBN 978-1-59454-357-9.

[2] H .264/MPEG-4 AVC Archived 2004-07-23의 최신 작업 초안.2008-02-29에 취득.

[3] .fraunhofer.de의 H.264/MPEG-4 AVC의 최신 작업 초안.^{[영구 데드링크]}

[4] 필립 H.Torr와 Andrew Zisserman:구조 및 동작 추정을 위한 기능 기반 방법, 비전 알고리즘에 관한 ICCV 워크숍, 278-294, 1999 페이지

[5] 미할 이라니와 P.Anandan: 직접 방법에 대하여, 비전 알고리즘에 관한 ICCV 워크숍, 267-277페이지, 1999.

[6] Rui Xu, David Taubman & Aous Thabit Naman, '상호정보 및 적응형 멀티스케일 임계값에 기초한 모션 추정', 이미지 처리, vol.25, no.3, 페이지 1095-1108, 2016년 3월.

[FurhtGreenberg2012-7] Borko Furht; Joshua Greenberg; Raymond Westwater (6 December 2012). Motion Estimation Algorithms for Video Compression. Springer Science & Business Media. ISBN 978-1-4615-6241-2.

[8] Swartz, Charles S. (2005). Understanding Digital Cinema: A Professional Handbook. Taylor & Francis. p. 143. ISBN 9780240806174.

[9] Kerl, Christian, Yurgen Sturm, Daniel Cremers."RGB-D 카메라용 고밀도 비주얼 SLAM." 2013 IEEE/RSJ 인텔리전트 로봇 및 시스템 국제회의.IEEE, 2013.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

Search

움직임 추정

네임스페이스

더

목차

관련 용어

알고리즘

직접적 방법

간접적인 방법

분류에 대한 추가 참고 사항

적용들

비디오 코딩

3D 재구성

「」를 참조해 주세요.

레퍼런스

Search

움직임 추정

관련 용어

알고리즘

직접적 방법

간접적인 방법

분류에 대한 추가 참고 사항

적용들

비디오 코딩

3D 재구성

「 」를 참조해 주세요.

레퍼런스

「」를 참조해 주세요.