대응 문제

Correspondence problem

대응문제는 한 화상의 어떤 부분이 다른 [1]화상의 어떤 부분에 해당하는지, 카메라의 움직임, 시간의 경과 및/또는 사진 속 사물의 움직임에 따라 차이가 나는지를 확인하는 문제를 말합니다.

통신문제는 컴퓨터 비전의 근본적인 문제입니다. 영향력 있는 컴퓨터 비전 연구자인 Takeo Kanade는 컴퓨터 비전의 세 가지 근본적인 문제: "통신문, 통신문, 통신문!"이라고 말한 것으로 유명합니다.많은 관련 응용 프로그램에서[2]사실, 편지 논란의 여지는 있지만 주요 건물 블록:광학 흐름(는 두 사람의 이미지 시간에 대한 후속적이다), 치밀형 스테레오 비전(두 이미지들은 스테레오 카메라 한쌍에서 있), 동작(SfM)과 시각적 SLAM(는 이미지들은 장면의지만 부분적으로 중복되는 다른 견해에서 온 구조체입니다.),및 교차 교차 대응(영상이 완전히 다른 장면에서 가져온 것)입니다.

개요

서로 다른 관점에서 찍은 동일한 3D 장면의 두 개 이상의 영상이 주어진 경우, 대응 문제는 한 영상에서 다른 영상에서 동일한 점으로 식별할 수 있는 일련의 점을 찾는 작업을 의미합니다.를 위해 한 영상의 점 또는 피쳐가 다른 영상의 점 또는 피쳐와 일치하므로 해당 점 또는 해당 피쳐(상동성또는 상동성 피쳐라고도 함)를 설정할 수 있습니다.영상은 다른 시점, 다른 시간 또는 카메라에 상대적인 일반적인 움직임의 장면에 있는 물체를 사용하여 촬영할 수 있습니다.

대응 문제는 동일한 장면의 두 이미지가 사용되는 스테레오 상황에서 발생할 수 있으며, N-view 대응 문제로 일반화할 수 있습니다.후자의 경우는, 동시에 촬영하는 N개의 다른 카메라로부터, 또는 씬에 대해서 상대적으로 이동하는 1개의 카메라로부터 화상을 얻을 수 있다.장면의 물체가 카메라와 상대적으로 움직이면 문제가 더욱 어려워집니다.

대응 문제의 일반적인 적용은 파노라마 작성 또는 이미지 스티치에서 발생합니다.중복되는 부분이 적은2개 이상의 이미지를 보다 큰 합성 이미지로 스티치하는 경우입니다.이 경우 한 이미지의 변환을 계산하여 다른 이미지에 연결하기 위해 한 쌍의 이미지에서 해당 포인트 세트를 식별할 수 있어야 합니다.

기본적인 방법

비디오[3] 프레임 간의 대응성을 나타내는 움직임 추정

두 이미지 간의 대응 관계를 찾는 두 가지 기본적인 방법이 있습니다.

상관관계 기반 – 이미지 내의 한 위치가 다른 이미지 내의 다른 위치와 동일한지 확인합니다.

기능 기반 – 이미지에서 기능을 찾아 두 이미지에서 일부 기능의 레이아웃이 유사한지 확인합니다.조리개 문제를 방지하려면 두 방향으로 국소적인 변화가 있어야 합니다.

사용하다

컴퓨터 비전에서는 컴퓨터가 이미지만 입력으로 하여 자동으로 문제를 해결해야 하는 경우를 위해 대응 문제를 연구합니다.일단 대응 문제가 해결되어 대응하고 있는 화상 포인트 세트가 생성되면, 다른 방법을 이 세트에 적용하여 장면에서 대응하는 3D 포인트의 위치, 움직임 및/또는 회전을 재구성할 수 있다.

대응 문제는 또한 입자상 속도 측정 기술의 기초가 되는데, 이는 오늘날 유체 역학 분야에서 유체 운동을 정량적으로 측정하기 위해 널리 사용되고 있습니다.

간단한 예

집합 A [1, 2, 3, 4, 5]와 집합 B [3, 4, 6, 7] 사이의 대응 관계를 찾으려면 두 집합이 서로 겹치는 위치와 한 집합이 다른 집합에서 얼마나 떨어져 있는지를 찾습니다.여기에서는 세트 A의 마지막 3개의 숫자가 세트 B의 처음 3개의 숫자에 대응하고 있음을 알 수 있습니다.이것은 B가 A의 왼쪽에 오프셋 2임을 나타냅니다.

단순 상관 관계 기반 예제

간단한 방법은 수정된 이미지 의 작은 패치를 비교하는 것입니다.이것은, 스테레오 이미지와 같이, 거의 같은 시점에서, 또는 이미지 캡쳐간에 씬의 움직임이 거의 없는 경우에 최적으로 동작합니다.

작은 창이 하나의 이미지에서 여러 위치에 걸쳐 통과됩니다.각 위치가 다른 이미지의 동일한 위치와 얼마나 잘 비교되는지 확인합니다.한 영상에서 다른 영상에서 완전히 동일한 영상 위치에 있지 않을 수 있는 개체에 대해 근처의 여러 위치를 비교합니다.충분히 좋은 핏이 없을 수도 있어요.즉, 두 이미지에 모두 기능이 없거나 검색 범위를 벗어났거나 너무 많이 변경되었거나 이미지의 다른 부분에 의해 숨겨져 있을 수 있습니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ W. Bach; J.K. Aggarwal (29 February 1988). Motion Understanding: Robot and Human Vision. Springer Science & Business Media. ISBN 978-0-89838-258-7.
  2. ^ X. Wang (September 2019). Learning and Reasoning with Visual Correspondence in Time.
  3. ^ John X. Liu (2006). Computer Vision and Robotics. Nova Publishers. ISBN 978-1-59454-357-9.

외부 링크