랜드마크 감지

Landmark detection

컴퓨터 과학에서 랜드마크 탐지는 이미지에서 중요한 랜드마크를 찾는 과정입니다.이것은 원래 탐색 목적을 위해 랜드마크를 찾는 것을 의미했습니다. 예를 들어 로봇 비전에서 또는 위성 이미지에서 지도를 만드는 것을 참조하십시오.내비게이션에 사용되는 방법은 다른 분야, 특히 얼굴의 핵심 포인트를 식별하는 데 사용되는 얼굴 인식 분야로 확장되었습니다.또한 의료 영상에서 해부학적 랜드마크를 식별하여 의학에서 중요한 응용 분야를 가지고 있습니다.

적용들

내비게이션

얼굴 랜드마크

얼굴 랜드마크를 찾는 것은 이미지에서 사람들의 얼굴을 식별하는 중요한 단계입니다.얼굴 랜드마크는 또한 [1]사람의 기분과 의도에 대한 정보를 추출하는 데 사용될 수 있습니다.사용된 방법은 전체론적 방법, 제한된 로컬 모델 방법 및 회귀 기반 [2]방법의 세 가지 범주로 나뉩니다.

전체론적 방법은 얼굴 모양 및 랜드마크 위치 계수에 대한 통계 정보로 사전 프로그래밍됩니다.고전적인 전체론적 방법은 [3]1998년에 도입된 능동적 외모 모델(AAM)입니다.그 이후로 이 방법에 대한 많은 확장과 개선이 있었습니다.이것들은 피팅 알고리즘에 크게 개선된 것들이며 분석 피팅 방법과 학습 기반 피팅 [4]방법의 두 가지 그룹으로 분류할 수 있습니다.분석 방법은 Gauss-Newton 알고리즘과 같은 비선형 최적화 방법을 적용합니다.이 알고리듬은 매우 느리지만 프로젝트 아웃 역구성(POIC) 알고리듬 및 동시 역구성([5]SIC) 알고리듬과 같은 더 나은 알고리듬이 제안되었습니다.학습 기반 피팅 방법은 기계 학습 기술을 사용하여 얼굴 계수를 예측합니다.선형 회귀 분석, 비선형 회귀 분석 및 기타 적합 [6]방법을 사용할 수 있습니다.일반적으로 분석적 피팅 방법은 더 정확하고 교육이 필요하지 않은 반면, 학습 기반 피팅 방법은 더 빠르지만 [7]교육이 필요합니다.기본 AAM 방법의 다른 확장은 픽셀 강도가 아닌 영상의 웨이블릿을 분석합니다.이것은 기본적인 AAM이 [8]문제가 되는 얼굴의 보이지 않는 부분을 맞추는 데 도움이 됩니다.

의료 영상

두류측량학

패션

패션 이미지에서 랜드마크 감지의 목적은 분류 목적입니다.이 기능은 데이터베이스 또는 일반 검색에서 지정된 기능을 가진 이미지를 검색하는 데 도움이 됩니다.패션 랜드마크의 한 예는 드레스의 밑단의 위치입니다.패션 랜드마크 감지는 [9]의류에서 발생할 수 있는 극도의 변형으로 인해 특히 어렵습니다.

스케일 불변 특징 변환과 같은 일부 고전적인 특징 검출 방법은 과거에 사용되었습니다.하지만, 이제 딥러닝 방법을 사용하는 것이 더 일반적입니다.이는 [10]교육에 사용할 수 있는 많은 대규모 패션 데이터 세트의 출판으로 인해 크게 도움이 되었습니다.이러한 방법에는 회귀 기반 모델, 제약 조건 기반 모델 및 주의 깊은 [11]모델이 포함됩니다.패션 랜드마크 감지(변형)의 특정 문제는 [12]옷을 입은 모델의 포즈를 감지하고 고려하는 포즈 추정 모델로 이어졌습니다.

방법들

이미지에서 랜드마크를 찾기 위한 몇 가지 알고리즘이 있습니다.요즘에는 보통 인공 신경망특히러닝 알고리듬을 사용하여 작업을 해결하지만, 입자 군집 최적화같은 진화 알고리듬도 이 작업을 수행하는 데 유용할 수 있습니다.

딥 러닝

딥 러닝은 실제 [13]사진에서 랜드마크를 보다 정확하고 효율적으로 감지할 수 있게 함으로써 자율 얼굴 랜드마크 감지에 상당한 영향을 미쳤습니다.전통적인 컴퓨터 비전 기술을 사용하면 조명, 머리 위치 및 폐색의 변화로 인해 얼굴 랜드마크를 감지하는 것이 어려울 수 있지만 CNN(Convolutional Neural Networks)은 컴퓨터가 대규모 이미지 데이터 세트에서 기능을 학습할 수 있도록 함으로써 랜드마크 감지에 혁신을 가져왔습니다.레이블이 지정된 얼굴 랜드마크가 있는 이미지 데이터 세트에서 CNN을 교육함으로써 알고리듬은 이러한 랜드마크가 다른 조명 조건, 다른 각도 또는 부분적으로 가려진 뷰에 나타날 때도 새로운 이미지에서 높은 정확도로 감지하는 방법을 배울 수 있습니다.

특히, 이 접근 방식을 기반으로 한 솔루션은 모바일 장치GPU에서 실시간 효율성을 달성하고 증강 현실 [14]애플리케이션에서 그 용도를 발견했습니다.

진화 알고리즘

훈련 단계의 진화 알고리듬은 랜드마크를 정확하게 결정하는 방법을 배우려고 노력합니다.이 단계는 반복적인 프로세스이므로 여러 번 반복적으로 수행됩니다.마지막 반복이 완료되면 일정한 정확도로 랜드마크를 정확하게 결정할 수 있는 시스템을 얻을 수 있습니다.입자 군집 최적화 방법에는 랜드마크를 검색하는 입자가 있으며, 각 입자는 랜드마크 [15]탐지를 최적화하기 위해 각 반복에서 특정 공식을 사용합니다.

레퍼런스

  1. ^ Wu & Ji, 115페이지
  2. ^ Wu & Ji, 116페이지
  3. ^ Wu & Ji, 116페이지
  4. ^ Wu & Ji, 117페이지
  5. ^ Wu & Ji, 118페이지
  6. ^ Wu & Ji, 118페이지
  7. ^ Wu & Ji, 119페이지
  8. ^ Wu & Ji, 119페이지
  9. ^ Zhang, Zhang & Du, 1페이지
  10. ^ Zhang, Zhang & Du, 1페이지
  11. ^ Zhang, Zhang & Du, 1-4페이지.
  12. ^ Zhang, Zhang & Du, 2페이지
  13. ^ 우앤지
  14. ^ Kartynnik, Yury; Ablavatski, Artsiom; Grishchenko, Ivan; Grundmann, Matthias (2019). "Real-time Facial Surface Geometry from Monocular Video on Mobile GPUs". arXiv:1907.06724 [cs.CV].
  15. ^ WIJESINGHE, GAYAN (2005). LANDMARK DETECTION ON CEPHALOMETRIC X-RAYS USING PARTICLE SWARM OPTIMISATION (Thesis). RMIT University. CiteSeerX 10.1.1.72.3218.

서지학