활성 등고선 모형

Active contour model

뱀이라고불리는 액티브 등고선 모델은 노이즈많은 2D 이미지에서 물체의 윤곽을 묘사하기 위해 Michael Kass, Andrew WitkinDemetri Terzopoulos[1] 의해 도입된 컴퓨터 비전 프레임워크입니다.뱀 모델은 컴퓨터 시각에서 인기가 있으며 뱀은 물체 추적, 형상 인식, 분할, 가장자리 감지 및 스테레오 매칭과 같은 응용 프로그램에서 널리 사용됩니다.

뱀은 변형에 저항하는 물체 윤곽과 내부 힘 쪽으로 잡아당기는 구속력과 이미지 힘에 의해 영향을 받는 에너지를 최소화하고 변형 가능한 스플라인입니다.뱀은 에너지 [1]최소화를 통해 변형 가능한 모델을 화상에 매칭하는 일반적인 기법의 특수한 경우로 이해할 수 있다.2차원에서 활성 형상 모델은 포인트 분포 모델을 이용하여 훈련 세트에서 학습한 명시적 영역으로 형상 범위를 제한함으로써 이 접근법의 이산 버전을 나타낸다.

뱀 – 능동형 변형 모델

이 방법을 사용하려면 원하는 윤곽 모양을 미리 알아야 하기 때문에 뱀은 영상에서 윤곽을 찾는 모든 문제를 해결하지 못합니다.오히려 사용자와의 상호작용, 보다 높은 수준의 이미지 이해 프로세스와의 상호작용 또는 시간 또는 공간에 인접한 이미지 데이터의 정보 등 다른 메커니즘에 의존합니다.

동기

컴퓨터 비전에서 등고선 모델은 이미지에서 도형의 경계를 나타냅니다.특히 뱀은 경계의 대략적인 모양을 알 수 있는 문제를 해결하기 위해 고안되었다.변형 가능한 모델로서 뱀은 스테레오 매칭과 모션 트래킹의 차이와 노이즈에 적응할 수 있다.또한 이 방법은 누락된 경계 정보를 무시하여 영상에서 Illusory 윤곽을 찾을 수 있습니다.

기존의 특징 추출 기술과 비교하여 뱀은 여러 가지 장점이 있습니다.

  • 이들은 자율적이고 적응적으로 최소 상태를 검색합니다.
  • 외부 이미지 힘은 직관적인 방식으로 뱀에게 작용합니다.
  • 영상 에너지 기능에 가우스 평활 기능을 통합하면 스케일 감도가 도입됩니다.
  • 동적 객체를 추적하는 데 사용할 수 있습니다.

전통적인 뱀의 주요 결점은

  • 이들은 로컬 최소 상태에 민감하며, 이는 시뮬레이트된 어닐링 기술로 대항할 수 있습니다.
  • 전체 윤곽선에 걸쳐 에너지를 최소화하는 동안 종종 미세 피쳐가 무시됩니다.
  • 정확도는 컨버전스 정책에 [2]따라 달라집니다.

에너지 제제

탄성 스네이크는 n -({i 탄성 에너지 내부{\internal 외부 에지 기반 에너지 E_extstyle {으로 정의됩니다.내부 에너지 용어의 목적은 뱀에 가해지는 변형을 제어하는 것이며 외부 에너지 용어의 목적은 이미지에 대한 윤곽선의 적합을 제어하는 것입니다.외부 에너지는 보통 이미지에 의한 힘과 사용자 con {\ 의한 구속력의 조합입니다.

뱀의 에너지 함수는 뱀의 외부 에너지와 내부 에너지의 합계이다.

내부 에너지

뱀의 내부 에너지는 \ 포함하는 의 연속성과 의 곡선의 평활성으로 구성됩니다.

[3]

이것은 다음과 같이 확장할 수 있습니다.

α ( ) { ) ( ((s ){ (s )는 사용자 정의 가중치입니다.이러한 가중치는 뱀의 스트레칭량과 뱀의 곡률량에 대한 내부 에너지 함수의 감도를 각각 제어하여 뱀의 형상에 대한 구속의 수를 제어합니다.

실제로 연속성 항에 대한 큰 ( s) \( s)는 등고선의 점 사이의 거리 변화에 불이익을 준다.평활도 항에 큰 무게 s ) { \s )}는 윤곽선의 진동에 영향을 미쳐 윤곽선이 얇은 판으로 작용하게 됩니다.

이미지 에너지

이미지 내의 에너지는 이미지 기능의 일부 기능입니다.이것은 파생법에서 가장 일반적인 수정 포인트 중 하나입니다.화상이나 화상 자체의 피쳐는, 다종다양한 방법으로 처리할 수 있습니다.

I( ,) { I ( , )、 ,,,선, 엣지 및 종단부가 이미지에 존재하는 경우 이미지에 의한 에너지의 일반적인 공식은 다음과 같습니다.

서 w 행 edge { term {\ 이러한 주요 기능의 가중치입니다.가중치가 높을수록 돌출 형상이 이미지 힘에 더 큰 영향을 미친다는 것을 나타냅니다.

회선 기능

선의 기능은 다음과 같이 나타낼 수 있는 이미지의 강도입니다.

기호에 따라 선이 어두운 선과 밝은 선 중 어느 쪽에 끌릴지 결정됩니다.

이미지에 약간의 평활 또는 노이즈 감소를 사용할 수 있습니다. 그러면 선이 다음과 같이 작동합니다.

엣지 기능

가장자리 기능은 영상 구배를 기반으로 합니다.이 구현의 한 가지입니다.

원하는 개체 윤곽에서 멀리 떨어진 뱀은 일부 로컬 최소값으로 잘못 수렴할 수 있습니다.이러한 국소 최소값을 피하기 위해 축척 공간 연속을 사용할 수 있습니다.이는 이미지에 흐릿한 필터를 사용하고 계산이 진행됨에 따라 흐릿한 양을 줄임으로써 뱀의 적합성을 개선함으로써 실현됩니다.스케일 공간 연속을 사용한 에너지 기능은 다음과 같습니다.

서 G { \ 표준편차 igma { \ \의 가우스어입니다.이 함수의 최소값은 G I의 교차점에 해당합니다.\ \ } , \ ^ { }}: Marr-Hildress 이론에 따라 모서리를 정의합니다.

종료 기능

약간 평활된 영상에서 레벨 선의 곡률을 사용하여 영상에서 모서리와 종단을 감지할 수 있습니다. 방법을 사용하여 C(x ,) { C ( , ) }을(를) 평활화 .

경사각을 가지고

경사 방향을 따른 단위 벡터

및 경사 방향에 수직인 단위 벡터

에너지의 종단 기능은 다음과 같이 나타낼 수 있습니다.

구속 에너지

원래 뱀 구현을 포함한 일부 시스템은 초기 위치뿐만 아니라 에너지 측면에서도 뱀을 안내하기 위한 사용자 상호작용을 허용했다.이러한 제약 { 사용하여 뱀을 대화식으로 특정 지점으로 유도하거나 특정 지점으로 유도할 수 있습니다.

경사 강하를 통한 최적화

뱀에 대한 초기 추측이 주어졌을 때, 뱀의 에너지 기능은 반복적으로 최소화된다.경사 하강 최소화는 스네이크 [4]에너지를 최소화하는 데 사용할 수 있는 가장 단순한 최적화 중 하나입니다.각 반복은 제어된 스텝사이즈 {\}의 포인트의 음의 구배에서 로컬 최소값을 구합니다.이 구배 감소 최소화는 다음과 같이 구현될 수 있습니다.

서 Fsnake( i)({ 뱀에 대한 힘입니다.이것은 에너지 필드의 구배 음수에 의해 정의됩니다.

( )( ( s s에 대해 일정하다고 가정하면 이 반복 방법은 다음과 같이 단순화할 수 있습니다.

이산 근사

실제로 이미지는 한정된 해상도를 가지며 한정된 시간 단계 에서만 통합할 수 있습니다. 따라서 뱀의 실제 구현을 위해서는 이산적인 근사치가 이루어져야 합니다.

뱀의 에너지 기능은 뱀의 개별적인 점을 사용하여 근사할 수 있습니다.

결과적으로 뱀의 힘은 다음과 같이 근사할 수 있다.

경사근사는 유한차이와 같은 s에 관한 임의의 유한근사법을 통해 이루어질 수 있다.

이산 시간으로 인한 수치 불안정성

알고리즘에 이산 시간을 도입하면 뱀이 끌어당기는 최소값을 넘어 이동하는 업데이트가 발생할 수 있으며, 이는 최소값을 중심으로 진동을 일으키거나 다른 최소값을 찾을 수 있습니다.

이는 이미지 힘에 의해 스텝 크기가 픽셀보다 크지 않도록 타임스텝을 조정함으로써 회피할 수 있습니다.그러나 에너지가 낮은 지역에서는 내부 에너지가 업데이트를 지배합니다.

또, 화상의 힘이 1픽셀만 갱신되도록, 각 스텝에 대해서 화상의 힘을 정규화할 수 있다.이것은 다음과 같이 나타낼 수 있다.

여기서 k \ \ k는 픽셀 크기 값에 가깝습니다.이렇게 하면 시간 [5]스텝 조정으로 인해 발생하는 내부 에너지가 지배적인 문제를 피할 수 있습니다.

이산 공간에 의한 수치 불안정

연속 영상의 에너지는 영상의 픽셀로 존재하지 않는 제로 크로싱을 가질 수 있습니다.이 경우 뱀의 한 점은 이 제로 크로싱에 인접한 두 픽셀 사이에서 진동합니다.이 진동은 가장 가까운 [5]인접 픽셀 대신 픽셀 간 보간을 사용하여 방지할 수 있습니다.

뱀의 일부 변종

기본 방식인 snaks에는 다양한 제한과 컨버전스가 제대로 수행되지 않는 코너 케이스가 있습니다.디폴트 방법의 문제를 해결하는 몇 가지 대안이 존재한다.여기에 몇 가지 목록이 있습니다.

GVF 스네이크 모델

Gradient Vector Flow(GVF; 그라데이션벡터 플로우) 스네이크모델[6] 스네이크에 관한 다음 두 가지 문제에 대처합니다.

  • 오목한 경계에 대한 낮은 수렴 성능
  • snake가 최소값보다 훨씬 더 초기화된 경우 낮은 수렴 성능

2D에서 GVF 벡터 text})(는) 에너지 기능을 최소화합니다.

μ {\ 제어 가능한 평활 용어입니다.이것은 오일러 방정식을 풀어서 풀 수 있다.

이 문제는 정상 상태 값을 향한 반복을 통해 해결할 수 있습니다.

이 결과는 기본 외력을 대체합니다.

GVF를 사용할 때의 주요 문제는 평활 μ {\ 인해 윤곽선의 가장자리가 반올림된다는 것입니다.μ 줄이면 반올림은 감소하지만 평활량은 약해집니다.

풍선 모형

풍선[5] 모형은 기본 활성 등고선 모형을 사용하여 다음과 같은 문제를 해결합니다.

  • 뱀은 먼 곳에 끌리지 않는다.
  • 뱀에 실질적인 힘이 작용하지 않으면 뱀은 안쪽으로 움츠러들 것이다.
  • 최소 윤곽보다 큰 뱀은 결국 그 안으로 줄어들지만, 최소 윤곽보다 작은 뱀은 최소 윤곽을 찾지 못하고 계속 줄어들 것이다.

풍선 모델은 뱀에 작용하는 힘에 인플레이션 용어를 도입합니다.

서 n ( s) {{ ( { v 에서의 곡선의 정규 단위 벡터이고 k {1}는 힘의 크기입니다. 1{ 이미지 정규화 k {k}와 같아야 합니다.k k보다 작은 값을 사용하여 이미지 가장자리의 힘이 팽창력을 극복할 수 있도록 합니다.

풍선 모델을 사용하면 다음 세 가지 문제가 발생합니다.

  • 뱀은 축소되는 대신 최소로 확장되어 그보다 작은 최소 윤곽을 발견하지 못할 것이다.
  • 외부 힘에 의해 윤곽선이 실제 최소값보다 약간 커집니다.안정적인 용액이 발견된 후 풍선력을 감소시킴으로써 해결할 수 있다.
  • 팽창력은 약한 모서리로부터의 힘을 압도하여 이미지의 약한 특징을 무시한 뱀으로 문제를 증폭시킬 수 있습니다.

확산 뱀 모형

확산 뱀 모델은[7] 소음, 잡동사니 및 교락에 대한 뱀의 민감도를 다룬다.Mumford-Shah 함수와 그 만화적 한계를 수정하고 통계적 형상 지식을 통합한다.기본 이미지 에너지 E 다음과 같이 대체됩니다.

변경된 Mumford-Shah 기능을 기반으로 합니다.

J ( ) { J ( { \ {} )는 I ( ) { I ( { \ { )의 부분적인 스무스 모델입니다.B (는 다음과 같이 정의됩니다.

서 Bn ()({}(s 2차 B-스플라인 기준 이고 n({})은 스플라인의 제어 지점입니다.변경된 카툰 제한은 ( \ \ \ )로 취득되며, E \ 의 유효한 구성입니다.

c {\ 다양한 등고선의 이진 영상의 교육을 기반으로 하며 α {\에 의해 강도를 제어합니다. 평균 제어점 z 제어점 z {\ 가우스 분포의 경우 및 공분산 행렬({ 가우스 확률에 대응하는 2차 에너지는 다음과 같습니다.

이 방법의 강도는 훈련 데이터의 강도와 수정된 Mumford-Shah 기능의 조정에 의존한다.뱀마다 훈련 데이터 세트와 튜닝이 다릅니다.

기하학적 활성 등고선

기하학적 활성 등고선 또는 지오데식 활성 등고선(GAC)[8] 또는 등각 활성[9] 등고선은 유클리드 곡선 단축 진화의 아이디어를 사용한다.윤곽선은 영상의 객체 검출에 따라 분할 및 병합됩니다.이러한 모델은 주로 레벨 세트에 의해 영감을 받아 의료 이미지 컴퓨팅에 광범위하게 사용되고 있습니다.

예를 들어 GAC의 경사 하강 곡선 진화 방정식은 다음과 같다.

서 g { g 정지 함수, c는 Lagrange 승수, {\ 곡률, {\ 단위 내향 법선입니다.이 특정한 형태의 곡선 진화 방정식은 정상 방향의 속도에만 의존합니다.따라서 다음과 같이 레벨 설정 함수 \Phi 삽입하여 오일러 형식으로 동등하게 다시 쓸 수 있습니다.

단순하지만 강력한 레벨 세트 재구성을 통해 활성 등고선이 경사 하강 곡선 진화 중 위상 변화를 처리할 수 있다.그것은 관련 분야에서 엄청난 발전을 불러일으켰고, 수준 집합 재구성을 해결하기 위해 수치적 방법을 사용하는 것은 현재 일반적으로 수준 집합 방식으로 알려져 있다.레벨 세트 방법이 활성 등고선을 구현하기 위해 꽤 인기 있는 도구가 되었지만, Wang과 Chan은 모든 곡선 진화 방정식이 직접적으로 [10]풀릴 필요는 없다고 주장했다.

활성 등고선의 보다 최근의 발전은 지역 특성의 모델링, 유연한 형상 우선의 통합 및 완전 자동 분할 등을 다룬다.

Lankton과 Allen Tannenbaum[11]국지적 특성과 전역적 특징을 결합한 통계 모델을 공식화했다.

그래프 절단과의 관계

그래프 컷 또는 max-flow/min-cut은 마르코프 랜덤 필드(MRF) 에너지라고 불리는 에너지의 특정 형태를 최소화하는 일반적인 방법입니다.Graph cuts(그래프 절단) 방법은 영상 분할에도 적용되었으며 모델이 MRF이거나 MRF로 근사할 수 있는 경우 수준 설정 방법을 능가하는 경우가 있습니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b Kass, M.; Witkin, A.; Terzopoulos, D. (1988). "Snakes: Active contour models" (PDF). International Journal of Computer Vision. 1 (4): 321. CiteSeerX 10.1.1.124.5318. doi:10.1007/BF00133570. S2CID 12849354. Archived from the original (PDF) on 2016-01-12. Retrieved 2015-08-29.
  2. ^ 뱀: 활동 중인 모델 라마니 피추마니, http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/RAMANI1/node31.html
  3. ^ 네바다 대학교 George Bebis 박사(http://www.cse.unr.edu/~bebis/CS791E/Notes/Deformable Contours.pdf)
  4. ^ 이미지 이해, 브라이언 S.모스, 브리검영대학교, 1998-2000, http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/MORSE/iu.pdf
  5. ^ a b c 로랑D.Cohen, 활성 등고선 모델과 풍선에 관한 CVGIP: 이미지 이해, 제5권, 제2호, 1991년 3월, 211-218페이지, ISSN 1049-9660, doi:10.1016/1049-9660(91)90028-N
  6. ^ C. Xu와 J.L. Prince, "Gradient Vector Flow: 뱀을 위한 새로운 외부 힘", Proc.IEEE 회의컴포넌트에 있습니다.Vis. 팻.기록한다 (CVPR), 로스 알라미토스:Comp. Soc. 프레스, 66-71, 1997년 6월, http://iacl.ece.jhu.edu/pubs/p087c.pdf
  7. ^ Cremers, D.; Schnorr, C.; Weickert, J. (2001). Diffusion-snakes: combining statistical shape knowledge and image information in a variational framework. Proceedings. IEEE Workshop on. Vol. 50. pp. 137–144. CiteSeerX 10.1.1.28.3639. doi:10.1109/VLSM.2001.938892. ISBN 978-0-7695-1278-5. S2CID 14929019.
  8. ^ a b 지오데식 활성 등고선, V. Caselles, R. Kimmel, G. Sapiro http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.21.2196
  9. ^ 컨포멀 곡률 흐름:단계 이행에서 액티브한 시력으로의 이행에서 Satyanad Kichenassamy, Arun Kumar, Peter Olver, Allen Tannenbaum 및 Anthony Yezi https://doi.org/10.1007%2FBF00379537
  10. ^ Wang, Junyan; Chan, Kap Luk (2014-07-08). "Active Contour with a Tangential Component". Journal of Mathematical Imaging and Vision. 51 (2): 229–247. arXiv:1204.6458. doi:10.1007/s10851-014-0519-y. ISSN 0924-9907. S2CID 13100077.
  11. ^ Lankton, S.; Tannenbaum, A., "Localizing Region-Based Active Contours", 이미지 처리, IEEE Transactions on, vol.17, No.11, 페이지 2029, 2039, 2008년 11월 doi: 10.1109/TIP.2004.11.http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=4636741&tag=1

외부 링크

샘플코드