일반화 구조 텐서
Generalized structure tensor기능 검출 |
---|
에지 검출 |
코너 검출 |
블럽 검출 |
능선 검출 |
하프 변환 |
구조 텐서 |
아핀 불변 피쳐 검출 |
기능 설명 |
공간 축척 |
이미지 분석에서 일반화 구조 텐서(GST)는 데카르트 구조 텐서를 곡선 [1]좌표로 확장한 것이다.데카르트 구조 텐서가 데카르트 좌표로 방향을 검출하고 나타내는 것처럼 곡선의 "방향" 매개변수를 검출하고 나타내는 데 주로 사용됩니다.로컬 직교 함수 쌍에 의해 생성된 곡선 패밀리가 가장 잘 연구되었습니다.
지문에 [2]의한 생체 인식, 인체 조직 부분 [3]연구 등 컴퓨터 비전을 포함한 영상 및 비디오 처리 분야에서 널리 알려진 방법입니다.[4]
2D 및 국소 직교 베이스의 GST
image라는 용어는 f ( (, ) , , ), { f )} , { f , y) } 。 , 는 실수 변수이고, { , \ f { f 는 실수 함수입니다.GST는 f {\ f가 다음 조건을 충족하는 "라인"을 따라 최소(총 최소 제곱) 오차로 극소 변환을 수행할 수 있는 방향을 나타냅니다.
1. "선"은 곡선 좌표 기준 , \ \의 보통선이다
위의 방정식으로 설명된 대로 데카르트 좌표의 곡선입니다.오류는 L의 로 측정되며, 오류의 최소성은 L2 규범을 나타냅니다.
(2) 함수 (x ,) , ( , , )\ , )}는 조화쌍을 구성하며, 즉 코시-리만 방정식을 만족시킨다.
따라서 이러한 는 국소적으로 직교한다.
다음으로 GST는 다음과 같이 구성됩니다.
서 0 n x 0 _max}}는 최적의 방향(\ 및 최악의 방향 style \} +로 지정)으로의 변환 오류입니다.( , ){ w ( \, \) } {\ {\ {\ {\ 、 \ w (\xi , \ )의 검출이 실행되는 "외부 스케일"을 정의하는 윈도우 기능으로, f{ f}에 포함되어 있거나f {\ f가 (로컬이 아닌 전체 이미지일 생략할 수 있습니다.은 아이덴티티 매트릭스입니다.연쇄규칙을 이용하여 g의 실수부분과 허수부분을 , \\,\가 쌍으로 할 때, 상기의 적분이 일반 구조텐서에 적용되는 데카르트 좌표의 곡선으로 구현될 수 있음을 알 수 있다.
서 z + { z[5] 분석 함수의 예로는g ( z = + 、 displaydisplaydisplaydisplaydisplaydisplay (+ ) ( x + iy )가 있습니다. , (z ) / ( + )n / { { g ( z ) = /= (x + iy 서 {\ n은 임의의 양의 정수 또는 음의 정수입니다.g ( ) n {\ g)=은 컴퓨터 비전 및 이미지 처리에서 고조파 함수라고도 합니다.
따라서 데카르트 구조 텐서는 GST의 특수한 경우이며, 여기서 \ 고조파 함수는 단순히g ( ( { g) =z이다.따라서 고조파 gg를 선택하면 {\ \, \eta 이(가) 아닌 경우에도 (직사각형) 이미지 그리드 상에서만 실제 부분과 가상 부분의 선형 조합인 곡선을 모두 검출할 수 있습니다.또한 구조 텐서의 복소판에 적용되는 복잡한 필터를 사용하여 컨볼루션 연산을 할 수 있다.따라서, GST 구현은 (1,1) 텐서를 사용하는 대신 구조 텐서의 복잡한 버전을 사용하여 자주 수행되었습니다.
GST의 복잡한 버전
일반 [구조 텐서]의 복잡한 버전이 있으므로, GST의 복잡한 버전도 있습니다.
이 필터는 사촌과동일하지만 ww는 필터입니다.통상 구조 ww는 실제 필터이며, 일반적으로 외부 척도라고도 하는 근방을 묘사하기 위해 샘플링 및 스케일링된 가우스에서 정의됩니다.이러한 단순성이 GST 구현에서 주로 위의 복잡한 버전을 사용하는 이유입니다. g gdisplaystyle에 의해 정의된 { \, \}의 경우, 근린 정의 함수가 복합적으로 평가되고 있음을 알 수 있다.
- (x ± ) exp (- ( + / ( 2 ) exp ( -( + ) /( 2){ w = ( \ i )^ n} \ exp ( { + y^ { } / { 2 )
이른바 가우스 대칭 도함수따라서, 찾는 패턴의 방향별 변화는 근린 정의 함수에 직접 통합되고, 검출은 (일반) 구조 텐서의 공간에서 발생한다.
이미지 처리 및 컴퓨터 비전에 사용하기 위한 기본 개념
\ style \ {\ \ display \ \ display \ eta쌍의 화상처리를 통해 효율적인 검출이 가능합니다.복잡한 컨볼루션(또는 대응하는 매트릭스 연산)과 점 비선형 매핑은 GST 구현의 기본 연산 요소입니다.다음으로 2의 총 최소 제곱 오차 추정치를 (displaystyle _ 및 n _과 함께 구한다. 추정 각도는 데카르트 구조 텐서와 마찬가지로 이중 각도 표현이다. { 2 \ 는 연산에 의해 전달되며 형상 피쳐로 사용할 수 있습니다. 반면 x - _ { style \ style \ _ { } - \ { max} + _ { da _ min } } inationinationinationinationination ( (inationinationinationination ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( \ display sty ) ) ( ( ( ( (각도 추정을 용이하게 합니다.
예를 들어 원을 포함한 로그 나선형은 (복잡한) 곡선과 비선형 [1]매핑을 통해 탐지될 수 있습니다.Spiral(나선형)은 회색(값) 영상 또는 이진 영상일 수 있습니다. 즉, 원 또는 Spiral(나선형) 윤곽선과 같은 해당 패턴의 가장자리 요소의 위치를 알거나 달리 표시해서는 안 됩니다.
일반화된 구조 텐서는 예를 들어 접합점 등 국소적인 방향을 모델링할 수 있는 패턴을 검출하기 위해 화상 처리 및 컴퓨터 비전에서의 Hough 변환의 대안으로 사용할 수 있다.주요 차이점은 다음과 같습니다.
- 부정 투표는 물론 복잡한 투표도 허용된다.
- 하나의 템플릿을 사용하여 동일한 패밀리에 속하는 여러 패턴을 검출할 수 있습니다.
- 이미지 2치화는 필요하지 않습니다.
물리적 및 수학적 해석
GST의 곡선 좌표는 이미지에 적용되는 물리적 과정을 설명할 수 있습니다.잘 알려진 프로세스 쌍은 회전과 줌으로 구성됩니다.이들은 log ( 2 +2 ){ \xi = \2}}}} = - 1( x,y ){ \eta = \ ^ { - ( x , y ) ( , y )와 관련이 있습니다.
f {\ f가 \xi$로만 설명할 수 있는 iso-curves로 구성된 경우, 즉,그 등각선은 원 f f)=로 구성됩니다. 서g { g는 1D에서 정의된 실제 가치 있는 미분 함수이며 이미지는 ( 주위의) 회전과 불변합니다.
줌(줌 해제) 동작도 마찬가지로 모델링됩니다.이미지에 "별" 또는 자전거 스포크처럼 보이는 Iso-display가 있는 경우(: ( , ) ( ) { f( \, \ ) ( \ ) r ther 、 t rr the rr rrrrrrrrrrrrrrrrrrrrrrrrrrrrrrr therrrrtrrr。 1Displaystyle f ( \ ( \
조합해서
는 스케일링과 조합된 특정 회전량에 따라 변하지 않으며, 여기서 파라미터 {\ 에 의해 값이 사전 지정됩니다.
마찬가지로 데카르트 구조 텐서도 번역의 표현이다.여기서 물리적인 과정은 x x y\displaystyle의 일반적인 번역과 결합되어 있습니다.
여기서 금액은 파라미터 로 지정됩니다.여기서 는 회선의 방향을 나타냅니다.
일반적으로 는 극소 변환이 이미지를 불변하게 하는 방향 좌표)을 나타냅니다(실제로는 최소 변형).따라서 모든 곡선 좌표 기저 쌍에 대해, 선형 조합이 미분 연산자인 한 쌍의 극소 변환자가 있습니다.후자는 리 대수와 관련이 있다.
여러가지 종류의
GST의 콘텍스트에서의 「이미지」는, 콘텍스트에 따라, 통상의 화상 및 그 화상 근방(로컬 화상)을 모두 의미할 수 있다.예를 들어, 사진은 그 주변의 어느 곳과 마찬가지로 이미지입니다.
「 」를 참조해 주세요.
레퍼런스
- ^ a b c Bigun, J.; Bigun, T.; Nilsson, K. (December 2004). "Recognition by symmetry derivatives and the generalized structure tensor". IEEE Transactions on Pattern Analysis and Machine Intelligence. 26 (12): 1590–1605. doi:10.1109/TPAMI.2004.126. PMID 15573820.
- ^ Fronthaler, H.; Kollreider, K.; Bigun, J. (2008). "Local Features for Enhancement and Minutiae Extraction in Fingerprints". IEEE Transactions on Image Processing. 17 (3): 354–363. Bibcode:2008ITIP...17..354F. CiteSeerX 10.1.1.160.6312. doi:10.1109/TIP.2007.916155. PMID 18270124.
- ^ O. Schmitt; H. Birkholz (2010). "Improvement in cytoarchitectonic mapping by combining electrodynamic modeling with local orientation in high-resolution images of the cerebral cortex". Microsc. Res. Tech. 74 (3): 225–243. doi:10.1109/TIP.2007.916155. PMID 18270124.
- ^ O. Schmitt; M. Pakura; T. Aach; L. Homke; M. Bohme; S. Bock; S. Preusse (2004). "Analysis of nerve fibers and their distribution in histologic sections of the human brain". Microsc. Res. Tech. 63 (4): 220–243. doi:10.1002/jemt.20033. PMID 14988920.
- ^ Bigun, Josef (December 1997). "Pattern Recognition in Images by Symmetries and Coordinate Transformations". Computer Vision and Image Understanding. 68 (3): 290–307. doi:10.1006/cviu.1997.0556.