피라미드(이미지 처리)
Pyramid (image processing)기능 검출 |
---|
에지 검출 |
코너 검출 |
블럽 검출 |
능선 검출 |
하프 변환 |
구조 텐서 |
아핀 불변 피쳐 검출 |
기능 설명 |
공간 축척 |
피라미드 또는 피라미드 표현은 컴퓨터 비전, 이미지 처리 및 신호 처리 커뮤니티에 의해 개발된 멀티스케일 신호 표현의 한 종류로, 신호 또는 이미지는 반복적인 평활과 서브샘플링의 대상이 됩니다.피라미드 표현은 스케일 공간 표현 및 다중 해상도 분석의 전신입니다.
피라미드 세대
피라미드에는 크게 로우패스와 밴드패스의 두 종류가 있다.
로패스 피라미드는 적절한 스무딩 필터로 이미지를 평활하고 평활된 이미지를 서브샘플링하여 만들어집니다(보통 각 좌표 방향에 따라 2배).그런 다음 결과 영상에 동일한 절차가 적용되고 사이클이 여러 번 반복됩니다.이 프로세스의 각 주기는 평활도가 증가하지만 공간 샘플링 밀도가 감소(즉, 영상 분해능 감소)된 더 작은 영상을 생성합니다.그래프로 나타내면 전체 멀티스케일 표현은 피라미드처럼 보입니다.원래 이미지는 아래쪽에 있고 그 결과 작은 이미지는 위에 겹쳐져 있습니다.
밴드패스 피라미드는 피라미드 내의 인접한 레벨에서의 화상 간의 차이를 형성하고 인접한 해상도 레벨 간의 화상 보간을 함으로써 화소별 [1]차이의 계산을 가능하게 한다.
피라미드 세대 커널
피라미드 [2][3][4][5][6][7]생성을 위해 다양한 스무딩 커널이 제안되었습니다.제시된 제안 중 이항 계수에서 발생하는 이항 커널은 특히 유용하고 이론적으로 근거가 있는 [3][8][9][10][11]클래스로 두드러집니다.따라서, 2차원 이미지가 주어졌을 때, 우리는 (정규화된) 이항 필터(1/4, 1/2, 1/4)를 각 공간 차원을 따라 일반적으로 두 번 이상 적용한 다음 2배씩 이미지를 서브샘플링할 수 있다.이 작업은 원하는 횟수만큼 진행되어 콤팩트하고 효율적인 멀티스케일 표현으로 이어질 수 있습니다.특정 요건에 의해 동기 부여되는 경우, 중간 규모 레벨은 서브 샘플링 단계가 때때로 생략되어 오버 샘플링 또는 하이브리드 [10]피라미드로 이어질 수 있다.오늘날 CPU의 연산 효율이 높아짐에 따라 피라미드 생성 단계에서 지원되는 광범위한 가우스 필터를 스무딩 커널로 사용하는 것도 가능합니다.
가우스 피라미드
가우스 피라미드에서 후속 화상은 가우스 평균(가우스 블러)을 사용하여 가중치를 부여하고 축소합니다.로컬 평균을 포함한 각 화소는 피라미드 하단의 근방 화소에 대응한다.이 기술은 특히 텍스처 합성에 사용됩니다.
라플라시안 피라미드
라플라시안 피라미드는 가우스 피라미드와 매우 유사하지만 각 레벨 간의 흐릿한 버전의 차이 이미지를 저장합니다.가장 작은 레벨만 상위 레벨의 차이 영상을 사용하여 고해상도 영상을 재구성할 수 있는 차이 영상이 아닙니다.이 기술은 영상 [12]압축에 사용할 수 있습니다.
스테이터블 피라미드
Simoncelli 및 기타에 의해 개발된 스테이터블 피라미드는 이미지 압축, 텍스처 합성 및 객체 인식을 포함한 애플리케이션에 사용되는 멀티 스케일, 멀티 오리엔테이션 밴드 패스 필터 뱅크의 구현입니다.이것은 단일 라플라시안 또는 가우스 [13][14][15]필터 대신 피라미드의 각 레벨에서 조향 가능한 필터 뱅크를 사용하는 라플라시안 피라미드의 방향 선택 버전으로 생각할 수 있습니다.
피라미드의 응용
대체 표현
컴퓨터 비전 초기에는 피라미드가 실제 이미지 데이터에서 멀티스케일 이미지 특징을 계산하는 멀티스케일 표현의 주요 유형으로 사용되었습니다.보다 최근의 기술에는 일부 연구자들 사이에서 널리 알려진 스케일 공간 표현, 멀티 스케일 표현에서 서브 샘플링 단계를 분리하는 능력, 이론 분석을 위한 보다 강력한 도구, 원하는 척도로 표현을 계산하는 능력 등이 있다.다른 해상도로 영상 표현을 관련짓는 알고리즘 문제를 피할 수 있습니다.그럼에도 불구하고 피라미드는 여전히 스케일 공간 [10][16][17]표현에 대한 계산 효율적인 근사치를 표현하기 위해 자주 사용된다.
상세 조작
라플라시안 피라미드 레벨은 다른 척도로 세부사항을 확대 또는 축소하기 위해 원본 이미지에 추가하거나 원본 이미지에서 제거할 수 있습니다.그러나 이러한 형태의 세부 조작은 많은 경우 후광 유물을 생성하는 것으로 알려져 있어 양자 필터와 같은 대체물의 개발로 이어진다.
일부 이미지 압축 파일 형식은 Adam7 알고리즘 또는 기타 인터레이스 기술을 사용합니다.이것들은 일종의 이미지 피라미드라고 볼 수 있다.이러한 파일 포맷은 먼저 "대규모" 기능을 저장하고 나중에 파일에 세부 정보를 저장하기 때문에 작은 "썸네일" 또는 작은 화면에 표시되는 특정 뷰어는 사용 가능한 픽셀로 표시할 수 있는 충분한 양의 이미지만 빠르게 다운로드할 수 있습니다.따라서 하나의 파일이 저장 또는 생성하지 않고도 많은 뷰어 해상도를 지원할 수 있습니다.각 해상도마다 다른 파일을 먹었다.
「 」를 참조해 주세요.
레퍼런스
- ^ E.H. 안델슨과 C.H. 앤더슨과 J.R.버겐과 PJ 버트와 J.M. 오그든입니다"이미지 처리에서의 피라미드 방법" 1984.
- ^ Burt, P. J. (May 1981). "Fast filter transform for image processing". Computer Graphics and Image Processing. 16: 20–51. doi:10.1016/0146-664X(81)90092-7.
- ^ a b Crowley, James L. (November 1981). "A representation for visual information". Carnegie-Mellon University, Robotics Institute. tech. report CMU-RI-TR-82-07.
{{cite journal}}
:Cite 저널 요구 사항journal=
(도움말) - ^ Burt, Peter; Adelson, Ted (1983). "The Laplacian Pyramid as a Compact Image Code" (PDF). IEEE Trans. Commun. 9 (4): 532–540. CiteSeerX 10.1.1.54.299. doi:10.1109/TCOM.1983.1095851.
- ^ Crowley, J. L.; Parker, A. C. (March 1984). "A representation for shape based on peaks and ridges in the difference of low-pass transform". IEEE Transactions on Pattern Analysis and Machine Intelligence. 6 (2): 156–170. CiteSeerX 10.1.1.161.3102. doi:10.1109/TPAMI.1984.4767500. PMID 21869180. S2CID 14348919.
- ^ Crowley, J. L.; Sanderson, A. C. (1987). "Multiple resolution representation and probabilistic matching of 2-D gray-scale shape" (PDF). IEEE Transactions on Pattern Analysis and Machine Intelligence. 9 (1): 113–121. CiteSeerX 10.1.1.1015.9294. doi:10.1109/tpami.1987.4767876. PMID 21869381. S2CID 14999508.
- ^ Meer, P.; Baugher, E. S.; Rosenfeld, A. (1987). "Frequency domain analysis and synthesis of image generating kernels". IEEE Transactions on Pattern Analysis and Machine Intelligence. 9 (4): 512–522. doi:10.1109/tpami.1987.4767939. PMID 21869409. S2CID 5978760.
- ^ 린데버그, 토니, "이산 신호에 대한 스케일 공간", PAMI(12), No.3, 1990년 3월, 페이지 234-254.
- ^ 린데버그, 토니컴퓨터 비전의 스케일 공간 이론, Kluwer Academic Publishers, 1994, ISBN 0-7923-9418-6 (특히 일반화된 이항 커널과 이산 가우스 커널에 대한 이론은 2장 참조)
- ^ a b c Lindeberg, T. and Bretzner, L. 하이브리드 멀티스케일 표현에서의 실시간 스케일 선택, Proc.Scale-Space'03, 스코틀랜드 스카이섬, Springer 강의 노트, 2695권, 148-163쪽, 2003.
- ^ 매우 간단한 이론적 설명은 멀티스케일 접근법에 대한 기사를 참조하십시오.
- ^ Burt, Peter J.; Adelson, Edward H. (1983). "The Laplacian Pyramid as a Compact Image Code" (PDF). IEEE Transactions on Communications. 31 (4): 532–540. CiteSeerX 10.1.1.54.299. doi:10.1109/TCOM.1983.1095851.
- ^ Simoncelli, Eero. "The Steerable Pyramid". cns.nyu.edu.
- ^ Manduchi, Roberto; Perona, Pietro; Shy, Doug (1997). "Efficient Deformable Filter Banks" (PDF). California Institute of Technology/University of Padua.
에도 - ^ 스탠리 A.클라인, 톰 카니, 로렌 바그아웃-스타인, 크리스토퍼 W.타일러 "7가지 마스킹 모델"입니다, 형사님SPIE 3016, Human Vision and Electronic Imaging II, 13 (1997년 6월 3일), doi: 10.1117/12.274510
- ^ 크롤리, J, 리프 오스케일 정규화된 가우스 수용 필드의 빠른 계산, Proc.Scale-Space'03, 스코틀랜드 스카이섬, Springer 강의 노트, 컴퓨터 사이언스, 제2695권, 2003.
- ^ Lowe, D. G. (2004). "Distinctive image features from scale-invariant keypoints". International Journal of Computer Vision. 60 (2): 91–110. CiteSeerX 10.1.1.73.2924. doi:10.1023/B:VISI.0000029664.99615.94. S2CID 221242327.
외부 링크
- 가우스-라플라시안 피라미드 이미지 코딩 - 다운샘플링, 업샘플링 및 가우스 컨볼루션 방법을 보여줍니다.
- 가우스 피라미드 - 절차를 간략히 소개하고 여러 소스를 인용합니다.
- 라플라시안 불규칙 그래프 피라미드 - 이 페이지의 그림 1은 가우스 피라미드의 예를 보여줍니다.
- 전자책 제출 시 컴팩트 이미지 코드로서의 라플라시안 피라미드