가변 커널 밀도 추정

Variable kernel density estimation

통계학에서 적응형 또는 "가변대역폭" 커널 밀도 추정커널 밀도 추정의 한 형태로, 견적에 사용되는 커널의 크기는 샘플의 위치 또는 테스트 포인트의 위치에 따라 달라집니다.이는 샘플 공간이 다차원일 때 특히 효과적인 기술입니다.[1]

근거

샘플 x { \ } { i } \ a 、 ( x ) { P ( { \ { x} ) { { { x} :} }, , the the the the the the the the the the the the the the the the the 、 P ( ( x \ displaystyle \ vacc { displaystyle { rvec { x ) ) given given given given given given

여기서 n은 샘플 수, K는 "표본", h는 해당 폭, D는 x {\ 의 치수 수입니다.커널은 단순한 선형 필터로 생각할 수 있습니다.

고정 필터 폭을 사용하면 밀도가 낮은 영역에서는 모든 샘플이 매우 낮은 가중치로 필터의 꼬리에 들어가는 반면 밀도가 높은 영역에서는 가중치가 통일성에 가까운 중앙 영역에서 과도한 수의 샘플이 발견됩니다.이 문제를 해결하기 위해 샘플 공간의 다른 영역에서 커널의 폭을 변경합니다.여기에는 풍선 추정과 점 추정의 두 가지 방법이 있습니다.풍선 추정기에서 커널 폭은 테스트 포인트의 위치에 따라 변화한다.점별 추정기에서 커널 폭은 [1]샘플의 위치에 따라 변화한다.

다변량 추정기의 경우 모수 h는 커널의 크기뿐만 아니라 모양도 다양하도록 일반화할 수 있습니다.이 보다 복잡한 접근방식은 여기서 다루지 않습니다.

풍선 추정기

커널 폭을 변경하는 일반적인 방법은 테스트 포인트의 밀도에 반비례하도록 하는 것입니다.

여기서 k는 상수입니다.추정된 PDF를 역치환하여 가우스 커널 함수를 가정하면 W가 [2]상수임을 알 수 있습니다.

(2µ)D/2항 대신 다른 상수 계수를 가지지만 정규화 함수가 h차인D 커널에 대해서도 유사한 유도체가 유지된다.이를 통해 k-근접 인접 알고리즘이 일반화됩니다.즉, 균일한 커널 함수는 KNN [2]기술을 반환합니다.

오차에는 분산 항과 치우침 항이라는 두 가지 성분이 있습니다.분산 항은 다음과 [1]같이 표시됩니다.

1 D({}={ K {

바이어스 항은 커널 폭이 표본 간격보다 훨씬 커짐에 따라 한계에서 근사 함수를 평가하여 구합니다.실제 함수에 Taylor 확장을 사용하면 바이어스 항이 드롭됩니다.

따라서 각 추정치의 오차를 최소화하는 최적의 커널 폭을 도출할 수 있습니다.

통계 분류에 사용

이 방법은 통계적 분류에 적용할 때 특히 효과적이다.다음 두 가지 방법으로 진행할 수 있습니다.첫 번째는 다른 대역폭 파라미터를 사용하여 각 클래스의 PDF를 개별적으로 계산한 후 [3]Taylor에서와 같이 비교하는 것입니다.또는 각 샘플의 클래스에 따라 합계를 나눌 수 있습니다.

여기i c는 ith 샘플의 클래스입니다.시험점의 등급은 최대우도를 통해 추정할 수 있습니다.


외부 링크

레퍼런스

  1. ^ a b c D. G. Terrell; D. W. Scott (1992). "Variable kernel density estimation". Annals of Statistics. 20 (3): 1236–1265. doi:10.1214/aos/1176348768.
  2. ^ a b Mills, Peter (2011). "Efficient statistical classification of satellite measurements". International Journal of Remote Sensing. 32 (21): 6109–6132. arXiv:1202.2194. doi:10.1080/01431161.2010.507795.
  3. ^ Taylor, Charles (1997). "Classification and kernel density estimation". Vistas in Astronomy. 41 (3): 411–417. Bibcode:1997VA.....41..411T. doi:10.1016/s0083-6656(97)00046-9.