분산 지수

Index of dispersion

확률 분포의 분산의 확률 이론과 통계에서 변화의 계수처럼 dispersion,[1]분산 지수의 인덱스, 분산 계수, 상대 분산 또는variance-to-mean 비율(대형 물량 이동보고), 정규화된 측정으로 그것은 조치 여부 관찰된 사건들의 집합을 있clus을 계량화하는데 사용된다.착륙표준 통계 모델과 비교하여 편집되거나 분산됩니다.

에 대한 분산 비율로 정의됩니다.

이것은 Fano factor라고도 불리지만, 이 용어는 때때로 창 데이터(평균과 분산은 하위 모집단에 걸쳐 계산됨)에 대해 예약되며, 창이 무한대인 특수한 경우 분산 지수가 사용됩니다.데이터 윈도우 설정은 빈번하게 이루어집니다.VMR은 다양한 시간 간격 또는 공간 내의 작은 영역에 걸쳐 자주 계산됩니다.이것은 "윈도우"라고 불릴 수 있으며, 그 결과 발생하는 통계는 Fano 계수라고 불립니다.

은 평균μ \mu(가) 0이 아닌 경우에만 정의되며, 일반적으로 카운트 데이터나 이벤트 간 시간 의 양의 통계 정보 또는 기본 분포가 지수 분포 또는 포아송 분포로 가정되는 경우에만 사용됩니다.

용어.

이러한 맥락에서 관측된 데이터 세트는 특정 규모의 특정 지역의 지진과 같은 사전 정의된 사건의 발생 시간 또는 특정 종의 식물의 지리적 공간의 위치로 구성될 수 있다.그러한 발생의 세부 사항은 먼저 동일한 크기의 시간 영역 또는 공간 영역의 각 집합에서 발생 횟수 또는 발생 횟수로 변환된다.

위는 [2]카운트의 분산 인덱스를 정의합니다.간격에 [3]대한 분산 지수에 대해서는 다른 정의가 적용된다. 여기서 처리되는 수량은 사건 간 시간 간격의 길이이다.일반적으로 "분산 지수"는 카운트의 분산 지수를 의미합니다.

해석

일부 분포, 특히 포아송 분포는 분산과 평균이 같으므로 VMR = 1이 됩니다.기하 분포와 음이항 분포는 VMR > 1이고 이항 분포는 VMR < 1, 상수 랜덤 변수는 VMR = 0입니다.그러면 다음 표가 생성됩니다.

분배 VMR
상수 랜덤 변수 VMR = 0 분산되어 있지 않다
이항 분포 0 < VMR < 1 미달의
포아송 분포 VMR = 1
음이항 분포 VMR > 1 과신.

이는 이심률에 의한 원뿔 단면 분류와 유사하다고 볼 수 있다. 자세한 내용은 특정 확률 분포의 누적량을 참조한다.

분산 지수의 관련성은 구간에서 발생 횟수의 확률 분포가 포아송 분포일 때 값이 1이라는 것입니다.따라서 이 측도를 사용하여 포아송 공정을 사용하여 관측 데이터를 모형화할 수 있는지 여부를 평가할 수 있습니다.분산 계수가 1보다 작을 경우 데이터 집합은 "분산 부족"이라고 합니다. 이 조건은 포아송 프로세스와 관련된 랜덤성보다 더 규칙적인 발생 패턴과 관련될 수 있습니다.예를 들어, 정기적인 이벤트는 과소 분산됩니다.분산 지수가 1보다 크면 데이터 집합이 과대 분산된 것으로 간주됩니다.

분산 지수의 표본 기반 추정치를 사용하여 일련의 계수가 포아송 [4][5]분포를 따르는 모형의 적합성에 대한 공식적인 통계 가설 검정을 구성할 수 있습니다.구간-카운트의 관점에서, 과대산포는 포아송 분포에 비해 계수가 낮은 구간과 계수가 높은 구간이 더 많은 것에 해당한다. 반면, 과소산포는 포아송 분포에 비해 평균 카운트에 가까운 계수를 가진 구간이 더 많은 것이 특징이다.

VMR은 또한 특정 현상의 랜덤성 정도를 나타내는 좋은 척도입니다.예를 들어, 이 기술은 통화 관리에 일반적으로 사용됩니다.

랜덤하게 확산하는 입자(브라운 운동)의 경우, 주어진 부피 내의 입자 수 분포는 푸이소닉(VMR=1)입니다. 따라서 주어진 공간 패턴(측정 방법이 있는 경우)이 순수하게 확산에 의한 것인지 또는 일부 입자-입자 간 상호작용에 관련된 것인지를 평가하려면 공간을 패치로 분할하고 Quadr.ats 또는 샘플 단위(SU), 각 패치 또는 SU의 개체 수를 계산하고 VMR을 계산합니다. VMR이 1을 크게 초과하면 매력적인 입자 간 잠재성을 억제하기에 충분한 랜덤 워크가 아닌 클러스터 분포를 나타냅니다.

역사

포아송 분포 또는 이항 분포에서 편차를 탐지하기 위해 검정을 사용하는 것에 대해 처음으로 논의한 사람은 1877년의 렉시스인 것으로 보입니다.그가 개발한 테스트 중 하나는 렉시스 비율이었다.

이 지수는 1936년 Clapham에 의해 식물학에서 처음 사용되었다.

변수가 포아송 분포인 경우 분산 지수는 n이 크고 μ > [6]3일 자유도가 n - 1인 δ2 통계량으로 분포됩니다.많은 관심 사례에서 이 근사치는 정확하며, Fisher는 1950년에 이 근사치에 대한 정확한 테스트를 도출했다.

Hoel[7]분포의 처음 4개의 순간을 연구했다.그는 μ > 5일 경우 δ2 통계량에 대한 근사치가 타당하다는 것을 발견했다.

치우친 분포

치우침이 심한 분포의 경우 2차 분포가 아닌 선형 손실 함수를 사용하는 것이 더 적절할 수 있습니다.이 경우 유사한 분산 계수는 데이터의 [8]중위수에서 중위수에 대한 평균 절대 편차의 비율 또는 기호로는 다음과 같습니다.

여기서 n은 표본 크기, m은 표본 중위수 및 전체 표본에 대해 취해진 합입니다.아이오와, 뉴욕 사우스다코타는 이 선형 분산 계수를 사용하여 회비세를 [9][10][11]추정합니다.

표본 크기가 크고 두 표본의 중위수가 동일하며 주변 산포가 다른 2-표본 검정의 경우 선형 분산 계수에 대한 신뢰 구간은 다음과 같이 낮은 경계가 됩니다.

여기j t는 j 표본th 평균 절대 편차이고α z는 신뢰 α 정규 분포에 대한 신뢰 구간 길이입니다(: α = 0.05α, z = 1.96).[8]

「 」를 참조해 주세요.

비슷한 비율

  • /μ \ / \
  • 모멘트, k / k{ \_ { } / \ ^ { }
  • Fano factor, † / W { \ _ { W} / \ _ { } (윈도 VMR )
  • 잡음비,μ /μ / / (신호 처리 시

메모들

  1. ^ Cox & Lewis (1966)
  2. ^ Cox & Lewis (1966), 페이지 72
  3. ^ Cox & Lewis (1966), 페이지 71
  4. ^ Cox & Lewis (1966), p158
  5. ^ Upton & Cook (2006년), 분산지수 아래
  6. ^ Frome, E. L. (1982). "Algorithm AS 171: Fisher's Exact Variance Test for the Poisson Distribution". Journal of the Royal Statistical Society, Series C. 31 (1): 67–71. JSTOR 2347079.
  7. ^ Hoel, P. G. (1943). "On Indices of Dispersion". Annals of Mathematical Statistics. 14 (2): 155–162. doi:10.1214/aoms/1177731457. JSTOR 2235818.
  8. ^ a b Bonett, DG; Seier, E (2006). "Confidence interval for a coefficient of dispersion in non-normal distributions". Biometrical Journal. 48 (1): 144–148. doi:10.1002/bimj.200410148. PMID 16544819.
  9. ^ "Statistical Calculation Definitions for Mass Appraisal" (PDF). Iowa.gov. Archived from the original (PDF) on 11 November 2010. Median Ratio: The ratio located midway between the highest ratio and the lowest ratio when individual ratios for a class of realty are ranked in ascending or descending order. The median ratio is most frequently used to determine the level of assessment for a given class of real estate.
  10. ^ "Assessment equity in New York: Results from the 2010 market value survey". Archived from the original on 6 November 2012.
  11. ^ "Summary of the Assessment Process" (PDF). state.sd.us. South Dakota Department of Revenue - Property/Special Taxes Division. Archived from the original (PDF) on 10 May 2009.

레퍼런스

  • Cox, D. R.; Lewis, P. A. W. (1966). The Statistical Analysis of Series of Events. London: Methuen.
  • Upton, G.; Cook, I. (2006). Oxford Dictionary of Statistics (2nd ed.). Oxford University Press. ISBN 978-0-19-954145-4.