학생화 범위 분포

Studentized range distribution
학생화 범위 분포
확률밀도함수
StudentizedRangePDF.svg
누적분포함수
StudentizedRangeCDF.svg
매개변수 k > 1, 그룹 수
> 0, 자유도
지원
PDF
CDF

확률통계에서 학생 범위 분포정규 분포 모집단에서 학생 범위 표본의 연속 확률 분포.

동일한 정규 분포 N(μ, μ2)을 가진 각 k 모집단에서 n 크기의 표본을 추출하고 (가) 이러한 표본 평균 중 가장 작으며 이 이러한 표본 평균 중 가장 크다고 가정해 보십시오.이러한 표본으로부터의 합동 표본 분산.그리고 다음 통계량은 학생화된 범위 분포를 가진다.

정의

확률밀도함수

q에 대해 누적분포함수를 구분하면 확률밀도함수가 나온다.

적분 외부에서는 방정식이

지수 인자를 대체하기 위해 사용되었다.

누적분포함수

누적 분포 함수는 다음과 같이 지정된다.

특례

k가 2 또는 3이면 [2]학생화된 확률 분포 함수를 직접 평가할 수 있는데 여기서 z) 표준 정규 확률밀도함수이고 정규 누적 분포함수인 Phi(z

자유도가 무한대에 근접하면 표준 정규 분포를 사용하여 k에 대해 학생화된 범위 누적 분포를 계산할 수 있다.

적용들

학생화된 범위 분포의 임계값은 Tukey의 범위 테스트에서 사용된다.[3]

학생화된 범위는 무작위로 추출하는 것이 아니라 표본 데이터의 극단적인 차이를 선택적으로 찾는 데이터 마이닝에 의해 얻어진 결과에 대한 유의 수준을 계산하는 데 사용된다.

학생화된 범위 분포는 가설 검정다중 비교 절차에 적용된다.예를 들어, 터키의 범위 시험과 던컨의 새로운 다중 검정(첩운)은 샘플 x1,..., 수단의 xn은 표본과 q기본test-statistic은, 사후 분석으로 간에 두 그룹을 의미하 시험 하나 중요한 차이점(쌍별 비교)는 모든 그룹의 공 가설 거부하여 사용할 수 있다. f표준 분산 분석으로 동일한 모집단(즉, 모든 평균이 동일함)을 롬화한다.[4]

관련 분포

두 그룹 평균의 동일성(μ = μ2)만 문제가 되는 경우(즉, μ1 = μ), 학생화된 범위 분포는 학생의 t 분포와 유사하며, 첫 번째 분포가 고려 중인 평균 수를 고려한다는 점에서만 다르며, 임계 값은 그에 따라 조정된다.고려 중인 수단이 많을수록 임계치는 커진다.이는 평균이 많을수록 우연만으로 인해 평균 쌍 간의 차이가 최소한 유의하게 클 확률이 크기 때문에 타당하다.

파생

그 표준화된 범위 분포 함수는 표본 표준에 의해 가변 q로 편차 s로 표준화된 범위 습관적으로 표준 편차 단위에 표로 만들어져는....mw-parser-output .frac{white-space:nowrap}.mw-parser-output.frac .num,.mw-parser-output.frac .den{그 표본 범위 Rre-scaling에서 비롯된다.Font-size:80%;line-height:0;vertical-align:슈퍼}.mw-parser-output.frac .den{vertical-align:서브}.mw-parser-output .sr-only{국경:0;클립:rect(0,0,0,0), 높이:1px, 마진:-1px, 오버 플로: 숨어 있었다. 패딩:0;위치:절대, 너비:1px}R⁄s.파생은 모든 표본 데이터 분포에 적용되는 표본 범위의 분포 함수의 완전히 일반적인 형태로 시작한다.

"학생화" 범위 q의 관점에서 분포를 얻기 위해 R에서 sq로 변수를 변경한다. 표본 데이터가 정규 분포를 따른다고 가정할 때 표준 편차 s는 χ 분포가 된다.s를 더 통합함으로써 우리는 매개변수로서 s를 제거하고 q의 측면에서만 재확대된 분포를 얻을 수 있다.

일반형식

확률밀도함수 fX 대해 범위확률밀도 fR 다음과 같다.[2]

즉, 분포에서 k를 끌어와 그 중 2가 r로 차이를 보이고, 나머지 k - 2가 모두 두 극단값 사이에 속할 확률을 더하는 것이다.u= -1 가 범위의 로우엔드인 u로 변경하고 FX fX 누적분포함수로 정의하면 방정식이 단순화될 수 있다.

유사한 통합형 제품을 소개하며, 통합형 신호에 따라 차별화하면

위와 같은 핵심을 회복해서 [a]마지막 관계가

왜냐하면 어떤 연속적인 cdf에 대해서도

정규 데이터에 대한 특수 양식

범위 분포는 표본 평균 주위의 신뢰 구간에 가장 자주 사용되며, 이는 중앙 한계 정리에 의해 점증적으로 정규 분포를 따른다.

정규 데이터에 대한 학생화 범위 분포를 생성하기 위해 먼저 일반 fX F에서X 표준 정규 분포에 대한 분포 함수 φ과 φ로 전환하고 변수 rs/q로 변경하며, 여기서 q는 스케일링 계수 s의해 r을 재스케일화하는 고정 인자:

q가 범위가 넓은 표준 편차의 수가 되도록 스케일링 계수 s를 표본 표준 편차로 선택한다.정규 데이터의 경우 ski 분산이고[b], ki 분포의 분포 함수S f는 다음과 같이 지정된다.

분포RS f와 f를 곱하고 표준 편차 s에 대한 의존성을 제거하기 위해 통합하면 정규 데이터에 대한 학생화된 범위 분포 함수를 얻을 수 있다.

어디에

q는 표준 편차로 측정한 데이터 범위의 폭이다.
ν은 표본 표준 편차를 결정하기 위한 자유도 수입니다.[c]
k는 범위 내에서 점을 구성하는 개별 평균 수입니다.

위의 섹션에 나와 있는 pdf에 대한 방정식은 사용에서 비롯된다.

외부 적분에서 지수 식을 대체한다.

메모들

  1. ^ 기술적으로, 그 관계는 다음 섹션에서 논의한 대로 정상 데이터에 대해 모든 곳에 있는 (+ )> 지점 에 대해서만 사실이지만, 균일하게 분포된 데이터와 같이 지원 범위가 상한 분포에는 해당되지 않는다.
  2. ^ "제곱"이 없다는 점에 유의하십시오.본문은 χ2 분포아니라 χ 분포를 가리킨다.
  3. ^ 일반적으로 = - 여기서 n은 범위의 값인 평균을 찾는 데 사용되는 모든 기준점의 총 수입니다.

참조

  1. ^ Lund, R.E.; Lund, J.R. (1983). "Algorithm AS 190: Probabilities and upper quantiles for the studentized range". Journal of the Royal Statistical Society. 32 (2): 204–210. JSTOR 2347300.
  2. ^ a b McKay, A.T. (1933). "A note on the distribution of range in samples of n". Biometrika. 25 (3): 415–420. doi:10.2307/2332292. JSTOR 2332292.
  3. ^ [1]
  4. ^ Pearson & Hartley(1970, 섹션 14.2)

추가 읽기

외부 링크