이산 균일 분포

Discrete uniform distribution
이산 제복
확률 질량 함수
Discrete uniform probability mass function for n = 5
n = 5 여기서 n = b - a + 1
누적분포함수
Discrete uniform cumulative distribution function for n = 5
표기법 { a, 또는 f{ }
매개변수 , 정수 b a
지원
PMF
CDF
평균
중앙값
모드 해당 없음
분산
왜도
엑스트라 쿠르토시스
엔트로피
MGF
CF
PGF

확률 이론통계에서 이산형 균일 분포는 한정된 수의 값이 동일하게 관측될 가능성이 있는 대칭 확률 분포로, n개 값의 모든 값이 동일한 확률 1/n을 가진다. "구체적인 균일 분포"를 말하는 또 다른 방법은 "동일하게 발생할 가능성이 있는 알려진 유한한 결과 수"일 것이다.

분리된 균일 분포의 간단한 예는 공정한 주사위를 던지는 것이다. 가능한 값은 1, 2, 3, 4, 5, 6이며, 주사위가 던져질 때마다 주어진 점수의 확률은 1/6이다. 주사위를 두 개 던져서 그 값을 더하면 모든 합이 같은 확률을 가지는 것은 아니기 때문에 결과 분포가 더 이상 균일하지 않다. 이와 같이 정수에 대한 이산형 균일분포를 설명하는 것이 편리하지만, 유한 집합에 대한 이산형 균일분포를 고려할 수도 있다. 예를 들어, 무작위 순열은 주어진 길이의 순열에서 균일하게 생성된 순열이며, 균일 스패닝 트리는 주어진 그래프의 스패닝 트리에서 균일하게 생성된 스패닝 트리다.

이산형 균일 분포 자체는 본질적으로 비모수적이다. 그러나 ab가 분포의 주요 매개변수가 되도록, 한 구간 [a,b]의 모든 정수로 일반적으로 값을 표시하는 것이 편리하다(종종 단일 매개변수 n으로 구간 [1,n]을 단순하게 고려한다). 이러한 규약을 사용하면 k ∈ [a,b]에 대해 이산형 균일 분포의 누적분포함수(CDF)를 다음과 같이 표현할 수 있다.

최대값 추정

예는 k 관측치의 표본이 1,, N 1의 균일한 분포에서 얻어진다고 설명하며, 문제는 알 수 없는 최대 N을 추정하는 것이다. 이 문제는 제2차 세계 대전 중 독일 탱크 생산량 추정치에 최대 추정치를 적용한 데 이어 독일 탱크 문제로 통한다.

최대값에 대한 균일 최소 분산 편중(UMVU) 추정기는 다음과 같다.

여기서 m표본 최대값이고 k표본 크기, 교체 없이 표본 추출한다.[1] 이는 최대 간격 추정의 매우 단순한 사례로 볼 수 있다.

이것은 다음과[1] 같은 차이가 있다.

따라서 약 의 표준 편차 표본 간 간격의 평균 크기, 위의 m {\tfrac }}}을를) 비교하십시오.

표본 최대값은 모집단 최대값에 대한 최대우도 추정기이지만 위에서 설명한 것처럼 편향적이다.

표본에 번호가 매겨지지 않지만 인식 가능하거나 표시가 가능한 경우, 대신 캡처-복잡 방법을 통해 모집단 크기를 추정할 수 있다.

무작위 순열

균일하게 분포된 무작위 순열의 고정점 수에 대한 확률 분포 계정은 렌컨츠 번호를 참조하십시오.

특성.

정수 범위에 걸친 균일한 분포의 계열(하나 또는 두 한계를 모두 알 수 없음)은 유한 차원 충분한 통계량, 즉 표본 최대값, 표본 최소값 및 표본 크기의 3배를 가지지만, 지지도가 모수에 따라 다르기 때문에 지수 분포 계열은 아니다. 지지가 매개변수에 의존하지 않는 가정의 경우, 피트만-쿠프만-다르무아 정리는 지수 가족만이 표본 크기가 증가함에 따라 치수가 경계되는 충분한 통계량을 가지고 있다고 명시한다. 따라서 균일한 분포는 이 정리의 한계를 보여주는 단순한 예다.

참고 항목

참조

  1. ^ a b Johnson, Roger (1994), "Estimating the Size of a Population", Teaching Statistics, 16 (2 (Summer)): 50–52, CiteSeerX 10.1.1.385.5463, doi:10.1111/j.1467-9639.1994.tb00688.x