동전이 공정한지 확인
Checking whether a coin is fair![]() |
통계에서, 동전이 공정한지 여부를 확인하는 문제는 첫째, 통계 추론의 기본 사상을 설명할 수 있는 간단한 문제를 제공하고, 둘째, 의사결정 이론을 포함한 다양한 경쟁적인 통계 추론 방법을 비교하는 데 사용될 수 있는 간단한 문제를 제공하는 데 중요하다.동전이 공정한지 여부를 확인하는 실제적인 문제는 충분히 많은 실험을 수행함으로써 쉽게 해결될 수 있지만, 통계와 확률 이론은 두 가지 유형의 문제에 대한 지침을 제공할 수 있다. 특히 시행해야 할 시험 횟수와 정확도에 대한 지침은 h로 나타날 확률을 추정하는 것이다.주어진 시험 샘플에서 파생된 eads.
페어 코인은 두 상태(일반적으로 "머리"와 "꼬리")가 있는 이상적인 무작위화 장치다.그것은 스포츠와 다른 상황에서 널리 사용되는 코인 플립을 기반으로 하며, 그것은 두 당사자에게 같은 승률을 주어야 한다.비록 후자가 비대칭적인 무게분포 때문에 약간 "불공정"할 수 있지만, 특수하게 설계된 칩 또는 보다 일반적으로 단순한 통화 동전이 사용되며, 이것은 한 국가가 다른 국가보다 더 자주 발생하게 하여 한 당사자에게 불공정한 이점을 줄 수 있다.[1]따라서 동전이 실제로 "공정"인지, 즉 동전이 던져질 때 양쪽에 떨어질 확률은 정확히 50%인지에 대한 실험이 필요할 수 있다.물론 일생 동안 한 번의 플립에만 영향을 미칠 것으로 예상될 수 있는 공정성으로부터의 임의적인 작은 편차를 배제하는 것은 불가능하다; 또한 불공정한 (또는 "편향된") 동전이 항상 20 플립에 정확히 10개의 헤드가 나타나는 것은 가능하다.따라서 공정성 시험은 일정 정도 공정성(일정한 최대 편향)에 대한 신뢰도만 확립해야 한다.보다 엄밀한 용어로, 문제는 베르누이 실험의 제한된 샘플만 주어지는 베르누이 공정의 매개변수를 결정하는 것이다.
서문
이 글은 동전이 공정한지 불공정한지를 결정하기 위한 실험 절차를 설명한다.이러한 실험 절차를 분석하는 통계적 방법은 많다.이 기사는 그들 중 두 명을 예시하고 있다.
두 가지 방법 모두 동전을 여러 번 던져 각 던지기 결과를 기록하는 실험(또는 시험)을 규정한다.그리고 나서 그 결과는 통계적으로 분석되어 동전이 "공정하지 않은" 것인지 아니면 "아마도 공정하지 않은" 것인지를 결정할 수 있다.
- 후방 확률밀도함수 또는 PDF(베이지안 접근법).초기에는 동전을 던졌을 때 특정 측면을 얻을 수 있는 진정한 확률은 알 수 없지만, 불확실성은 "사전 분포"로 표현된다.베이지안 추론 이론은 실험에서 얻은 정보를 나타내는 선행 분포와 우도 함수를 결합하여 후분포를 도출하는 데 사용된다.이 특정 동전이 "공정한 동전"일 확률은 실제적인 의미에서 "공정한"으로 계산될 수 있는 모든 확률을 나타내는 관련 간격에 걸쳐 후분포의 PDF를 통합함으로써 얻을 수 있다.
- 실제 확률 추정기(수시론적 접근법).이 방법은 실험자가 동전을 얼마든지 던지기로 결정할 수 있다고 가정한다.실험자는 먼저 요구되는 신뢰도와 허용 오차 한계를 결정한다.이 매개변수는 실험을 완료하기 위해 수행해야 하는 최소 토스 수를 결정한다.
이 두 가지 접근법 사이의 중요한 차이점은 첫 번째 접근법은 동전을 던졌던 이전의 경험에 어느 정도 무게를 주는 반면, 두 번째 접근법은 그렇지 않다는 것이다.그 경험의 질(신뢰성)에 따라 이전 경험에 어느 정도의 비중을 두어야 할 것인가 하는 문제는 신뢰도 이론에서 논의되고 있다.
후방 확률밀도함수
한 가지 방법은 베이지안 확률론의 후방 확률밀도함수를 계산하는 것이다.
테스트는 동전을 N번 던지며 관찰된 머리, h, 꼬리 수 t를 기록함으로써 수행된다.기호 H와 T는 실험에서 관찰되었을 수 있는 머리와 꼬리의 수를 각각 나타내는 보다 일반화된 변수를 나타낸다.따라서 N = H+T = h+t.
다음으로, 동전을 한 번 던질 때 헤드를 얻을 수 있는 실제 확률이 되도록 하자.이것이 조사되고 있는 동전의 재산이다.베이지스의 정리를 이용하여 h와 t를 조건부로 하는 r의 후확률밀도를 다음과 같이 표현한다.
여기서 g(r)는 0 - 1 범위에 있는 r의 이전 확률밀도분포를 나타낸다.
사전 확률밀도분포는 관측치가 없을 때 r의 분포에 대해 알려진 것을 요약한다.우리는 r의 이전 분포가 [0, 1] 구간에 걸쳐 균일하다고 가정할 것이다.즉, g(r) = 1. (실제로는 실제 동전에 대한 우리의 경험을 반영하기 위해 0.5 전후의 지역에서 훨씬 더 가중치가 높은 사전 분포를 가정하는 것이 더 적절할 것이다.)
헤드의 확률이 r과 같은 동전의 N 토스에서 헤드를 얻을 확률은 이항 분포에 의해 주어진다.
이를 이전 공식으로 대체하는 방법:
이것은 사실 베타 분포(이항 분포에 대한 이전의 결합)이며, 분모는 베타 함수의 관점에서 표현될 수 있다.
균일한 사전 분포를 가정했으며, h와 t는 정수이기 때문에, 이것은 또한 요인 측면에서도 기록될 수 있다.
예
예를 들어, N = 10, h = 7, 즉 동전을 10회 던지고 7 헤드를 얻도록 한다.
오른쪽 그래프는 10번의 토스에서 7개의 헤드를 얻었다는 점에서 r의 확률밀도함수를 보여준다.(주: r은 동전을 한 번 던질 때 앞면이 나올 확률이다.)
편향되지 않은 코인의 확률(이 목적을 위해 헤드가 내려올 확률은 45%에서 55% 사이인 코인으로 정의됨)
대립 가설(편향된 동전)과 비교할 때 작다.그러나 동전이 상당한 편향성을 가지고 있다고 믿게 할 만큼 작지 않다.이 확률은 동전이 균일한 사전 분배에 대응하여 공정했을 확률을 10%로 추정하는 것보다 약간 높다.동전이 무엇이고 그것이 어떻게 작용하는지에 대한 우리의 사전 지식을 반영하는 사전 분포를 사용하면, 후분포는 편향의 가설을 선호하지 않을 것이다.그러나 이 예에서 시행 횟수는 매우 적으며 시행 횟수가 많을수록 사전 분포의 선택은 다소 덜 목적적합할 것이다.)
균일 이전의 경우, 후방 확률 분포 f(r H = 7,T = 3)는 r = h / (h + t) = 0.7에서 최고점에 도달한다. 이 값을 r의 최대 authori(MAP) 추정치라고 한다.또한 이전의 균일성과 함께, 후분포 아래의 r의 기대값은 다음과 같다.
실제 확률 추정기
실제 값 r 에 대한 의 추정치는 추정기 = + 이 추정기에는 특정 신뢰 수준에서 - < E 의 오차 한계(E)가 있다. |
이 접근방식을 사용하여 동전을 던져야 하는 횟수를 결정하기 위해서는 다음 두 가지 매개변수가 필요하다.
- 신뢰 구간(Z)으로 표시되는 신뢰 수준
- 최대(허용 가능한) 오류(E)
Z값 | 신뢰수준 | 댓글 |
---|---|---|
0.6745 | 50.000% 수준의 자신감 부여 | 절반 |
1.0000 | 68.269% 수준의 자신감 부여 | 원 std dev |
1.6449 | 90.000% 수준의 자신감 부여 | "원 나인" |
1.9599 | 95.000% 수준의 신뢰감을 준다. | 95% |
2.0000 | 95.450% 수준의 신뢰도를 제공 | 2 std dev |
2.5759 | 99.000% 수준의 자신감 제공 | "2나인" |
3.0000 | 99.730% 수준의 자신감 제공 | 3 std dev |
3.2905 | 99.900% 수준의 자신감 제공 | "삼나인" |
3.8906 | 99.990% 수준의 자신감 제공 | "네인즈" |
4.0000 | 99.993% 수준의 자신감 제공 | 4 std dev |
4.4172 | 99.999% 수준의 자신감 제공 | "5나인" |
- 최대 오차(E)는 - < E 에 의해 정의된다. 서 p p는 헤드를 얻을 수 있는 추정 확률이다.참고: 은(헤드 획득의) 이 글의 이전 섹션의 r 과(와) 같은 실제 확률이다.
- 통계에서 표본 비율(p로 표시됨)의 추정치는 다음과 같은 표준 오차를 가진다.
여기서 n은 시행 횟수(이전 절에서 N으로 표시됨)이다.
이 표준 오차 s 의 함수는 p=( - )= p에서 최대치를 가진다 나아가 동전이 던져지는 경우에는 p가 0.5에서 멀지 않을 가능성이 높으므로 p=0.5를 다음과 같이 취하는 것이 합리적이다.
따라서 최대 오류(E) 값은
필요한 동전 던지기 횟수에 대한 해결, n
예
1. 0.01의 최대 오차가 필요한 경우 동전을 몇 번 던져야 하는가?
- = 신뢰도 68.27% 수준(Z=1)
- = 신뢰도 95.45% 수준(Z=2)
- = 신뢰도 99.90% 수준(Z=3.3)
2. 동전을 10000번 던졌을 경우, {\의 값에 대한 p p의 최대 오차는 얼마인가? (동전 투척에서 헤드를 얻을 실제 확률)
- = 68.27% 신뢰 수준(Z=1)
- = 95.45% 신뢰 수준(Z=2)
- = 신뢰도 99.90% 수준(Z=3.3)
3. 동전은 5961헤드(그리고 6039꼬리)의 결과로 12000번 던져진다.99.999%의 신뢰 수준을 원하는 경우 헤드를 얻을 수 있는 실제 확률)의 값은 어느 간격 내에 있는가?
이제 99.999% 신뢰 수준에 해당하는 Z 값을 찾으십시오.
이제 E를 계산하십시오.
따라서 r을 포함하는 간격은 다음과 같다.
기타 접근법
동전이 공정한지 여부를 확인하는 문제에 대한 다른 접근법은 의사결정 이론을 사용하여 이용할 수 있으며, 이러한 접근법은 주어진 의사결정의 결과를 설명하는 손실 함수 또는 효용 함수의 공식화가 필요할 것이다.(베이지안 접근법에서와 같이) 손실 함수나 사전 확률을 요구하지 않는 접근법은 "수용 표본 추출"[2]이다.
기타 응용 프로그램
동전이 공정한지를 결정하기 위한 위의 수학적 분석은 다른 용도에도 적용될 수 있다.예를 들면 다음과 같다.
- 특정(그러나 잘 정의된) 조건을 따르는 제품의 불량품 비율 결정.때때로 제품은 생산하기가 매우 어렵거나 비쌀 수 있다.또한, 그러한 제품을 시험할 때 파괴될 경우 최소 개수의 품목을 시험해야 한다.유사한 분석을 통해 제품 불량률의 확률밀도함수를 찾을 수 있다.
- 두 정당 투표.만약 상호 배타적인 선택이 두 개 밖에 없는 곳에서 소규모 무작위 표본 조사를 한다면, 이것은 편향된 동전을 사용하여 하나의 동전을 여러 번 던지는 것과 유사하다.따라서 실제 투표율에 대한 신뢰도를 결정하기 위해 유사한 분석을 적용할 수 있다. (만약 기권할 수 있다면, 그 분석을 고려해야 하며, 코인 플립 비유가 잘 지켜지지 않는다.)
- 많은 동물 종의 성비를 결정한다.모집단의 랜덤 표본을 추출할 때 소량 랜덤 표본(즉, 총 모집단에 비해 작음)을 추출할 경우, 분석은 동전 던지기에서 헤드를 얻을 확률을 결정하는 것과 유사하다.
참고 항목
참조
- ^ 그러나 튕기거나 빙글빙글 돌리기보다 동전이 잡히면 동전 던지기 결과를 편향하기 어렵다.참조Gelman, Andrew; Deborah Nolan (2002). "Teacher's Corner: You Can Load a Die, But You Can't Bias a Coin". American Statistician. 56 (4): 308–311. doi:10.1198/000313002605. S2CID 123597087.
- ^ Cox, D.R, Hinkley, D.V. (1974) 이론 통계(예 11.7), 채프먼 & 홀.ISBN 0-412-12420-3
- Guttman, Wilks 및 Hunter:John Wiley & Sons, Inc. (1971) ISBN 0-471-33770-6
- Devinder Sivia: 데이터 분석, 베이시안 자습서, 옥스퍼드 대학 출판부(1996) ISBN 0-19-851889-7