쿠폰 수집기 문제

Coupon collector's problem
쿠폰 수를 나타내는 그래프, n 대 모든 쿠폰을 수집하는 데 필요한 시행 횟수(예: 시간), E(T)

확률론에서 쿠폰수집자의 문제는 "모든 쿠폰을 모아서 이기는" 콘테스트를 기술한다.다음과 같은 질문을 던진다.시리얼 브랜드의 각 박스에 쿠폰이 들어 있고, 쿠폰 종류가 n개라면, 모든 쿠폰을 모으기 위해 t박스 이상을 사야 할 확률은 얼마인가?대안은 다음과 같다: 쿠폰이 n개인 경우, 각 쿠폰을 한 번 이상 추첨하기 전에 교체 쿠폰을 몇 개까지 추첨해야 할 것으로 예상하십니까?문제의 수학적 분석에 따르면 ( ( 에 따라 필요한 시험의 예상 횟수가 증가한다는 것을 알 수 있다[a] 예를 들어, n = 50일 경우, 쿠폰 50장을 모두 회수하는 데 평균 약 225회의[b] 시험이 소요된다.

해결책

기대치 계산

시간 T는 모든 n개의 쿠폰을 모으는 데 필요한 추첨 횟수로 하고, i - 1 쿠폰을 모은 후에는 i번째i 쿠폰을 모으는 시간으로 한다.그러면 = + + Tti 랜덤 변수로 생각한다. 쿠폰을 수집할 확률은 i= - (- 1)= n- + 임을 확인하십시오따라서 t 은(는) i = - + 1 {을(를) 가진 기하학적 분포가 있다 기대치:

여기서 Hn n번째 고조파 수입니다.고조파 숫자의 점근법을 사용하여 다음을 얻는다.

여기서 0 \gamma \ 오일러-마스체로니 상수이다.

마르코프 부등식을 사용하여 원하는 확률에 바인딩:

위 내용은 이미 쿠폰 일부를 회수했을 때 케이스 처리를 위해 약간 수정할 수 있다.k를 이미 수집된 쿠폰의 개수로 설정한 후:

k= (가) 되면 원래의 결과가 나온다.

분산 계산

랜덤 변수 ti 독립성을 사용하여 다음을 얻는다.

since (see Basel problem).

체비셰프 부등식을 사용하여 원하는 확률 제한:

꼬리 추정치

상부 꼬리에 대한 더 강력한 꼬리 추정치는 다음과 같이 구한다. i 은(는) 첫 r -th 쿠폰이 선택되지 않은 이벤트를 나타낸다.그러면

Thus, for , we have . Via a union bound over the coupons, we obtain

확장 및 일반화

  • 도날드 J. 뉴먼과 로렌스 셰프는 각 쿠폰의 m 카피를 수집해야 할 때 쿠폰 수집기의 문제를 일반화했다.각 쿠폰의 m 복사본이 수집되는 것은 Tm 처음이다.그들은 이 경우에 대한 기대가 다음을 충족한다는 것을 보여주었다.
여기 m은 고정되어 있다.m = 1일 때 우리는 기대치에 대한 더 이른 공식을 얻는다.
  • Erdős 및 Rényi에 의한 일반적인 일반화:
이것은 와 같다.
여기서 m은 수집할 쿠폰의 수를 나타내며, PJ 쿠폰 J 세트의 쿠폰을 받을 확률을 나타낸다.

참고 항목

메모들

  1. ^ 여기서 그리고 이 글 전체에서 "log"는 어떤 다른 베이스에 대한 로그가 아닌 자연 로그를 가리킨다.여기서 θ을 사용하면 큰 o 표기법이 발동된다.
  2. ^ E(50) = 50(1 + 1/2 + 1/3 + … + 1/50) = 224.9603, 쿠폰 50개를 모두 회수할 것으로 예상되는 시험 횟수이 예상 숫자에 대한 n + + / n\ nn+은(는) 이 경우 + + 1/ + 을 제공한다

참조

  1. ^ Flajolet, Philippe; Gardy, Danièle; Thimonier, Loÿs (1992), "Birthday paradox, coupon collectors, caching algorithms and self-organizing search", Discrete Applied Mathematics, 39 (3): 207–229, CiteSeerX 10.1.1.217.5965, doi:10.1016/0166-218x(92)90177-c

외부 링크