조건부 확률

Conditional probability

확률론에서 조건부 확률은 (가정, 추정, 주장 또는 증거에 의한) 다른 사건이 이미 [1]발생했다는 것을 고려할 때 사건의 발생 확률에 대한 척도이다.이 특정 방법은 다른 이벤트A와의 관계에서 발생하는 이벤트B에 의존합니다.이 경우 이벤트 B는 A에 대한 조건부 확률로 해석할 수 있다.관심 사건이 A이고 사건 B가 발생했다고 가정하거나 알려진 경우, "A가 주어진 B의 조건부 확률" 또는 "B 조건에서의 A의 확률"은 일반적으로 P(A B)[2] 또는 경우에 따라B P(A)로 표기된다.이는 A: (B ) (B ) P ( B)= B[3]와 교차하는 확률 B의 비율로도 이해할 수 있습니다.

예를 들어, 특정 사람이 특정 날짜에 기침이 날 확률은 5%에 불과할 수 있습니다.하지만 만약 우리가 그 사람이 아프다는 것을 알고 있거나 추측한다면, 그들은 기침을 할 가능성이 훨씬 더 높다.예를 들어, 몸이 좋지 않은 사람이 기침할 확률은 75%일 수 있으며, 이 경우 P(Cough) = 5%, P(Cough Sick) = 75%가 됩니다.이 예에서는 A와 B 사이에 관계가 있지만 A와 B 사이이러한 관계나 의존성은 필요하지 않으며 동시에 발생할 필요도 없다.

P(A B)는 P(A)(A의 무조건 확률)와 같을 수도 있고 아닐 수도 있다.P(A B) = P(A)이면 사건 A와 사건 B는 독립적이라고 한다. 이 경우, 두 사건에 대한 지식은 서로의 가능성을 바꾸지 않는다.P(A B)(A가 주어진 B의 조건부 확률)는 일반적으로 P(B A)와 다르다.예를 들어, 뎅기열이 있는 사람이면, 그 사람은 그 질병에 대해 양성으로 검사될 확률이 90%가 될 수 있다.이 경우 측정되는 것은 이벤트 B(뎅기열을 가진 경우)가 발생했을 때 B가 발생했을 때 A(양성으로 추정)의 확률은 90%이며, 단순히 P(A B) = 90%로 표기된다.대신 뎅기열 양성 반응이 나오면 허위 양성률이 높아 실제로 뎅기열에 걸릴 확률은 15%에 불과하다.이 경우, 사건 A(양성)가 발생한 경우 사건 B(뎅기열)의 확률은 15% 또는 P(B A) = 15%이다.이 두 가지 가능성을 거짓으로 동일시하면 기준금리 오류에서 흔히 볼 수 있는 다양한 추론 오류가 발생할 수 있다는 것이 이제 분명해져야 한다.

조건부 확률이 매우 유용한 정보를 제공할 수 있지만, 제한된 정보가 제공되거나 가까이 있는 경우가 많습니다.따라서, Bayes의 정리를 사용하여 조건부 확률을 반전 또는 변환하는 것이 유용할 수 ( ) ( A) P( ) \ P ( AB ) = p ( A ) = ( ) \ { ( B )[4] 다른 조건이다.

정의.

오일러 다이어그램을 사용한 조건부 확률의 그림.무조건 확률 P(A) = 0.30 + 0.10 + 0.12 = 0.52입니다.그러나 조건부 확률 P(AB1) = 1, P(AB2) = 0.12µ(0.12 + 0.04) = 0.75 및 P(AB3) = 0입니다.
트리 다이어그램에서 분기 확률은 상위 노드와 관련된 이벤트에 따라 달라집니다.(여기서 오버바는 이벤트가 발생하지 않음을 나타냅니다).
조건부 확률을 설명하는 벤 파이 차트

이벤트 조건 설정

콜모고로프 정의

확률공간의 시그마필드로부터의 2개이벤트 A와 B가, B의 무조건 확률이 0보다 클 경우(즉, PB) > 0), 주어진 B( (B P Bdisplaystyle P(A\mid Bd B가 발생하는 경우, 또는 B의 조건부 확률은 다음과 같습니다.A는 표본 공간이 제한되거나 축소된 실험 또는 랜덤 시행의 가능한 모든 결과 집합으로 가정합니다.조건부 확률은 이벤트 A와 B의 결합 교점 확률()(\ P(A B)\ P(\cap B비율(A와 B가 동시에 발생할 필요는 없지만)과 [2][6][7]B의 확률에 따라 구할 수 있습니다.

( B ) ( AB ) () \ P ( \ B ) = frac ( \ B ) } { P ( B )}

동일한 우도 결과로 구성된 표본 공간의 경우, 사건 A의 확률은 표본 공간에 있는 모든 결과의 수에 대한 A의 결과 수의 비율로 이해됩니다.다음으로 이 방정식은 세트A (\ A B 집합B에 대한 비율로 이해됩니다.위의 방정식은 단순한 이론적 결과가 아닌 정의입니다. B {displaystyle B { 양을 P B 'A조건부 확률'이라고 부릅니다.

확률의 공리로서

de Finetti와 같은 일부 저자는 확률의 공리로서 조건부 확률을 도입하는 것을 선호한다.

( B ) ( B ) () \ P ( \ B ) ( \

조건부 확률에 대한 이 방정식은 수학적으로 동일하지만 직관적으로 이해하기 쉬울 수 있습니다.이는 "B가 발생할 확률에 A가 발생할 확률을 곱한 것으로 해석할 수 있다. 단, B가 발생할 확률은 A와 B가 함께 발생할 확률과 동일하지만 반드시 동시에 발생할 필요는 없다"고 해석할 수 있다.추가적으로, 이것은 철학적으로 선호될 수 있다; 주관적 이론과 같은 주요 확률 해석에서 조건부 확률은 원시적 실체로 간주된다.또한 이 "곱셈 규칙"은 A 계산에 실질적으로 유용할 수 있으며, 상호 배타적 [8]대한 합산 공리와의 대칭성을 도입한다.

따라서 방정식을 조합하여의 새로운 표현을 찾을 수 있습니다.

조건부 사건의 확률로서

확률은 조건부 의 확률로 정의할 수 있습니다Goodman-Nguyen-Van Fraassen 조건부 이벤트는 다음과 같이 정의할 수 있다.

}) 및 B_})는 A 또는 상태 또는 요소를 나타냅니다.[9]

라는 것을 알 수 있다

콜모고로프의 조건부 [10]확률 정의를 충족합니다.

확률이 0인 사건에 대한 조건화

P P)= 정의에 따라 B P B 정의되지 않습니다.

가장 관심 있는 경우는 연속 랜덤 변수 X를 조건으로 특정 결과 x를 생성하는 랜덤 변수 Y입니다. B { { B=\{(는) 확률이 0이므로 조건화할 수 없습니다.

X를 정확히 x로 하는 대신 x에서 거리(\보다 가깝다고 가정할 수 있습니다. B { - < + } { B=\{\} 은 일반적으로 0이 아니므로 조건화할 수 있습니다.그러면 우리는 한계치를 취할 수 있다.

예를 들어, 2개의 연속 랜덤 변수 Y합동 f X , y )({y, L'Hopital 규칙Libniz 적분 규칙에 따라\\ 에 대한 차이점을 부여합니다.

결과 한계는 주어진 X의 Y의 조건부 확률 분포로, 분모인 f X( )(\0가 엄밀하게 양의 값일 때 존재합니다.

이 한계를 사용하여 정의되지 않은 P X P X 정의하는 은 유혹적이지만, 이는 일관된 방법으로 수행될 수 없습니다.특히 이벤트{ }({\{x\})와{ }({\{ 동일하지만 결과 한계는 [11]동일하지 않은 랜덤 변수 X W 및 x, w를 찾을 수 있습니다.

보렐-콜모고로프 역설은 기하학적 논거로 이것을 증명한다.

이산 랜덤 변수에 대한 조건화

X를 이산 랜덤 변수로 하고 가능한 결과를 V로 표시하자.예를 들어 X가 압연된 다이의 값을 나타내는 경우 V는 세트{,,, ,6 \, 3 5, 입니다. 표시를 위해 X가 이산 랜덤 변수이므로 V의 각 값이 0이 아닌 확률을 갖는다고 가정해 보겠습니다.

V x와 사건 A의 경우, 조건부 P(x x P X.

즉, xA라는 두 변수의 함수임을 알 수 있습니다.

고정 A의 경우, 임의의 Y (X ,) \ Y ( , )。 X 이 관측될 때마다 P( X ) \ P ( \ X )의 를 나타냅니다.

따라서 A가 주어진 X의 조건부 확률은 [ 구간에서 결과를 갖는 랜덤 변수 Y로 취급할 수 있으며, 총확률의 법칙에서 기대값은 A무조건적 확률과 같다.

부분 조건부 확률

부분 조건부 P B b , , B m P B_ 주어진 각 의 이벤트 에 관한 것입니다%와 다를 수 있는 플레이 b_}(신념도, 경험도).[12] 이러한 n{n\displaystyle}부분 조건부 확률 사건의 조건부로 예상 평균 발생 A{A\displaystyle}으로 정의될 수 있-bounded 조건을 충족할 경우 적절한 길이의 실험 반복에서 n{n\displaystyle}시험한다 Frequentistically, 부분 조건부 확률이 얼마나 있겠는가. 에서모든 확률 i b \ B _ { } \ _ {} i n n nn n nbedbedbedbedbedbedn의 테스트베드. 즉,

[12]

이를 바탕으로 부분 조건부 확률을 다음과 같이 정의할 수 있습니다.

서 b N \ \

Jeffrey 조건부화[13][14] 조건 사건이 파티션을 형성해야 하는 부분 조건부 확률의 특별한 경우입니다.

누군가가 두 개의 공정한 6면체 주사위를 몰래 굴린다고 가정하고, 우리는 그들의 합계가 5보다 크지 않다는 정보를 바탕으로 첫 번째 주사위의 페이스업 값이 2일 확률을 계산하려고 합니다.

  • D를 금형 1로 압연된 값이라고 하자1.
  • D를 금형 2의 압연값으로 한다2.

D = 2일 확률1

표 1은 두 주사위 값의 36개 조합의 표본 공간을 나타내며, 각각은 확률 1/36으로 발생하며, 빨간색과 어두운 회색 셀에 표시된 숫자12 D + D이다.

D1 = 36개 결과 중 정확히 6개 중 2개이므로 P(D1 = 2) =6/36 = 1/6:

표 1.
+ D2.
1 2 3 4 5 6
D1 1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12

D1 + D2 5 5일 확률

1 2는 36개 결과 중 정확히 10개에 대해 D + D2 5 5이므로 P(D1 + D2 5 5) = 10 36:

표 2
+ D2
1 2 3 4 5 6
D1 1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12

D + D2 5 5일1 때 D = 2일 확률1

표 3은 이 10가지 결과 중 3가지에 대해1 D = 2라는 것을 보여준다.

따라서 조건부 확률 P(D1 = 21 D+D2 5 5) = 3µ10 = 0.3:

표 3
+ D2
1 2 3 4 5 6
D1 1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12

여기서, 조건부 확률의 정의에 대한 앞의 표기법에서, 조건부 사건 B는 D + D25이고1, 사건 A1 D = 2이다.( AB ) ( ) / 10 / { P ( \ B ) = 3 display ( \ B ) } { ( A \ cap B ) } = / } { . 0 . 0 . 0 . 0 }}

추론에 사용

통계적 추론에서 조건부 확률은 새로운 [15]정보에 기초한 사건의 확률을 갱신하는 것이다.새로운 정보는 [1]다음과 같이 통합될 수 있습니다.

  • 예를 들어 (X,P)와 같이 표본 공간에 관심 있는 사건인 A가 있다고 가정합니다.
  • 이벤트 A가 이벤트 B가 이미 발생했거나 발생할 것임을 안다는 것은 이벤트 A가 B로 제한된다는 것을 의미한다. BA \ ) 。
  • B의 발생에 대한 지식이 없으면 A의 발생에 대한 정보는 P(A)가 된다.
  • A가 이벤트 B가 발생했거나 발생할 가능성이 있는 것을 알 확률은 P(B)에 대한 A의 B A B , 즉 B가 발생했을 확률입니다.
  • 그 결과, P(B > 0 및 그 이외의 경우 P) ( B ) / P \ P B) = P B) / .

이 접근 방식은 원래 확률 측도와 일관되고 모든 Kolmogorov 공리를 충족하는 확률 측도를 생성합니다.이 조건부 확률 측정은 X에 대한 A 확률의 상대적 크기가 B에 대해 유지된다고 가정함으로써도 발생할 수 있다(아래의 공식 도출 참조).

"증거" 또는 "정보"라는 표현은 일반적으로 확률의 베이지안 해석에 사용된다.조건화 이벤트는 조건화 이벤트에 대한 증거로 해석됩니다.즉, P(A)는 근거 E를 회계처리하기 전 A확률이고, P(A E)는 근거 E를 회계처리한 후 또는 업데이트된 P(A) 이후 A의 확률이다.이것은 위에서 설명한 첫 번째 정의인 빈도론 해석과 일치한다.

추론에 사용 예제

Morse 코드가 전송되면 수신된 "dot" 또는 "dash"가 잘못되었을 가능성이 있습니다.이는 메시지 전송에 대한 간섭으로 간주되는 경우가 많습니다.따라서, 「닷」을 송신할 때는, 예를 들면 「닷」이 수신되었을 가능성을 고려하는 것이 중요합니다.은 P( t t r d ) ( v e e d) ( t v d ) ( \ \ r e e e dot rece receive p ( \ ) \ this this this this 。} Morse 부호의 경우, 도트와 대시의 비율은 3:4이므로, "도트"와 "도트"의 확률은 ( t e t )= 7 ( e nt )= { ( \ ) { \ 7 \ 7 } } {\7}입니다대시로서 d는 1/10이고, 대시가 점으로 전송될 확률은 1/10입니다.그러면 Bayes 규칙을 하여 P( r d ) \ P ( \received ) 를 계산할 수 있습니다.

으로 P( n t d e i d){ P ( \ \ \received ) } 를 계산할 수 있습니다.

[16]

통계적 독립성

사건 A와 B의 교집합 확률이 A와 B의 확률 곱과 같을 경우 사건 A와 B는 통계적으로 독립적이라고 정의된다.

P(B)가 0이 아닌 경우, 이는 다음과 같은 문장과 동일합니다.

마찬가지로 P(A)가 0이 아니면

또한 동등합니다.파생된 형태가 더 직관적으로 보일 수 있지만 조건부 확률이 정의되지 않을 수 있고 선호되는 정의는 A와 B에서 대칭적이기 때문에 선호되는 정의는 아니다.독립성은 분리된 [17]사건을 의미하지 않는다.또한 독립 사건 쌍 [A B]와 변수 B가 주어졌을 때, 쌍은 제품이 [18]참일 경우 조건적으로 독립적이라고 정의된다는 점에 유의해야 한다.

이 정리는 여러 독립 이벤트가 관찰되는 응용 프로그램에서 유용할 수 있습니다.

독립 이벤트와 상호 배타적 이벤트

상호 독립적인 이벤트와 상호 배타적인 이벤트의 개념은 분리되고 구별됩니다.다음 표는 두 경우에 대한 결과를 대비시킨다(조건화 사건의 확률이 0이 아닌 경우).

통계적으로 독립되어 있는 경우 상호 배타적인 경우
0
0
0

사실, 상호 배타적 사건은 통계적으로 독립적일 수 없다(둘 다 불가능하지 않은 한). 왜냐하면 한 사건이 발생한다는 것을 아는 것은 다른 사건에 대한 정보를 제공하기 때문이다(특히 후자는 발생하지 않을 것이다).

일반적인 오류

이러한 오류들은 로버트 K와 혼동되어서는 안 된다.쇼프의 1978년 "조건부 오류"질문을 요구하는 반사실적 예를 다룬다.

조건부 확률이 역방향과 유사한 크기라고 가정합니다.

베이즈 정리의 기하학적 시각화.표에서 값 3, 1, 2, 6은 대응하는 각 조건과 경우의 상대적인 가중치를 나타낸다.그림은 각 메트릭에 포함된 표의 셀을 나타내며, 음영 처리된 각 그림의 분율일 가능성이 높습니다.이는 P(A B) P(B) = P(B A) P(A) 즉, P(A B) =P(B A) P(A)/P(B) . P(A) = P(B āA) P(A)/P(B) 등이라는 유사한 추론을 사용할 수 있다.

일반적으로 P(A B) p P(B A)라고 가정할 수 없다.이는 [19]통계에 매우 정통한 사람들에게도 음흉한 오류가 될 수 있다.P(A B)와 P(B A)의 관계는 베이즈의 정리에 의해 주어진다.

즉, P(B)/P(A) 1 1 또는 이에 상당하는 P(A) p P(B)일 경우에만 P(A) ( P(B)이다.

한계 확률과 조건부 확률이 유사한 크기라고 가정합니다.

일반적으로 P(A) p P(A B)라고 가정할 수 없다.이러한 확률은 총 확률의 법칙을 통해 연결됩니다.

여기서 이벤트 n})는 의 카운트 가능 파티션을 형성합니다.

이 오류는 선택 [20]편향으로 인해 발생할 수 있습니다.예를 들어 의료 클레임의 맥락에서 S는 상황(급성 조건) C의 결과로 후유증(만성 질환) S가 발생하는 사건이라고 가정한다C.H는 개인이 의학적 도움을 구하는 사건이라고 합시다.대부분의 경우 C가 S를 유발하지 않는다고 가정합니다(따라서 P(SC)가 낮습니다).또한 C로 인해 S가 발생한 경우에만 의학적 치료를 받는다고 가정합니다.따라서 환자의 경험상 의사는 P(SC)가 높다고 잘못 판단할 수 있습니다.의사가 실제로 관찰한 확률은 P(SC H)입니다.

과중량 또는 저중량 우선 순위

사전 확률을 부분적으로 또는 완전히 고려하지 않는 것을 기준금리 무시라고 한다.이전 확률과 반대로 불충분한 조정은 보수주의이다.

형식 파생

공식적으로, P(A B)는 표본 공간의 새로운 확률 함수에 따른 A의 확률로 정의되며, 따라서 B에 포함되지 않은 결과가 확률 0을 가지며 모든 원래 확률 [21][22]측도와 일치한다.

δ를 기본이벤트 {θ}의 샘플공간으로 하고, Pδ의 δ-대수에 대한 확률측도라고 한다.이벤트 B가 발생했다고 합니다.이를 반영하기 위해 {}}에 새로운 확률분포(조건부 표기로 표시)를 할당합니다.B에 포함되지 않는 모든 사건은 새로운 분포에서 null 확률을 가집니다.B의 사건의 경우, 두 가지 조건이 충족되어야 한다. 즉, B의 확률은 1이고 확률의 상대적 크기는 보존되어야 한다.전자는 확률 공리에 의해 요구되며, 후자는 새로운 확률 측도가 B의 확률이 1인 P의 유사성이어야 하므로 B에 포함되지 않는 모든 사건은 null 확률을 갖는다.따라서 일부 척도 계수 α의 경우 새로운 분포는 다음을 충족해야 한다.

Substituting 1 and 2 into 3 to select α:

So the new probability distribution is

Now for a general event A,

See also

References

  1. ^ a b Gut, Allan (2013). Probability: A Graduate Course (Second ed.). New York, NY: Springer. ISBN 978-1-4614-4707-8.
  2. ^ a b "Conditional Probability". www.mathsisfun.com. Retrieved 2020-09-11.
  3. ^ Dekking, Frederik Michel; Kraaikamp, Cornelis; Lopuhaä, Hendrik Paul; Meester, Ludolf Erwin (2005). "A Modern Introduction to Probability and Statistics". Springer Texts in Statistics: 26. doi:10.1007/1-84628-168-7. ISBN 978-1-85233-896-1. ISSN 1431-875X.
  4. ^ Dekking, Frederik Michel; Kraaikamp, Cornelis; Lopuhaä, Hendrik Paul; Meester, Ludolf Erwin (2005). "A Modern Introduction to Probability and Statistics". Springer Texts in Statistics: 25–40. doi:10.1007/1-84628-168-7. ISBN 978-1-85233-896-1. ISSN 1431-875X.
  5. ^ Reichl, Linda Elizabeth (2016). "2.3 Probability". A Modern Course in Statistical Physics (4th revised and updated ed.). WILEY-VCH. ISBN 978-3-527-69049-7.
  6. ^ Kolmogorov, Andrey (1956), Foundations of the Theory of Probability, Chelsea
  7. ^ "Conditional Probability". www.stat.yale.edu. Retrieved 2020-09-11.
  8. ^ Gillies, Donald (2000); "Philosophical Theories of Probability"; Routledge; Chapter 4 "The subjective theory"
  9. ^ Flaminio, Tommaso; Godo, Lluis; Hosni, Hykel (2020-09-01). "Boolean algebras of conditionals, probability and logic". Artificial Intelligence. 286: 103347. arXiv:2006.04673. doi:10.1016/j.artint.2020.103347. ISSN 0004-3702. S2CID 214584872.
  10. ^ Van Fraassen, Bas C. (1976), Harper, William L.; Hooker, Clifford Alan (eds.), "Probabilities of Conditionals", Foundations of Probability Theory, Statistical Inference, and Statistical Theories of Science: Volume I Foundations and Philosophy of Epistemic Applications of Probability Theory, The University of Western Ontario Series in Philosophy of Science, Dordrecht: Springer Netherlands, pp. 261–308, doi:10.1007/978-94-010-1853-1_10, ISBN 978-94-010-1853-1, retrieved 2021-12-04
  11. ^ Gal, Yarin. "The Borel–Kolmogorov paradox" (PDF).
  12. ^ a b c Draheim, Dirk (2017). "Generalized Jeffrey Conditionalization (A Frequentist Semantics of Partial Conditionalization)". Springer. Retrieved December 19, 2017.
  13. ^ Jeffrey, Richard C. (1983), The Logic of Decision, 2nd edition, University of Chicago Press, ISBN 9780226395821
  14. ^ "Bayesian Epistemology". Stanford Encyclopedia of Philosophy. 2017. Retrieved December 29, 2017.
  15. ^ Casella, George; Berger, Roger L. (2002). Statistical Inference. Duxbury Press. ISBN 0-534-24312-6.
  16. ^ "Conditional Probability and Independence" (PDF). Retrieved 2021-12-22.
  17. ^ Tijms, Henk (2012). Understanding Probability (3 ed.). Cambridge: Cambridge University Press. doi:10.1017/cbo9781139206990. ISBN 978-1-107-65856-1.
  18. ^ Pfeiffer, Paul E. (1978). Conditional Independence in Applied Probability. Boston, MA: Birkhäuser Boston. ISBN 978-1-4612-6335-7. OCLC 858880328.
  19. ^ Paulos, J.A. (1988) Innumeracy: Mathematical Illiteracy and its Consequences, Hill and Wang. ISBN 0-8090-7447-8 (p. 63 et seq.)
  20. ^ F. Thomas Bruss Der Wyatt-Earp-Effekt oder die betörende Macht kleiner Wahrscheinlichkeiten (in German), Spektrum der Wissenschaft (German Edition of Scientific American), Vol 2, 110–113, (2007).
  21. ^ George Casella and Roger L. Berger (1990), Statistical Inference, Duxbury Press, ISBN 0-534-11958-1 (p. 18 et seq.)
  22. ^ Grinstead and Snell's Introduction to Probability, p. 134

External links