확률밀도함수
Probability density function확률론에서, 연속 랜덤 변수의 밀도 함수(PDF)는 표본 공간(랜덤 변수에 의해 취해진 가능한 값의 집합)의 주어진 표본(또는 점)에서의 값이 랜덤 변수의 값이 다음과 같은 상대적인 가능성을 제공하는 함수이다.그 샘플.[2][3]확률 밀도는 단위 길이당 확률이다. 즉, 연속 랜덤 변수가 특정 값을 취할 절대 우도는 0인 반면(시작할 수 있는 값의 무한한 세트가 있기 때문에), 두 개의 다른 샘플에서 PDF 값은 랜덤의 특정 추첨에서 추론하는 데 사용될 수 있다.변수 - 랜덤 변수가 다른 표본에 비해 한 표본에 가까울 확률이 얼마나 더 높은지 나타냅니다.
보다 정확한 의미에서 PDF는 임의의 값을 취하는 것이 아니라 랜덤 변수가 특정 값의 범위 내에 들어갈 확률을 지정하기 위해 사용됩니다.이 확률은 해당 범위에 걸친 이 변수의 PDF의 적분에 의해 제공됩니다. 즉, 밀도 함수 아래 수평 축 위 영역과 범위의 가장 낮은 값과 가장 큰 값 사이의 영역에 의해 제공됩니다.확률 밀도 함수는 모든 면에서 음이 아니며 전체 공간에 대한 적분은 1입니다.
"확률 분포 함수"[4]와 "확률 함수"[5]라는 용어는 확률 밀도 함수를 나타내기 위해 가끔 사용되어 왔다.그러나 이러한 사용은 확률론자와 통계학자들 사이에서 표준적이지 않습니다.다른 소스에서는 확률분포가 일반적인 값의 집합에 대한 함수로 정의되거나 누적분포함수를 참조하거나 밀도가 아닌 확률질량함수(PMF)일 수 있는 경우 "확률분포함수"를 사용할 수 있다."밀도 함수" 자체는 확률 질량 함수에도 사용되므로 더 큰 [6]혼동을 일으킨다.그러나 일반적으로 PMF는 이산 랜덤 변수(카운터블 집합의 값을 취하는 랜덤 변수)의 컨텍스트에서 사용되는 반면 PDF는 연속 랜덤 변수의 컨텍스트에서 사용됩니다.
예
특정 종의 박테리아가 일반적으로 4시간에서 6시간 정도 산다고 가정해 보자.박테리아가 정확히 5시간 살 확률은 0과 같다.많은 박테리아가 약 5시간 동안 살지만 정확히 5.00에 박테리아가 죽을 가능성은 없다.그러나 5시간에서 5.01시간 사이에 박테리아가 죽을 확률은 정량화할 수 있다.답이 0.02(즉, 2%)라고 가정합니다.그러면 5시간에서 5.001시간 사이에 박테리아가 죽을 확률은 약 0.002가 될 것이다. 왜냐하면 이 시간 간격은 이전의 10분의 1이기 때문이다.5시간에서 5.0001시간 사이에 박테리아가 죽을 확률은 약 0.0002일 것입니다.
이 예에서는 비율(간격 중에 사망할 확률) / (간격의 지속 시간)이 거의 일정하며 시간당 2(또는 2시간−1)와 같습니다.예를 들어, 5.01시간 간격에서 사망할 확률은 0.02이고 (0.02 확률 / 0.01시간) = 2시간입니다−1.이 2시간을−1 약 5시간에 사망할 확률 밀도라고 합니다.따라서 세균이 5시간 후에 죽을 확률은 (2시간−1)dt로 표기할 수 있다.이것은 5시간 정도의 아주 작은 시간 내에 박테리아가 죽을 확률입니다.여기서 dt는 이 기간의 지속 시간입니다.예를 들어, 5시간 이상이지만 (5시간 + 1나노초)보다 짧은 수명은 (2시간−1)×(1나노초) 6 6×10이다−13(단위 변환 3.6×10나노초12 = 1시간).
f(5시간) = 2시간인−1 확률밀도함수 f가 있다.시간 간격의 f의 적분은 박테리아가 그 창에서 죽을 확률이다.
절대 연속 일변량 분포
확률 밀도 함수는 절대 연속 일변량 분포와 가장 일반적으로 연관되어 있습니다.랜덤 X({X})는 f_를 가집니다.서 f })는 다음과 같은 경우 음이 아닌 르베그 적분 가능 함수입니다.
F X가 XX의 누적분포함수인 :
직감적으로 f (x ) ( \ f _ { X ( x ) , 는X 가 작은 간격x , + \ , , x + dx에 들어갈 이라고 할 수 있습니다.
형식적 정의
(이 정의는 확률의 측정 이론 정의를 사용하여 확률 분포로 확장될 수 있습니다.)
한 무작위 변수 X값을(X, A){\displaystyle({{X}},{{A}\mathcal}\mathcal)}(측정 가능한 하위 집합이 보렐 집합과 보통 Rn{\displaystyle \mathbb{R}^{n}})확률 분포로(X, A){\displaystyle에 그 조치 X∗P({\와 같이 있는 측정 가능한 우주에서{X\displaystyle}.m {\ ( 의 기준 에 대한X(\ X의 밀도 {\는 라돈-니코디엠 도함수이다.
즉, f는 다음과 같은 특성을 가진 측정 가능한 함수이다.
논의
위의 연속 일변량 사례에서 기준 측도는 르베그 측도입니다.이산 랜덤 변수의 확률 질량 함수는 표본 공간(일반적으로 정수 집합 또는 일부 부분 집합)에 대한 계수 측정과 관련된 밀도입니다.
임의의 측정을 기준으로 밀도를 정의할 수 없습니다(예: 연속 랜덤 변수의 기준으로 카운트 측정을 선택할 수 없음).게다가, 그것이 존재할 때, 그 밀도는 거의 유일하며, 이는 그러한 두 밀도가 거의 모든 곳에서 일치한다는 것을 의미합니다.
상세 정보
확률과 달리 확률 밀도 함수는 1보다 큰 값을 취할 수 있습니다. 예를 들어 구간 [0, 1/2]의 균일한 분포는 0 µ x † 1/2에 대한 확률 밀도 f(x) = 2를 가지며 f(x) = 0을 갖습니다.
표준 정규 분포에는 확률 밀도가 있습니다.
랜덤 변수 X가 주어지고 분포가 확률 밀도 함수 f를 허용하면 X의 기대값(기대값이 존재하는 경우)은 다음과 같이 계산될 수 있습니다.
모든 확률 분포가 밀도 함수를 갖는 것은 아닙니다. 이산 랜덤 변수의 분포가 그렇지 않으며 칸토어 분포가 이산 성분이 없음에도 불구하고 개별 점에 양의 확률을 할당하지 않습니다.
분포는 그 누적분포함수 F(x)가 절대적으로 연속적인 경우에만 밀도함수를 가진다.이 경우:F는 거의 모든 면에서 미분 가능하며, 그 도함수는 확률 밀도로 사용될 수 있습니다.
확률 분포가 밀도를 허용하면 모든 1점 집합 {a}의 확률은 0이 됩니다. 유한 집합과 계산 가능한 집합도 마찬가지입니다.
두 확률 밀도 f와 g는 르베그 측정값 0에서만 다를 경우 정확하게 동일한 확률 분포를 나타냅니다.
통계물리학 분야에서는 확률밀도함수의 정의로서 누적분포함수와 확률밀도함수의 도함수와의 관계에 대한 비정형 재구성이 일반적으로 사용된다.이 대체 정의는 다음과 같습니다.
dt가 무한히 작은 숫자일 경우 X가 구간(t, t + dt)에 포함될 확률은 f(t) dt와 같거나 다음과 같습니다.
이산 분포와 연속 분포 간의 링크
Dirac 델타 함수를 사용하여 일반화된 확률 밀도 함수를 사용하여 연속 부분과 이산 부분을 모두 포함하는 랜덤 변수뿐만 아니라 특정 이산 랜덤 변수를 나타낼 수 있습니다.(이것은 위에서 정의한 의미에서의 확률 밀도 함수에서는 가능하지 않습니다.분포를 사용하여 수행할 수 있습니다.)예를 들어 Rademacher 분포를 갖는 이항 이산 랜덤 변수를 고려합니다. 즉, 확률로 값에 -1 또는 1을 취합니다.각각 1개씩 2개씩.이 변수와 관련된 확률 밀도는 다음과 같습니다.
보다 일반적으로 이산 변수가 실수 중에서 n개의 다른 값을 취할 수 있는 경우 관련 확률 밀도 함수는 다음과 같습니다.
이것은 이산적이고 연속적인 확률 분포의 처리를 실질적으로 통합한다.위의 식을 사용하면 확률의 연속 분포를 위해 주어진 공식에서 시작하여 이러한 이산 변수의 통계적 특성(평균, 분산 및 첨도 등)을 결정할 수 있습니다.
밀도 패밀리
확률밀도함수(및 확률질량함수)는 매개변수화, 즉 지정되지 않은 매개변수로 특징지어지는 것이 일반적이다.예를 들어, 정규 분포는 평균과 분산의 관점에서 모수화되며, 각각μ {\와 2 {\^{로 표시되며, 밀도 패밀리를 구한다.
파라미터는 상수이기 때문에 패밀리 내의 다른 랜덤 변수의 특성을 제공하기 위해 다른 파라미터의 관점에서 밀도를 재매개하는 것은 단순히 새로운 파라미터 값을 기존 파라미터 값 대신 공식에 대입하는 것을 의미합니다.
다중 변수와 관련된 밀도
연속 랜덤 변수1 X, ..., X의n 경우 집합 전체에 관련된 확률 밀도 함수를 정의할 수도 있습니다. 종종 공동 확률 밀도 함수라고 합니다.이 밀도 함수는 변수1 X, ..., Xn 값의 n차원 공간에 있는 도메인 D에 대해 설정 변수의 실현이 도메인 D 내에 있을 확률은 다음과 같이 n개의 변수의 함수로 정의된다.
F(x1, ..., xn) = Pr(X1 x1 x, ..., Xn xn x)가 벡터(X1, ..., Xn)의 누적 분포 함수라면, 결합 확률 밀도 함수는 부분 도함수로 계산할 수 있다.
한계 밀도
i = 1, 2, ..., n의 경우 f(xi)를 변수 X와i 관련된 확률 밀도 함수라고 합니다Xi.이를 한계 밀도 함수라고 하며, 다른 n - 1 변수의 모든 값에 적분하여 랜덤 변수1 X, ..., X와n 관련된 확률 밀도로부터 추론할 수 있습니다.
인디펜던스
연속 랜덤 변수1 X, ..., X가n 접합 밀도를 허용하는 경우 모두 다음과 같은 경우에만 서로 독립적입니다.
결과
n개의 랜덤 변수 벡터의 결합 확률 밀도 함수를 하나의 변수 n개의 함수의 곱에 포함할 수 있는 경우
예
이 기본적인 예는 두 변수 집합의 함수의 단순한 경우 다차원 확률 밀도 함수의 위의 정의를 보여줍니다.R {\style 을(를) 2차원 좌표 랜덤 벡터(X, Y)라고 합니다. 양의 x 및 y의 1/4 평면에서 R {\을 (를) 얻을 확률은 과 같습니다.
확률밀도함수의 랜덤 변수 함수 및 변수 변화
랜덤 변수(또는 벡터) X의 확률 밀도 함수를 f(x)로X 지정하면 일부 변수 Y = g(X)의 확률 밀도 함수를 계산할 수 있다(그러나 종종 필요하지 않음).이를 "변수 변경"이라고도 하며 알려진(예: 균일한) 난수 생성기를 사용하여 임의 형상g(X) f = f의Y 난수 변수를 생성하는 데 실제로 사용됩니다.
기대값 E(g(X))를 구하기 위해서는 먼저 새로운 랜덤 변수 Y = g(X)의 확률 밀도g(X) f를 찾아야 한다고 생각하는 것은 유혹적이다.단, 컴퓨팅이 아닌
두 적분의 값은 X와 g(X)가 모두 실제로 확률 밀도 함수를 갖는 모든 경우에 동일합니다.g가 일대일 함수일 필요는 없습니다.어떤 경우에는 후자의 적분이 전자보다 훨씬 쉽게 계산된다.무의식 통계학자의 법칙을 참조하십시오.
스칼라에서 스칼라로
g: {\ g \을 단조 함수라고 하면, 그 결과 밀도 함수는 다음과 같습니다.
여기서−1 g는 역함수를 나타낸다.
이는 변수 변경 시 미분 영역에 포함되는 확률이 불변해야 한다는 사실에서 비롯됩니다.그것은,
단조롭지 않은 함수의 경우 y에 대한 확률 밀도 함수는 다음과 같습니다.
벡터 대 벡터
x가 접합 밀도 f를 갖는 n차원 랜덤 변수라고 가정합니다.y = H(x)일 경우, 여기서 H는 분사가능함수이며, y는 밀도 g:
예를 들어, 2차원 경우 x = (x1, x2)에서 변환 H는2 y1 = H(x, x2−1), y = H(x1, x22)로112, 역수1 x = H1−1(y1, y2), x2 = H(y1, y2)로 지정된다고 가정합니다.y = (y1, y2)에 대한 접합 분포에는 밀도가[8] 있습니다.
벡터와 스칼라 연결
: {\ V : \ \ } 、 {\ X} 、 \ \X} be be of of of of of of of of ofof of of of of of of of of of of of of of of of )는Dirac 델타 함수입니다의 공식을 사용하여 f를 할 수 있습니다 Y (X) \ Y의 확률 밀도 함수로서, 다음과 같이 지정됩니다.
실증:
Z{ Z를 확률 밀도 Z ( ){)=\즉, 0과 같은 상수)를 갖는 접힌 랜덤 변수라고 합니다.랜덤 X~ 및 H(\ H를 다음과 같이 정의합니다.
H는 바이젝티브 매핑이며 H- 1 H의 제이코비안은 다음과 같이 주어진다.
주 대각선에 1이 있는 상위 삼각 행렬이므로 행렬식은 1입니다.이전 섹션의 변수 정리의 변화를 적용하면 다음과 같은 것을 얻을 수 있습니다.
이 x(\ x에 비해 제한하면 원하는 확률 밀도 함수로 이어집니다.
독립 랜덤 변수의 합계
각각 확률 밀도 함수를 갖는 두 개의 독립 랜덤 변수 U와 V의 합계의 확률 밀도 함수는 다음과 같은 개별 밀도 함수의 합입니다.
밀도1 U, ..., U를N 사용하여 N개의 독립 랜덤 변수의 합계에 대한 이전 관계를 일반화할 수 있습니다.
이는 독립 랜덤 변수의 몫에 대한 아래 예시와 유사하게 Y = U + V 및 Z = V와 관련된 변수의 이원 변화에서 도출할 수 있습니다.
독립 랜덤 변수의 곱 및 몫
각각 확률 밀도 함수를 갖는 두 개의 독립적인 랜덤 변수 U와 V가 주어졌을 때, 제품 Y = UV 및 몫 Y = U/V의 밀도는 변수의 변화를 통해 계산할 수 있습니다.
예:몫분포
두 개의 독립 랜덤 변수 U 및 V의 몫 Y = U/V를 계산하려면 다음 변환을 정의합니다.
그 후 U,V에서 Y,Z로의 변수 변화에 의해 접합밀도 p(y,z)를 산출할 수 있으며, 접합밀도로부터 Z를 소외시킴으로써 Y를 도출할 수 있다.
역변환은
이 변환의 야코비안 행렬 J VY, { Y,의 절대값은 다음과 같습니다.
다음과 같이 됩니다.
그리고 Y의 분포는 Z를 주변화함으로써 계산할 수 있습니다.
이 방법은 결정적으로 U,V에서 Y,Z로의 변환이 비사적이어야 한다.위의 변환은 Z를 V에 직접 매핑할 수 있고 주어진 V에 대한 비율 U/V는 단조롭기 때문에 이 조건을 충족합니다.이는 U + V, U - V 및 제품 UV의 합계에 대해서도 마찬가지입니다.
동일한 방법을 사용하여 여러 독립 랜덤 변수의 다른 함수의 분포를 계산할 수 있습니다.
예:두 표준 정규의 몫
두 개의 표준 정규 변수 U와 V가 주어졌을 때, 몫은 다음과 같이 계산될 수 있습니다.첫째, 변수에는 다음과 같은 밀도 함수가 있습니다.
위와 같이 변환합니다.
그 결과, 다음과 같이 됩니다.
「 」를 참조해 주세요.
레퍼런스
- ^ "AP Statistics Review - Density Curves and the Normal Distributions". Archived from the original on 2 April 2015. Retrieved 16 March 2015.
- ^ Grinstead, Charles M.; Snell, J. Laurie (2009). "Conditional Probability - Discrete Conditional" (PDF). Grinstead & Snell's Introduction to Probability. Orange Grove Texts. ISBN 978-1616100469. Retrieved 2019-07-25.
- ^ "probability - Is a uniformly random number over the real line a valid distribution?". Cross Validated. Retrieved 2021-10-06.
- ^ 확률분포함수 PlanetMath 2011-08-07 Wayback Machine에서 아카이브됨
- ^ MathWorld에서의 확률 함수
- ^ Ord, J.K.(1972) 주파수 분포 패밀리, 그리핀.ISBN 0-85264-137-0 (예를 들어 표 5.1 및 예 5.4)
- ^ Devore, Jay L.; Berk, Kenneth N. (2007). Modern Mathematical Statistics with Applications. Cengage. p. 263. ISBN 978-0-534-40473-4.
- ^ David, Stirzaker (2007-01-01). Elementary Probability. Cambridge University Press. ISBN 978-0521534284. OCLC 851313783.
추가 정보
- Billingsley, Patrick (1979). Probability and Measure. New York, Toronto, London: John Wiley and Sons. ISBN 0-471-00710-2.
- Casella, George; Berger, Roger L. (2002). Statistical Inference (Second ed.). Thomson Learning. pp. 34–37. ISBN 0-534-24312-6.
- Stirzaker, David (2003). Elementary Probability. ISBN 0-521-42028-8. 7장부터 9장까지는 연속형 변수에 대한 내용입니다.
외부 링크
- Ushakov, N.G. (2001) [1994], "Density of a probability distribution", Encyclopedia of Mathematics, EMS Press
- Weisstein, Eric W. "Probability density function". MathWorld.