Kolmogorov–Smirnov test

Kolmogorov–Smirnov test
콜모고로프-스미르노프 통계량의 그림. 빨간색 선은 모형 CDF, 파란색 선은 경험적 CDF, 검은색 화살표는 KS 통계량입니다.

통계학에서 Kolmogorov–Smirnov 검정(K–S 검정 또는 KS 검정)은 주어진 기준 확률 분포에서 표본이 나왔는지 여부를 검정하는 데 사용할 수 있는 1차원 확률 분포인 연속형(또는 불연속형)의 동등성에 대한 비모수 검정(2.2절 참조), 또는 두 표본이 동일한 분포에서 나왔는지 여부를 검정합니다(2-표본 K–S 검정). 직관적으로 이 검정은 "만약 표본들이 그 확률 분포로부터 추출되었다면 우리는 이런 표본들을 보게 될 가능성이 얼마나 될까요?" 또는 두 번째 경우에 정성적으로 답할 수 있는 방법을 제공합니다. "같은 (그러나 알려지지 않은) 확률 분포에서 추출된 두 개의 샘플 세트를 보게 될 가능성은 얼마나 될까요?" 이름은 안드레이 콜모고로프니콜라이 스미르노프의 이름을 따서 지어졌습니다.

Kolmogorov–Smirnov 통계량은 표본의 경험적 분포 함수와 기준 분포의 누적 분포 함수 사이 또는 두 표본의 경험적 분포 함수 사이의 거리를 정량화합니다. 이 통계량의 귀무 분포는 표본이 기준 분포(일 표본의 경우)에서 추출되거나 표본이 동일한 분포(2 표본의 경우)에서 추출된다는 귀무 가설 하에 계산됩니다. 단일 표본의 경우 귀무 가설 하에서 고려된 분포는 연속적이거나(2절 참조), 순수하게 이산적이거나 혼합적일 수 있습니다(2.2절 참조). 2-표본의 경우( 3 참조) 귀무 가설 하에서 고려된 분포는 연속형 분포이지만 그렇지 않은 경우에는 제한이 없습니다. 그러나 두 표본 검정은 표본 간 불연속성, 이질성 및 종속성을 허용하는 보다 일반적인 조건에서도 수행할 수 있습니다.[1]

2-표본 K–S 검정은 두 표본의 경험적 누적 분포 함수의 위치와 모양의 차이에 모두 민감하기 때문에 두 표본을 비교하는 데 가장 유용하고 일반적인 비모수 방법 중 하나입니다.

Kolmogorov–Smirnov 검정은 적합도 검정의 역할을 하도록 수정할 수 있습니다. 분포의 정규성 검정의 특수한 경우에는 표본을 표준화하여 표준 정규 분포와 비교합니다. 이는 기준 분포의 평균과 분산을 표본 추정치와 동일하게 설정하는 것과 같으며, 이를 사용하여 특정 기준 분포를 정의하면 검정 통계량의 귀무 분포가 변경되는 것으로 알려져 있습니다(추정 모수를 사용한 검정 참조). 다양한 연구를 통해 이 보정된 형태에서도 샤피로보다 테스트가 정상성 테스트에 덜 강력하다는 사실이 밝혀졌습니다.Wilk 검정 또는 Anderson-Darling 검정.[2] 그러나 이러한 다른 테스트에는 각각의 단점이 있습니다. 예를 들어 샤피로호는-Wilk 검정은 동일한 값이 많은 표본에서는 잘 작동하지 않는 것으로 알려져 있습니다.

1-표본 Kolmogorov–Smirnov 통계량

n개의 독립적이고 동일하게 분포된 (즉, 동일하게 분포된) 순서 관측치 X대한n 경험적 분포 함수 F는 다음i 같이 정의됩니다.

-∞, ] (X i ) {\X_{i})}은 지시 함수이며, Xi≤ x {\}\leq x}인경우 이고, 그렇지 않은 경우 0입니다.

주어진 누적 분포 함수 F(x)에 대한 Kolmogorov–Smirnov 통계량은

여기서 sup은x 거리 집합의 최댓값입니다. 직관적으로 통계량은 모든 x 값에 걸쳐 두 분포 함수 간의 절대적인 차이가 가장 큽니다.

Glivenko-Cantelli 정리에 의해 표본이 분포 F(x)에서 나온다면, 이 무한대로 갈Dn 거의 확실하게 0으로 수렴합니다. 콜모고로프는 이 수렴 속도를 효과적으로 제공함으로써 이 결과를 강화했습니다(콜모고로프 분포 참조). 돈스커의 정리는 더욱 강력한 결과를 제공합니다.

실제로 통계량은 귀무 가설을 적절히 기각하기 위해 상대적으로 많은 수의 데이터 점(Anderson-Darling 검정 통계량과 같은 다른 적합도 기준에 비해)을 필요로 합니다.

콜모고로프 분포

콜모고로프 배포판의 PDF 삽화

콜모고로프 분포는 랜덤 변수의 분포입니다.

여기서 B(t)는 브라운 다리입니다. K누적분포함수는 다음과[3] 같이 주어집니다.

이는 Jacobi theta 함수ϑ 01(z = 0;τ =2 i x 2 / π) {\displaystyle \vartheta _{01}(z = 0;\tau = 2ix^{2}/\pi )}으로도 표현할 수 있습니다. 콜모고로프-스미르노프 검정 통계량의 형태와 귀무 가설에 따른 점근 분포는 Andrey Kolmogorov에 의해 발표되었습니다. Nikolai Smirnov에 의해 배포된 표가 출판되는 동안.[5] 유한 표본에서 검정 통계량의 분포에 대한 반복 관계를 사용할 수 있습니다.[4]

표본이 가설 분포 F(x)에서 나온다는 귀무 가설 하에서,

B(t)는 브라운 다리입니다. F가 연속이면 귀무 가설 아래에서 F에 의존하지 않는 콜모고로프 분포로 수렴합니다. 이 결과는 콜모고로프 정리라고도 할 수 있습니다.

이 유한할 때 K의 정확한 cdf에 대한 근사치로서 이 한계의 정확도는 그다지 인상적이지 않습니다. = n = 1000}인 경우에도 해당하는 최대 는 약 % {\displaystyle 0.9입니다. 이 오류는 % 로 증가합니다 {\ 100는 6이고, n 10 {\displaystyle n 10}일 때는 허용할 수 없는 7% {\displaystyle 7~\%}입니다. x 을(를) 대체하는 매우 간단한 방법은

Jacobi theta 함수의 인수에서는 이러한 오류를 각각 0 0 로 줄입니다. 이러한 정확도는 일반적으로 모든 실제 응용 분야에서 적합한 것으로 간주됩니다.[6]

적합도 검정 또는 Kolmogorov-Smirnov 검정은 Kolmogorov 분포의 임계값을 사용하여 구성할 수 있습니다. 테스트는 n → ∞ n\\infty .}수준 α\alpha}에서 귀무 가설을 기각할 때 점근적으로 유효합니다.

Kα 위치는

이 검정의 점근 검정력은 1입니다.

n {\ 및 x x에 대한 cdf ⁡(n ≤ ) displaystyleleq x)} 또는 그 보체를 계산하는 빠르고 정확한 알고리즘은 다음에서 사용할 수 있습니다.

  • [7] 그리고 C와 자바의 코드가 있는 연속 널 분포를 찾을 수 있습니다.[7]
  • [9] 통계 계산을 위한 R 프로젝트의 KS 일반 패키지에 구현된 순수한 이산, 혼합 또는 연속적인 널 분포의 경우, 주어진 표본에 대해 KS 시험 통계치와 그 p-값도 계산합니다. 대체 C++ 구현은 에서 사용할 수 있습니다.[9]

추정 모수를 사용한 검정

데이터 X에서i F(x)의 형태 또는 매개변수가 결정된 경우 이러한 방식으로 결정된 임계값은 유효하지 않습니다. 이런 경우 몬테카를로나 다른 방법이 필요할 수도 있지만 일부 경우를 위해 표가 준비되어 있습니다. 검정 통계량과 정규 분포지수 분포에 대한 임계값에 대한 필요한 수정에 대한 세부 정보가 발표되었으며,[11] 이후 간행물에는 검벨 분포도 포함되어 있습니다.[12] 릴리포스 검정은 정규 분포에 대한 특수한 경우를 나타냅니다. 로그 변환은 Kolmogorov 검정 데이터가 정규 분포에서 왔다는 가정에 맞지 않는 것처럼 보이는 경우를 극복하는 데 도움이 될 수 있습니다.

추정된 모수를 사용하면 어떤 추정 방법을 사용해야 하는지에 대한 질문이 발생합니다. 일반적으로 이 방법은 최대 우도 방법이지만, 예를 들어 정규 분포 MLE의 경우 시그마의 바이어스 오차가 큽니다. 순간 적합 또는 KS 최소화를 사용하는 것은 임계 값에 큰 영향을 미치고 테스트 전력에도 약간의 영향을 미칩니다. KS 검정을 통해 df = 2인 스튜던트-T 데이터에 대해 데이터가 정규인지 여부를 결정해야 하는 경우 H(데이터는 정규이므로 척도에 대한 표준 편차를 사용)를 기반으로 한 ML 추정은 최소 KS 적합보다 훨씬 큰 KS 거리를 제공합니다. 이 경우 표본 표준 편차가 T-2 데이터의 경우 매우 클 수 있지만 KS 최소화를 사용하면 H를0 거부하기에는 여전히 너무 낮은 KS를 얻을 수 있으므로 MLE의 경우 H를0 거부해야 합니다. Student-T의 경우 MLE가 아닌 KS 견적으로 수정된 KS 테스트가 실제로 KS 테스트를 약간 더 나쁘게 만듭니다. 그러나 다른 경우에는 이렇게 수정된 KS 테스트가 약간 더 좋은 테스트 파워로 이어집니다.[citation needed]

이산 및 혼합 귀무 분포

F 감소하지 않고 오른쪽 연속이며 점프 수가 셀 수 있는(가능하면 무한히 많은) 경우 KS 테스트 통계량은 다음과 같이 표현할 수 있습니다.

의 오른쪽 연속에서- ≥ tF(F^{-1}(geq - F ≤ x {\1}(Fleq x} 이므로, 의 분포는 널 분포 F에 따라 달라집니다 즉, 연속적인 경우처럼 더 이상 분포가 없습니다. 따라서 F(x F가 C++[9]와 R언어의 KS 일반 패키지로 구현된 순수하게 이산적이거나 혼합된 경우 의 정확하고 점근적인 분포를 계산할 수 있는 빠르고 정확한 방법이 개발되었습니다. 함수들은 disc_ks_test(), mixed_ks_test() 그리고. cont_ks_test() 또한 순수하게 이산, 혼합 또는 연속형의 널 분포와 임의의 표본 크기에 대한 KS 검정 통계량과 p-값을 계산합니다. 이산 널 분포와 작은 표본 크기에 대한 KS 테스트와 그 p-값도 R 언어의 dgof 패키지의 일부로 계산됩니다. SAS가 포함된 주요 통계 패키지 PROC NPAR1WAY ,[14]스타타 ksmirnov [15] KS 검정은 {\ 연속적이라는 가정 하에 실행되며, 이는 Null 분포가 실제로 연속적이지 않은 경우 더 보수적입니다( 참조).

2-표본 Kolmogorov–Smirnov 검정

2-표본 Kolmogorov–Smirnov 통계량의 그림입니다. 빨간색과 파란색 선은 각각 경험적 분포 함수에 해당하고 검은색 화살표는 2-표본 KS 통계량입니다.

Kolmogorov–Smirnov 검정을 사용하여 두 개의 기본 1차원 확률 분포가 서로 다른지 여부를 검정할 수도 있습니다. 이 경우 Kolmogorov–Smirnov 통계량은

서 F F 각각 제1 및 제2 샘플의 경험적 분포 함수이고, 최상위 함수입니다.

큰 표본의 경우, 귀무 가설은 레벨 에서 기각됩니다.

여기서 각각 첫 번째 및 두 번째 표본의 크기입니다. 가장 일반적인 의 α 에 대해 의 값이 아래 표에 나와 있습니다.

0.20 0.15 0.10 0.05 0.025 0.01 0.005 0.001
1.073 1.138 1.224 1.358 1.48 1.628 1.731 1.949

그리고[19] 일반적으로

상태가 알 수 있도록

여기서도 표본 크기가 클수록 최소 한계에 민감하게 반응합니다. 주어진 표본 크기 비율(: m = displaystyle m = n})의 경우 최소 한계는 역제곱근에 따라 표본 크기가 조정됩니다.

2-표본 검정에서는 두 데이터 표본이 동일한 분포에서 나오는지 여부를 확인합니다. 이것은 일반적인 분포가 무엇인지(예: 정규 분포인지 여부)를 지정하지 않습니다. 이번에도 임계 값의 표가 발행되었습니다. 일변량 Kolmogorov–Smirnov 검정의 단점은 두 분포 함수 사이의 가능한 모든 유형의 차이에 대해 민감하게 반응하도록 고안되었기 때문에 그다지 강력하지 않다는 것입니다. 일부는 원래 위치와 척도를 동시에 비교하기 위해 제안된 쿠코니 테스트가 두 분포 함수를 비교할 때 콜모고로프-스미르노프 테스트보다 훨씬 더 강력할 수 있다고 주장합니다[20][21].

비대칭 효과를 감지하고 자연 실험을 연구하기 위해 두 표본 KS 테스트가 경제학에 적용되었습니다.[22]

분포 함수의 모양에 대한 신뢰 한계 설정

Kolmogorov–Smirnov 검정은 일반적으로 주어진 F(x)가 F(xn)의 기본 확률 분포인지 여부를 검정하는 데 사용되지만 절차를 뒤집어서 F(x) 자체에 대한 신뢰 한계를 제공할 수 있습니다. P(D > D) = α가 되도록 검정 통계량 D의 임계값을 선택하면 F(x) 주변의 너비 ±D 밴드가 확률 1 - α의 F(x)를 완전히 포함하게 됩니다.

여러 차원의 콜모고로프-스미르노프 통계량

무분포 다변량 Kolmogorov–Smirnov 적합도 검정은 Justel, Pena 및 Zamar(1997)에 의해 제안되었습니다.[23] 검정은 Rosenblatt의 변환을 사용하여 구축된 통계량을 사용하며, 이변량의 경우 이를 계산하기 위한 알고리즘이 개발됩니다. 어떤 차원에서도 쉽게 계산할 수 있는 대략적인 테스트도 제시됩니다.

유사한 검정을 다변량 데이터에 적용하려면 Kolmogorov-Smirnov 검정 통계량을 수정해야 합니다. 두 합동 누적 분포 함수 간의 최대 차이가 일반적으로 모든 보완 분포 함수의 최대 차이와 동일하지 않기 때문에 이는 간단하지 않습니다. 따라서 < < Y )x < Xland y < Y)} 또는 Pr(X < x ∧ Y > y) {\displaystyle \Pr(X < x\land Y> y)} 또는 다른 두 가지 가능한 배열 중 어느 것을 사용하는지에 따라 최대 차이가 달라집니다. 어떤 사람은 사용된 테스트의 결과가 어떤 선택을 했는지에 따라 달라지지 않아야 한다고 요구할 수 있습니다.

위의 우려를 충족하는 Kolmogorov–Smirnov 통계를 더 높은 차원으로 일반화하는 한 가지 접근법은 두 샘플의 cdf를 가능한 모든 순서와 비교하고 결과 KS 통계 세트 중 가장 큰 값을 취하는 것입니다. 차원적으로 2 - 1개의d 그러한 순서가 있습니다. 이러한 변화 중 하나는 피코크[24](3D 버전은 고셋[25] 참조) 때문이고, 다른 하나는 파사노와 프란체스키니[26](비교 및 계산 세부 사항은 Lopes et al. 참조) 때문입니다.[27] 검정 통계량에 대한 임계값은 시뮬레이션을 통해 얻을 수 있지만 합동 분포의 종속 구조에 따라 달라집니다.

한 차원에서 콜모고로프-스미르노프 통계는 소위 별 불일치 D와 동일하므로 다른 고유 KS는 단순히 D를 더 높은 차원에서도 사용하는 것입니다. 불행히도, 별의 불일치는 고차원적으로 계산하기 어렵습니다.

2021년에는 통계적 검정에 필요한 다변량 KS 검정통계의 꼬리확률 추정 문제를 단순화한 다변량 KS 검정통계의 기능적 형태를 제안하였습니다. 다변량 사례의 경우i, F가 k개의 변수가 있는 확률 분포에서 i번째 연속 한계이면 다음과 같습니다.

따라서 한계 분포는 한계 분포에 의존하지 않습니다.[1]

구현

Kolmogorov–Smirnov 테스트는 많은 소프트웨어 프로그램에서 구현됩니다. 이들 대부분은 표본 추출된 1개 및 2개 검정을 모두 구현합니다.

  • Mathematica는 Kolmogorov Smirnov Test를 가지고 있습니다.
  • MATLAB의 통계 도구 상자에는 1-표본 및 2-표본 Kolmogorov–Smirnov 검정에 대해 각각 kstestkstest2가 있습니다.
  • R 패키지 "KS 일반"[10]은 임의, 이산형, 혼합형 또는 연속형 귀무 분포 하에서 KS 테스트 통계치와 그 p-값을 계산합니다.
  • R의 통계 기본 패키지는 "stats" 패키지에 test asks.test {stats}을(를) 구현합니다.
  • SAS는 PROC NPAR1에서 테스트를 구현합니다.WAY 절차.
  • Python에서 SciPy 패키지는 scipy.stats.kstest 함수에 테스트를 구현합니다.[28]
  • SYSTAT (SPSS Inc., Chicago, IL)
  • JavaApache Commons에서 제공하는 이 테스트를 구현합니다.[29]
  • KNIME에는 위의 Java 구현을 기반으로 이 테스트를 구현하는 노드가 있습니다.[30]
  • 줄리아는 패키지 가설을 가지고 있습니다.ExactOneSampleK 함수를 사용하여 tests.jl테스트(x::추상 벡터 {<:Real}, d::일변량 분포).[31]
  • StatsDirect(StatsDirect Ltd, 영국 맨체스터)는 모든 일반적인 변형을 구현합니다.
  • Stata(Stata Corporation, College Station, TX)는 ksmirnov(Kolmogorov–Smirnov-분포 동등성 검정) 명령에서 검정을 구현합니다.[32]
  • PSPP는 테스트를 KOLMOGOROV-SMIRNOV(또는 KS 바로가기 기능 사용)로 구현합니다.
  • Excel용 Real Statistics Resource Pack은 테스트를 KSCRIT 및 KSPRROB로 실행합니다.[33]

참고 항목

참고문헌

  1. ^ a b Naaman, Michael (2021). "On the tight constant in the multivariate Dvoretzky-Kiefer-Wolfowitz inequality". Statistics and Probability Letters. 173: 109088. doi:10.1016/j.spl.2021.109088. S2CID 233844405.
  2. ^ Stephens, M. A. (1974). "EDF Statistics for Goodness of Fit and Some Comparisons". Journal of the American Statistical Association. 69 (347): 730–737. doi:10.2307/2286009. JSTOR 2286009.
  3. ^ Marsaglia G, Tsang WW, Wang J (2003). "Evaluating Kolmogorov's Distribution". Journal of Statistical Software. 8 (18): 1–4. doi:10.18637/jss.v008.i18.
  4. ^ a b Kolmogorov A (1933). "Sulla determinazione empirica di una legge di distribuzione". G. Ist. Ital. Attuari. 4: 83–91.
  5. ^ Smirnov N (1948). "Table for estimating the goodness of fit of empirical distributions". Annals of Mathematical Statistics. 19 (2): 279–281. doi:10.1214/aoms/1177730256.
  6. ^ Vrbik, Jan (2018). "Small-Sample Corrections to Kolmogorov–Smirnov Test Statistic". Pioneer Journal of Theoretical and Applied Statistics. 15 (1–2): 15–23.
  7. ^ a b Simard R, L'Ecuyer P (2011). "Computing the Two-Sided Kolmogorov–Smirnov Distribution". Journal of Statistical Software. 39 (11): 1–18. doi:10.18637/jss.v039.i11.
  8. ^ Moscovich A, Nadler B (2017). "Fast calculation of boundary crossing probabilities for Poisson processes". Statistics and Probability Letters. 123: 177–182. arXiv:1503.04363. doi:10.1016/j.spl.2016.11.027. S2CID 12868694.
  9. ^ a b c Dimitrova DS, Kaishev VK, Tan S (2020). "Computing the Kolmogorov–Smirnov Distribution when the Underlying cdf is Purely Discrete, Mixed or Continuous". Journal of Statistical Software. 95 (10): 1–42. doi:10.18637/jss.v095.i10.
  10. ^ a b c Dimitrova, Dimitrina; Kaishev, Vladimir; Tan, Senren (2 October 2020). "KSgeneral: Computing P-Values of the KS Test for (Dis)Continuous Null Distribution". cran.r-project.org/web/packages/KSgeneral/index.html.
  11. ^ Pearson, E. S.; Hartley, H. O., eds. (1972). Biometrika Tables for Statisticians. Vol. 2. Cambridge University Press. pp. 117–123, Tables 54, 55. ISBN 978-0-521-06937-3.
  12. ^ Shorack, Galen R.; Wellner, Jon A. (1986). Empirical Processes with Applications to Statistics. Wiley. p. 239. ISBN 978-0-471-86725-8.
  13. ^ Arnold, Taylor B.; Emerson, John W. (2011). "Nonparametric Goodness-of-Fit Tests for Discrete Null Distributions" (PDF). The R Journal. 3 (2): 34\[Dash]39. doi:10.32614/rj-2011-016.
  14. ^ "SAS/STAT(R) 14.1 User's Guide". support.sas.com. Retrieved 14 April 2018.
  15. ^ "ksmirnov — Kolmogorov–Smirnov equality-of-distributions test" (PDF). stata.com. Retrieved 14 April 2018.
  16. ^ Noether GE (1963). "Note on the Kolmogorov Statistic in the Discrete Case". Metrika. 7 (1): 115–116. doi:10.1007/bf02613966. S2CID 120687545.
  17. ^ Slakter MJ (1965). "A Comparison of the Pearson Chi-Square and Kolmogorov Goodness-of-Fit Tests with Respect to Validity". Journal of the American Statistical Association. 60 (311): 854–858. doi:10.2307/2283251. JSTOR 2283251.
  18. ^ Walsh JE (1963). "Bounded Probability Properties of Kolmogorov–Smirnov and Similar Statistics for Discrete Data". Annals of the Institute of Statistical Mathematics. 15 (1): 153–158. doi:10.1007/bf02865912. S2CID 122547015.
  19. ^ 크누스, D.E., 컴퓨터 프로그래밍의 기술, 제2권(세미너리 알고리즘), 제3판, Addison Wesley, Reading Mass, 1998.
  20. ^ Marozzi, Marco (2009). "Some Notes on the Location-Scale Cucconi Test". Journal of Nonparametric Statistics. 21 (5): 629–647. doi:10.1080/10485250902952435. S2CID 120038970.
  21. ^ Marozzi, Marco (2013). "Nonparametric Simultaneous Tests for Location and Scale Testing: a Comparison of Several Methods". Communications in Statistics – Simulation and Computation. 42 (6): 1298–1317. doi:10.1080/03610918.2012.665546. S2CID 28146102.
  22. ^ Monge, Marco (2023). "Two-Sample Kolmogorov-Smirnov Tests as Causality Tests. A narrative of Latin American inflation from 2020 to 2022". 17 (1): 68–78. {{cite journal}}: 저널 인용 요구사항 journal= (도와주세요)
  23. ^ Justel, A.; Peña, D.; Zamar, R. (1997). "A multivariate Kolmogorov–Smirnov test of goodness of fit". Statistics & Probability Letters. 35 (3): 251–259. CiteSeerX 10.1.1.498.7631. doi:10.1016/S0167-7152(97)00020-5.
  24. ^ Peacock J.A. (1983). "Two-dimensional goodness-of-fit testing in astronomy". Monthly Notices of the Royal Astronomical Society. 202 (3): 615–627. Bibcode:1983MNRAS.202..615P. doi:10.1093/mnras/202.3.615.
  25. ^ Gosset E. (1987). "A three-dimensional extended Kolmogorov–Smirnov test as a useful tool in astronomy}". Astronomy and Astrophysics. 188 (1): 258–264. Bibcode:1987A&A...188..258G.
  26. ^ Fasano, G.; Franceschini, A. (1987). "A multidimensional version of the Kolmogorov–Smirnov test". Monthly Notices of the Royal Astronomical Society. 225: 155–170. Bibcode:1987MNRAS.225..155F. doi:10.1093/mnras/225.1.155. ISSN 0035-8711.
  27. ^ Lopes, R.H.C.; Reid, I.; Hobson, P.R. (23–27 April 2007). The two-dimensional Kolmogorov–Smirnov test (PDF). XI International Workshop on Advanced Computing and Analysis Techniques in Physics Research. Amsterdam, the Netherlands.
  28. ^ "scipy.stats.kstest". SciPy v1.7.1 Manual. The Scipy community. Retrieved 26 October 2021.
  29. ^ "KolmogorovSmirnovTest". Retrieved 18 June 2019.
  30. ^ "New statistics nodes". Retrieved 25 June 2020.
  31. ^ "Nonparametric tests · HypothesisTests.jl".
  32. ^ "ksmirnov — Kolmogorov –Smirnov equality-of-distributions test" (PDF). Retrieved 18 June 2019.
  33. ^ "Kolmogorov–Smirnov Test for Normality Hypothesis Testing". Retrieved 18 June 2019.

더보기

  • Daniel, Wayne W. (1990). "Kolmogorov–Smirnov one-sample test". Applied Nonparametric Statistics (2nd ed.). Boston: PWS-Kent. pp. 319–330. ISBN 978-0-534-91976-4.
  • Eadie, W.T.; D. Drijard; F.E. James; M. Roos; B. Sadoulet (1971). Statistical Methods in Experimental Physics. Amsterdam: North-Holland. pp. 269–271. ISBN 978-0-444-10117-4.
  • Stuart, Alan; Ord, Keith; Arnold, Steven [F.] (1999). Classical Inference and the Linear Model. Kendall's Advanced Theory of Statistics. Vol. 2A (Sixth ed.). London: Arnold. pp. 25.37–25.43. ISBN 978-0-340-66230-4. MR 1687411.
  • Corder, G. W.; Foreman, D. I. (2014). Nonparametric Statistics: A Step-by-Step Approach. Wiley. ISBN 978-1-118-84031-3.
  • Stephens, M. A. (1979). "Test of fit for the logistic distribution based on the empirical distribution function". Biometrika. 66 (3): 591–595. doi:10.1093/biomet/66.3.591.

외부 링크