비모수 통계량

Nonparametric statistics

비모수 통계량모수화확률 분포 군만을 기반으로 하지 않는 통계량입니다(모수의 일반적인 예는 평균과 분산).비모수 통계량은 분포가 없거나 지정된 분포를 가지지만 분포의 모수가 지정되지 않은 것을 기준으로 합니다.비모수 통계량에는 기술 통계량통계 추론이 모두 포함됩니다.비모수 검정은 모수 검정의 가정이 [1]위반될 때 종종 사용됩니다.

정의들

"비모수 통계"라는 용어는 특히 다음과 같은 두 가지 방법으로 부정확하게 정의되었다.

  1. 비모수의 첫 번째 의미는 확률 분포의 특정 모수군에 속하는 데이터에 의존하지 않는 기술을 포함합니다.

    여기에는 다음이 포함됩니다.

    • 데이터가 주어진 모수 계열의 확률 분포에서 추출된다는 가정에 의존하지 않는 무분포 방법.따라서 이는 파라메트릭 통계의 반대이다.
    • 비모수 통계량(통계량은 표본에 대한 함수로 정의되며 모수에 대한 종속성이 없음).

    관측치순위를 기반으로 하는 순서 통계량은 이러한 통계량의 한 예입니다.

    다음은 Kendall'[2]s에서 인용한 것입니다.

    통계 가설은 관측 가능한 랜덤 변수의 동작과 관련이 있습니다.예를 들어, 정규 분포에 지정된 평균과 분산이 있다는 가설(a)은 통계적이며, (b) 평균은 있지만 지정되지 않은 분산이 있다는 가설(c) 평균과 분산이 모두 정규 형식이라는 가설(c) 마지막으로, 지정되지 않은 두 개의 Cont에 대한 가설(d)도 통계적입니다.불연속 분포는 동일합니다.

    예제 (a)와 (b)에서 관측치의 기초가 되는 분포가 특정 형태(정규 분포)로 간주되었고 가설은 모수 중 하나 또는 둘 모두의 값과 전적으로 관련이 있다는 것을 알게 될 것이다.그러한 가설을 명백한 이유로 파라메트릭이라고 한다.

    가설 (c)은 가설의 진술에 매개변수 값이 지정되지 않았기 때문에 다른 성질의 가설이었다. 우리는 합리적으로 그러한 가설을 비모수적 가설이라고 부를 수 있다.가설(d)도 비모수적이지만 분포의 기본 형식조차 지정하지 않으므로 이제 분포 없는 것으로 합리적으로 칭할 수 있습니다.이러한 차이에도 불구하고, 통계 문헌은 "비모수"라는 라벨을 방금 "분포 없음"이라고 한 테스트 절차에 일반적으로 적용하므로, 유용한 분류가 상실된다.

  2. 비모수적 의미의 두 번째에는 모형의 구조가 고정되어 있다고 가정하지 않는 기법이 포함됩니다.일반적으로 모델의 크기는 데이터의 복잡성을 수용할 수 있도록 커집니다.이러한 기술에서는 일반적으로 개별 변수가 모수 분포에 속하는 것으로 가정되며 변수 간의 연결 유형에 대한 가정도 이루어집니다.이러한 기술에는 특히 다음이 포함됩니다.
    • 비모수 회귀 분석 - 변수 간 관계 구조가 비모수적으로 처리되지만 모형 잔차의 분포에 대한 모수적 가정이 있을 수 있는 모형화입니다.
    • 디리클레 프로세스에 기초한 모델과 같은 비모수적 계층적 베이지안 모델은 데이터에 맞는 잠복 변수의 수가 필요에 따라 증가하도록 허용하지만 개별 변수가 여전히 모수 분포를 따르고 잠복 변수의 성장 속도를 제어하는 과정도 모수 분포를 따른다.

응용 프로그램 및 목적

비모수적 방법은 순위가 매겨진 모집단(예: 별 1개에서 별 4개를 받는 영화 리뷰)을 연구하는 데 널리 사용됩니다.데이터에 순위는 있지만 선호도 평가와 같이 명확한 수치 해석이 없는 경우 비모수적 방법을 사용해야 할 수 있다.측정 수준의 측면에서 비모수 방법을 사용하면 순서형 데이터가 생성됩니다.

비모수적 방법은 가정 횟수가 적기 때문에 해당 모수적 방법보다 적용 범위가 훨씬 넓어집니다.특히 해당 출원에 대해 잘 알려지지 않은 상황에서 적용될 수 있습니다.또한 더 적은 가정에 의존하기 때문에 비모수적 방법이 더 강력합니다.

비모수적 방법을 사용하는 또 다른 이유는 단순성입니다.경우에 따라서는 파라메트릭 방법을 사용하는 것이 정당하다고 하더라도 비파라메트릭 방법을 사용하는 것이 더 쉬울 수 있습니다.이러한 단순성과 견고성 때문에 일부 통계학자들은 비모수 방법을 부적절한 사용과 오해의 여지가 적은 것으로 보고 있다.

비모수 검정의 적용 가능성과 견고성 향상에는 대가가 따른다. 파라메트릭 테스트가 적절한 경우 비모수 검정의 전력은 감소한다.즉, 동일한 신뢰도로 결론을 도출하려면 더 큰 표본 크기가 필요할 수 있습니다.

비모수 모델

비모수 모형은 모형 구조가 선험적으로 지정되지 않고 대신 데이터에서 결정된다는 점에서 모수 모형과 다릅니다.비모수라는 용어는 그러한 모델에 매개변수가 완전히 부족하다는 것을 의미하는 것이 아니라 매개변수의 수와 특성이 유연하고 사전에 고정되지 않았다는 것을 의미한다.

방법들

비모수(또는 분포가 없는) 추정 통계 방법은 모수 통계와 달리 평가 대상 변수의 확률 분포에 대한 가정을 하지 않는 통계 가설 테스트를 위한 수학적 절차이다.가장 자주 사용되는 테스트는 다음과 같습니다.

  • 유사성 분석
  • Anderson-Darling 검정: 주어진 분포에서 표본을 추출했는지 여부를 검정합니다.
  • 통계 부트스트랩 방법: 통계의 정확도/샘플링 분포를 추정합니다.
  • Cochran의 Q: 결과가 0/1인 랜덤화 블럭 설계의 k개 처리의 효과가 동일한지 검정
  • Cohen의 카파: 범주형 항목에 대한 평가자 간 합치 측정
  • 순위별 Friedman 이원 분산 분석: 랜덤화된 블럭 설계에서 k개의 처리 효과가 동일한지 검정
  • Kaplan-Meier: 수명 데이터에서 생존 함수를 추정, 관측 중단 모델링
  • Kendall's tau: 두 변수 간의 통계적 의존성 측정
  • Kendall's W: 라우터 간 합의의 0과 1 사이의 측도
  • Kolmogorov-Smirnov 검정: 주어진 분포에서 표본을 추출했는지 또는 두 표본이 동일한 분포에서 추출되었는지 여부를 검정합니다.
  • Kruskal-Wallis 순위별 일원 분산 분석: > 2개의 독립 표본이 동일한 분포에서 추출되었는지 검정
  • Kuiper 검정: 주어진 분포에서 표본을 추출하고 요일과 같은 주기적 변동에 민감한지 여부를 검정합니다.
  • 로그랭크 검정: 우측으로 치우친 두 관측 중단 표본의 생존 분포를 비교합니다.
  • Mann-Whitney U 또는 Wilcoxon 순위 합 검정: 주어진 대립 가설과 비교하여 두 표본이 동일한 분포에서 추출되었는지 여부를 검정합니다.
  • McNemar 검정: 이분법 특성 및 일치하는 피험자 쌍이 있는 2 × 2 분할표에서 행과 열의 주변 주파수가 동일한지 여부를 검정한다.
  • 중위수 검정: 중위수가 같은 분포에서 두 표본이 추출되었는지 여부를 검정합니다.
  • Pitman's 치환 검정: 가능한 모든 레이블 재배열을 검사하여 정확한 p 값을 산출하는 통계적 유의성 검정
  • 등급 제품: 복제된 마이크로 어레이 실험에서 차등 발현 유전자를 검출합니다.
  • Siegel-Tukey 검정: 두 그룹 간의 척도 차이 검정
  • 부호 검정: 일치하는 쌍 표본이 중위수가 같은 분포에서 추출되는지 여부를 검정합니다.
  • Spearman 순위 상관 계수: 단조 함수를 사용하여 두 변수 간의 통계적 의존성을 측정합니다.
  • 제곱 순위 검정: 둘 이상의 표본에서 분산의 동일성을 검정합니다.
  • Tukey-Duckworth 검정: 순위를 사용하여 두 분포의 동일성을 검정합니다.
  • Wald-Wolfowitz 실행 테스트: 시퀀스의 요소가 상호 독립적/랜덤인지 테스트
  • Wilcoxon 부호 순위 검정: 일치하는 쌍 표본이 평균 순위가 다른 모집단에서 추출되는지 여부를 검정합니다.

역사

초기 비모수 통계에는 중위수(13세기 이전, 에드워드 라이트의 추정에 사용, 1599년, 중위수 history 역사 참조)와 출생 시 인간 성비 분석에서 존 아르부스노트(1710년)의 부호 검정(1710년)이 포함된다(사인 검정 history [3][4]역사 참조).

「 」를 참조해 주세요.

메모들

  1. ^ Pearce, J; Derrick, B (2019). "Preliminary testing: The devil of statistics?". Reinvention: An International Journal of Undergraduate Research. 12 (2). doi:10.31273/reinvention.v12i2.339.
  2. ^ Stuart A., Ord J.K, Arnold S.(1999), 켄달의 고급 통계 이론: 제2A권 - 고전적 추론선형 모형, 제6판, § 20.2–20.3(아놀드).
  3. ^ Conover, W.J. (1999), "Chapter 3.4: The Sign Test", Practical Nonparametric Statistics (Third ed.), Wiley, pp. 157–176, ISBN 0-471-16068-7
  4. ^ Sprent, P. (1989), Applied Nonparametric Statistical Methods (Second ed.), Chapman & Hall, ISBN 0-412-44980-3

일반 참고 자료

  • 바그도나비치우스, V., 크루피스, J., 니쿨린, 매사추세츠 (2011년)"전체 데이터에 대한 비파라미터 테스트", ISE & WILEY: 런던 & Hoboken.ISBN 978-1-84821-269-5.
  • Corder, G. W.; Foreman, D. I. (2014). Nonparametric Statistics: A Step-by-Step Approach. Wiley. ISBN 978-1118840313.
  • 기븐스, 디킨슨, 차크라보티, 서브하브라타(2003).비모수 통계적 추론, 제4판.CRC 프레스ISBN 0-8247-4052-1.
  • Hettmansperger, T. P.; McKean, J. W. (1998). Robust Nonparametric Statistical Methods. Kendall's Library of Statistics. Vol. 5 (First ed.). London: Edward Arnold. New York: John Wiley & Sons. ISBN 0-340-54937-8. MR 1604954. ISBN 0-471-19479-4도 참조해 주세요.
  • Hollander M., Wolfe D.A., Chicken E. (2014).비모수 통계법, John Wiley & Sons.
  • Sheskin, David J. (2003) 파라메트릭 비모수 통계 절차 핸드북.CRC 프레스ISBN 1-58488-440-1
  • Wasserman, Larry (2007).모든 비모수 통계량, 스프링거.ISBN 0-387-25145-6.