정규화(통계)

Normalization (statistics)

통계 및 통계 적용에서 정규화는 다양한 [1]의미를 가질 수 있습니다.가장 간단한 경우에서 등급 정규화는 여러 척도에서 측정된 값을 평균화 전에 개념적으로 공통 척도로 조정하는 것을 의미합니다.더 복잡한 경우 정규화는 조정된 값의 확률 분포 전체를 정렬하기 위한 보다 정교한 조정을 나타낼 수 있습니다.교육 평가에서 점수를 정규화하는 경우 분포를 정규 분포에 맞추려는 의도가 있을 수 있습니다.확률 분포의 정규화에 대한 다른 접근법은 다양한 측정값의 분위수를 정렬하는 분위수 정규화이다.

통계의 또 다른 용도에서 정규화는 이동 및 축소된 버전의 통계를 생성하는 것을 의미합니다. 여기서 정규화된 값비정상적인 시계열에서와 같이 특정 총 영향의 영향을 제거하는 방식으로 서로 다른 데이터셋에 대해 대응하는 정규화 값을 비교할 수 있도록 하기 위한 것입니다.일부 정규화 유형에는 크기 변수에 상대적인 값에 도달하기 위한 재스케일링만 포함됩니다.측정 수준의 측면에서 이러한 비율은 비율 측정(측정 비율이 의미 있는 경우)에만 해당되며, 간격 측정(거리만 의미 있고 비율은 의미 없는 경우)에는 해당되지 않습니다.

이론 통계학에서 모수 정규화는 종종 모수에 의존하지 않는 함수중추적인 수량으로 이어질 수 있으며, 이 함수는 모수를 몰라도 관측치로부터 계산할 수 있다.

통계에는 다양한 유형의 정규화(오차, 잔차, 평균 및 표준 편차의 비차원 비율)가 있으며, 따라서 척도 불변이며, 그 중 일부는 다음과 같이 요약될 수 있다.측정 수준의 관점에서 이러한 비율은 비율 측정(측정 비율이 의미 있는 경우)에만 해당되며 간격 측정(거리만 의미 있고 비율은 의미 없는 경우)에는 해당되지 않습니다.카테고리:통계 비율

이름. 공식 사용하다
표준점수 모집단 모수가 알려진 경우 오류를 정규화하는 중입니다.정규[2] 분포를 따르는 모집단에 적합합니다.
학생의 t-통계 모수의 추정값이 가설 값에서 벗어나 표준 오차에 의해 정규화됩니다.
학생화 잔차 모수가 추정될 때, 특히 회귀 분석에서 서로 다른 데이터 점에 걸쳐 잔차를 정규화합니다.
표준화된 모멘트 스케일의 척도로 사용하여 모멘트를 정규화합니다.
계수
변화
μ {\displaystyle 척도, 특히 지수 분포 및 포아송 분포와 같은 양의 분포를 사용하여 산포를 정규화합니다.
최소-최대 기능 피쳐 배율은 모든 값을 [0,1] 범위로 가져오는 데 사용됩니다.이것은 유니티 베이스 정규화라고도 불립니다.를 일반화하면 데이터 집합의 임의의 포인트: X + ( - min) ( - ) - min (b - a ) X min ( \ ' + { \ \ left \ ( X - X - X _ { \ min \ )을 사용하여 데이터 집합의 값 범위를 제한할 수 있습니다.

평균 분산비θ 와 같은 다른 비율(\^{도 정규화를 위해 수행되지만 비차원이 아닙니다. 단위는 취소되지 않으므로 비율이 변동하지 않습니다.

기타 타입

분포에 대한 가정 없이 사용할 수 있는 기타 비차원 정규화는 다음과 같습니다.

  • 백분위수 할당.이것은 표준화된 테스트에서 흔히 볼 수 있습니다.분위수 정규화를 참조하십시오.
  • 값이 0과 1 사이가 되도록 상수를 추가 및/또는 곱하는 정규화.이것은 확률밀도함수에 사용되며 물리화학 등의 분야에서 확률을 .에 할당하는 응용 프로그램에서 사용됩니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ Dodge, Y (2003) 옥스퍼드 통계 용어 사전, OUP. ISBN0-19-920613-9(점수 정규화 엔트리)
  2. ^ Freedman, David; Pisani, Robert; Purves, Roger (February 20, 2007). Statistics: Fourth International Student Edition. W.W. Norton & Company. ISBN 9780393930436.