통계적 분산

Statistical dispersion
평균은 같지만 산포가 다른 두 모집단의 표본 예제입니다.푸른 개체군은 붉은 개체군보다 훨씬 더 분산되어 있습니다.

통계학에서 분산(변동성, 산란 또는 스프레드라고도 함)은 분포가 늘어나거나 [1]압축되는 정도를 나타냅니다.통계적 산포 측정의 일반적인 예로는 분산, 표준 편차 및 사분위 간 범위가 있습니다.예를 들어 집합의 데이터 분산이 크면 데이터가 광범위하게 분산됩니다.반면 분산이 작으면 집합의 데이터가 군집화됩니다.

분산은 위치 또는 중심 경향과 대조되며, 둘 다 분포에서 가장 많이 사용되는 특성입니다.

방안

통계적 분산의 척도는 모든 데이터가 같으면 0이 되고 데이터가 다양해질수록 증가하는 음수가 아닌 실수입니다.

대부분의 분산 측정 단위는 측정 수량동일합니다.즉, 측정값이 미터 또는 초 단위인 경우 분산 측정값도 마찬가지입니다.분산 측정의 예는 다음과 같습니다.

값은 척도 모수의 추정치자주 사용되며, 이를 척도 모수의 추정치라고 합니다.강력한 척도는 소수의 특이치의 영향을 받지 않는 척도로 IQR과 MAD를 포함합니다.

위의 통계적 산포의 모든 척도는 위치 불변적이고 규모가 선형적이라는 유용한 특성을 가지고 있다.즉, 랜덤 변수 X의 분산X S인 경우, 실제 a b에 대한 선형 변환 Y = aX + b분산Y S = aX S이어야 합니다. 여기서 a는 a절대값이며, 즉 앞의 음의 부호를 무시합니다.

분산의 다른 척도는 차원이 없다.즉, 변수 자체에 단위가 있더라도 단위가 없습니다.여기에는 다음이 포함됩니다.

  • 변동 계수
  • 사분위 분산 계수
  • 지니 계수의 두 에 해당하는 상대 평균 차이
  • 엔트로피:이산 변수의 엔트로피는 위치에 따라 독립적이며, 따라서 위의 의미에서 분산의 척도가 아닌 반면, 연속 변수의 엔트로피는 위치 불변이며 척도에 있어 가법적이다: 만약 Hz가 연속 변수 z 및 z=ax+b의 엔트로피라면, Hz=Hx+log(a)

분산에는 다른 척도가 있습니다.

  • 분산(표준 편차의 제곱) – 위치가 불변하지만 척도가 선형적이지 않습니다.
  • 분산평균 비율 – 주로 분산 계수라는 용어를 사용할 때와 이 비율이 무차원일카운트 데이터에 사용됩니다. 카운트 데이터 자체는 무차원이기 때문입니다.

분산의 일부 척도는 특수한 목적을 가지고 있다.앨런 분산은 노이즈가 [2]컨버전스를 방해하는 애플리케이션에 사용할 수 있습니다.아다마르 분산을 사용하여 선형 주파수 드리프트 [3]감도를 상쇄할 수 있습니다.

범주형 변수의 경우 산포를 단일 숫자로 측정하는 것이 일반적이지 않습니다. 질적 변동을 참조하십시오.그렇게 하는 한 가지 척도는 이산 엔트로피입니다.

원천

자연과학에서 그러한 변동성은 무작위 측정 오류로 인해 발생할 수 있다. 계측기 측정은 종종 완벽하게 정확하지 않고,재현할 수 없으며, 측정된 결과를 해석하고 보고하는 데 추가적인 시험기변동성이 있다.측정되는 수량이 안정적이고 측정값 간의 변동이 관측 오차 때문이라고 가정할 수 있습니다.다수의 입자로 이루어진 시스템은 온도, 에너지 및 밀도 등 비교적 소수의 거시적 양의 평균값에 의해 특징지어진다.표준 편차는 변동 이론에서 중요한 척도이며, 이것은 하늘이 [4]왜 파란색인지 포함한 많은 물리적 현상을 설명한다.

생물과학에서 측정되는 양은 거의 변하지 않고 안정적이며, 관측된 변동은 추가로 현상에 내재할 수 있다.이는 개인 간 변동성, 즉 모집단의 개별 구성원들이 서로 다르기 때문일 수 있습니다.또한, 이는 개인 내 변동성, 즉 서로 다른 시간 또는 다른 조건에서 시험을 치르는 동일한 피험자가 다르기 때문일 수 있습니다.이러한 유형의 변동성은 공산품 분야에서도 볼 수 있습니다.그곳에서도, 세심한 과학자는 변화를 발견합니다.

경제학, 금융학 및 기타 분야에서 회귀 분석은 각각이 양의 산포를 갖는 하나 이상의 독립 변수를 사용하여 일반적으로 분산으로 측정되는 종속 변수의 산포를 설명하려고 시도합니다.설명되는 분산 비율을 결정 계수라고 합니다.

분산의 부분 순서

평균 보존 스프레드(MPs)는 확률 분포 A에서 다른 확률 분포 B로의 변화이며, 여기서 B는 평균(기대값)을 [5]변경하지 않고 A의 확률 밀도 함수의 하나 또는 여러 부분을 펼쳐 형성됩니다.평균 보존 확산의 개념은 분산에 따라 확률 분포의 부분적인 순서를 제공한다. 즉, 두 확률 분포 중 하나는 다른 것보다 분산이 많은 것으로 순위가 매겨질 수도 있고, 둘 다 분산이 더 많은 것으로 순위가 매겨질 수도 있다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ NIST/SEMATECH e-Handbook of Statistical Methods. "1.3.6.4. Location and Scale Parameters". www.itl.nist.gov. U.S. Department of Commerce.
  2. ^ "Allan Variance -- Overview by David W. Allan". www.allanstime.com. Retrieved 2021-09-16.
  3. ^ "Hadamard Variance". www.wriley.com. Retrieved 2021-09-16.
  4. ^ McQuarrie, Donald A. (1976). Statistical Mechanics. NY: Harper & Row. ISBN 0-06-044366-9.
  5. ^ Rothschild, Michael; Stiglitz, Joseph (1970). "Increasing risk I: A definition". Journal of Economic Theory. 2 (3): 225–243. doi:10.1016/0022-0531(70)90038-4.