표준오차
Standard error통계량(일반적으로 모수의 추정치)의 표준 오차(SE)[1]는 표본 분포의[2] 표준 편차 또는 해당 표준 편차의 추정치입니다.통계량이 표본 평균인 경우 이를 평균([1]SEM)의 표준 오차라고 합니다.
평균의 표본분포는 동일한 모집단에서 반복적으로 표본을 추출하여 얻은 표본수단을 기록함으로써 생성된다.이 분포는 서로 다른 평균의 분포를 형성하며, 이 분포에는 고유한 평균과 분산이 있습니다.수학적으로, 구한 표본 평균 분포의 분산은 모집단의 분산을 표본 크기로 나눈 값과 같습니다.표본 크기가 커질수록 표본은 모집단 평균 주위에 군집화를 더 가깝게 의미하기 때문입니다.
따라서 평균의 표준 오차와 표준 편차 사이의 관계는 주어진 표본 크기에서 평균의 표준 오차가 표본 [1]크기의 제곱근으로 나눈 표준 편차와 같도록 합니다.즉, 평균의 표준 오차는 모집단 평균 주위의 표본 평균 산포에 대한 측도입니다.
회귀 분석에서 "표준 오차"라는 용어는 축소된 카이 제곱 통계량의 제곱근 또는 특정 회귀 계수에 대한 표준 오차(예: 신뢰 구간에서 사용됨)를 나타냅니다.
평균의 표준 오차
정확한 값
통계적으로 1,, n },의 샘플이 가 })인 통계집단에서 추출된 샘플 x에서계산되는 (\ \sigma은 (는) 다음과 같은 [1]평균 "에 관련된 표준 오류가 있습니다.
- x¯= {\ { display { \ { x } = { display { n } 。
실제로 이는 모집단 평균의 값을 추정할 때1/(\ {n로 인해 추정 오차를 2배 줄이려면 표본에서 4배 많은 관측치를 획득해야 하며, 10배 줄이면 100배 이상의 관측치가 필요하다는 것을 말해준다.ns.
추정
표본 추출된 모집단의 표준 편차(\는 거의 알려져 있지 않습니다.따라서 평균의 표준 오차는 보통 표본 표준 편차 {\_로 대체하여 추정됩니다.
- x n x n { \ { x \ { _ { { \ { n} ) 。
이는 진정한 "표준 오류"의 추정치일 뿐이므로 다음과 같은 다른 표기법을 흔히 볼 수 있습니다.
- = = { {x}}) ={ = x
모집단의 표준편차( {\\} ), 표본의 ( x \ \ _ 및 평균 자체의 표준편차( \ style _를 명확히 구별하지 못할 때 공통적인 혼란이 발생한다.표준오차) 및 의 표준편차 추정치( ^ \ { { \ { x )입니다.이것은 가장 자주 계산되는 양이며, 일반적으로 표준오차라고도 불립니다.
추정기의 정확성
표본 크기가 작은 경우 모집단의 실제 표준 편차 대신 표본의 표준 편차를 사용하면 모집단 표준 편차가 체계적으로 과소평가되는 경향이 있으므로 표준 오차도 마찬가지입니다.n = 2인 경우 과소 추정치는 약 25%이지만 n = 6인 경우 과소 추정치는 5%에 불과합니다.Gurland와 Tripathi(1971)는 이 [3]효과에 대한 보정과 방정식을 제공한다.Sokal과 Rohlf(1981)는 n < [4]20의 작은 표본에 대한 보정 계수의 방정식을 제공한다.자세한 내용은 표준 편차의 치우침 없는 추정을 참조하십시오.
파생
평균에 대한 표준 오차는 분산의 정의와 분산의 몇 가지 간단한 특성을 고려할 때 독립 랜덤 [5]변수 합계의 분산에서 파생될 수 있습니다.1, 2, {\},이 (가) x {\ 및 표준편차가 \인 모집단에서의 독립된 샘플인 총계를 정의할 수 있습니다.
비에나이메 공식 때문에 차이가 있을 것이다.
의 평균은 과 같습니다
- / { {x} =/ n 。
평균의 분산은 다음과 같습니다.
표준오차는 정의상 단순히 분산의 제곱근인 x의표준편차(\ {입니다 .
- x¯ = = n \ { \ { x } {\ { { n } = { \} { \ { n} = fracacacacacacacacacacacacacacacacacacacacacac2n acn
상관 랜덤 변수의 경우 마르코프 연쇄 중심 한계 정리에 따라 표본 분산을 계산할 필요가 있다.
랜덤 표본 크기를 갖는 독립적이고 동일한 분포 랜덤 변수
어떤 기준에 따라 몇 개의 관측치가 허용될지 미리 알지 못한 채 표본을 채취하는 경우가 있다.이 경우 표본 N(\ N은 다음과 같이 X X의 변동에 더해지는 랜덤 변수이다.
N의 포아송 분포가 추정기 ({N의 E( ) Var N) 。 Var ( T)\ } ( T)의 추정치는 n + 2 ( \ _ { }^{ + {\ {가 표준오차의 다음 식을 나타냅니다.
(표준 편차가 분산의 제곱근이기 때문에)
value 값을 알 수 없는 경우의 학생 근사치
많은 실제 적용에서 θ의 진정한 값은 알려지지 않았습니다.그 결과, 우리는 가능한 of의 확산을 고려한 분포를 사용할 필요가 있다.θ를 알 수 없지만 실제 기본 분포가 가우스인 것으로 알려진 경우 결과 추정 분포는 Student t-분포를 따릅니다.표준 오차는 학생 t-분포의 표준 편차입니다.T 분포는 가우스 분포와 약간 다르며 표본 크기에 따라 달라집니다.작은 표본은 모집단 표준 편차를 과소평가하고 실제 모집단 평균과 다른 평균을 가질 가능성이 다소 높으며, 학생 t-분포는 가우스보다 다소 무거운 꼬리로 이러한 사건의 확률을 설명합니다.학생 t-분포의 표준 오차를 추정하려면 θ 대신 표본 표준 편차 "s"를 사용하면 충분하며 이 값을 사용하여 신뢰 구간을 계산할 수 있습니다.
참고: 학생의 확률 분포는 표본 크기가 100을 초과할 때 가우스 분포에 의해 잘 근사됩니다.이러한 표본의 경우 후자의 분포를 사용할 수 있으며, 이는 훨씬 더 간단합니다.
전제조건과 사용방법
SE \{SE를 사용하는 의 예로는 알 수 없는 모집단의 신뢰 구간을 평균으로 하는 것이 있습니다.표본 분포가 정규 분포인 경우 표본 평균, 표준 오차 및 정규 분포의 분위수를 사용하여 실제 모집단 평균에 대한 신뢰 구간을 계산할 수 있습니다.다음 식을 사용하여 95% 신뢰 상한 및 하한을 계산할 수 있습니다. 서 x {\는 평균과 같고 SE \은 표본 평균의 표준 오차이며 1.96은 정규 백분위 97.5% 포인트의 근사값입니다. 배포:
- 95% 상한 µ+ ( ×, {\= + (\ \1. 및
- 95% 하한 -( {\= \1.
특히 표본 통계량의 표준 오차(예: 표본 평균)는 표본 평균이 생성된 공정에서 표본 평균의 실제 또는 추정된 표준 편차입니다.즉, 표본 통계량의 표본 분포에 대한 실제 또는 추정된 표준 편차입니다.표준 오차 표기법은 SE, SEM(측정 또는 평균의 표준 오차) 또는E S 중 하나일 수 있습니다.
표준오차는 값의 불확실성에 대한 간단한 측정을 제공하며 다음과 같은 이유로 자주 사용된다.
- 여러 개별 수량의 표준 오차를 알고 있는 경우 수량의 일부 함수의 표준 오차를 쉽게 계산할 수 있다.
- 값의 확률 분포를 알면 정확한 신뢰 구간을 계산하는 데 사용할 수 있다.
- 확률 분포를 알 수 없는 경우, 체비셰프 또는 Vysochanski–-Petunin 부등식을 사용하여 보수적인 신뢰 구간을 계산할 수 있다.
- 표본 크기가 무한대인 경향이 있으므로 중심 한계 정리는 평균의 표본 분포가 점근 정규 분포임을 보장합니다.
평균 대 표준 편차의 표준 오차
과학 및 기술 문헌에서 실험 데이터는 표본 데이터의 평균 및 표준 편차 또는 표준 오차의 평균을 사용하여 요약되는 경우가 많습니다.이는 종종 상호 호환성에 대한 혼란으로 이어집니다.그러나 평균과 표준 편차는 기술 통계량이고 평균의 표준 오차는 랜덤 표본 추출 과정을 설명합니다.표본 데이터의 표준 편차는 측정 변동에 대한 설명이며, 평균의 표준 오차는 표본 크기가 중앙 한계 [7]정리에 비추어 모집단 평균의 추정치에 더 나은 경계를 제공하는 방법에 대한 확률론적 진술이다.
간단히 말해 표본 평균의 표준 오차는 표본 평균이 모집단 평균으로부터 얼마나 멀리 떨어져 있을 가능성이 높은지에 대한 추정치이며 표본 내 개인이 표본 [8]평균과 다른 정도를 나타냅니다.모집단 표준 편차가 유한하면 모집단 평균의 추정치가 개선되는 반면 표본 크기가 증가함에 따라 표본의 표준 편차가 모집단 표준 편차에 근접하기 때문에 표본 크기가 증가함에 따라 표본 평균의 표준 오차는 0이 되는 경향이 있습니다.
내선번호
유한 모집단 보정(FPC)
표준 오차에 대해 위에 제시된 공식은 모집단이 무한하다고 가정합니다.그럼에도 불구하고, 이는 사람들이 기존의 유한 모집단을 만든 과정을 측정하는 데 관심이 있을 때 종종 유한 모집단에 사용됩니다(이것을 분석 연구라고 합니다).모집단이 유한할 때는 위의 공식이 정확히 정확하지 않지만, 표본 추출 분율이 작을 때는 유한 모집단과 무한 모집단 버전 간의 차이가 작을 것이다(예: 유한 모집단의 작은 비율이 연구된다).이 경우 사람들은 종종 유한 모집단을 수정하지 않고 본질적으로 "거의 무한한" 모집단으로 취급한다.
시간이 지나도 변하지 않는 기존의 유한 모집단을 측정하는 데 관심이 있는 경우 모집단 크기(표집적 연구라고 함)를 조정할 필요가 있다.열거형 연구에서 표본 추출 비율(흔히 f라 칭함)이 클 경우(약 5% 이상), 표준 오차의 추정치에 "유한 모집단 보정"(일명: FPC)[9]을 곱하여 보정해야 한다.
큰 N의 경우:
모집단의 더 큰 비율에 가까운 표본을 추출하여 얻은 추가 정밀도를 설명한다.FPC의 효과는 표본 크기 n이 모집단 크기 N과 같을 때 오차가 0이 된다는 것입니다.
이는 교체 없이 표본을 추출할 때 조사 방법론에서 발생합니다.교환으로 샘플링을 실시하는 경우는, FPC는 동작하지 않습니다.
표본의 상관관계에 대한 보정
측정된 수량 A의 값이 통계적으로 독립적이지 않고 매개변수 공간 x의 알려진 위치에서 얻어진 경우 표본의 계산된 표준 오차(실제로 표준 편차 부분의 보정)에 계수 f를 곱하여 평균의 실제 표준 오차 추정치를 얻을 수 있습니다.
여기서 표본 바이어스 계수 θ는 모든 표본 지점 쌍에 대해 널리 사용되는 자기 상관 계수(-1과 +1)의 프라이스-윈스텐 추정치이다.이 대략적인 공식은 중간에서 큰 표본 크기에 대한 것입니다. 참조는 모든 표본 크기에 대한 정확한 공식을 제공하며 월스트리트의 주가처럼 자기 상관도가 높은 시계열에 적용할 수 있습니다.게다가, 이 공식은 양수나 음수나 [11]똑같이 작용한다.자세한 내용은 표준 편차에 대한 치우침 없는 추정도 참조하십시오.
「 」를 참조해 주세요.
레퍼런스
- ^ a b c d Altman, Douglas G; Bland, J Martin (2005-10-15). "Standard deviations and standard errors". BMJ : British Medical Journal. 331 (7521): 903. doi:10.1136/bmj.331.7521.903. ISSN 0959-8138. PMC 1255808. PMID 16223828.
- ^ Everitt, B. S. (2003). The Cambridge Dictionary of Statistics. CUP. ISBN 978-0-521-81099-9.
- ^ Gurland, J; Tripathi RC (1971). "A simple approximation for unbiased estimation of the standard deviation". American Statistician. 25 (4): 30–32. doi:10.2307/2682923. JSTOR 2682923.
- ^ Sokal; Rohlf (1981). Biometry: Principles and Practice of Statistics in Biological Research (2nd ed.). p. 53. ISBN 978-0-7167-1254-1.
- ^ Hutchinson, T. P. (1993). Essentials of Statistical Methods, in 41 pages. Adelaide: Rumsby. ISBN 978-0-646-12621-0.
- ^ Cornell, J R, Benjamin, CA, Probability, Statistics, and Decisions for Civil Engineers, McGraw-Hill, NY, 1970, ISBN 0486796094, 페이지 178-9.
- ^ Barde, M. (2012). "What to use to express the variability of data: Standard deviation or standard error of mean?". Perspect. Clin. Res. 3 (3): 113–116. doi:10.4103/2229-3485.100662. PMC 3487226. PMID 23125963.
- ^ Wassertheil-Smoller, Sylvia (1995). Biostatistics and Epidemiology : A Primer for Health Professionals (Second ed.). New York: Springer. pp. 40–43. ISBN 0-387-94388-9.
- ^ Isserlis, L. (1918). "On the value of a mean as calculated from a sample". Journal of the Royal Statistical Society. 81 (1): 75–81. doi:10.2307/2340569. JSTOR 2340569. (등식 1)
- ^ Bondy, Warren; Zlot, William (1976). "The Standard Error of the Mean and the Difference Between Means for Finite Populations". The American Statistician. 30 (2): 96–97. doi:10.1080/00031305.1976.10479149. JSTOR 2683803. (등식 2)
- ^ Bence, James R. (1995). "Analysis of Short Time Series: Correcting for Autocorrelation". Ecology. 76 (2): 628–639. doi:10.2307/1941218. JSTOR 1941218.