강하 회귀 분석
Deming regression통계학에서 W. Edwards Deming의 이름을 딴 Deming 회귀 분석은 2차원 데이터 집합에 가장 적합한 선을 찾으려고 하는 변수 내 오류 모델이다.x축과 y축 모두에서 관측치의 오류를 설명한다는 점에서 단순 선형 회귀 분석과는 다르다.이것은 예측 변수와 더 복잡한 오류 구조를 허용하는 총 최소 제곱의 특별한 경우다.
디밍 회귀는 두 변수에 대한 오차가 독립적이고 정규 분포를 따르는 것으로 가정하고, Δ로 표시된 두 변수의 분산 비율을 알고 있는 변수 모형의 최대우도 추정치와 동등하다.[1]실제로 이 비율은 관련 데이터 소스에서 추정할 수 있지만 회귀 분석 절차에서는 이 비율을 추정할 때 발생할 수 있는 오류를 고려하지 않는다.
데밍 회귀 분석은 단순 선형 회귀 분석보다 계산하기가 약간 더 어려울 뿐이다.임상 화학에 사용되는 대부분의 통계 소프트웨어 패키지는 데밍 회귀 분석을 제공한다.
이 모델은 원래 케이스 Δ = 1을 고려했던 애드콕(1878)이 도입했고, 그 다음엔 쿠멜(1879)이 임의 Δ로 도입했다.그러나 그들의 사상은 대체로 50여 년 동안 눈에 띄지 않고 있다가 구피만(1936년)에 의해 부활되고 후에 데밍(1943)에 의해 더욱 널리 전파되었다.후자의 책은 임상 화학 및 관련 분야에서 매우 유명해졌고, 그 방법들은 심지어 그 분야에서는 데밍 회귀라고 불릴 정도였다.[2]
사양
사용 가능한 데이터(yi, xi)가 회귀선에 있는 "참" 값(yii*, x*)의 측정된 관측치라고 가정하십시오.
오류 ε과 η이 독립적이며, 이들의 분산 비율을 알 수 있다고 가정하는 경우:
실제로 y 매개 변수의 분산을 알 수 없는 경우가 많아 의 추정치가 복잡해진다 및 y의 측정 방법이 동일할 경우 이러한 분산이 동일할 가능성이 높으므로이 =1 {\
우리는 "최고의 적합성"의 선을 찾으려고 한다.
모형의 잔차 제곱의 가중 합계가 최소화되도록:[3]
전체 파생은 젠센(2007)을 참조한다.
해결책
용액은 2차 샘플 모멘트로 표현할 수 있다.즉, 우리는 먼저 다음과 같은 수량을 계산한다(모든 합은 i = 1에서 n까지).
마지막으로 모형의 모수에 대한 최소 제곱 추정치는 다음과 같다[4].
직교 회귀 분석
분산이한 경우 즉 Δ = 1 {\displaystyle1}일 때, 데밍 회귀는 직교 회귀가 된다. 즉, 데이터 점에서 회귀선까지의 수직 거리 제곱의 합을 최소화한다.이 경우, 각 관측치를 복합 평면에서 점 z로j 나타낸다(즉, 점(xj, yj)은 zj = xj + iy로j 기록되며 여기서 i는 가상 단위임).중심으로부터의 데이터 지점의 제곱 차이(복잡한 좌표로도 표시됨)의 합계를 Z로 나타내며, 수평 및 수직 위치가 데이터 지점의 평균인 지점이다.다음:[5]
- Z = 0이면 중심을 통과하는 모든 선은 가장 적합한 직교 적합선이다.
- Z ≠ 0일 경우 직교 회귀선은 중심을 통과하며 원점에서 까지의 벡터에 평행하다
직교 회귀선의 삼각형 표현은 1913년에 Coolidge에 의해 주어졌다.[6]
적용
평면에서 세 개의 비협착 점의 경우, 이러한 점을 정점으로 하는 삼각형에는 중간점에서 삼각형의 측면에 접하는 독특한 스티너 이넬리프가 있다.이 타원의 주요 축은 세 정점에 대한 직교 회귀선에 위치한다.[7]생물학적 세포 내성 세포 소음에 대한 정량화는 두 리포터 합성 생물학적 회로의 관측된 거동에 데밍 회귀 분석을 적용하면 정량화할 수 있다.[8]
참고 항목
참조
- 메모들
- 참고 문헌 목록
- Adcock, R. J. (1878). "A problem in least squares". The Analyst. 5 (2): 53–54. doi:10.2307/2635758. JSTOR 2635758.
- Coolidge, J. L. (1913). "Two geometrical applications of the mathematics of least squares". The American Mathematical Monthly. 20 (6): 187–190. doi:10.2307/2973072. JSTOR 2973072.
- Cornbleet, P.J.; Gochman, N. (1979). "Incorrect Least–Squares Regression Coefficients". Clinical Chemistry. 25 (3): 432–438. doi:10.1093/clinchem/25.3.432. PMID 262186.
- Deming, W. E. (1943). Statistical adjustment of data. Wiley, NY (Dover Publications edition, 1985). ISBN 0-486-64685-8.
- Fuller, Wayne A. (1987). Measurement error models. John Wiley & Sons, Inc. ISBN 0-471-86187-1.
- Glaister, P. (2001). "Least squares revisited". The Mathematical Gazette. 85: 104–107. doi:10.2307/3620485. JSTOR 3620485. S2CID 125949467.
- Jensen, Anders Christian (2007). "Deming regression, MethComp package" (PDF). Gentofte, Denmark: Steno Diabetes Center.
- Koopmans, T. C. (1936). Linear regression analysis of economic time series. DeErven F. Bohn, Haarlem, Netherlands.
- Kummell, C. H. (1879). "Reduction of observation equations which contain more than one observed quantity". The Analyst. 6 (4): 97–105. doi:10.2307/2635646. JSTOR 2635646.
- Linnet, K. (1993). "Evaluation of regression procedures for method comparison studies". Clinical Chemistry. 39 (3): 424–432. doi:10.1093/clinchem/39.3.424. PMID 8448852.
- Minda, D.; Phelps, S. (2008). "Triangles, ellipses, and cubic polynomials". American Mathematical Monthly. 115 (8): 679–689. doi:10.1080/00029890.2008.11920581. MR 2456092. S2CID 15049234.
- Quarton, T. G. (2020). "Uncoupling gene expression noise along the central dogma using genome engineered human cell lines". Nucleic Acids Research. 48 (16): 9406–9413. doi:10.1093/nar/gkaa668. PMC 7498316. PMID 32810265.