강하 회귀 분석

Deming regression
강등 회귀 분석.빨간 선은 x와 y 다에서 오류를 보여준다.는 Y축에 평행한 오차를 측정하는 기존의 최소 제곱법과는 다르다.표시된 경우는 수직으로 측정된 편차로 xy의 오차가 동일한 분산을 가질 때 발생한다.

통계학에서 W. Edwards Deming의 이름을 딴 Deming 회귀 분석은 2차원 데이터 집합에 가장 적합한 선을 찾으려고 하는 변수 내 오류 모델이다.x축y축 모두에서 관측치의 오류를 설명한다는 점에서 단순 선형 회귀 분석과는 다르다.이것은 예측 변수와 더 복잡한 오류 구조를 허용하는 총 최소 제곱의 특별한 경우다.

디밍 회귀는 두 변수에 대한 오차가 독립적이고 정규 분포를 따르는 것으로 가정하고, Δ로 표시된 두 변수의 분산 비율을 알고 있는 변수 모형최대우도 추정치와 동등하다.[1]실제로 이 비율은 관련 데이터 소스에서 추정할 수 있지만 회귀 분석 절차에서는 이 비율을 추정할 때 발생할 수 있는 오류를 고려하지 않는다.

데밍 회귀 분석은 단순 선형 회귀 분석보다 계산하기가 약간 더 어려울 뿐이다.임상 화학에 사용되는 대부분의 통계 소프트웨어 패키지는 데밍 회귀 분석을 제공한다.

이 모델은 원래 케이스 Δ = 1을 고려했던 애드콕(1878)이 도입했고, 그 다음엔 쿠멜(1879)이 임의 Δ로 도입했다.그러나 그들의 사상은 대체로 50여 년 동안 눈에 띄지 않고 있다가 구피만(1936년)에 의해 부활되고 후에 데밍(1943)에 의해 더욱 널리 전파되었다.후자의 책은 임상 화학 및 관련 분야에서 매우 유명해졌고, 그 방법들은 심지어 그 분야에서는 데밍 회귀라고 불릴 정도였다.[2]

사양

사용 가능한 데이터(yi, xi)가 회귀선에 있는 "참" 값(yii*, x*)의 측정된 관측치라고 가정하십시오.

오류 εη이 독립적이며, 이들의 분산 비율을 알 수 있다고 가정하는 경우:

실제로 y 매개 변수의 분산을 알 수 없는 경우가 많아 의 추정치가 복잡해진다 y의 측정 방법이 동일할 경우 이러한 분산이 동일할 가능성이 높으므로 =1 {\

우리는 "최고의 적합성"의 선을 찾으려고 한다.

모형의 잔차 제곱의 가중 합계가 최소화되도록:[3]

전체 파생은 젠센(2007)을 참조한다.

해결책

용액은 2차 샘플 모멘트로 표현할 수 있다.즉, 우리는 먼저 다음과 같은 수량을 계산한다(모든 합은 i = 1에서 n까지).

마지막으로 모형의 모수에 대한 최소 제곱 추정치는 다음과 같다[4].

직교 회귀 분석

분산이한 경우 즉 Δ = 1 {\displaystyle1}일 때, 데밍 회귀는 직교 회귀가 된다. 즉, 데이터 점에서 회귀선까지의 수직 거리 제곱의 합을 최소화한다.이 경우, 각 관측치를 복합 평면에서 점 zj 나타낸다(즉, 점(xj, yj)은 zj = xj + iyj 기록되며 여기서 i가상 단위임).중심으로부터의 데이터 지점의 제곱 차이(복잡한 좌표로도 표시됨)의 합계를 Z로 나타내며, 수평 및 수직 위치가 데이터 지점의 평균인 지점이다.다음:[5]

  • Z = 0이면 중심을 통과하는 모든 선은 가장 적합한 직교 적합선이다.
  • Z ≠ 0일 경우 직교 회귀선은 중심을 통과하며 원점에서 까지의 벡터에 평행하다

직교 회귀선의 삼각형 표현은 1913년에 Coolidge에 의해 주어졌다.[6]

적용

평면에서 세 개의 비협착 점의 경우, 이러한 점을 정점으로 하는 삼각형에는 중간점에서 삼각형의 측면에 접하는 독특한 스티너 이넬리프가 있다.이 타원의 주요 축은 세 정점에 대한 직교 회귀선에 위치한다.[7]생물학적 세포 내성 세포 소음에 대한 정량화는 두 리포터 합성 생물학적 회로의 관측된 거동에 데밍 회귀 분석을 적용하면 정량화할 수 있다.[8]

참고 항목

참조

메모들
참고 문헌 목록