경로분석(통계)

Path analysis (statistics)

통계에서 경로 분석은 변수 집합 사이의 지시된 의존성을 설명하는 데 사용된다. 여기에는 다변량 분산 분석 및 공분산 분석(MANOVA, 분산 분석, ANCOVA)에서 모든 형태의 다중 회귀 분석, 요인 분석, 표준 상관 분석, 판별 분석과 동등한 모형이 포함된다.

경로 분석은 인과관계에 초점을 맞춘 다중 회귀의 한 형태로 생각될 뿐만 아니라, 인과 모형의 각 변수에 대해 단일 지표만 채택되는 구조 방정식 모델링(SEM)의 특수한 사례로 볼 수 있다. 즉, 경로분석은 구조모델이 있는 SEM이지만 측정모델은 없다. 경로 분석을 참조하는 데 사용되는 다른 용어로는 인과 모델링, 공분산 구조 분석잠재 변수 모델이 있다.

경로 분석은 유대 펄인과 추론 기법의 직접적인 조상이라고 간주한다.[1]

역사

경로 분석은 유전학자 Sewall Wright에 의해 1918년경에 개발되었는데, 그는 1920년대에 이것에 대해 더 광범위하게 썼다.[2] 그 후 생물학, 심리학, 사회학, 계량학 등 광범위한 복합 모델링 영역에 적용되었다.[3]

경로 모델링

일반적으로 경로 모델은 상자 또는 직사각형으로 그래픽으로 표시된 독립 변수 및 종속 변수로 구성된다. 종속변수가 아닌 독립변수인 변수를 '고유성'이라고 한다. 그래픽적으로, 이러한 외생 변수 상자는 모델의 바깥쪽 가장자리에 놓여 있고 그것들로부터 나오는 단두 화살표가 있을 뿐이다. 단일 머리 화살표가 외생 변수를 가리키지 않는다. 전적으로 종속 변수이거나 독립 변수 및 종속 변수인 변수를 '내생 변수'라고 한다. 그래픽적으로, 내생적 변수에는 적어도 하나 이상의 단일 머리 화살표가 그들을 가리키고 있다.

아래 모델에서 두 개의 외생 변수(Ex와12 Ex)는 쌍두 화살표에 표시된 것처럼 상관관계가 있는 것으로 모델링된다. 이 두 변수 모두 En2(의존적 또는 '내생적' 변수/요인)에 대한 직간접적(En을1 통해) 영향을 미친다. 대부분의 실제 모델에서 내생 변수는 모델 외부에서 발생하는 변수 및 요인(측정 오류를 포함한 외부 효과)에 의해 영향을 받을 수도 있다. 이러한 효과는 모형의 "e" 또는 오차 항으로 설명된다.

Path example.JPG

동일한 변수를 사용하면 대체 모델을 생각할 수 있다. 예를 들어 Ex가1 Ex에서1 En까지의2 화살표를 삭제하여 En에2 간접적인 영향만 미친다고 가정할 수 있으며, 이 두 모형의 우도나 '적합'을 통계적으로 비교할 수 있다.

경로 추적 규칙

다이어그램의 두 상자 사이의 관계를 유효하게 계산하기 위해, 라이트(1934)는 두 변수 사이의 상관관계를 계산하기 위한 간단한 경로 추적 규칙 집합을 제안했다.[4] 상관관계는 두 변수가 연결되는 모든 경로의 기여도의 합과 같다. 이러한 각각의 기여 경로의 강도는 해당 경로를 따라 발생하는 경로의 산물로 계산된다.

경로 추적 규칙:

  1. 화살표를 뒤로 추적하여 다음 변수를 따라 앞으로 이동하거나 한 변수에서 다른 변수로 앞으로 이동하지만 앞으로 이동하거나 뒤로 이동하지 마십시오. 이 규칙을 생각해 볼 수 있는 또 다른 방법은, 절대로 한 화살촉에서 다른 화살촉으로 넘어갈 수 없다는 것이다: 머리끝이 아니라 머리끝, 또는 꼬리머리.
  2. 각 변수를 주어진 경로 체인에 한 번만 통과시킬 수 있다.
  3. 각 경로 체인에 두 개 이상의 양방향 화살표를 포함할 수 없다.

다시 말하지만, 두 변수 사이에 추적된 각 체인으로 인한 기대 상관관계는 표준화된 경로 계수의 산물이며, 두 변수 사이의 총 예상 상관관계는 이러한 기여 경로 체인의 합이다.

NB: Wright의 규칙은 피드백 루프가 없는 모델을 가정한다: 모델의 방향 그래프에는 사이클이 없어야 한다. 즉, 유도 진주의 인과 분석 프레임워크에서 광범위하게 연구된 방향 아세클릭 그래프다.

표준화되지 않은 모델의 경로 추적

모델링된 변수가 표준화되지 않은 경우, 추가 규칙은 종속 변수를 다른 종속 변수에 연결하는 경로가 존재하지 않는 한 예상 공분류를 계산할 수 있다.

모든 잔차 분산을 명시적으로 모델링하는 가장 단순한 경우를 구한다. 이 경우 위의 세 가지 규칙 외에 다음과 같이 예상 공분산율을 계산한다.

  1. 관심 변수 사이의 각 경로에서 계수 산출물을 계산하고, 거꾸로 추적하고, 두 개의 머리 화살표로 방향을 바꾼 다음, 앞으로 추적한다.
  2. 다른 계수를 포함하거나 다른 순서로 해당 계수를 접하는 경우 경로가 구별되는 것으로 간주되는 모든 고유 경로에 대한 합계.

(양방향 화살표를 제외하고) 경로에서 발생하는 방향 변경 시 잔차 분산이 명시적으로 포함되지 않거나 보다 일반적인 해결책으로 변경 지점의 변수에 대한 분산을 포함시킨다. 즉, 종속변수에서 독립변수로의 경로를 추적할 때 독립변수의 분산을 포함하되, 독립변수가 위의 규칙 1을 위반하는 경우(즉, 독립변수가 다른 독립변수에 연결되는 경우)를 제외한다. 분산을 도출할 때(명시적으로 모델링되지 않은 경우에 필요함) 종속 변수에서 독립 변수 및 백으로의 경로는 한 번만 계수된다.

참고 항목

참조

  1. ^ Pearl, Judea (May 2018). The Book of Why. New York: Basic Books. p. 6. ISBN 978-0-465-09760-9.
  2. ^ Wright, S. (1921). "Correlation and causation". J. Agricultural Research. 20: 557–585.
  3. ^ 닷지, Y. (2003) 옥스퍼드 통계 용어 사전. OUP. ISBN 0-19-920613-9
  4. ^ Wright, S. (1934). "The method of path coefficients". Annals of Mathematical Statistics. 5 (3): 161–215. doi:10.1214/aoms/1177732676.

외부 링크