랜덤 효과 모형

Random effects model

통계에서 분산 성분 모형이라고도 하는 랜덤 효과 모형은 모형 모수가 랜덤 변수통계적 모형이다. 그것은 계층적 선형 모델의 일종으로, 분석되는 데이터는 그 계층과 관련된 차이가 있는 서로 다른 모집단의 계층 구조에서 도출된다고 가정한다. 계량학에서 랜덤 효과 모델은 고정 효과가 없다고 가정할 때 계층적 또는 패널 데이터패널 분석에서 사용된다(개별 효과를 허용). 랜덤 효과 모델은 혼합 모델의 특별한 경우다.

생물통계학적 정의와 대조하여 생물통계학자들이 각각 "고정"과 "랜덤" 효과를 사용하여 모집단 평균 및 주체별 효과(그리고 후자가 일반적으로 알 수 없는 잠재적 변수로 가정되는 경우)를 참조한다.[1][2][3][4][5]

정성적 설명

랜덤 효과 모델은 이질성이 시간에 따라 일정하고 독립 변수와 상관되지 않을 때 관찰되지 않은 이질성을 제어하는 데 도움이 된다. 이 상수는 차이점을 통해 종적 데이터에서 제거할 수 있다. 왜냐하면 첫 번째 차이를 갖는 것은 모델의 불변 구성요소를 제거하기 때문이다.[6]

개별적인 특정 효과에 대해 두 가지 일반적인 가정을 할 수 있다: 무작위 효과 가정과 고정 효과 가정. 무작위 효과 가정은 관찰되지 않은 개별 이질성이 독립 변수와 무관하다는 것이다. 고정 효과 가정은 개별 특정 효과가 독립 변수와 상관 관계가 있다는 것이다.[6]

랜덤 효과 가정이 유지된다면, 랜덤 효과 추정기는 고정 효과 모델보다 더 효율적이다.

간단한 예

나라의 수천 개 중에서 큰 초등학교가 무작위로 선택된다고 가정해보자. 또한 선택된 각 학교에서 같은 나이의 학생이 무작위로 선발되지 않는다고 가정해 보자. 표준 적성 검사에서 그들의 점수는 확인되었다. yij ith 학교의 j번째 학생의 점수로 하자. 이 변수를 모형화하는 간단한 방법은

여기서 μ는 전체 모집단의 평균 시험 점수다.모델에서i U는 학교별 무작위 효과로, 학교 i의 평균 점수와 전국 평균 점수의 차이를 측정한다. W라는ij 용어는 개별적인 무작위 효과, 즉 i번째 학교의 평균에서 j번째 학생의 점수의 편차다.

모델은 다른 그룹들 간의 점수 차이를 포착할 수 있는 추가 설명 변수를 포함함으로써 증강될 수 있다. 예를 들면 다음과 같다.

여기서 성은ij 남자/여자아이와ij 부모교육 기록의 더미 변수, 예를 들어, 어린이 부모의 평균 교육 수준. 이는 성교육과 부모교육에 고정효과 용어를 도입해 순수 무작위 효과 모델이 아닌 혼합형 모델이다.

분산 성분

Yij 분산은 각각 Ui Wij 분산 τ과2 σ의2 합이다.

내버려두다

eth 학교의 모든 점수의 평균이 아니라, 무작위 표본에 포함된 eth 학교의 점수들의 평균이다. 내버려두다

최고 평균이다

내버려두다

그룹 차이로 인한 제곱합과 그룹 차이로 인한 제곱합이 각각 된다. 그렇다면 라는 것을 보여줄[citation needed] 수 있다.

그리고

이러한 "기대 평균 제곱"을 "분산 성분" σ2 τ2 추정 기준으로 사용할 수 있다.

τ2 매개변수를 ac내 상관 계수라고도 한다.

적용들

실제 사용되는 랜덤 효과 모델에는 보험계약의 뷔르만 모델소면적 추정에 사용되는 페이-헤리엇 모델이 포함된다.

참고 항목

추가 읽기

  • Baltagi, Badi H. (2008). Econometric Analysis of Panel Data (4th ed.). New York, NY: Wiley. pp. 17–22. ISBN 978-0-470-51886-1.
  • Hsiao, Cheng (2003). Analysis of Panel Data (2nd ed.). New York, NY: Cambridge University Press. pp. 73–92. ISBN 0-521-52271-4.
  • Wooldridge, Jeffrey M. (2002). Econometric Analysis of Cross Section and Panel Data. Cambridge, MA: MIT Press. pp. 257–265. ISBN 0-262-23219-7.
  • Gomes, Dylan G.E. (20 January 2022). "Should I use fixed effects or random effects when I have fewer than five levels of a grouping factor in a mixed-effects model?". PeerJ. 10: e12794. doi:10.7717/peerj.12794.

참조

  1. ^ Diggle, Peter J.; Heagerty, Patrick; Liang, Kung-Yee; Zeger, Scott L. (2002). Analysis of Longitudinal Data (2nd ed.). Oxford University Press. pp. 169–171. ISBN 0-19-852484-6.
  2. ^ Fitzmaurice, Garrett M.; Laird, Nan M.; Ware, James H. (2004). Applied Longitudinal Analysis. Hoboken: John Wiley & Sons. pp. 326–328. ISBN 0-471-21487-6.
  3. ^ Laird, Nan M.; Ware, James H. (1982). "Random-Effects Models for Longitudinal Data". Biometrics. 38 (4): 963–974. doi:10.2307/2529876. JSTOR 2529876.
  4. ^ Gardiner, Joseph C.; Luo, Zhehui; Roman, Lee Anne (2009). "Fixed effects, random effects and GEE: What are the differences?". Statistics in Medicine. 28 (2): 221–239. doi:10.1002/sim.3478. PMID 19012297.
  5. ^ Gomes, Dylan G.E. (20 January 2022). "Should I use fixed effects or random effects when I have fewer than five levels of a grouping factor in a mixed-effects model?". PeerJ. 10: e12794. doi:10.7717/peerj.12794.
  6. ^ a b Wooldridge, Jeffrey (2010). Econometric analysis of cross section and panel data (2nd ed.). Cambridge, Mass.: MIT Press. p. 252. ISBN 9780262232586. OCLC 627701062.

외부 링크