고정 효과 모형

Fixed effects model

통계에서 고정 효과 모형은 모형 모수가 고정 또는 랜덤하지 않은 수량인 통계 모델이다. 이는 모형 모수의 전부 또는 일부가 랜덤 변수인 랜덤 효과 모형혼합 모형과는 대조적이다. 계량법[1] 생물통계학[2][3][4][5][6] 포함한 많은 응용에서 고정 효과 모델은 집단 평균이 모집단의 랜덤 표본인 랜덤 효과 모델과는 반대로 집단 평균이 고정(비랜덤)된 회귀 모델을 가리킨다.[7][6] 일반적으로 데이터는 몇 가지 관측된 요인에 따라 그룹화할 수 있다. 그룹 평균은 각 그룹에 대해 고정 또는 랜덤 효과로 모델링될 수 있다. 고정 효과 모델에서 각 그룹 평균은 그룹별 고정 수량이다.

동일한 주제에 대해 세로방향 관측치가 존재하는 패널 데이터에서 고정 효과는 주제별 평균을 나타낸다. 패널 데이터 분석에서 용어 고정 효과 추정기(내 추정기라고도 함)를 사용하여 이러한 고정 효과를 포함한 회귀 모형의 계수에 대한 추정기(각 피험자에 대해 시간 내 절편 1회)를 참조한다.

정성적 설명

그러한 모델은 이 이 이질성이 시간에 따라 일정하게 유지될 때 관찰되지 않은 이질성으로 인한 누락된 변수 편향에 대한 제어를 돕는다. 예를 들어, 시간 경과에 따른 그룹 수준 평균을 빼거나 모델의 시간 불변 구성요소를 제거하는 첫 번째 차이를 취함으로써 이 이질성을 데이터에서 제거할 수 있다.

개별적인 특정 효과에 대한 두 가지 일반적인 가정이 있다: 무작위 효과 가정과 고정 효과 가정이다. 랜덤 효과 가정은 개별 특정 효과가 독립 변수와 무관하다는 것이다. 고정효과 가정은 개별특정효과가 독립변수와 상관관계가 있다는 것이다. 랜덤 효과 가정이 유지된다면, 랜덤 효과 추정기는 고정 효과 추정기보다 더 효율적이다. 그러나 이 가정이 유지되지 않으면 랜덤 효과 추정기는 일관되지 않는다. 더빈-Wu-Hausman 검정은 고정 효과 모델과 랜덤 효과 모델을 구별하기 위해 종종 사용된다.[8][9]

형식 모델 및 가정

관측치 T{\T} 기간에 대해 관찰되지 않은 선형 효과 모델을 고려하십시오.

for and

위치:

  • 는 시간 에서 개별 에 대해 관측된 종속 변수다
  • 시간 변수 독립 변수의 수) 역추적 벡터다.
  • 는) k× 1 {\ 1 변수 행렬이다.
  • 은(는) 비보존적 시간변동적 개별 효과다. 예를 들어 개인에 대한 선천적인 능력이나 국가들에 대한 역사적 제도적 요소들.
  • i 오차항이다.

와는 달리 는 직접 관측할 수 없다.

관측되지 않은i(가) t , . ., , X 와 독립된 랜덤 효과 모델과는 달리, 고정 효과(FE) 모델은 을(를) regressor Xi t {\it}}}과(와) 상관할 수 있도록 허용한다. 에 대한 엄격한 이질성은 여전히 필요하다.

통계적 추정

고정 효과 추정기

은(는) 관측할 수 없으므로 직접 제어할 수 없다. 모델은 i 을(를) 제거하며, 내부 변환을 사용하여 변수를 격하한다.

여기서 = = T = t = {\{1}{{\frac {1}{}}{{}}}{}}}}{\frac {1의 i = = 1T i {\{i {1}{1}{\ {1

(는) 하므로 i = {\(는) 효과가 없어진다. FE 추정기 }}그런 다음 은(는) yddot{의 OLS 회귀 분석을 통해 얻는다

내부 변환에 대한 적어도 세 가지 대안이 변동과 함께 존재한다.

는 각 개인 i>1 {\다중 공선성으로 인해 첫 번째 개인에 대한 더미 변수를 추가하는 것이다. 이는 수치로(수치적으로)는 고정 효과 모델에 해당하지 않으며, 시계열 수와 전역 매개변수 수의 합계가 관측치 수보다 작은 경우에만 작동한다.[10] 더미 변수 접근방식은 컴퓨터 메모리 사용과 관련하여 특히 까다로우며 사용 가능한 RAM보다 큰 문제 및 적용된 프로그램 컴파일이 수용할 수 있는 문제에는 권장하지 않는다.

두 번째 대안은 지역 및 글로벌 추정에 연속적인 반복 접근법을 사용하는 것이다.[11] 이 접근방식은 더미 변수 접근법보다 계산적으로 훨씬 더 효율적인 낮은 메모리 시스템에 매우 적합하다.

세 번째 접근방식은 개별 영상 시리즈에 대한 국부 추정을 모델 정의의 일부로 프로그래밍하는 내포된 추정이다.[12] 이 접근방식은 가장 계산적이고 메모리 효율적이지만, SAS에서도 프로그래밍할 수 있지만, 능숙한 프로그래밍 기술과 모델 프로그래밍 코드에 대한 접근이 필요하다.[13][14]

마지막으로, (비선형 모델 내에서) 직렬별 추정이 선형일 경우 위의 대안 각각을 개선할 수 있으며, 이 경우 개별 직렬에 대한 직접 선형 솔루션을 비선형 모델 정의의 일부로 프로그래밍할 수 있다.[15]

첫 번째 차이 추정기

내부 변환의 대안은 다른 추정기를 생성하는 첫 번째 차이 변환이다. = ,, 의 경우

FD 추정기 {\그런 다음 OLS 회귀 분석으로 을(를) 얻는다

= 인 경우 첫 번째 차이와 고정 효과 추정기는 수적으로 동일하다 > 에 대해서는 그렇지 않다. 오차항 {\이(가) 직렬 상관관계가 없는 동음극성인 경우 고정 효과 추정기가 첫 번째 차이 추정기보다 더 효율적이다. 그러나 무작위 걷기를 따른다면 첫 번째 차이 추정기가 더 효율적이다.[16]

T=2일 때 고정 효과와 첫 번째 차이 추정기의 동일성

특수 2주기 사례(= } )의 경우 고정 효과(FE) 추정기와 첫 번째 차이(FD) 추정기는 숫자로 동일하다. FE 추정기가 FD 추정기에 사용된 데이터 세트를 효과적으로 "더빙"하기 때문이다. To see this, establish that the fixed effects estimator is:

Since each can be re-written as , we'll re-write the line as:

체임벌린법

내부 추정기의 일반화인 Gary Chamberlain의 방법은 를 설명 변수에 선형 투영으로 대체한다. 선형 투영을 다음과 같이 쓰는 중:

이는 다음과 같은 방정식을 낳는다.

최소 거리 추정에 의해 추정될 수 있다.[17]

하우스만-테일러법

i 과(와) 상관없는 하나 이상의 시간변수 레지스터( 및 하나 Z 이( 있어야 함

Partition the and variables such that where and are uncorrelated with . Need .

= + i 을(를) 계측기로 X 1 }와 }를 사용하여추정하면 일관된 추정치가 나온다.

입력 불확도를 이용한 일반화

데이터에 대한 입력 불확도가 있는 경우 y{\ y 잔차 제곱합이 {\} 값을 최소화해야 한다.[18] 이는 대체 규칙에서 직접 달성할 수 있다.

,

그런 다음 mathbf {\ 에 대한 값과 표준 편차를 고전적인 일반 최소 제곱 분석 및 분산-공분산 행렬을 통해 결정할 수 있다.

고정 효과(FE) 대 랜덤 효과(RE) 검정

Durbin-를 사용하여 고정 효과 모형 또는 랜덤 효과 모형이 적절한지 여부를 검정할 수 있다.우-하우스만 테스트.

: X , i
: X ,

참일 경우 E{\{\}} (는) 일관되지만 (는) 효율적이다. 참이면 E (는) 일관되고 E 은(는) 그렇지 않다.

where

하우스만 테스트는 사양 테스트여서 큰 테스트 통계량은 EIV(오류 인 변수)가 있거나 모델이 잘못 지정되었을 수 있다. FE 가정이 사실이라면 L ^ ^ F F {\{\

휴리스틱은 만약 > F > {\ 거기 EIV가 있을 수 있다.

참고 항목

메모들

  1. ^ 그린, 2011년 W.H. 계량분석, 7부, 프렌티스 홀
  2. ^ Diggle, Peter J.; Heagerty, Patrick; Liang, Kung-Yee; Zeger, Scott L. (2002). Analysis of Longitudinal Data (2nd ed.). Oxford University Press. pp. 169–171. ISBN 0-19-852484-6.
  3. ^ Fitzmaurice, Garrett M.; Laird, Nan M.; Ware, James H. (2004). Applied Longitudinal Analysis. Hoboken: John Wiley & Sons. pp. 326–328. ISBN 0-471-21487-6.
  4. ^ Laird, Nan M.; Ware, James H. (1982). "Random-Effects Models for Longitudinal Data". Biometrics. 38 (4): 963–974. JSTOR 2529876.
  5. ^ Gardiner, Joseph C.; Luo, Zhehui; Roman, Lee Anne (2009). "Fixed effects, random effects and GEE: What are the differences?". Statistics in Medicine. 28: 221–239. doi:10.1002/sim.3478.
  6. ^ a b Gomes, Dylan G.E. (20 January 2022). "Should I use fixed effects or random effects when I have fewer than five levels of a grouping factor in a mixed-effects model?". PeerJ. 10: e12794. doi:10.7717/peerj.12794.
  7. ^ 램지, F, 쉐퍼, D, 2002. Statistical Sleuth: 데이터 분석 방법의 과정, 2차 개정. 덱스베리 프레스
  8. ^ Cameron, A. Colin; Trivedi, Pravin K. (2005). Microeconometrics: Methods and Applications. Cambridge University Press. pp. 717–19.
  9. ^ Nerlove, Marc (2005). Essays in Panel Data Econometrics. Cambridge University Press. pp. 36–39.
  10. ^ Garcia, Oscar. (1983). "A stochastic differential equation model for the height growth of forest stands". Biometrics: 1059–1072.
  11. ^ Tait, David; Cieszewski, Chris J.; Bella, Imre E. (1986). "The stand dynamics of lodgepole pine". Can. J. For. Res. 18: 1255–1260.
  12. ^ Strub, Mike; Cieszewski, Chris J. (2006). "Base–age invariance properties of two techniques for estimating the parameters of site index models". Forest Science. 52 (2): 182–186.
  13. ^ Strub, Mike; Cieszewski, Chris J. (2003). "Fitting global site index parameters when plot or tree site index is treated as a local nuisance parameter In: Burkhart HA, editor. Proceedings of the Symposium on Statistics and Information Technology in Forestry; 2002 September 8–12; Blacksburg, Virginia: Virginia Polytechnic Institute and State University": 97–107. {{cite journal}}: Cite 저널은 필요로 한다. journal= (도움말)
  14. ^ Cieszewski, Chris J.; Harrison, Mike; Martin, Stacey W. (2000). "Practical methods for estimating non-biased parameters in self-referencing growth and yield models" (PDF). PMRC Technical Report. 2000 (7): 12.
  15. ^ Schnute, Jon; McKinnell, Skip (1984). "A biologically meaningful approach to response surface analysis". Can. J. Fish. Aquat. Sci. 41: 936–953.
  16. ^ Wooldridge, Jeffrey M. (2001). Econometric Analysis of Cross Section and Panel Data. MIT Press. pp. 279–291. ISBN 978-0-262-23219-7.
  17. ^ Chamberlain, Gary (1984). "Chapter 22 Panel data". 2: 1247–1318. doi:10.1016/S1573-4412(84)02014-6. ISSN 1573-4412. {{cite journal}}: Cite 저널은 필요로 한다. journal= (도움말)
  18. ^ Ren, Bin; Dong, Ruobing; Esposito, Thomas M.; Pueyo, Laurent; Debes, John H.; Poteet, Charles A.; Choquet, Élodie; Benisty, Myriam; Chiang, Eugene; Grady, Carol A.; Hines, Dean C.; Schneider, Glenn; Soummer, Rémi (2018). "A Decade of MWC 758 Disk Images: Where Are the Spiral-Arm-Driving Planets?". The Astrophysical Journal Letters. 857: L9. arXiv:1803.06776. Bibcode:2018ApJ...857L...9R. doi:10.3847/2041-8213/aab7f5.

참조

  • Christensen, Ronald (2002). Plane Answers to Complex Questions: The Theory of Linear Models (Third ed.). New York: Springer. ISBN 0-387-95361-2.
  • Gujarati, Damodar N.; Porter, Dawn C. (2009). "Panel Data Regression Models". Basic Econometrics (Fifth international ed.). Boston: McGraw-Hill. pp. 591–616. ISBN 978-007-127625-2.
  • Hsiao, Cheng (2003). "Fixed-effects models". Analysis of Panel Data (2nd ed.). New York: Cambridge University Press. pp. 95–103. ISBN 0-521-52271-4.
  • Wooldridge, Jeffrey M. (2013). "Fixed Effects Estimation". Introductory Econometrics: A Modern Approach (Fifth international ed.). Mason, OH: South-Western. pp. 466–474. ISBN 978-1-111-53439-4.

외부 링크