Distributed lag

In statistics and econometrics, a distributed lag model is a model for time series data in which a regression equation is used to predict current values of a dependent variable based on both the current values of an explanatory variable and the lagged (past period) values of this explanatory variable.[1][2]

The starting point for a distributed lag model is an assumed structure of the form

or the form

where yt is the value at time period t of the dependent variable y, a is the intercept term to be estimated, and wi is called the lag weight (also to be estimated) placed on the value i periods previously of the explanatory variable x. In the first equation, the dependent variable is assumed to be affected by values of the independent variable arbitrarily far in the past, so the number of lag weights is infinite and the model is called an infinite distributed lag model. In the alternative, second, equation, there are only a finite number of lag weights, indicating an assumption that there is a maximum lag beyond which values of the independent variable do not affect the dependent variable; a model based on this assumption is called a finite distributed lag model.

In an infinite distributed lag model, an infinite number of lag weights need to be estimated; clearly this can be done only if some structure is assumed for the relation between the various lag weights, with the entire infinitude of them expressible in terms of a finite number of assumed underlying parameters. In a finite distributed lag model, the parameters could be directly estimated by ordinary least squares (assuming the number of data points sufficiently exceeds the number of lag weights); nevertheless, such estimation may give very imprecise results due to extreme multicollinearity among the various lagged values of the independent variable, so again it may be necessary to assume some structure for the relation between the various lag weights.

분산 지연 모델의 개념은 하나 이상의 오른쪽 측면 설명 변수의 맥락에 쉽게 일반화된다.

비정형추정

분산된 시차들과 관련된 파라미터를 추정하는 가장 간단한 방법은 일반 최소 제곱에 의해, 고정된 최대 p를 가정하고 독립적이고 동일하게 분포된 오류를 가정하며, 지연된 설명자의 계수의 관계에 대한 구조를 서로 부과하지 않는 것이다. 그러나 지연된 설명자 사이의 다중 공선성은 종종 발생하여 계수 추정치의 높은 분산을 초래한다.

구조추정

구조화된 분산 지연 모델은 유한형과 무한형의 두 가지 유형으로 나온다. 무한분포시차(infinite distributed substance)는 특정 시간에 독립변수의 값을 사용하여 종속변수에 무한히 영향을 미치거나, 또는 다른 방식으로 말하면 종속변수의 현재 값이 무한히 오래 전에 발생한 독립변수의 값에 의해 영향을 받지만, 일부 la를 벗어나도록 허용한다.g 길이가 효과가 0으로 점점 가늘어진다. 유한분포시차에서는 특정 시간에 독립변수가 유한한 기간 동안만 종속변수에 영향을 미칠 수 있다.

유한분포시차

가장 중요한 구조화된 유한분산 지연 모델은 Almon 지연 모델이다.[3] 이 모델은 데이터가 시차 구조의 모양을 결정할 수 있도록 하지만 연구자는 최대 시차 길이를 지정해야 한다. 잘못 지정된 최대 시차 길이는 독립 변수의 누적 효과뿐만 아니라 추정 시차 구조의 모양을 왜곡할 수 있다. Almon lag는 k + 1 lag weight n + 1 선형 추정 가능한 기본 매개변수(n < k) aj 다음과 같은 관계가 있다고 가정한다.

= .

무한분산시차

구조화된 무한분산 지연 모델의 가장 일반적인 유형은 Koyck lag라고도 알려진 기하학적 지연이다. 이 지연 구조에서 지연된 독립 변수 값의 가중치(영향력 크기)는 지연의 길이에 따라 기하급수적으로 감소한다. 따라서 지연 구조의 형상은 이 기법의 선택에 의해 완전히 부과되는 반면, 감소율과 전체적인 효과의 크기는 데이터에 의해 결정된다. 회귀 방정식의 규격은 매우 간단하다. 설명자(회귀에서 오른쪽 변수)로 종속 변수의 1주기 지연 값과 독립 변수의 현재 값을 포함한다.

여기서 < 1{\\leq < 이 모델에서 독립변수에 대한 단위변동의 단기(동일한 주기) 효과는 b의 값인 반면, 독립변수에 대한 지속적인 단위변동의 장기(누적) 효과는 다음과 같이 보일 수 있다.

데이터가 지연 구조의 모양을 결정할 수 있도록 다른 무한 분산 지연 모델이 제안되었다. 다항식 역지연[4][5] 시차 가중치가 다음과 같은 기본 선형 추정 가능한 모수j 관련이 있다고 가정한다.

= …, i에 대해

기하학적 조합 지연[6] 시차 가중치가 다음 중 하나에 따라 기초적이고 선형적으로 추정 가능한 매개변수j a와 관련이 있다고 가정한다.

for or

for

The gamma lag[7] and the rational lag[8] are other infinite distributed lag structures.

Distributed lag model in health studies

Distributed lag models are also used in health studies as a method incorporating time-series concept into time-to-event analysis or sensitive window analysis. While time series studies have been established in epidemiology for a long time, the concept has been introduced into health-related studies in 2002 by Zanobetti and Schwartz.[9] The Bayesian version of the model was suggested by Welty in 2007.[10] Gasparrini introduces a more flexible statistical models in 2010[11] that are flexible enough to describe additional time dimensions of the exposure-response relationship, and develop the family of distributed lag non-linear models (DLNM), a modeling framework that can simultaneously represent non-linear exposure-response dependencies and delayed effects.[12]

The distributed lag model concept was first to apply to longitudinal cohort research by Hsu in 2015,[13] studying the relationship between PM2.5 and child asthma, and more complicated distributed lag method aimed to accommodate longitudinal cohort research analysis such as Bayesian Distributed Lag Interaction Model[14] by Wilson have been subsequently developed to answer similar research questions.

See also

References

  1. ^ Cromwell, Jeff B.; et al. (1994). Multivariate Tests For Time Series Models. SAGE Publications. ISBN 0-8039-5440-9.
  2. ^ Judge, George G.; Griffiths, William E.; Hill, R. Carter; Lee, Tsoung-Chao (1980). The Theory and Practice of Econometrics. New York: Wiley. pp. 637–660. ISBN 0-471-05938-2.
  3. ^ Almon, Shirley, "The distributed lag between capital appropriations and net expenditures," Econometrica 33, 1965, 178-196.
  4. ^ Mitchell, Douglas W., and Speaker, Paul J., "A simple, flexible distributed lag technique: the polynomial inverse lag," Journal of Econometrics 31, 1986, 329-340.
  5. ^ Gelles, Gregory M, Mitchell, Douglas W, "다항식 역지연의 근사 정리", Economic Letters 30, 1989, 129-132.
  6. ^ 스피커, 폴 J, 미첼, 더글러스 W, 그리고 그레고리 M, "지오메트리 조합은 유연한 무한 분산 지연 추정기로서 뒤떨어진다", Journal of Economic Dynamics and Control 13, 1989, 171-185.
  7. ^ Schmidt, Peter (1974). "A modification of the Almon distributed lag". Journal of the American Statistical Association. 69 (347): 679–681. doi:10.1080/01621459.1974.10480188.
  8. ^ Jorgenson, Dale W. (1966). "Rational distributed lag functions". Econometrica. 34 (1): 135–149. doi:10.2307/1909858. JSTOR 1909858.
  9. ^ Zanobetti, Antonella; Schwartz, Joel; Samoli, Evi; Gryparis, Alexandros; Touloumi, Giota; Atkinson, Richard; Le Tertre, Alain; Bobros, Janos; Celko, Martin; Goren, Ayana; Forsberg, Bertil (January 2002). "The temporal pattern of mortality responses to air pollution: a multicity assessment of mortality displacement". Epidemiology. 13 (1): 87–93. doi:10.1097/00001648-200201000-00014. ISSN 1044-3983. PMID 11805591. S2CID 25181383.
  10. ^ Welty, L. J.; Peng, R. D.; Zeger, S. L.; Dominici, F. (March 2009). "Bayesian distributed lag models: estimating effects of particulate matter air pollution on daily mortality". Biometrics. 65 (1): 282–291. doi:10.1111/j.1541-0420.2007.01039.x. ISSN 1541-0420. PMID 18422792.
  11. ^ Gasparrini, A; Armstrong, B; Kenward, M G (2010-09-20). "Distributed lag non-linear models". Statistics in Medicine. 29 (21): 2224–2234. doi:10.1002/sim.3940. ISSN 0277-6715. PMC 2998707. PMID 20812303.
  12. ^ "Distributed Lag Non-Linear Models [R package dlnm version 2.4.6]". cran.r-project.org. 2021-06-15. Retrieved 2021-09-17.
  13. ^ Leon Hsu, Hsiao-Hsien; Mathilda Chiu, Yueh-Hsiu; Coull, Brent A.; Kloog, Itai; Schwartz, Joel; Lee, Alison; Wright, Robert O.; Wright, Rosalind J. (2015-11-01). "Prenatal Particulate Air Pollution and Asthma Onset in Urban Children. Identifying Sensitive Windows and Sex Differences". American Journal of Respiratory and Critical Care Medicine. 192 (9): 1052–1059. doi:10.1164/rccm.201504-0658OC. ISSN 1073-449X. PMC 4642201. PMID 26176842.
  14. ^ Wilson, Ander; Chiu, Yueh-Hsiu Mathilda; Hsu, Hsiao-Hsien Leon; Wright, Robert O.; Wright, Rosalind J.; Coull, Brent A. (July 2017). "Bayesian distributed lag interaction models to identify perinatal windows of vulnerability in children's health". Biostatistics (Oxford, England). 18 (3): 537–552. doi:10.1093/biostatistics/kxx002. ISSN 1465-4644. PMC 5862289. PMID 28334179.