박스-젠킨스 방법

Box–Jenkins method

시계열 분석에서 통계학자George BoxGwilym Jenkins의 이름을 [1]따서 명명된 Box-Jenkins 방법시계열의 과거 값에 가장 적합한 시계열 모형을 찾기 위해 자기 회귀 이동 평균(ARMA) 또는 자기 회귀 통합 이동 평균(ARIMA) 모형을 적용합니다.

모델링 접근법

원래 모델은 반복적인 3단계 모델링 접근법을 사용합니다.

  1. 모형 식별모형 선택: 변수가 정상 상태인지 확인하고 종속계열에서 계절성을 식별(필요한 경우 계절적으로 차이), 그리고 종속 시계열의 자기 상관(ACF)부분 자기 상관(PACF) 함수의 그림을 사용하여 모형에서 자기 회귀 또는 이동 평균 성분을 사용해야 하는지 결정합니다.
  2. 계산 알고리즘을 사용하여 선택한 ARIMA 모델에 가장 적합한 계수에 도달하는 파라미터 추정. 가장 일반적인 방법은 최대 우도 추정 또는 비선형 최소 자승 추정을 사용합니다.
  3. 추정된 모형이 정지 일변량 공정의 규격에 적합한지 여부를 검정하여 통계적 모형을 검사합니다. 특히 잔차는 서로 독립적이고 시간에 따른 평균과 분산이 일정해야 합니다. (시간에 따른 잔차의 평균과 분산을 표시하고 Ljung-Box 검정을 수행하거나 잔차의 자기 상관 및 부분 자기 상관을 표시하는 것이 잘못된 규격을 식별하는 데 도움이 됩니다.) 추정이 부적절하다면, 우리는 1단계로 돌아가 더 나은 모델을 구축하려고 시도해야 합니다.

그들이 사용한 데이터는 가스로에서 가져온 것입니다. 이러한 데이터는 예측 모형을 벤치마킹하기 위한 Box and Jenkins 가스로 데이터로 잘 알려져 있습니다.

Commander & Koopman(2007, §10.4)은 Box-Jenkins 접근법이 근본적으로 문제가 있다고 주장합니다. 문제는 "경제와 사회 분야에서는 아무리 많은 차이가 있어도 실제 시리즈는 결코 고정되어 있지 않기 때문"에 발생합니다. 따라서 조사관은 정지 상태에서 얼마나 가까운가라는 질문에 직면해야 합니다. 저자들이 언급하듯이, "이것은 대답하기 어려운 질문입니다." 저자들은 또한 Box-Jenkins를 사용하는 것보다 상태 공간 방법을 사용하는 것이 더 낫다고 주장합니다. 그러면 시계열의 고정성이 필요하지 않기 때문입니다.

Box-Jenkins 모형 식별

정상성 및 계절성

Box-Jenkins 모형을 개발하는 첫 번째 단계는 시계열이 정지 상태에 있는지 여부와 모형화해야 할 중요한 계절성이 있는지 여부를 결정하는 것입니다.

정상성 탐지 중

안정성은 런 시퀀스 그림에서 평가할 수 있습니다. 런 시퀀스 그림에는 일정한 위치와 척도가 표시되어야 합니다. 자기 상관도에서도 탐지할 수 있습니다. 특히, 비안정성은 종종 매우 느린 감쇠를 가진 자기 상관 그림으로 표시됩니다.

계절성 탐지

계절성(또는 주기성)은 일반적으로 자기 상관 그림, 계절 하위 계열 그림 또는 스펙트럼 그림에서 평가할 수 있습니다.

안정성을 달성하기 위한 차분

Box와 Jenkins는 안정성을 얻기 위해 차분 접근법을 권장합니다. 그러나 곡선을 적합시키고 원래 데이터에서 적합치를 뺀 값은 Box-Jenkins 모형의 맥락에서도 사용할 수 있습니다.

계절차분

모형 식별 단계에서는 계절성이 있는 경우 계절성을 감지하고 계절 자기 회귀 및 계절 이동 평균 항의 순서를 식별하는 것이 목표입니다. 많은 시리즈의 경우 기간이 알려져 있고 단일 계절성 항으로 충분합니다. 예를 들어, 월별 데이터의 경우 일반적으로 계절적 AR 12 항 또는 계절적 MA 12 항을 포함합니다. Box-Jenkins 모형의 경우 모형을 적합시키기 전에 계절성을 명확하게 제거하지 않습니다. 대신 ARIMA 추정 소프트웨어에 대한 모형 사양의 계절 항 순서를 포함합니다. 그러나 계절적 차이를 데이터에 적용하고 자기 상관 및 부분 자기 상관 그림을 재생성하는 것이 도움이 될 수 있습니다. 이는 모형의 비계절 성분의 모형 식별에 도움이 될 수 있습니다. 어떤 경우에는 계절성 차이가 계절성 효과의 대부분 또는 전부를 제거할 수 있습니다.

pq 식별

안정성과 계절성이 해결되면 다음 단계는 자기 회귀 및 이동 평균 항의 순서(, p와 q)를 식별하는 것입니다. 저자마다 p와 q를 식별하기 위한 접근 방식이 다릅니다. Brockwell과 Davis(1991)[3]는 "[ARMA(p,q) 모델 중] 모델 선택에 대한 우리의 주요 기준은 AICc가 될 것입니다." 즉, 보정이 있는 Akaike 정보 기준입니다. 다른 저자는 아래에 설명된 자기 상관 그림과 부분 자기 상관 그림을 사용합니다.

자기 상관 및 부분 자기 상관 그림

표본 자기 상관 그림과 표본 부분 자기 상관 그림은 순서가 알려져 있을 때 이러한 그림의 이론적 행동과 비교됩니다.

구체적으로, AR(1) 공정의 경우 표본 자기 상관 함수는 지수 함수적으로 감소하는 모양을 가져야 합니다. 그러나 고차 AR 프로세스는 기하급수적으로 감소하는 사인파 성분과 감쇠된 사인파 성분이 혼합된 경우가 많습니다.

고차 자기 회귀 공정의 경우 표본 자기 상관을 부분 자기 상관 그림으로 보충해야 합니다. AR(p) 공정의 부분 자기 상관은 lag p + 1 이상에서 0이 되므로 표본 부분 자기 상관 함수를 조사하여 0에서 벗어난 증거가 있는지 확인합니다. 이 값은 일반적으로 표본 부분 자기 상관도(표본 자기 상관도를 생성하는 대부분의 소프트웨어 프로그램도 이 신뢰 구간을 표시함)에 95% 신뢰 구간을 배치하여 결정됩니다. 소프트웨어 프로그램이 신뢰 대역을 생성하지 않는 경우 약± / N 이며N은 표본 크기를 나타냅니다.

MA(q) 공정의 자기 상관 함수는 lag q + 1 이상에서 0이 되므로 표본 자기 상관 함수를 조사하여 본질적으로 0이 되는 위치를 확인합니다. 표본 자기 상관 함수에 대한 95% 신뢰 구간을 표본 자기 상관 그림에 배치하여 이 작업을 수행합니다. 자기 상관도를 생성할 수 있는 대부분의 소프트웨어도 이 신뢰 구간을 생성할 수 있습니다.

표본 부분 자기 상관 함수는 일반적으로 이동 평균 공정의 순서를 식별하는 데 도움이 되지 않습니다.

모형 식별을 위해 표본 자기 상관 함수를 사용할 수 있는 방법을 요약하면 다음 표와 같습니다.

모양. 표시된 모델
지수, 0으로 감소 자기회귀모형. 부분 자기 상관 그림을 사용하여 자기 회귀 모형의 순서를 식별할 수 있습니다.
양과 음을 번갈아 가며 0으로 감소 자기회귀모형. 편 자기 상관도를 사용하여 순서를 식별할 수 있습니다.
하나 이상의 스파이크, 나머지는 기본적으로 0(또는 0에 가까움)입니다. 이동 평균 모형, 그림이 0이 되는 위치로 식별된 순서입니다.
몇 번의 시차를 두고 시작하는 붕괴 혼합 자기 회귀 및 이동 평균(ARMA) 모델.
모두 0이거나 0에 가깝습니다. 데이터는 기본적으로 무작위입니다.
고정된 간격에서 높은 값 계절적 자기 회귀 항을 포함합니다.
0으로 붕괴되지 않음(또는 매우 느리게 붕괴됨) 시리즈는 고정되어 있지 않습니다.

힌드만과 아타나소풀로스는 다음과 같이 제안합니다.[4]

서로 다른 데이터의 ACF 및 PACF 그림이 다음 패턴을 나타내는 경우 데이터는 ARIMA(p,d,0) 모델을 따를 수 있습니다.
  • ACF가 지수 함수적으로 붕괴하거나 사인모양입니다.
  • PACF의 lag p에는 상당한 스파이크가 있지만 lag p를 넘지는 않습니다.
서로 다른 데이터의 ACF 및 PACF 그림이 다음 패턴을 나타내는 경우 데이터는 ARIMA(0,d,q) 모델을 따를 수 있습니다.
  • PACF가 지수 함수적으로 붕괴하거나 사인모양입니다.
  • ACF에서 lag q에 상당한 스파이크가 있지만 lag q를 초과하지는 않습니다.

실제로 표본 자기 상관 및 편 자기 상관 함수는 랜덤 변수이며 이론 함수와 동일한 그림을 제공하지 않습니다. 이로 인해 모델 식별이 더 어려워집니다. 특히 혼합 모델은 식별이 특히 어려울 수 있습니다. 경험은 도움이 되지만 이러한 표본 그림을 사용하여 좋은 모형을 개발하려면 많은 시행착오가 수반될 수 있습니다.

Box-Jenkins 모형 추정

Box-Jenkins 모형의 모수를 추정하는 것은 비선형 방정식의 해를 수치적으로 근사하는 것을 포함합니다. 이러한 이유로 접근 방식을 처리하기 위해 설계된 통계 소프트웨어를 사용하는 것이 일반적입니다. 거의 모든 최신 통계 패키지에는 이러한 기능이 포함되어 있습니다. Box-Jenkins 모형을 적합시키는 주요 방법은 비선형 최소 제곱과 최대 우도 추정입니다. 최대 우도 추정은 일반적으로 선호되는 기법입니다. 전체 Box-Jenkins 모형에 대한 우도 방정식은 복잡하므로 여기에 포함되지 않습니다. 수학적 세부 사항은 (Brockwell and Davis, 1991)을 참조하십시오.

Box-Jenkins 모형 진단

안정 일변량 공정에 대한 가정

Box-Jenkins 모형에 대한 모형 진단은 비선형 최소 자승 적합에 대한 모형 검증과 유사합니다.

즉, 오차항 At 정지 일변량 공정에 대한 가정을 따른다고 가정합니다. 잔차는 평균과 분산이 일정한 고정 분포에서 추출한 백색 잡음(또는 분포가 정규 분포일 때 독립적임) 도면이어야 합니다. Box-Jenkins 모형이 데이터에 좋은 모형이라면 잔차가 이러한 가정을 만족해야 합니다.

이러한 가정이 충족되지 않으면 보다 적합한 모형을 적합시켜야 합니다. 즉, 모델 식별 단계로 돌아가 더 나은 모델을 개발하도록 노력합니다. 잔차 분석을 통해 보다 적절한 모형에 대한 몇 가지 단서를 얻을 수 있기를 바랍니다.

Box-Jenkins 모형의 잔차가 가정을 따르는지 여부를 평가하는 한 가지 방법은 잔차의 통계적 그래픽(자기 상관도 포함)을 생성하는 것입니다. Box–Ljung 통계량 값도 볼 수 있습니다.

참고문헌

  1. ^ Box, George; Jenkins, Gwilym (1970). Time Series Analysis: Forecasting and Control. San Francisco: Holden-Day.
  2. ^ Commandeur, J. J. F.; Koopman, S. J. (2007). Introduction to State Space Time Series Analysis. Oxford University Press.
  3. ^ Brockwell, Peter J.; Davis, Richard A. (1991). Time Series: Theory and Methods. Springer-Verlag. p. 273. Bibcode:1991tstm.book.....B.
  4. ^ Hyndman, Rob J; Athanasopoulos, George. Forecasting: principles and practice. Retrieved 18 May 2015.

더보기

  • Beveridge, S.; Oickle, C. (1994), "Comparison of Box–Jenkins and objective methods for determining the order of a non-seasonal ARMA model", Journal of Forecasting, 13 (5): 419–434, doi:10.1002/for.3980130502
  • Pankratz, Alan (1983), Forecasting with Univariate Box–Jenkins Models: Concepts and Cases, John Wiley & Sons

외부 링크

Public Domain 이 기사는 다음의 퍼블릭 도메인 자료를 포함합니다.