지수 평활
Exponential smoothing![]() |
지수 평활은 지수 창 함수를 사용하여 시계열 데이터를 평활하기 위한 경험적 기법입니다.단순 이동 평균에서는 과거 관측치에 균등하게 가중치가 부여되는 반면, 지수 함수는 시간에 따라 기하급수적으로 감소하는 가중치를 할당하는 데 사용됩니다.계절성 등 사용자의 사전 가정을 바탕으로 결정을 내리기 위해 쉽게 학습하고 쉽게 적용할 수 있는 절차입니다.지수 평활은 시계열 데이터 분석에 자주 사용됩니다.
지수 평활은 신호 처리 시 부드러운 데이터에 일반적으로 적용되는 여러 창 기능 중 하나로, 고주파 노이즈를 제거하는 로우패스 필터 역할을 합니다.이 방법은 19세기부터 포아송의 재귀 지수 창 함수를 사용한 것뿐만 아니라 콜모고로프와 주르벤코의 1940년대 난류 연구에서 재귀 이동 평균을 사용한 것에 선행한다.
The raw data sequence is often represented by beginning at time , and the output of the exponential smoothing algorithm is commonly written as , which may be regarded as a best estimate of what the next value of x은 (는)관측 시퀀스가 t {\ t에서 시작되면 가장 간단한 형태의 지수 평활은 다음과 같은 공식으로 제공됩니다.[1]
서α {\는 평활화 계수이며 << 1 {\0 <1 입니다.
기본(단순) 지수 평활(홀트 선형)
지수 창 함수의 사용은 17세기부터 수치 분석 기법의 확장으로 처음 포아송에[2] 기인하며, 이후 1940년대에 신호 처리 커뮤니티에 의해 채택되었다.여기서 지수 평활은 지수 또는 포아송 창 함수를 적용하는 것입니다.지수 평활은 1956년 [3]로버트 구델 브라운의 이전 연구에 대한 인용 없이 통계 문헌에서 처음 제안되었고, 찰스 C에 의해 확장되었다. 1957년 [4]홀트.일반적으로 사용되는 아래 공식은 Brown에 기인하며 "Brown의 단순 지수 평활"[5]로 알려져 있습니다.Holt, Winters 및 Brown의 모든 방법은 유한 임펄스 응답(FIR) 필터를 무한 임펄스 응답 필터로 변환하기 위해 1940년대에[2] 처음 발견된 재귀 필터링의 단순한 적용으로 볼 수 있습니다.
지수 평활의 가장 간단한 형태는 다음 공식으로 제공됩니다.
서α {\는 평활계수이고 0≤ 1 {\1이다. 즉, t {\는 현재 xt {\와 이전 -의 단순 가중평균이다. 단순 지수 평활은 쉽게 적용되며 두 개의 관측치를 사용할 수 있는 즉시 평활된 통계량을 생성합니다.여기서α(\에 되는 평활 계수라는 용어는 잘못된 명칭으로,α(\ \alpha})의 값이 클수록 평활 수준이 감소하며 α(\ \alpha = 제한의 경우 출력 시리즈는 현재 관측치일 뿐입니다.1에 가까운α(\ 은 평활 효과가 적고 최근 데이터 변경에 가중치가 큰 반면, 0에 가까운displaystyle \alpha 값은 평활 효과가 크고 최근 변경에 대한 반응성이 낮다.
α를 하는 데 공식적으로 올바른 절차는 없다. 때로는 통계학자의 판단이 적절한 요소를 선택하는 데 사용된다.또는 통계기법을 사용하여의 값을 최적화할 수 있다. 예를 들어, 최소 제곱법을 사용하여의 값( - x +) 2의 을 최소화할 수 있다.d.[6]
단순 이동 평균과 같은 다른 평활 방법과 달리 이 기술은 결과를 내기 전에 최소 수의 관측치를 만들 필요가 없습니다.그러나 실제로는 여러 샘플이 함께 평균화될 때까지 "좋은 평균"이 달성되지 않습니다. 예를 들어 일정한 신호는 실제 값의 95%에 도달하는 데 약 /α(\ 3 단계가 소요됩니다.오래된 샘플의 무게가 기하급수적으로 감소하기 때문에 정보 손실 없이 원래 신호를 정확하게 재구성하려면 지수 이동 평균의 모든 단계를 사용할 수 있어야 합니다.이는 평균 내에서 표본의 지속적인 가중치로 인해 많은 정보 손실 없이 일부 표본을 건너뛸 수 있는 단순한 이동 평균과는 대조적이다.기존의 샘플 수가 누락될 경우 새 샘플과 건너뛸 모든 샘플에 동일한 가중치를 부여하여 가중 평균을 조정할 수도 있습니다.
지수 평활의 이 간단한 형식을 지수 가중 이동 평균(EWMA)이라고도 합니다.기술적으로 항이 [7]일정하지 않은 자기 회귀 통합 이동 평균(ARIMA)(0,1,1) 모형으로도 분류할 수 있습니다.
시간 상수
지수 이동 평균의 시간 상수는 단위 스텝 함수의 평활 응답이 원래 신호의 1- / e63디스플레이 1-1/e\에 입니다.이 시간 상수 {\ \와 평활 계수 {\의 관계는 다음 공식으로 나타납니다.
- 1- - T / ( \ displaystyle 1 - \ T / \ ) - T -) ( \ \ - { \ ( 1 - ) { \ ( 1 - ln ( 1 - )}} }
여기서 T \T는 이산 시간 구현의 샘플링 시간 간격입니다.샘플링 시간이 시간 상수( Tdisplay \ \ T \ tau)에 비해 빠릅니다.
초기 평활값 선택
위의 정의에서는 0이 x(\으로 초기화되어 있습니다.지수의 스무딩에는 각 단계에서 이전 예측이 필요하기 때문에 메서드를 시작하는 방법은 명확하지 않습니다.초기 예측은 수요의 초기 값과 동일하다고 가정할 수 있지만, 이 접근법에는 심각한 단점이 있습니다.지수 평활은 과거 관측치에 상당한 비중을 두므로 수요의 초기 값은 초기 예측에 터무니없이 큰 영향을 미칩니다.이 문제는 프로세스가 적절한 기간(10개 이상) 동안 진화하도록 허용하고 해당 기간 동안의 수요 평균을 초기 예측으로 사용함으로써 극복할 수 있다.이 초기값을 설정하는 방법은 여러 가지가 있지만 α 이 작을수록 예측이 이 초기 값 0(\[8][9]0})의 선택에 더욱 민감해집니다.
최적화
모든 지수 평활 방법에 대해 평활 모수의 값도 선택해야 합니다.단순 지수 평활의 경우 평활 모수(α)가 하나만 있지만 다음 방법의 경우 일반적으로 평활 모수가 두 개 이상 있습니다.
평활화 모수가 주관적인 방식으로 선택되는 경우가 있습니다. 즉, 예보관은 이전 경험을 바탕으로 평활화 모수의 값을 지정합니다.그러나 지수 평활 방법에 포함된 알 수 없는 모수에 대한 값을 구하는 보다 강력하고 객관적인 방법은 관측된 데이터에서 값을 추정하는 것입니다.
지수 평활 방법에 대한 알 수 없는 모수와 초기 값은 오차 제곱합(SSE)을 최소화하여 추정할 수 있습니다.오류는 , {\ t에 대해 e t t - ^ t { _ { t } - { t \ - { \ hat { } - { t \ mid t } - { } - { t \ mid t - { t } - { t } - { t } - { t } - { t ( t )로 지정됩니다.따라서 알 수 없는 파라미터의 값 및 초기값이 검출되어
회귀 사례(SSE를 최소화하는 회귀 계수를 직접 계산하는 공식)와 달리, 여기에는 비선형 최소화 문제가 포함되며 이를 수행하려면 최적화 도구를 사용해야 합니다.
'지수적' 명명
'지수 평활'이라는 이름은 컨볼루션 중에 지수 창 함수를 사용하기 때문에 붙여진 것입니다.그것은 더 이상 홀트, 윈터스, 브라운에 기인하지 않는다.
간단한 지수 평활을 위한 정의 방정식을 직접 대체함으로써 우리는 다음과 같은 사실을 알게 된다.
즉, 시간이 경과함에 따라 평활화된 st {\t}}는 과거 t-, -t - {\ \의 가중평균이 되며, 이전 관측치에 할당된 가중치는 기하학적 조건에 비례한다.진행
기하 급수는 지수 함수의 이산 버전이기 때문에 통계 정보에 따라 이 평활 방법의 이름이 여기에서 유래되었습니다.
이동 평균과의 비교
지수 평활과 이동 평균에는 입력 데이터에 상대적인 지연이 발생하는 유사한 결점이 있습니다.이것은 이동 평균이나 가우스와 같은 대칭 커널의 윈도우 길이의 절반만큼 결과를 이동시킴으로써 수정될 수 있지만, 이것이 지수 평활에 얼마나 적합한지는 불분명하다.또한 α = 2/(k + 1)일 때 예측 오차 분포는 거의 동일합니다.이들은 지수 평활이 모든 과거 데이터를 고려하는 반면 이동 평균은 k개의 과거 데이터 점만 고려한다는 점에서 다릅니다.계산적으로 볼 때, 이들은 또한 이동 평균이 과거 k개의 데이터 지점 또는 지연 k + 1에 있는 데이터 지점에 가장 최근의 예측 값을 더한 값을 유지하도록 요구하는 반면, 지수 평활은 가장 최근의 예측 [11]값만 유지하면 된다는 점에서 다르다.
신호처리 문헌에서는 비원인(대칭) 필터의 사용이 일반적이며 지수창 함수는 이 방법으로 널리 사용되고 있지만 다른 용어가 사용된다.지수 평활은 1차 무한임펄스 응답(IIR) 필터와 동등하며 이동 평균은 유한임펄스 응답과 동등하다.가중 계수가 동일한 온세 필터.
이중 지수 평활
데이터에 추세가 있는 경우 단순 지수 평활은 잘 수행되지 않습니다.[1] 이러한 상황에서 "이중 지수 평활" 또는 "이중 지수 평활"이라는 이름으로 여러 가지 방법이 고안되었습니다. 이 방법은 지수 필터를 두 번 재귀적으로 적용하기 때문에 "이중 지수 평활"이라고 불립니다.이 명명법은 재귀 [12]깊이를 참조하는 4배 지수 평활과 유사합니다.이중 지수 평활의 기본 개념은 일련의 추세가 어떤 형태로든 나타날 가능성을 고려하는 용어를 도입하는 것입니다.이 경사 구성요소는 지수 평활을 통해 업데이트됩니다.
한 가지 방법은 다음과 같습니다.[13]
다시 관찰의 원시 데이터 시퀀스는 t 부터 {\로 됩니다. 시간 {\ t에 대한 평활값을 나타내기 위해 s {\displaystyle t}를 합니다. {\}}}는 t에서 추세의 최선의 추정치입니다.저는 t입니다.알고리즘의 출력은 F +m (\m로 되어 있습니다.이것은 t까지의 원시 데이터에한 m> 0 (\ 에서의 t + (\x_{t+m 의 추정치입니다.이중 지수 평활은 공식에 의해 제공됩니다.
t> < t 의
서α({ 1 0 \ 1)은 데이터 평활 이고β 1는 트렌드 평활 계수입니다.
t를 초과하는 예측은 다음과 같이 근사치입니다.
bb의 설정은 우선 사항입니다.위의 옵션 이외의 옵션은 - n ( n\ n}의 경우 { { x { } - x { 0 } { } 。
F는0 정의되지 않았으며(시간 0에 대한 추정은 없음), 잘 정의된 정의 F1=s0+b에0 따라 추가 값을 평가할 수 있습니다.
브라운의 선형 지수 평활(LES) 또는 브라운의 이중 지수 평활이라고 하는 두 번째 방법은 다음과 같이 작동합니다.[14]
여기서t a는 t시점과 b시점의t 추정치 수준이며 t시점의 추정치는 다음과 같다.
삼중 지수 평활(Holt Winters)
트리플 지수 평활은 지수 평활을 세 번 적용하는데, 이는 스터디 중인 시계열에서 제거할 고주파 신호가 세 개 있을 때 일반적으로 사용됩니다.계절성에는 다른 유형이 있다: 덧셈과 곱셈이 수학에서 기본 연산인 것처럼 본질적으로 '승법'과 '가법'이다.
만약 우리가 12월 매달 11월보다 10,000채의 아파트를 더 많이 판다면 계절성은 본질적으로 부가적이다.하지만 여름 아파트가 겨울보다 10% 더 많이 팔리면 계절성은 배가된다.승수 계절성은 절대량이 아닌 상수 인자로 나타낼 수 있습니다.[15]
트리플 지수 평활은 Holt의 학생인 Peter Winters가 1940년대 지수 [16]평활에 관한 신호 처리 책을 읽은 후 1960년에 처음 제안했습니다.홀트의 참신한 생각은 이전 [16]시대 학자들에게 인기가 있었던 1보다 크고 5보다 작은 홀트 수의 필터를 반복하는 것이었다.재귀 필터링은 이전에 사용된 적이 있지만, Hadamard 추측과 일치하도록 2회, 4회 적용되었으며, 3회 적용에는 단수 회전의 2배 이상의 연산이 요구되었습니다.트리플 어플리케이션의 사용은 이론적인 기초에 기초한 것이 아니라 경험의 법칙으로 간주되며, 실무자에 의해 종종 과대평가되어 왔다. - 계절 변화의 주기가 len인 일련의 t{\ 가 있다고 가정하자. L\ L。
이 방법에서는 데이터의 트렌드라인과 해당 시점이 L L 사이클에서 어디에 속하는지 기준으로 트렌드라인의 값에 가중치를 부여하는 계절 인덱스를 계산합니다.
t}는 시간 t{\t {\는 변화에 중첩된 선형 트렌드의 최적 추정치 , c {\ 는 계절 보정 시퀀스입니다.요인들.관찰이 이루어지는 사이클에서 c tt \ _ { } L \ L 。경험적으로 계절적 요인 세트를 초기화하려면 최소 2개의 전체 시즌( 의 이력 데이터가 필요하다.
이 알고리즘의 출력 다시 Ft+m{\displaystyle F_{t+m}}, xt+m{\displaystyle x_{t+m}의 값의 시간에 견적}t+m>0{\displaystyle t+m>0} 미가공 데이터에 t{\displaystyle지}증가하는 계절적 특성과. 트리플 지수 smoothing이 주어질 때까지 기반을 두고 쓴 것이다.th에 의해e[1] 공식
서α(\ 1)는 스무딩 계수 01)는 트렌드 스무딩 계수,0\1)는 입니다개별 변경 평활 인자.
추세 의 일반적인 공식은 다음과 같다
i ,2, {\ i 2에 계절 i}}의 초기 추정치를 설정하는 것은 조금 더 복잡하다.N N이 데이터에 존재하는 전체 사이클 수인 :
어디에
j{ A _ { } is 、 \ j^ { \ { } of of {\ {\ {\ {\ {\ {\ x{\의 입니다.
가법 계절성을 갖는 삼중 지수 평활은 다음과 같이 구할 수 있습니다.
통계 패키지 구현
- R: Stats[17] 패키지의 HoltWinters 함수 및[18] Forecast 패키지의 ets 함수(더 완전한 구현으로 일반적으로 더 나은 성능을[19] 얻을 수 있습니다).
- Python: Statsmodels 패키지의 Holtwinters 모듈은 단순, 이중 및 삼중 지수 평활을 가능하게 합니다.
- IBM SPSS는 Statistics 및 Modeler 통계 패키지의 Time-Series 모델링 절차에 Simple, Simple Seasonal, Holt's Linear Trend, Brown's Linear Trend, Damped Trend, Winters' Addition 및 Winters' Multiplative를 포함합니다.기본 Expert Modeler 기능은 계절 및 계절이 아닌 p, d 및 q 값의 범위를 사용하여 7가지 지수 평활 모형과 ARIMA 모형을 모두 평가하고 베이지안 정보 기준 통계량이 가장 낮은 모형을 선택합니다.
- Stata: tssmooth[20] 명령어
- LibreOffice 5.2[21]
- Microsoft Excel 2016[22]
「 」를 참조해 주세요.
- 자기 회귀 이동 평균 모형(ARMA)
- 통계량의 오차 및 잔차
- 이동평균
- 연속분율
메모들
- ^ a b c "NIST/SEMATECH e-Handbook of Statistical Methods". NIST. Retrieved 23 May 2010.
- ^ a b Oppenheim, Alan V.; Schafer, Ronald W. (1975). Digital Signal Processing. Prentice Hall. p. 5. ISBN 0-13-214635-5.
- ^ Brown, Robert G. (1956). Exponential Smoothing for Predicting Demand. Cambridge, Massachusetts: Arthur D. Little Inc. p. 15.
- ^ Holt, Charles C. (1957). "Forecasting Trends and Seasonal by Exponentially Weighted Averages". Office of Naval Research Memorandum. 52. 에 전재된.
- ^ Brown, Robert Goodell (1963). Smoothing Forecasting and Prediction of Discrete Time Series. Englewood Cliffs, NJ: Prentice-Hall.
- ^ "NIST/SEMATECH e-Handbook of Statistical Methods, 6.4.3.1. Single Exponential Smoothing". NIST. Retrieved 5 July 2017.
- ^ Nau, Robert. "Averaging and Exponential Smoothing Models". Retrieved 26 July 2010.
- ^ "생산 및 운영 분석" 나흐미아스.2009.
- ^ 치사르, P. 및 치사르, S. M. (2011년)"EWMA 통계의 최적화 방법"악타 폴리테크니카 헝가리카, 8(5), 73-87.78쪽.
- ^ 7.1 Simple exponential smoothing Forecasting: Principles and Practice.
- ^ Nahmias, Steven (3 March 2008). Production and Operations Analysis (6th ed.). ISBN 0-07-337785-6.[페이지 필요]
- ^ "Model: Second-Order Exponential Smoothing". SAP AG. Retrieved 23 January 2013.
- ^ "6.4.3.3. Double Exponential Smoothing". itl.nist.gov. Retrieved 25 September 2011.
- ^ "Averaging and Exponential Smoothing Models". duke.edu. Retrieved 25 September 2011.
- ^ Kalehar, Prajakta S. "Time series Forecasting using Holt–Winters Exponential Smoothing" (PDF). Retrieved 23 June 2014.
- ^ a b Winters, P. R. (April 1960). "Forecasting Sales by Exponentially Weighted Moving Averages". Management Science. 6 (3): 324–342. doi:10.1287/mnsc.6.3.324.
- ^ "R: Holt–Winters Filtering". stat.ethz.ch. Retrieved 5 June 2016.
- ^ "ets {forecast} inside-R A Community Site for R". inside-r.org. Archived from the original on 16 July 2016. Retrieved 5 June 2016.
- ^ "Comparing HoltWinters() and ets()". Hyndsight. 29 May 2011. Retrieved 5 June 2016.
- ^ Stata 매뉴얼의 tssmooth
- ^ "LibreOffice 5.2: Release Notes – the Document Foundation Wiki".
- ^ "Excel 2016 Forecasting Functions Real Statistics Using Excel".
외부 링크
- 지수 평활 강의 노트(Duke University, Robert Nau)
- 데이터 스무딩 by Jon McLoone, Wolfram 데모 프로젝트
- 지수적 스무딩에 대한 Holt-Winters 접근법: Paul Goodwin(2010)의 50세 및 강자: 국제 응용 예측 저널
- 불규칙한 간격의 시계열 알고리즘: Andreas Eckner의 이동 평균 및 기타 압연 연산자