전력 변환

Power transform

통계에서, 전력 변환은 전력 함수를 이용한 데이터의 단조적 변환을 만들기 위해 적용된 기능의 집합이다.분산 안정화, 데이터의 정규 분포 유사성, 연관성 측도(변수 간 Pearson 상관 관계 등)의 유효성 향상 및 기타 데이터 안정화 절차에 사용되는 데이터 변환 기법이다.

전력 변환은 다중 분해능 파장 분석,[1] 통계 데이터 분석, 의료 연구, 물리적 프로세스의 모델링,[2] 지질화학 데이터 분석,[3] 역학[4] 및 기타 많은 임상, 환경 및 사회 연구 영역을 포함한 여러 분야에서 사용된다.

정의

전력 변환은 특이점(λ parameter = 0)에서 연속적으로 만드는 조각 형태의 함수 형태로 전력 매개변수 λ과 관련하여 연속적으로 변화하는 함수로 정의된다.i y > 0이 되는 데이터 벡터(y1,..., yn)의 경우, 전력 변환은

어디에

관측치 y1, ..., yn 기하학적 이다. = {\는 {{\(가) 0에 근접함에 따라 한계가 된다.To see this, note that = .Then = , and everything but becomes negligible for sufficiently small.

기하 평균의 (1955 - 1)번째 힘을 분모에 포함시키면 measurement의 변화에도 측정 단위가 변하지 않기 때문에 ( 와 관련된 모든 방정식의 과학적 해석을 단순화한다.

Box and Cox(1964)는 먼저 재조정된 전력 변환의 자코비안을 포함시킴으로써 기하학적 평균을 이 변환에 도입했다.

-

그럴 듯하게이 야코비안은 다음과 같다.

이를 통해 최대값의 정상 로그우도를 다음과 같이 기록할 수 있다.

From here, absorbing into the expression for produces an expression that establishes that minimizing the sum of squares of residuals from is - ) / 로부터의 편차의 정상 로그 우도의 합계와 변환의 Jacobian 로그의 합계를 최대화하는 것과 동등하다.

any에 대한 Y = 1 값은 0이고, Y에 대한 파생상품λ에 대해 1이 있다.때때로 Y는 어떤 종류의 평균값에서 Y = 1을 주기 위해 크기가 조정된 일부 다른 변수의 버전이다.

변환은 동력 변환이지만, = = 0에서 매개변수 λ으로 연속적으로 이루어지도록 한다.그것은 계량학포함한 회귀 분석에서 인기 있는 것으로 증명되었다.

박스와 콕스는 또한 시프트 파라미터를 통합한 보다 일반적인 형태의 변환을 제안했다.

모든 i대해i y + α > 0일 경우 고정한다.만약 ((Y, ,, α)이 잘린 정규 분포를 따른다면, Y Box-Cox 분포를 따른다고 한다.

비켈과 독섬은 다음과 같이 변환 범위를 모든 y로 확장하여 잘린 분포를 사용할 필요가 없었다.

,

여기서 sgn(.)은 부호함수다. 가) 보통인 )보다 작으면 이러한 정의의 변경은 실질적인 가져오기가 거의 없다.[5]

비켈과 독섬은 또한 모수 추정치가 적절한 규칙성 조건에서 일관되고 점증적으로 정규적이라는 것을 증명했지만, 표준 Cramér-Rao 하한은 모수 값이 소음 분산에 비해 작을 때 분산을 실질적으로 과소평가할 수 있다.[5]그러나 이러한 분산을 과소평가하는 문제는 많은 적용에서 실질적인 문제가 아닐 수 있다.[6][7]

박스-콕스 변환

단일 변수 Box-Cox 변환은 다음과 같이 정의된다.

및 2-모수 Box-Cox 변환:

원문에 기술된 [8][9]바와 같이게다가 첫 번째 변환은 > 에 대해, 두 번째 i > 0에 대해, 두 번째 변환은 - }}에 대해 유지된다[8]

{\}은(는) 프로파일 우도 함수와 적합도 검정을 사용하여 추정한다.[10]

신뢰구간

Box-Cox 변환에 대한 신뢰 구간은 다음과 같은 제한을 충족하는on {\의 가능한 모든 값을 찾기 위해 프로파일우도함수에 대한 Wilks의 정리를 사용하여 점증적으로 구성할 수 있다.[11]

BUPA 간 데이터 세트에는[12] 간 효소 ALTγGT에 대한 데이터가 들어 있다.로그(log)를 사용하여 ALT를 예측하는 데 관심이 있다고 가정합시다.그림의 패널(a)에 데이터의 플롯이 나타난다.일정하지 않은 분산이 있는 것으로 보이며, Box-Cox 변환이 도움이 될 수 있다.

BUPA BoxCox.JPG

전력 파라미터의 로그 우도는 패널 (b)에 나타난다.수평 기준선은 최대값에서 maximum/212 거리에 있으며 2에 대한 약 95% 신뢰 구간을 판독하는데 사용할 수 있다.0에 가까운 값이 좋을 것 같아서 통나무를 가져간다.

로그 변환에 Shift 매개 변수를 추가하여 변환을 개선할 수 있다.그림의 패널(c)은 로그 우도를 나타낸다.이 경우 최대 확률이 0에 가까우면 이동 매개변수가 필요하지 않음을 의미한다.마지막 패널은 회귀선이 중첩된 변환된 데이터를 보여준다.

Box-Cox 변환은 모델 적합성을 크게 개선할 수 있지만, 변환에 도움이 될 수 없는 몇 가지 문제가 있다는 점에 유의하십시오.현재의 예에서는 데이터가 다소 과중한 편이어서 정규성에 대한 가정이 현실적이지 않고 강력한 회귀 접근방식이 보다 정확한 모델로 이어진다.

계량적용

경제학자들은 종종 Box-Cox 변환의 어떤 변종에 의해 생산 관계를 특성화한다.[13]

생산 Q를 자본 주식 K가 제공하는 서비스와 노동 시간 N이 제공하는 서비스에 의존하는 것으로 공통적으로 나타낸다고 간주한다.

Box-Cox 변환을 뒤집어서 Q를 해결하는 방법

이를 대체(CES) 생산 함수의 지속적인 탄력성이라고 한다.

CES 생산함수는 도 1의 균일한 함수다.

λ = 1이면 선형 생산함수가 생성된다.

λ → 0이 되면 다음과 같이 유명한 Cobb-Douglas 생산기능이 생성된다.

활동 및 데모

SOCR 리소스 페이지에는 Java 애플릿과 차트를 사용한 Box-Cox(파워) 변환을 시연하는 다양한 체험형 인터랙티브 활동이[14] 수록되어 있다.이것들은 Q–Q 그림, X–Y 산점도, 시계열도 및 히스토그램에 대한 이 변환의 영향을 직접적으로 보여준다.

여존손 변신

Yeo-Johnson 변환은[15] y{\y}의 0과 음의 값을 허용한다 은(는 모든 실제 숫자가 될 수 있으며, 여기서 = =1}은 ID 변환을 생성한다.변환 법률은 다음과 같이 규정되어 있다.

메모들

  1. ^ Gao, Peisheng; Wu, Weilin (2006). "Power Quality Disturbances Classification Using Wavelet and Support Vector Machines". Proceedings of the Sixth International Conference on Intelligent Systems Design and Applications - Volume 01. ISDA '06. Washington, DC, USA: IEEE Computer Society. 1: 201–206. doi:10.1109/ISDA.2006.217. ISBN 9780769525280.
  2. ^ Gluzman, S.; Yukalov, V. I. (2006-01-01). "Self-similar power transforms in extrapolation problems". Journal of Mathematical Chemistry. 39 (1): 47–56. arXiv:cond-mat/0606104. Bibcode:2006cond.mat..6104G. doi:10.1007/s10910-005-9003-7. ISSN 1572-8897.
  3. ^ Howarth, R. J.; Earle, S. A. M. (1979-02-01). "Application of a generalized power transformation to geochemical data". Journal of the International Association for Mathematical Geology. 11 (1): 45–62. doi:10.1007/BF01043245. ISSN 1573-8868.
  4. ^ Peters, J. L.; Rushton, L.; Sutton, A. J.; Jones, D. R.; Abrams, K. R.; Mugglestone, M. A. (2005). "Bayesian methods for the cross-design synthesis of epidemiological and toxicological evidence". Journal of the Royal Statistical Society, Series C. 54: 159–172. doi:10.1111/j.1467-9876.2005.00476.x.
  5. ^ a b Bickel, Peter J.; Doksum, Kjell A. (June 1981). "An analysis of transformations revisited". Journal of the American Statistical Association. 76 (374): 296–311. doi:10.1080/01621459.1981.10477649.
  6. ^ Sakia, R. M. (1992), "The Box–Cox transformation technique: a review", The Statistician, 41 (2): 169–178, CiteSeerX 10.1.1.469.7176, doi:10.2307/2348250, JSTOR 2348250
  7. ^ Li, Fengfei (April 11, 2005), Box–Cox Transformations: An Overview (PDF) (slide presentation), Sao Paulo, Brazil: University of Sao Paulo, Brazil, retrieved 2014-11-02
  8. ^ a b Box, George E. P.; Cox, D. R. (1964). "An analysis of transformations". Journal of the Royal Statistical Society, Series B. 26 (2): 211–252. JSTOR 2984418. MR 0192611.
  9. ^ Johnston, J. (1984). Econometric Methods (Third ed.). New York: McGraw-Hill. pp. 61–74. ISBN 978-0-07-032685-9.
  10. ^ Asar, O.; Ilk, O.; Dag, O. (2017). "Estimating Box-Cox power transformation parameter via goodness-of-fit tests". Communications in Statistics - Simulation and Computation. 46 (1): 91–105. arXiv:1401.3812. doi:10.1080/03610918.2014.957839.
  11. ^ Abramovich, Felix; Ritov, Ya'acov (2013). Statistical Theory: A Concise Introduction. CRC Press. pp. 121–122. ISBN 978-1-4398-5184-5.
  12. ^ BUPA 간 질환 데이터 세트
  13. ^ Zarembka, P. (1974). "Transformation of Variables in Econometrics". Frontiers in Econometrics. New York: Academic Press. pp. 81–104. ISBN 0-12-776150-0.
  14. ^ Power Transform 제품군 그래프, SOCR 웹 페이지
  15. ^ Yeo, In-Kwon; Johnson, Richard A. (2000). "A New Family of Power Transformations to Improve Normality or Symmetry". Biometrika. 87 (4): 954–959. doi:10.1093/biomet/87.4.954. JSTOR 2673623.

참조

외부 링크