함수 회귀

Functional regression

함수 회귀는 반응 또는 공변량함수 데이터를 포함할 때 회귀 분석의 한 버전이다.기능적 회귀 모델은 반응 또는 공변량이 기능적인지 또는 스칼라인지 여부에 따라 (i) 기능적 공변량이 있는 스칼라 반응, (ii) 기능적 공변량이 있는 기능적 반응, (iii) 기능적 공변량이 있는 기능적 반응, (iv) 기능적 a가 있는 기능적 반응 등 4가지 유형으로 분류할 수 있다.스칼라 공변량.또한 기능적 회귀 모형은 선형, 부분적 선형 또는 비선형일 수 있다.특히 기능적 다항식 모델, 기능적 단일다중 인덱스 모델, 기능적 가법적 모델은 기능적 비선형 모델의 3가지 특수한 경우다.

기능 선형 모델(FLM)

기능적 선형 모형(FLM)은 선형 모형(LM)의 확장이다.스칼라 반응 R 및 스칼라 X Rp {\ \ {^{p(를) 갖는 선형 모델은 다음과 같이 쓸 수 있다.

(1)

where denotes the inner product in Euclidean space, and denote the regression coefficients, and is a random error with 평균 0과 유한 분산.FLM은 반응에 따라 두 가지 유형으로 나눌 수 있다.

스칼라 반응이 있는 기능 선형 모형

Functional linear models with scalar responses can be obtained by replacing the scalar covariates and the coefficient vector in model (1) by a centered functional covariate and 계수함수 = (β ){\=\(\ 각각 T이(가) 있고, Hilbert space 2 유클리드 공간의 내부 제품을 대체한다.

(2)

where here denotes the inner product in . One approach to estimating and is to expand the centered covariate 계수함수 ) 을(를) 동일한 기능 기준으로 한다(: B-spline basis 또는 Karhunen-Loeve 확장에 사용되는 고유바시스).Suppose is an orthonormal basis of . Expanding and in this basis, , , model (2) becomes

구현을 위해서는 정규화가 필요하며 잘림, 스타일 }}벌칙 또는 스타일 벌칙을 통해 할 수 있다.[1]또한 모델 (2)의 ( (를) 추정하는 데 재생산 커널 힐버트 공간(RKHS) 접근법을 사용할 수도 있다.[2]

여러 기능 및 스칼라 공변량 추가, 모델(2) 확장 가능

(3)

where are scalar covariates with , are regression coefficients for , respectively, is a centered functional covariate given by , is regression coefficient function for , and is the domain of and , for . However, due to the parametric component , the estimation methods for model (2) cannot이 경우에[3] 사용되며, 모델 (3)에 대한 대체 추정 방법을 사용할 수 있다.[4][5]

기능 반응이 있는 기능 선형 모형

For a functional response with domain and a functional covariate with domain , two FLMs regressing on 이(가) 고려되었다.[3][6]이 두 모델 중 하나는 형식이다.

(4)

where is still the centered functional covariate, and are coefficient functions, and 은(는) 평균 0과 유한 분산을 갖는 랜덤 공정으로 가정한다.In this case, at any given time , the value of , i.e., , depends on the entire trajectory of . Model (4), for any given time , is an extension of multivariate linear regression wiL 다변량 선형 회귀에 의한 추정 방정식은

where , is defined as with for .[3] Regularization is needed and can be done through truncation, penalization or penalization.[1]모델(4)에 대한 다양한 추정 방법을 사용할 수 있다.[7][8]
언제 X{X\displaystyle}, Y{Y\displaystyle}동시에 관측된다, 즉, S)T{\displaystyle{{S\mathcal}}={{T\mathcal}}},[9]그것은 합리적인 심의할 역사적 기능적 선형 모델, 현재 값의 Y{Y\displaystyle}만에 따라 역사의 X{X\displaystyle}. ,예: 모델 (4 > displaystyle (s , t ) = 0 [3][10]과거 기능 선형 모델의 단순한 버전은 기능 동시 모델(아래 참조)이다.
다중 기능 공변량 추가, 모델(4) 확장 가능

(5)

where for , is a centered functional covariate with domain , and 각각 같은 도메인을 가진 해당 계수 함수다.[3] j () 을(를) 상수함수로 취하면 모델(5)의 특수한 사례가 발생한다.

기능 반응과 스칼라 공변량이 있는 FLM이다.

기능 동시 모델

= 를) 가정하면 기능 동시 모델이라고도 하며, 때로는 변화-코효율 모델이라고도 하는 다른 모델이 형식이다.

(6)

여기서 }및 α {\displaystyle 은 계수 함수다.Note that model (6) assumes the value of at time , i.e., , only depends on that of at the same time, i.e., . Various estimation methods can be applied to model (6).[11][12][13]
다중 기능 공변량 추가, 모델(6)도 확장 가능

where are multiple functional covariates with domain and are the coefficient functions with the same domain.[3]

기능 비선형 모델

기능 다항식 모델

기능적 다항식 모형은 다항식 회귀 분석으로 선형 회귀 분석을 확장하는 것과 유사하게 스칼라 반응을 갖는 FLM의 확장이다.반응Y {\ Y 및 도메인 T {\ {\T이(가 있는 기능 X(\ )의 경우 기능다항식 모델의 가장 간단한 예는 기능 2차 회귀[14] 분석이다

where is the centered functional covariate, is a scalar coefficient, and are coefficient functi각각 도메인 (와) T {\ {가) 있고respectively {\은 평균 0과 유한 분산을 갖는 임의 오차다.스칼라 반응을 가진 FLM과 유사하게 기능 다항식 모델의 추정은 중심 공변량 계수 함수 을 모두 정형 기준으로 확장하여 얻을 수 있다.[14]

기능적인 단일 및 다중 인덱스 모델

기능적 다중 인덱스 모델은 다음과 같다.

= {\}을를) 선택하면 기능적인 단일 인덱스 모델이 생성된다.그러나 > 의 경우 이 모델은 차원성의 저주로 인해 문제가 있다> }과와) 상대적으로 표본 크기가 작은 경우, 이 모델에 의해 주어진 추정기는 분산이 큰 경우가 많다.[15]대체 -구성요소 기능 다중지수 모델은 다음과 같이 표현할 수 있다.
기능적인 단일 및 다중 인덱스 모델의 추정 방법을 이용할 수 있다.[15][16]

기능적 첨가 모델(FAM)

Given an expansion of a functional covariate with domain in an orthonormal basis : , 모델 (2)에 표시된 스칼라 반응을 가진 기능적 선형 모델은 다음과 같이 쓸 수 있다.

하나의 형태의 FAM은 x k k 의 선형 함수를 일반 함수 f
는 k Ef k (x)= }(을 만족한다[3][17] 또 다른 형태의 FAM은 다음과 같은 시간 가산형 모델로 구성된다.
where is a dense grid on with increasing size , and with a smooth function,= ,, 의 경우

확장

모델 (2)에 표시된 스칼라 반응을 갖는 FLM을 직접 확장하는 것은 링크 함수를 추가하여 일반화된 기능 선형 모형(GFLM)을 만들어 선형 회귀 분석을 일반화된 선형 회귀 분석(GLM)으로 확장하는 것인데, 이 세 가지 구성 요소는 다음과 같다.

  1. 선형 예측 변수 = 0+ T ( ) ( t) d
  2. 분산 함수 X)= () X 여기서 = ) X조건부 평균이다.
  3. 조건부 평균과 선형 예측 변수를 = )를 통해 연결하는 연결 함수

참고 항목

참조

  1. ^ a b Morris, Jeffrey S. (2015). "Functional Regression". Annual Review of Statistics and Its Application. 2 (1): 321–359. arXiv:1406.4068. Bibcode:2015AnRSA...2..321M. doi:10.1146/annurev-statistics-010814-020413. S2CID 18637009.
  2. ^ 위안과 차이(2010년)."기능 선형 회귀에 대한 커널 힐버트 공간 접근 재생성"통계 연보. 38 (6):3412–3444. doi:10.1214/09-AOS772.
  3. ^ a b c d e f g h Wang, Jane-Ling; Chiou, Jeng-Min; Müller, Hans-Georg (2016). "Functional Data Analysis". Annual Review of Statistics and Its Application. 3 (1): 257–295. Bibcode:2016AnRSA...3..257W. doi:10.1146/annurev-statistics-041715-033624.
  4. ^ 공, 수, 야오, 장(2016년)."높은 차원의 부분 기능 선형 회귀"바이오메트리카. 103 (1):147–159. 도이:10.1093/바이오메트/asv062.
  5. ^ 후, 왕, 캐롤 (2004년)."종단/클러스터된 데이터에 대한 부분 선형 모델의 프로파일 대 백피팅"바이오메트리카. 91(2): 251–262. 도이:10.1093/바이오메트/91.2.251.
  6. ^ 램지와 실버맨(2005년).기능 데이터 분석, 2부, 뉴욕: 스프링거, ISBN 0-387-40080-X.
  7. ^ 램지와 달젤(1991년)."기능 데이터 분석을 위한 일부 도구"영국 왕립통계학회지. 시리즈 B(방법론적)53 (3):539–572.https://www.jstor.org/stable/2345586.
  8. ^ 야오, 뮐러, 왕(2005년)."종방향 데이터에 대한 기능 선형 회귀 분석".통계 연보. 33 (6):2873–2903. 도이:10.1214/009053605000000660.
  9. ^ 그레넌더(1950)."stochastic 프로세스와 통계적 추론".Arkiv Matematik. 1:195–277. doi:10.1007/BF02590638.
  10. ^ 말파이트와 램지(2003년)."역사적 기능 선형 모델".캐나다 통계학 저널. 31(2):115–128. doi:10.2307/3316063.
  11. ^ 팬과 장(1999년)."다양한 계수 모형의 통계적 추정"통계 연보. 27 (5):1491–1518. doi:10.1214/aos/1017939139.
  12. ^ 황, 우, 주 (2004년)."종방향 데이터를 사용한 다양한 계수 모형에 대한 다항식 스플라인 추정 및 추론"바이오메트리카. 14:763–788.https://www.jstor.org/stable/24307415.
  13. ^ 옌튀르크와 뮐러(2010년)."종방향 데이터에 대한 기능 변화 계수 모델"미국통계협회지.105 (491):1256–1264. doi:10.1198/jasa.2010.tm09228.
  14. ^ a b 야오와 뮐러(2010년)."기능 2차 회귀 분석".바이오메트리카 97 (1):49–64. 도이:10.1093/바이오메트/asp069.
  15. ^ a b 첸, 홀, 뮐러(2011년)."비모수 링크가 있는 단일 및 다중 인덱스 기능 회귀 모형"통계 연보. 39 (3):1720–1747. doi:10.1214/11-AOS882.
  16. ^ 장과 왕(2011년)."종적 데이터에 대한 기능적 단일 인덱스 모델" 39 (1):362–388. doi:10.1214/10-AOS845.
  17. ^ 뮐러와 야오(2008)."기능적 부가 모델".미국통계협회지.103 (484):1534–1544. doi:10.1198/016214508000000751.
  18. ^ 팬, 제임스, 라드첸코(2015년)."기능적 가법 회귀 분석".통계 연보. 43 (5):2296–2325. doi:10.1214/15-AOS1346.