방향 성분 분석

Directional component analysis

지향성 성분 분석(DCA)[1][2][3]은 기후 과학에서 역사적 기후 관측,[1] 날씨 예측[2] 앙상블 또는 [3]기후 앙상블과 같은 시공간 데이터 세트에서 변동성의 대표적인 패턴을 식별하기 위해 사용되는 통계적 방법입니다.

첫 번째 DCA 패턴은 발생할 가능성이 높고(우도를 사용하여 측정) 영향이 큰(특정 선형 충격 함수의 경우, 그리고 특정 수학적 조건이 주어진 경우: 아래 참조) 날씨 또는 기후 변동성 패턴입니다.

첫 번째 DCA 패턴은 발생 가능성이 높지만 큰 영향을 미치지 않을 수 있는 첫 번째 PCA 패턴과 대비되며, 영향이 크지만 발생 가능성이 없는 충격 함수의 기울기에서 파생된 패턴과 대비됩니다.

DCA는 외부 벡터인 충격의 기울기를 고려한다는 점에서 EOF,[4] 회전[5] EOF 및 확장[6] EOF와 같은 기후 연구에 사용되는 다른 패턴 식별 방법과 다릅니다.

DCA는 일기[2] 예보 또는 기후[3] 모델에서 두 가지 패턴으로 큰 앙상블을 줄이는 방법을 제공합니다.첫 번째 패턴은 앙상블 평균이고, 두 번째 패턴은 DCA 패턴으로, 영향을 고려한 방식으로 앙상블 평균 주위의 변동성을 나타낸다.DCA는 앙상블의 구조 외에도 영향을 고려한다는 점에서 앙상블[7][8]의 감소를 위해 제안된 다른 방법과 대조된다.

개요

입력

DCA는 다음 두 가지 입력을 [1][2][3]통해 계산됩니다.

  • 과거 기후 관측 또는 날씨 또는 기후 앙상블과 같은 날씨 또는 기후 데이터의 다변량 데이터 세트
  • 선형 충격 함수선형 충격 함수는 날씨 또는 기후 데이터의 모든 공간 패턴에 대한 충격 수준을 공간 패턴의 다른 위치에 있는 값의 가중 합계로 정의하는 함수입니다.예를 들어 공간 패턴 전체의 평균 값을 들 수 있습니다.선형 충격 함수는 비선형 충격 [3]함수의 다변량 테일러 급수에서 첫 번째 항으로 생성될 수 있습니다.

공식

개별 공간 패턴 x {\ x를 포함하는 시공간 데이터 X {\ X를 생각해 보십시오. 여기서 개별 패턴은 평균 0 및 공분산 C {\ C를 갖는 다변량 정규 분포의 단일 샘플로 간주됩니다.

우리는 공간 패턴의 선형 충격 함수를 x {\ r로 정의합니다. r {r}은 공간 가중치의 벡터입니다.

첫 번째 DCA 패턴은 공분산 C C rr}의 으로 x {\x Cr에 의해 제공됩니다.

그런 다음 [1]필요에 따라 패턴을 임의의 길이로 정규화할 수 있습니다.

특성.

날씨 또는 기후 데이터가 타원형으로 분포되어 있는 경우(예: 다변량 정규 분포 또는 다변량 t-분포로 분포되어 있는 경우) 첫 번째 DCA 패턴(DCA1)은 다음과 같은 수학적 특성을 갖는 공간 패턴으로 정의됩니다.

  • DCA1은 주어진 충격[1] 값에 대한 확률 밀도를 최대화합니다.
  • DCA1은 주어진 확률[1] 밀도 값에 대한 영향을 최대화합니다.
  • DCA1은 충격 및 확률[3] 밀도의 곱을 최대화합니다.
  • DCA1은 특정 수준의[3] 영향을 초과하는 것을 조건으로 하는 조건부 기대값입니다.
  • DCA1은 충격 가중 앙상블[3] 평균입니다.
  • DCA1을 수정하면 패턴이 덜 극단적이거나 더 낮은 확률 밀도를 갖게 됩니다.

강우량 예제

예를 들어, 강우 이상 데이터 세트에서 총 강우 이상으로 정의된 영향 메트릭을 사용하는 첫 번째 DCA 패턴은 주어진 총 강우 이상에 대해 가장 높은 확률 밀도를 갖는 공간 패턴입니다.주어진 총 강우량 이상이 큰 값을 갖도록 선택된 경우, 이 패턴은 메트릭 측면에서 극단적인 것(즉, 총 강우량을 나타내는 것)과 패턴 측면에서 가능성이 높은 것을 결합하므로 대표적인 극단적인 패턴으로 적합합니다.

PCA와의 비교

주성분 분석(PCA)과 DCA의[1] 주요 차이점은 다음과 같습니다.

  • PCA는 공분산 행렬의 함수이며 설명된 분산을 최대화하도록 첫 번째 PCA 패턴이 정의됩니다.
  • DCA는 공분산 행렬과 벡터 방향(충격 함수의 기울기)의 함수이며, 첫 번째 DCA 패턴은 충격 메트릭의 주어진 값에 대한 확률 밀도를 최대화하도록 정의됩니다.

결과적으로 단위 벡터 공간 패턴의 경우:

  • 첫 번째 PCA 공간 패턴은 항상 더 높은 설명된 분산에 해당하지만 퇴화된 경우를 제외하고는 영향 메트릭(예: 총 강우량 이상)의 값이 더 낮습니다.
  • 첫 번째 DCA 공간 패턴은 항상 영향 메트릭의 더 높은 값에 해당하지만 퇴화된 경우를 제외하고 설명된 분산의 더 낮은 값을 갖습니다.

PCA 및 DCA 패턴이 동일한 경우 퇴화가 발생합니다.

또한 첫 번째 PCA 패턴이 주어지면 DCA 패턴을 다음과 같이 조정할 수 있습니다.

  • 축척된 DCA 패턴은 첫 번째 PCA 패턴과 동일한 확률 밀도를 가지지만, 더 높은 영향,
  • 크기가 조정된 DCA 패턴은 첫 번째 PCA 패턴과 동일한 영향을 미치지만 확률 밀도는 더 높습니다.

2차원[1] 예제

그림 1: 2차원 예에서 PCA(파란색) 및 DCA(빨간색) 벡터

그림 1은 다음과 같이 이해할 수 있는 예를 보여줍니다.

  • 두 축은 두 위치에서 연간 평균 강우량의 이상을 나타내며, 다이어그램의 오른쪽 상단 모서리에서 가장 높은 총 강우량 이상 값을 나타냅니다.
  • 두 위치에서 강우 이상 징후의 공동 변동성은 이변량 정규 분포를 따르는 것으로 가정합니다.
  • 타원은 이 이변량 정규 분포에서 타원 내부의 더 높은 값을 가진 확률 밀도의 단일 등고선을 보여줍니다.
  • 타원의 중앙에 있는 빨간색 점은 두 위치 모두에서 강우량 이상이 없음을 나타냅니다.
  • 파란색 평행선 화살표는 첫 번째 PCA 공간 패턴 벡터이기도 한 타원의 주축을 나타냅니다.
  • 이 경우 PCA 패턴이 타원에 닿도록 크기가 조정됩니다.
  • 대각선은 일정한 양의 총 강우량 이상을 나타내는 선으로, 상당히 극단적인 수준으로 가정됩니다.
  • 빨간색 점선 화살표는 대각선이 타원에 접하는 지점을 가리키는 첫 번째 DCA 패턴을 나타냅니다.
  • 이 경우 DCA 패턴이 타원에 닿도록 크기가 조정됩니다.

이 다이어그램에서 DCA 패턴은 다음과 같은 특성을 가지고 있음을 알 수 있습니다.

  • 대각선에 있는 모든 점 중에서 확률 밀도가 가장 높은 점입니다.
  • 타원의 모든 점 중에서 총 강우량 이상이 가장 높은 점입니다.
  • PCA 패턴과 동일한 확률 밀도를 가지지만 총 강우량이 더 높음을 나타냅니다(즉, 다이어그램의 오른쪽 상단 모서리를 향해 더 먼 지점).
  • DCA 패턴을 변경하면 확률 밀도가 감소하거나(타원에서 벗어나는 경우) 총 강우량 이상이 감소합니다(타원을 따라 이동하거나 타원 안으로 들어가는 경우).

이 경우 PCA 패턴의 총 강우량 이상은 두 위치의 강우량 이상 간의 반 상관 관계로 인해 상당히 작습니다.결과적으로, 첫 번째 PCA 패턴은 총 강우량 이상이 큰 패턴의 좋은 대표적인 예가 아니지만, 첫 번째 DCA 패턴은 그렇습니다.

n n 에서 타원은 타원체가 되고, 대각선은 - 평면이 되며, PCA DCA 패턴은 n n 벡터입니다.

적용들

기후 변동성에 대한 적용

DCA는 미국과 [1]중국에서 강우량 극단의 가장 가능성이 높은 패턴을 이해하기 위해 과거 강우량[9] 변동의 CRU 데이터 세트에 적용되었습니다.

앙상블 일기예보의 적용

DCA는 ECMWF 중거리 일기 예보 앙상블에 적용되어 앙상블 [2]예측에서 가장 가능성이 높은 극단적인 온도 패턴을 식별했습니다.

앙상블 기후모델 예측에 대한 적용

DCA는 극단적인 미래 [3]강우의 가장 가능성이 높은 패턴을 식별하기 위해 앙상블 기후 모델 예측에 적용되었습니다.

최초의 DCA[1] 패턴 도출

개별 공간 패턴 x {\ x를 포함하는 시공간 데이터 X {\ X를 생각해 보십시오. 여기서 개별 패턴은 평균 0 및 공분산 C {\ C를 갖는 다변량 정규 분포의 단일 샘플로 간주됩니다.

x x의 함수로서 로그 확률 밀도는 - - x {{비례합니다.

우리는 공간 패턴의 선형 충격 함수를 x {\ r로 정의합니다. r {r}은 공간 가중치의 벡터입니다.

그런 다음 선형 충격 함수의 주어진 값에 대한 확률 밀도를 최대화하는 공간 패턴을 찾습니다.이는 선형 충격 함수의 주어진 값에 대한 로그 확률 밀도를 최대화하는 공간 패턴을 찾는 것과 같으며, 이는 해결하기가 약간 더 쉽습니다.

이것은 제한된 최대화 문제이며, 라그랑주 승수의 방법을 사용하여 해결할 수 있습니다.

라그랑주 함수는 다음과 같이 주어진다.

x x 미분하고 0으로 설정하면 솔루션이 제공됩니다.

x x 단위 벡터가 정규화하면 다음과 같이 됩니다.

이것이 첫 번째 DCA 패턴입니다.

첫 번째 패턴과 직교하는 후속 패턴을 도출하여 직교 정규 집합과 행렬 인수분해 방법을 구성할 수 있습니다.

레퍼런스

  1. ^ a b c d e f g h i j k Jewson, S. (2020). "An Alternative to PCA for Estimating Dominant Patterns of Climate Variability and Extremes, with Application to U.S. and China Seasonal Rainfall". Atmosphere. 11 (4): 354. Bibcode:2020Atmos..11..354J. doi:10.3390/atmos11040354.
  2. ^ a b c d e f Scher, S.; Jewson, S.; Messori, G. (2021). "Robust Worst-Case Scenarios from Ensemble Forecasts". Weather and Forecasting. 36 (4): 1357–1373. Bibcode:2021WtFor..36.1357S. doi:10.1175/WAF-D-20-0219.1. S2CID 236300040.
  3. ^ a b c d e f g h i j Jewson, S.; Messori, G.; Barbato, G.; Mercogliano, P.; Mysiak, J.; Sassi, M. (2022). "Developing Representative Impact Scenarios From Climate Projection Ensembles, With Application to UKCP18 and EURO-CORDEX Precipitation". Journal of Advances in Modeling Earth Systems. 15 (1). doi:10.1029/2022MS003038. S2CID 254965361.
  4. ^ Hannachi, A.; Jolliffe, I.; Stephenson, D. (2007). "Empirical orthogonal functions and related techniques in atmospheric science: A review". International Journal of Climatology. 27 (9): 1119. Bibcode:2007IJCli..27.1119H. doi:10.1002/joc.1499. S2CID 52232574.
  5. ^ Mestas-Nunez, A. (2000). "Orthogonality properties of rotated empirical modes". International Journal of Climatology. 20 (12): 1509–1516. doi:10.1002/1097-0088(200010)20:12<1509::AID-JOC553>3.0.CO;2-Q.
  6. ^ Fraedrich, K.; McBride, J.; Frank, W.; Wang, R. (1997). "Extended EOF Analysis of Tropical Disturbances: TOGA COARE". Journal of the Atmospheric Sciences. 41 (19): 2363. Bibcode:1997JAtS...54.2363F. doi:10.1175/1520-0469(1997)054<2363:EEAOTD>2.0.CO;2.
  7. ^ Evans, J.; Ji, F.; Abramowitz, G.; Ekstrom, M. (2013). "Optimally choosing small ensemble members to produce robust climate simulations". Environmental Research Letters. 8 (4): 044050. Bibcode:2013ERL.....8d4050E. doi:10.1088/1748-9326/8/4/044050. S2CID 155021417.
  8. ^ Herger, N.; Abramowitz, G.; Knutti, R.; Angelil, O.; Lehmann, K.; Sanderson, B. (2017). "Selecting a climate model subset to optimise key ensemble properties". Earth System Dynamics. 9: 135–151. doi:10.5194/esd-9-135-2018.
  9. ^ Harris, I.; Jones, P.; Osborn, T.; Lister, D. (2013). "Updated high-resolution grids of monthly climatic observations— The CRU TS3.10 Dataset" (PDF). International Journal of Climatology. 34 (3): 623. Bibcode:2014IJCli..34..623H. doi:10.1002/joc.3711. S2CID 54866679.