상관 관계

Correlation
집합에 대해 Pearson 상관 계수xy인 여러 개의 (x, y) 점 집합.상관관계는 선형관계의 소음과 방향(상행)을 반영하지만, 그 관계의 기울기(중간), 비선형관계의 많은 측면(하단)은 반영하지 않는다.N.B.: 중앙의 수치는 기울기가 0이지만, 이 경우 Y의 분산이 0이기 때문에 상관 계수가 정의되지 않는다.

통계에서 상관관계의존성인과관계든 아니든 두 랜덤 변수이변수 데이터 사이의 통계적 관계를 의미한다.가장 넓은 의미에서는 "상관"이 어떤 유형의 연관성을 나타낼 수 있지만, 통계학에서는 일반적으로 한 쌍의 변수가 선형적으로 연관되는 정도를 가리킨다.종속 현상의 익숙한 예로는 부모와 자식의 의 상관관계, 이른바 수요곡선에 묘사되어 있듯이 재화의 가격과 소비자가 구매하고자 하는 수량의 상관관계가 있다.

상관관계는 실제로 악용될 수 있는 예측관계를 나타낼 수 있기 때문에 유용하다.예를 들어, 전기 유틸리티는 전력 수요와 날씨 사이의 상관관계에 기초하여 온화한 날에 더 적은 전력을 생산할 수 있다.이 예에는 인과관계가 있는데, 극한 기후로 인해 사람들이 난방이나 냉방을 위해 전기를 더 많이 사용하게 되기 때문이다.그러나 일반적으로 상관관계의 존재는 인과관계의 존재를 추론하기에 충분하지 않다(즉, 상관관계는 인과관계를 의미하지 않는다).

공식적으로 랜덤 변수는 확률론적 독립성의 수학적 특성을 만족하지 못하면 종속적이다.비공식적으로 말하자면 상관관계의존과 동의어다.그러나 기술적 의미로 사용될 때 상관관계는 시험된 변수와 각각의 기대치 사이의 수학 연산의 몇 가지 특정한 유형 중 하나를 가리킨다.본질적으로 상관관계는 둘 이상의 변수가 서로 어떻게 연관되어 있는지를 나타내는 척도다. 계수는 여러 가지가 있으며, 흔히 상관 계수의 정도를 측정하는 r 로 표시된다.그 중 가장 흔한 것이 Pearson 상관 계수인데, 이는 두 변수 사이의 선형 관계에만 민감하다(한 변수가 다른 변수의 비선형 함수인 경우에도 존재할 수 있다).스피어맨의 순위 상관 관계와 같은 다른 상관 계수는 피어슨 계수보다 더 견고하게, 즉 비선형 관계에 더 민감한 것으로 개발되었다.[1][2][3]상호 정보는 두 변수 사이의 의존도를 측정하는 데도 적용될 수 있다.

Pearson의 제품 순간 계수

다양한 상관 계수가 있는 다양한 데이터 집합의 산점도 예제.

정의

두 수량 사이의 의존도를 측정하는 가장 친숙한 척도는 Puperson 제품 순간 상관 계수(PPMCC) 또는 "Peerson's 상관 계수"로, 일반적으로 단순히 "상관 계수"라고 불린다.이 값은 분산의 제곱근으로 정규화된 우리의 수치 데이터 집합에 관한 두 변수의 공분산 비율을 취함으로써 얻는다.수학적으로 두 변수의 공분산표준 편차의 산물로 나눈다.Karl Pearson은 Francis Galton의 비슷하지만 약간 다른 아이디어에서 이 계수를 개발했다.[4]

Pearson 제품 순간 상관 계수는 기본적으로 예상 값을 배치하여 두 변수의 데이터 집합을 통해 가장 적합한 라인을 설정하려고 시도하며, 결과 Pearson의 상관 계수는 실제 데이터 집합이 예상 값과 얼마나 멀리 떨어져 있는지를 나타낸다.Pearson의 상관 계수의 부호에 따라 데이터 집합의 변수 사이에 어떤 종류의 관계가 있으면 음수 또는 양의 상관 계수로 끝날 수 있다.

The population correlation coefficient between two random variables and with expected values and and standard deviations 는 다음과 같이 정의된다.

여기서 는) 예상값 연산자, 공분산을 의미하며, 은 상관 계수에 대해 널리 사용되는 대체 표기법이다.Pearson 상관관계는 표준편차가 모두 유한하고 양적인 경우에만 정의된다.순전히 순간의 관점에서 대안 공식은 다음과 같다.

대칭 특성

상관 계수는 (X, )= ( , ){\ 이것은 곱셈의 동시 속성에서 확인된다.

제품으로서의 상관 관계

임의 변수 X 편차 > 0{\ > 을(으)로 두십시오다음:

상관관계 및 독립성

피어슨 상관 계수의 절대값이 1보다 크지 않다는 것은 카우치-슈워즈 불평등의 상수다.따라서 상관 계수의 값은 -1과 +1 사이에 있다.그 상관 계수 완벽한 직접적인(증가)선형 관계(상관), 완벽한 역의 경우에는 선형 관계(anti-correlation)[5]며 개방 간격(− 1,1){\displaystyle(-1,1)}에 다른 모든 경우에 어떤 가치(감소)−1, 선형 의존의 정도 여부를 나타내는 값의 경우 +1 있다.tw변수를 완화하다그것이 0에 가까워질수록 관계가 더 적다.계수가 -1 또는 1에 가까울수록 변수 간의 상관관계가 강해진다.

변수가 독립적일 경우 피어슨의 상관 계수는 0이지만 상관 계수는 두 변수 사이의 선형 종속성만 감지하기 때문에 그 반대는 사실이 아니다.

예를 들어 변수 X (가) 0에 대해 대칭적으로 분포하고 Y= 그러면 (가) 의해 완전히 결정되므로 X X 및 Y은( 하게 종속되지만)r 상관관계는 0이다; 그것들은 상관관계가 없다.그러나 이(가) 공동으로 정상일 때 특별한 경우, 비관계는 독립성과 동등하다.

상관관계가 없는 데이터가 반드시 독립성을 의미하는 것은 아니지만, 임의변수의 상호정보가 0이면 독립성을 확인할 수 있다.

표본상관계수

페어, ){\displaystyle(X_에 대한 의 n n} 측정값이 지정됨= ,, 에 의해 색인화된 샘플 계수하여 X {\displaystyle Y {\ 의 Pearson 상관 를 추정할 수 있다 샘플 상관 계수는 다음과 같이 정의된다.

Y의 샘플 평균X{\ X 와 s {\ 은 X}의 보정된 샘플 표준 편차이다. Y Y

에 대한 등가 식은 다음과 같다.

여기서 은(는 X {\ }및 Y {\\수정되지 않은 샘플 표준 편차입니다

(가) 측정 오차를 포함하는 측정값의 결과인 경우 상관 계수에 대한 현실적인 한계는 -1 ~ +1이 아니라 더 작은 범위가 된다.[6]단일 독립 변수를 갖는 선형 모델의 경우 결정 계수(R 제곱)는 Pearson의 제품 순간 계수인 y 의 제곱이다.

아래 표에 제시된 XY공동 확률 분포를 고려하십시오.

y
x
−1 0 1
0 0 1/3 0
1 1/3 0 1/3

이 공동 분포의 한계 분포는 다음과 같다.

이는 다음과 같은 기대와 분산을 산출한다.

따라서 다음과 같다.

순위 상관 계수

Spearman의 순위 상관 계수Kendall의 순위 상관 계수(계수)와 같은 순위 상관 계수(계수)는 한 변수가 증가할수록 다른 변수가 증가하는 경향을 보이며, 그 증가를 선형 관계로 나타낼 필요가 없다.한 변수가 증가하면 다른 변수가 감소하면 순위 상관 계수는 음수가 된다.이러한 순위 상관 계수를 계산량을 줄이거나 분포의 비정규성에 덜 민감하게 만드는 데 사용되는 Pearson 계수의 대체 계수로 간주하는 것이 일반적이다.그러나 순위 상관 계수는 Pearson 제품-순간 상관 계수와는 다른 유형의 관계를 측정하고 모집단 상관 계수의 대체 측도가 아니라 다른 유형의 연관성의 측도로 가장 잘 보여지기 때문에 이 관점은 수학적 근거가 거의 없다.[7][8]

순위 상관 관계의 특성과 선형 상관과의 차이를 설명하려면 다음 네 쌍의 숫자, y ) (을(를) 고려하십시오

(0, 1), (10, 100), (101, 500), (102, 2000).

각 쌍에서 다음 쌍 으)로 이동할수록 y {\도 증가하며 의 증가는 y 의 증가를 동반한다는 점에서 이 관계는 완벽하다이것은 우리가 완벽한 순위 상관 관계를 가지고 있다는 것을 의미하며, 스피어맨과 켄달의 상관 계수는 모두 1인 반면, 이 예에서 피어슨 제품-순간 상관 계수는 0.7544로 점들이 일직선에 놓여 있는 것과는 거리가 멀다는 것을 나타낸다. 방법으로, x (가) 때 y {\displaystyle 이(가) 항상 감소할 경우 순위 상관 계수는 -1인 반면 Pearson 제품-순간 상관 계수는 점들이 직선에 얼마나 가까운지에 따라 -1에 가깝거나 가깝지 않을 수 있다.완벽한 순위 상관 관계가 있는 극단적인 경우에서 두 계수는 모두 동일하지만(+1 또는 둘 다 -1) 이는 일반적으로 해당되지 않으므로 두 계수의 값을 의미 있게 비교할 수 없다.[7]예를 들어, 세 쌍의 경우 (1, 1) (2, 3) (3, 2) 스피어맨 계수는 1/2이고, 켄달 계수는 1/3이다.

랜덤 변수 간의 기타 의존도 측정

상관 계수에 의해 주어진 정보는 랜덤 변수들 사이의 의존 구조를 정의하기에 충분하지 않다.[9]상관 계수는 분포가 다변량 정규 분포인 경우와 같이 매우 특별한 경우에만 의존 구조를 완전히 정의한다.(위 도표 참조)타원 분포의 경우 동일한 밀도의 (하이퍼-)엘립을 특징으로 하지만, 의존 구조를 완전히 특성화하지는 않는다(예를 들어, 다변량 t-분포의 자유도가 꼬리 의존도를 결정한다).

거리 상관관계[10][11] Pearson의 상관관계가 0일 수 있다는 결핍을 해결하기 위해 도입되었다. 거리 상관관계는 0이 독립성을 의미한다.

임의의존도계수는[12] 다변량 랜덤 변수들 사이의 의존성에 대한 계산적으로 효율적인 코풀라 기반 측정값이다.RDC는 무작위 변수의 비선형 스칼링과 관련하여 불변하며, 광범위한 기능적 연관 패턴을 발견할 수 있으며 독립적으로 값을 0으로 취한다.

두 이항 변수의 경우, 오즈비는 의존성을 측정하고 음수가 아닌 범위, 아마도 :[ 0+ Yule의 Y, Q와 같은 관련 통계는 범위- 1, 로 정규화한다종속 변수가 이산형이고 하나 이상의 독립 변수가 있을 수 있는 경우를 모형화하는 로지스틱 모형.

상관 비율, 엔트로피 기반 상호 정보, 총 상관 관계, 이중상관 관계 및 다색상 상관 관계도 그들 사이의 코풀라 고려와 마찬가지로 더 일반적인 의존성을 탐지할 수 있는 반면 결정 계수는 다중 회귀에 대한 상관 계수를 일반화할 수 있다.

데이터 분포에 대한 민감도

변수 XY 사이의 의존도는 변수가 표현되는 척도에 따라 달라지지 않는다., X와 Y의 관계를 분석하는 경우 대부분의 상관 계수는 X + bX로 변환하고 Yc 변환하여 영향을 받지 않으며, 여기서 a, b, c, d는 상수(b와 d는 양수)이다.이것은 그들의 인구 유사점뿐만 아니라 일부 상관관계 통계에도 적용된다.순위 상관 계수 같은 일부 상관 통계량은 X 및/또는 Y의 한계 분포에 대한 단조 변환에도 불변한다.

XY 사이의 Pearson/Spearman 상관 계수는 두 변수의 범위가 제한되지 않은 경우와 X의 범위가 구간(0,1)으로 제한되었을 때 나타난다.

대부분의 상관 계수는 XY를 표본으로 추출하는 방식에 민감하다.더 넓은 범위의 값으로 보면 의존성이 더 강한 경향이 있다.따라서 성인 남성 전체에 대한 아버지와 아들의 키 사이의 상관 계수를 고려하고, 아버지가 165cm에서 170cm 사이인 것으로 선택되었을 때 계산된 동일한 상관 계수와 비교한다면, 후자의 경우 상관 계수가 더 약해질 것이다.한 변수 또는 두 변수의 범위 제한에 대한 수정을 시도하는 몇 가지 기법이 개발되었으며, 일반적으로 메타 분석에 사용된다. 가장 일반적인 기법은 쏜디케의 사례 II와 사례 III 방정식이다.[13]

XY의 특정 공동 분포에 대해 사용 중인 다양한 상관 관계 측도가 정의되지 않을 수 있다.예를 들어 Pearson 상관 계수는 모멘트로 정의되므로 모멘트가 정의되지 않으면 정의되지 않는다.분량에 기초한 의존도 측정은 항상 정의된다.모집단 의존도 측정을 추정하기 위한 표본 기반 통계는 데이터를 표본으로 추출한 모집단의 공간 구조에 기초하여 편향되지 않거나 또는 점증적으로 일관되는 것과 같은 바람직한 통계 속성을 가질 수도 있고 아닐 수도 있다.

데이터 분포에 대한 민감도를 장점으로 사용할 수 있다.예를 들어, 축척 상관관계는 시계열의 빠른 성분들 사이의 상관관계를 선택하기 위해 범위에 대한 민감도를 사용하도록 설계된다.[14]제어된 방식으로 값의 범위를 줄임으로써 긴 시간 척도의 상관관계를 걸러내고 짧은 시간 척도의 상관관계만 드러낸다.

상관 행렬

The correlation matrix of random variables is the matrix whose entry is .따라서 대각선 입력은 모두 동일한 통합이다.사용된 상관관계 측도가 제품-모멘트 계수라면, 행렬은 i= , n , , i 대한 표준화된 랜덤 변수 X / ( ) 공분산 행렬과 동일하다 이는 모집단 행렬에 모두 적용된다.이온(이 경우 (는) 모집단 표준 ) 및표본 상관 행렬(이 경우 style displaystyle \ 은(는) 표본 표준 편차를 나타낸다.따라서 각각은 반드시 양-세미드 핀라이트 행렬이다.또한 상관 행렬은 어떤 변수도 다른 변수의 값의 선형 함수로 정확하게 생성된 모든 값을 가질 수 없는 경우 완전히 양수 확정적이다.

i X 의 상관관계가 의 상관관계와 같기 때문에 상관 행렬은 대칭이다

예를 들어, 상관 행렬은 다중 결정 계수에 대한 하나의 공식에서 다중 회귀 분석에서의 적합도 측도로 나타난다.

통계적 모델링에서 변수들 간의 관계를 나타내는 상관 행렬은 서로 다른 상관 구조로 분류되며, 변수들을 추정하는 데 필요한 모수의 수와 같은 요인에 의해 구별된다.예를 들어 교환 가능한 상관 행렬에서 모든 변수 쌍은 동일한 상관 관계를 갖는 것으로 모델링되므로 행렬의 모든 비대각 원소는 서로 동일하다.반면에 자기 회귀 행렬은 측정이 시간에 더 가까울 때 상관관계가 더 커질 가능성이 높기 때문에 변수가 시계열을 나타낼 때 자주 사용된다.다른 예로는 독립, 비정형, M 의존, 토플리츠 등이 있다.

탐색적 데이터 분석에서 상관관계의 아이콘그래피는 "제거 가능한" 상관관계가 실선(양성 상관관계) 또는 점선(음성 상관관계)으로 표현되는 다이어그램으로 상관행렬을 대체하는 데 있다.

가장 가까운 유효한 상관 행렬

일부 애플리케이션(예: 부분적으로만 관측된 데이터로부터 데이터 모델을 구축)에서는 "가장 가까운" 상관 행렬을 "대략적인" 상관 행렬(예: 계산된 방식으로 인해 일반적으로 반확실성이 결여된 행렬)에 대해 찾기를 원한다.

2002년에 하이암은[15] 프로베니우스 규범을 이용하여 근거리 개념을 공식화하고, 구현을 온라인 웹 API로 이용할 수 있는 Dykstra의 투영 알고리즘을 이용하여 가장 가까운 상관 행렬을 계산하는 방법을 제공하였다.[16]

이는 다음 해에 얻은 새로운 이론적 결과(예: 인자 구조로[17] 가장 가까운 상관 행렬의 계산)와 수치(예: 가장 가까운 상관 행렬의[18] 계산에 뉴턴의 방법 사용)와 함께 주제에 대한 관심을 불러일으켰다.

비관계성 및 확률적 공정의 독립성

이와 유사하게 두 개의 확률적 { T {\}\rightt\ {\mathcal { T : 독립적이라면 상관관계가 없는 것이다.[19]: p. 151 이 진술의 반대는 사실이 아닐 수도 있다.두 변수가 상관관계가 없더라도 서로 독립적이지 않을 수 있다.

일반적인 오해

상관관계 및 인과관계

"상관관계가 인과관계를 내포하지 않는다"는 기존 격언은 상관관계가 변수들 사이의 인과관계를 추론하는데 저절로 사용될 수 없다는 것을 의미한다.[20]이 격언은 상관관계가 인과관계의 잠재적 존재를 나타낼 수 없다는 뜻으로 받아들여서는 안 된다.그러나 상관관계의 기초가 되는 원인이 있다면 간접적이고 알려지지 않은 것일 수 있으며, 높은 상관관계도 인과 과정이 존재하지 않는 신분관계(토폴로지)와 중복된다.따라서 두 변수 사이의 상관관계는 (어느 방향에서든) 인과관계를 설정하기에 충분한 조건이 아니다.

어린이들의 나이와 키의 상관관계는 상당히 인과적으로 투명하지만, 사람들의 기분과 건강 사이의 상관관계는 덜하다.기분이 좋아지면 건강도 좋아지는가, 아니면 건강이 좋아지는가, 아니면 둘 다 좋아지는가?아니면 어떤 다른 요소들이 둘 다의 근거가 되는가?즉 상관관계는 가능한 인과관계에 대한 증거로 취할 수 있지만 인과관계가 있다면 어떤 것일 수 있는지는 나타낼 수 없다.

단순 선형 상관 관계

안스콤베의 4중주: 0.816의 동일한 상관관계를 갖는 4개의 데이터 집합

Pearson 상관 계수는 두 변수 사이의 선형 관계의 강도를 나타내지만, 그 값이 일반적으로 두 변수 간의 관계를 완전히 특성화하지는 않는다.[21]In particular, if the conditional mean of given , denoted , is not linear in , the correlation coefficient will not fully determine the form of .

인접한 이미지는 프랜시스 안스콤브가 만든 4쌍의 변수 세트인 안스콤베 4중주단산점도를 보여준다.[22]의 y 변수는 평균(7.5), 분산(4.12), 상관 관계(0.816), 회귀선(y = 3 + 0.5x)이 동일하다.그러나 그림에서 볼 수 있듯이 변수의 분포는 매우 다르다.첫 번째 변수(왼쪽 위)는 정규 분포를 따르는 것으로 보이며, 상관 관계가 있는 두 변수를 고려할 때 정규성을 가정할 때 예상되는 것과 일치한다.두 번째 변수(오른쪽 위)는 정규 분포를 따르지 않으며, 두 변수 사이의 분명한 관계를 관찰할 수 있지만 선형이 아니다.이 경우 Pearson 상관 계수는 정확한 기능적 관계가 있음을 나타내지 않는다. 단지 선형 관계에 의해 그 관계를 근사하게 추정할 수 있는 정도.세 번째 경우(왼쪽 하단)에서는 상관 계수를 1에서 0.816으로 낮추기에 충분한 영향을 미치는 특이치를 제외하고 선형 관계가 완벽하다.마지막으로 네 번째 예제(오른쪽 아래)는 두 변수 사이의 관계가 선형적이지 않더라도 하나의 특이치가 높은 상관 계수를 생성하기에 충분할 때 다른 예를 보여준다.

이러한 예는 상관 계수가 요약 통계량으로서 데이터의 시각적 검사를 대체할 수 없음을 나타낸다.이러한 예는 때때로 Pearson 상관관계가 데이터가 정규 분포를 따른다고 가정하지만 이는 부분적으로만 정확하다는 것을 입증한다고 한다.[4]Pearson 상관관계는 공분산 행렬이 유한한 모든 분포에 대해 정확하게 계산할 수 있으며, 여기에는 실제에서 만나는 대부분의 분포가 포함된다.그러나 다변량 정규 분포에서 데이터를 추출한 경우 Pearson 상관 계수(표본 평균 및 분산과 함께 계산)는 충분한 통계량일 뿐이다.따라서 Pearson 상관 계수는 다변량 정규 분포에서 데이터를 추출한 경우에만 변수 간의 관계를 완전히 특성화한다.

이바리산 정규 분포

If a pair of random variables follows a bivariate normal distribution, the conditional mean is a linear function of , and the conditional mean is a lin 의 이어 기능 (와) Y X}과와) 사이의 상관 계수 , Y {\displaystyle \와)와 X {\ 사이의 한계 평균과(분산도를 결정한다.

where and are the expected values of and , respectively, and and are the standard deviations of X Y Y


경험적 상관 r (는) 상관 계수 추정치. 대한 분포 추정치는 다음과 같다.

여기서 가우스 초지하계 함수= N- > 1 = 이 밀도는 베이지안 후방 밀도와 정확한 최적 신뢰 분포 밀도 둘 다이다.[23][24]

참고 항목

참조

  1. ^ Croxton, Frederick Emory; Cowden, Dudley Johnstone; Klein, Sidney (1968) Apply General Statistics, Pitman. ISBN9780273403159(625페이지)
  2. ^ Dietrich, Cornelius Frank(1991) 불확실성, 보정확률: 과학산업 측정 통계 제2판 A.하이글러.ISBN 9780750300605(331페이지)
  3. ^ Aitken, Alexander Craig (1957) 통계 수학 8판올리버 & 보이드.ISBN 9780050013007(95페이지)
  4. ^ a b Rodgers, J. L.; Nicewander, W. A. (1988). "Thirteen ways to look at the correlation coefficient". The American Statistician. 42 (1): 59–66. doi:10.1080/00031305.1988.10475524. JSTOR 2685263.
  5. ^ Dowdy, S.와 Wearden, S. (1983년)"Statistics for Research," Wiley.ISBN 0-471-08602-9 230 페이지
  6. ^ Francis, DP; Coats AJ; Gibson D (1999). "How high can a correlation coefficient be?". Int J Cardiol. 69 (2): 185–199. doi:10.1016/S0167-5273(99)00028-5. PMID 10549842.
  7. ^ a b Yule, G.U와 Kendall, M.G.(1950), "통계학 이론 소개", 14판 (제5회 Impression 1968년)찰스 그리핀 & 주식회사 258–270
  8. ^ Kendall, M. G. (1955) "순위 상관 관계 방법", Charles Griffin & Co.
  9. ^ Mahdavi Damghani B. (2013). "The Non-Misleading Value of Inferred Correlation: An Introduction to the Cointelation Model". Wilmott Magazine. 2013 (67): 50–61. doi:10.1002/wilm.10252.
  10. ^ Székely, G. J. Rizzo; Bakirov, N. K. (2007). "Measuring and testing independence by correlation of distances". Annals of Statistics. 35 (6): 2769–2794. arXiv:0803.4101. doi:10.1214/009053607000000505. S2CID 5661488.
  11. ^ Székely, G. J.; Rizzo, M. L. (2009). "Brownian distance covariance". Annals of Applied Statistics. 3 (4): 1233–1303. arXiv:1010.0297. doi:10.1214/09-AOAS312. PMC 2889501. PMID 20574547.
  12. ^ 로페즈파즈 D.와 헤니그 P.와 슐코프 B.(2013년)."임의의존도계수", "신경정보처리시스템에 대한 컨퍼런스" 재인쇄
  13. ^ Thorndike, Robert Ladd (1947). Research problems and techniques (Report No. 3). Washington DC: US Govt. print. off.
  14. ^ Nikolić, D; Muresan, RC; Feng, W; Singer, W (2012). "Scaled correlation analysis: a better way to compute a cross-correlogram". European Journal of Neuroscience. 35 (5): 1–21. doi:10.1111/j.1460-9568.2011.07987.x. PMID 22324876. S2CID 4694570.
  15. ^ Higham, Nicholas J. (2002). "Computing the nearest correlation matrix—a problem from finance". IMA Journal of Numerical Analysis. 22 (3): 329–343. CiteSeerX 10.1.1.661.2180. doi:10.1093/imanum/22.3.329.
  16. ^ "Portfolio Optimizer". portfoliooptimizer.io/. Retrieved 2021-01-30.
  17. ^ Borsdorf, Rudiger; Higham, Nicholas J.; Raydan, Marcos (2010). "Computing a Nearest Correlation Matrix with Factor Structure" (PDF). SIAM J. Matrix Anal. Appl. 31 (5): 2603–2622. doi:10.1137/090776718.
  18. ^ Qi, HOUDUO; Sun, DEFENG (2006). "A quadratically convergent Newton method for computing the nearest correlation matrix". SIAM J. Matrix Anal. Appl. 28 (2): 360–385. doi:10.1137/050624509.
  19. ^ Park, Kun Il (2018). Fundamentals of Probability and Stochastic Processes with Applications to Communications. Springer. ISBN 978-3-319-68074-3.
  20. ^ Aldrich, John (1995). "Correlations Genuine and Spurious in Pearson and Yule". Statistical Science. 10 (4): 364–376. doi:10.1214/ss/1177009870. JSTOR 2246135.
  21. ^ Mahdavi Damghani, Babak (2012). "The Misleading Value of Measured Correlation". Wilmott Magazine. 2012 (1): 64–73. doi:10.1002/wilm.10167. S2CID 154550363.
  22. ^ Anscombe, Francis J. (1973). "Graphs in statistical analysis". The American Statistician. 27 (1): 17–21. doi:10.2307/2682899. JSTOR 2682899.
  23. ^ Taraldsen, Gunnar (2021). "The Confidence Density for Correlation". Sankhya A. doi:10.1007/s13171-021-00267-y. ISSN 0976-8378. S2CID 244594067.
  24. ^ Taraldsen, Gunnar (2020). "Confidence in Correlation". doi:10.13140/RG.2.2.23673.49769. {{cite journal}}:Cite 저널은 필요로 한다. journal=(도움말)

추가 읽기

외부 링크