코페니틱 상관 관계
Cophenetic correlation통계에서, 특히 생물통계학에서, 결합학적 상관관계[1](더 정확히 말하면, 결합학적 상관 계수)는 덴드로그램이 원래 모델링되지 않은 데이터 지점 사이의 쌍방향 거리를 얼마나 충실히 보존하는지를 나타내는 척도다. 생물통계학 분야(일반적으로 DNA 서열의 클러스터 기반 모델 또는 기타 분류학 모델을 평가하기 위해)에서 가장 광범위하게 적용되었지만, 원시 데이터가 집단 또는 군집 내에서 발생하기 쉬운 다른 조사 분야에서도 사용될 수 있다.[2] 이 계수는 내포된 군집에 대한 검정으로도 사용할 수 있도록 제안되었다.[3]
합동 상관 계수 계산
원본 데이터 {Xi}이(가) 클러스터 방법을 사용하여 덴드로그램 {Ti}을(를) 생성했다고 가정합시다. 즉, "닫히는" 데이터가 계층 트리로 그룹화된 단순화된 모델을 가정해 보십시오. 다음과 같은 거리 측정값을 정의한다.
- ( , j)= X - ith 관측치와 jth 관측치 사이의 유클리드 거리
- ( , j) 모델 포인트 i 와 T_{ 사이의 단문법 거리 이 거리는 이 두 점이 처음 결합되는 노드의 높이다.
그런 다음 의{x을(를) x의 평균으로 하고 t의{\을(를) t(i, j)의 평균으로 지정하면 c는 다음과[4] 같다.
소프트웨어 구현
Dendext R 패키지를 사용하여 R의 결합학적 상관관계를 계산할 수 있다.[5]
파이썬에서는 SciPy 패키지도 구현을 하고 있다.[6]
MATLAB에서 Statistic and Machine Learning 도구 상자에는 구현이 포함되어 있다. [7]
참고 항목
참조
- ^ 소칼, R. R., F. J. Rohlf. 1962. 객관적인 방법에 의한 덴드로그램의 비교. 택슨, 11시 33분-40
- ^ 공방 B. 카, 크리스 J. 영, 리처드 C. 아스테르 및 시오아빙 장, CTBT 지진 사건 모니터링을 위한 클러스터 분석(미국 에너지부를 위해 준비된 연구)
- ^ Rohlf, F.J., 그리고 David L. 피셔 1968년 랜덤 데이터 집합의 계층 구조에 대한 검정 체계적 Zool, 17:407-412(링크)
- ^ Mathworks 통계 도구 상자
- ^ "Introduction to dendextend".
- ^ "scipy.cluster.hierarchy.cophenet — SciPy v0.14.0 Reference Guide". docs.scipy.org. Retrieved 2019-07-11.
- ^ "Cophenetic correlation coefficient - MATLAB cophenet".