업그마

UPGMA(산술 평균을 사용한 가중치 없는 쌍 그룹 방법)는 단순한 집적(상향식) 계층 군집화 방법입니다.이 방법은 일반적으로 Sokal과 Michener에 ^[1]기인한다.

UPGMA 방식은 WPGMA 방식과 유사합니다.

가중치 없는 항은 모든 거리가 계산되는 각 평균에 동일하게 기여함을 나타내며, 이 평균이 달성되는 산술은 참조하지 않습니다.따라서 WPGMA의 단순 평균은 가중 결과를 생성하고 UPGMA의 비례 평균은 가중되지 않은 결과를 생성한다(작업 ^[2]예 참조).

알고리즘.

UPGMA 알고리즘은 쌍별 유사도 매트릭스(또는 차등도 매트릭스)에 존재하는 구조를 반영하는 루트 트리(덴드로그램)를 구성합니다.각 단계에서 가장 가까운 두 군집이 더 높은 수준의 군집으로 결합됩니다.크기(즉, 카디널리티) ${|{\mathcal {A}}|}$ (\ $displaystyle {\mathcal {A}})$ ${|{\mathcal {B}}|}$ $(\$ $displaystyle$ {\mathcal {B}})의 두 ${\mathcal {A}}$ A $(\displaystyle$ {\ $mathcal$ {B $})$ 와 $B(\$ displaystyle {\mathcal { $B$ 사이의 ${\mathcal {A}}$ 거리는 모든 $d(x,y)$ 의 평균이 됩니다. $A$ $(\$ 의 ${\mathcal {A}}$ $객체$ 쌍x(\ $displaystyle$ x $)$ 와 B $x$ $(\$ { $B$ 의 y $(\displaystyle$ y $)$ 사이의 $y$ {\displaystyle d $(x,y),$ 즉 각 클러스터의 요소 간 평균 거리 $:$

{1\over {\mathcal {A}}\cdot {\mathcal {B}}}\sum _{x\in\mathcal {A}}\sum _{y\in\mathcal {B}}}d(x,y)

즉, 각 클러스터 단계에서 결합된 ${\mathcal {A}}\cup {\mathcal {B}}$ A ${\mathcal {A}}\cup {\mathcal {B}}$ B {\ $displaystyle {$ $A}\cup$ ${\mathcal$ {B $}}$ 과 ${\mathcal {A}}\cup {\mathcal {B}}$ $d_{{\mathcal {A}},X}$ $($ $)$ $새로운$ 클러스터X {\ $displaystyle$ X $}$ 사이의 $X$ 업데이트된 거리는 $d_{{\mathcal {A}},X}$ $,$ $X,$ $d_{{\mathcal {B}},X}$ 의 $d_{{\mathcal {A}},X}$ 평균에 의해 결정됩니다. $ystyle d_{\mathcal {B}},X}$ 거리 $d_{{\mathcal {B}},X}$ :

$({displaystyle d_{\mathcal {A}}, X}, X} = flac {\mathcal {A}, X} + {\mathcal {B}, X} \cdot d_{\mathcal {B}, X} + {\mathcal {B})$

UPGMA 알고리즘은 루트 덴드로그램을 생성하며 일정한 비율의 가정이 필요하다. 즉, 루트로부터 모든 분기 팁까지의 거리가 동일한 초변형 트리를 가정한다.팁이 동시에 샘플링된 분자 데이터(DNA, RNA 및 단백질)인 경우, 초측정성 가정은 분자 시계를 가정하는 것과 같아진다.

작업 예

이 작업 예는 5개 세균의 5S 리보솜 RNA 배열 정렬에서 계산한 JC69 유전자 거리 매트릭스에 기초한다. $(\$ $displaystyle$ a), $스테아로더모필루스균$ (\ $displaystyle$ b $),$ 락토바실루스 $(\style$ c $),$ $(\displaystyle$ d $),$ 마이크로코커스 $(\displaystyle$ e $)$ ^[3]^[4]

제1단계

첫 번째 클러스터링

5개의 요소 $, b, c, d,$ $)$ 와 그 사이의 쌍방향 거리 $D_{1}$ $($ 1})이 $(a,b,c,d,e)$ $D_{1}$ 있다고 가정합니다.

	a	b	c	d	e
a	0	17	21	31	23
b	17	0	30	34	21
c	21	30	0	28	39
d	31	34	28	0	43
e	23	21	39	43	0

이 예에서는 $D_{1}(a,b)=17$ $D_{1}(a,b)=17$ $=$ $D_{1}(a,b)=17$ ({ $displaystyle$ $D_{$ $1}(a,$ b)= $17)$ 이 $D_{1}(a,b)=17$ $D_{1}$ 의 $D_{1}$ ({ $1$ 이므로 $요소$ 와 $({displaystyle$ b $b$ 를 $a$ 결합합니다.

첫 번째 분기 길이 추정

$u$ { $displaystyle$ u }는 $u$ \ $displaystyle$ a $}$ $b$ b { $displaystyle$ b $}$ 가 $b$ 현재 연결되어 있는 $a$ 를 나타냅니다. $\delta (a,u)=\delta (b,u)=D_{1}(a,b)/2$ $\delta (a,u)=\delta (b,u)=D_{1}(a,b)/2$ ( $\delta (a,u)=\delta (b,u)=D_{1}(a,b)/2$ a , $\delta (a,u)=\delta (b,u)=D_{1}(a,b)/2$ ) $\delta (a,u)=\delta (b,u)=D_{1}(a,b)/2$ ( $\delta (a,u)=\delta (b,u)=D_{1}(a,b)/2$ b , $\delta (a,u)=\delta (b,u)=D_{1}(a,b)/2$ ) $\delta (a,u)=\delta (b,u)=D_{1}(a,b)/2$ $\delta (a,u)=\delta (b,u)=D_{1}(a,b)/2$ ( $\delta (a,u)=\delta (b,u)=D_{1}(a,b)/2$ , $\delta (a,u)=\delta (b,u)=D_{1}(a,b)/2$ ) / $\delta (a,u)=\delta (b,u)=D_{1}(a,b)/2$ ( \ $displaystyle \ display$ ( $a$ , u ) = \ $displaystyle$ ( $a$ , u ) $=$ D_ ${1}(a,b)/2를 사용$ 하면 $\delta (a,u)=\delta (b,u)=D_{1}(a,b)/2$ $요소$ $b$ $a와$ $b$ 가 $u$ 와 $u$ 등거리에 있음을 확인할 수 있습니다.이것은 초파형성 가설의 기대와 일치한다. $이어$ \ $displaystyle$ a $\$ $displaystyle$ b $\$ $displaystyle$ u\displaystyle b $\delta (a,u)=\delta (b,u)=17/2=8.5$ 와b\displaystyle b $\displaystyle$ u $\delta (a,u)=\delta (b,u)=17/2=8.5$ $b$ .5 $}($ 최종 덴드로그램 참조)의 길이가 $\delta (a,u)=\delta (b,u)=17/2=8.5$ .

첫 번째 거리 매트릭스 업데이트

그런 다음 초기 거리 $D_{1}$ $(\$ 을 $D_{1}$ 새로운 거리 $D_{2}$ $(\$ 로 업데이트합니다(아래 참조). $(\$ {})의 굵은 값은 b $(\displaystyle$ b $b$ 와 $함께$ {\ $displaystyle$ d_ ${})$ 로 $a$ 클러스터링되므로 크기가 1행 및 1열 감소됩니다.2 $)}$ 은 $D_{2}$ 첫 번째 클러스터 $(a,b)$ , $b )$ 의 $(a,b)$ 각 요소와 나머지 각 요소 간의 거리를 평균하여 계산한 새로운 거리에 해당합니다.

$\displaystyle D_{2}((a,b),c)=(D_{1}(a,c)\times 1+D_{1}(b,c)\times 1)/(1+1)=(21+30)/2=25.5}$

$D_{2}((a,b),d)=(D_{1}(a,d)+D_{1}(b,d)/2=32.5$

$D_{2}((a,b),e)=(D_{1}(a,e)+D_{1}(b,e)/2=(23+21)/2=22$

$(\$ 의 $D_{2}$ 기울임꼴 값은 첫 번째 클러스터에 포함되지 않은 요소 간의 거리에 대응하므로 매트릭스 업데이트의 영향을 받지 않습니다.

두 번째 단계

세컨드 클러스터링

이제 새로운 거리 $D_{2}$ $D_{2}$ 2 $({$ D_ ${2})$ 부터 시작하여 이전 세 단계를 반복합니다.

	(a, b)	c	d	e
(a, b)	0	25.5	32.5	22
c	25.5	0	28	39
d	32.5	28	0	43
e	22	39	43	0

$D_{2}((a,b),e)=22$ 서 $D_{2}((a,b),e)=22$ ( ( $D_{2}((a,b),e)=22$ , $D_{2}((a,b),e)=22$ b $D_{2}((a,b),e)=22$ ) , $D_{2}((a,b),e)=22$ ) $D_{2}((a,b),e)=22$ $D_{2}((a,b),e)=22$ ${$ { $displaystyle$ $D_{2}$ ( ( $a$ , b ) = $22$ $D_{2}$ 은 $D_{2}((a,b),e)=22$ $D_{2}$ 2 $D_{2}$ 의 $D_{2}$ 이므로, $(a,b)$ ( a , $(a,b)$ $displaystyle ( a$ , $(a,b)$ b )와 요소 e $(a,b)$ { $displaystyle$ e $e$ 를 결합합니다.

두 번째 분기 길이 추정

$v$ { $displaystyle$ v $}$ 는 $v$ ( $(a,b)$ $)$ { $displaystyle (a, b)}$ $e$ e { $displaystyle$ e $}$ 가 $e$ 현재 연결되어 있는 $(a,b)$ 노드를 나타냅니다.울트라메트릭성의 제약으로 인해 $,$ \ $displaystyle$ a} $b$ b {\ $displaystyle$ b $b$ }에서 $v$ {\ $displaystyle$ v $v$ $)$ 및 e {\ $displaystyle$ e}에서 v {\ $displaystyle$ v $}($ )로 $a$ 하는 브랜치는 동일하며 $\delta (a,v)=\delta (b,v)=\delta (e,v)=22/2=11$ 가 다음과 같습니다. $\delta (a,v)=\delta (b,v)=\delta (e,v)=22/2=11$ ( a , $\delta (a,v)=\delta (b,v)=\delta (e,v)=22/2=11$ ) $=$ b , $\delta (a,v)=\delta (b,v)=\delta (e,v)=22/2=11$ ) $\delta (a,v)=\delta (b,v)=\delta (e,v)=22/2=11$ $\delta (a,v)=\delta (b,v)=\delta (e,v)=22/2=11$ / 2 $\delta (a,v)=\delta (b,v)=\delta (e,v)=22/2=11$ $display$ sty ( e $\delta (a,v)=\delta (b,v)=\delta (e,v)=22/2=11$ , v ) = $\delta (a,v)=\delta (b,v)=\delta (e,v)=22/2=11$ / $\delta (a,v)=\delta (b,v)=\delta (e,v)=22/2=11$ = { $\delta (a,v)=\delta (b,v)=\delta (e,v)=22/2=11$ displaystystyle $11$ , $v$ = { displaystyle displaystyledisplayst $델타(b,v)=\delta(e,v)=22/2=11}$

$\delta (u,v)=\delta (e,v)-\delta (a,u)=\delta (e,v)-\delta (b,u)=11-8.5=2.5$ 된 분기 길이를 추정합니다. $\delta (u,v)=\delta (e,v)-\delta (a,u)=\delta (e,v)-\delta (b,u)=11-8.5=2.5$ ( $\delta (u,v)=\delta (e,v)-\delta (a,u)=\delta (e,v)-\delta (b,u)=11-8.5=2.5$ , $\delta (u,v)=\delta (e,v)-\delta (a,u)=\delta (e,v)-\delta (b,u)=11-8.5=2.5$ ) $\delta (u,v)=\delta (e,v)-\delta (a,u)=\delta (e,v)-\delta (b,u)=11-8.5=2.5$ ( ( $\delta (u,v)=\delta (e,v)-\delta (a,u)=\delta (e,v)-\delta (b,u)=11-8.5=2.5$ , $\delta (u,v)=\delta (e,v)-\delta (a,u)=\delta (e,v)-\delta (b,u)=11-8.5=2.5$ ) - $\delta (u,v)=\delta (e,v)-\delta (a,u)=\delta (e,v)-\delta (b,u)=11-8.5=2.5$ ) ( $\delta (u,v)=\delta (e,v)-\delta (a,u)=\delta (e,v)-\delta (b,u)=11-8.5=2.5$ , $\delta (u,v)=\delta (e,v)-\delta (a,u)=\delta (e,v)-\delta (b,u)=11-8.5=2.5$ ) $\delta (u,v)=\delta (e,v)-\delta (a,u)=\delta (e,v)-\delta (b,u)=11-8.5=2.5$ ( ( $\delta (u,v)=\delta (e,v)-\delta (a,u)=\delta (e,v)-\delta (b,u)=11-8.5=2.5$ , $\delta (u,v)=\delta (e,v)-\delta (a,u)=\delta (e,v)-\delta (b,u)=11-8.5=2.5$ ) - $\delta (u,v)=\delta (e,v)-\delta (a,u)=\delta (e,v)-\delta (b,u)=11-8.5=2.5$ ( ( $\delta (u,v)=\delta (e,v)-\delta (a,u)=\delta (e,v)-\delta (b,u)=11-8.5=2.5$ , $\delta (u,v)=\delta (e,v)-\delta (a,u)=\delta (e,v)-\delta (b,u)=11-8.5=2.5$ ) $\delta (u,v)=\delta (e,v)-\delta (a,u)=\delta (e,v)-\delta (b,u)=11-8.5=2.5$ - $\delta (u,v)=\delta (e,v)-\delta (a,u)=\delta (e,v)-\delta (b,u)=11-8.5=2.5$ . $\delta (u,v)=\delta (e,v)-\delta (a,u)=\delta (e,v)-\delta (b,u)=11-8.5=2.5$ 2.5 \ $display$ style \ display ( $u$ ) $=$ \ $display$ style ( $e$ , $v$ ) \ $displan$ ( e , v ) \ $spa$ , v ) \ sclan ( e , v ) \ $sclan$ ( $e$ , v ) \ sclan ( e , v ) \ sclan ) \ slannel (

두 번째 거리 매트릭스 업데이트

그런 다음 $({$ $displaystyle D_{$ 2})를 $D_{2}$ 새로운 거리 $D_{3}$ $($ 참조)로 $D_{2}$ 합니다 $(a,b)$ ( $(a,b)$ , $(a,b)$ b ) $(a,b)$ \ $displaystyle$ (a , $b$ ) \ displaystyle ( a , b ) $e$ {\eringering eringeringering $D_{3}$ {\ （ a , b ) \ $displaystyle$ D _ { 3 $D_{3}$ } $e$ $D_{3}$ in in in in in in in in in in in in in ） $in$ in in in in in in in in in in in in in in in in {\ cor D_{ $displaystyle$ D_ ${$ $D_{3}$ displayst비례 평균으로 계산된 새 거리에 대한 계산:

$\displaystyle D_{3}(((a,b,e),c)=(D_{2}(((a,b),c)\times 2+D_{2}(e,c)\times 1)/(25.5\times 2+39\times 1)/3=30}$

이 비례 평균 덕분에 이 새로운 거리는e\ $displaystyle$ e $}($ 하나의 $e$ 요소)에 대해 ( $(a,b)$ $)\$ display style $($ a, b)\ $display$ (a, b)\display (a, b)\display style (a, b $)$ 클러스터 $(a,b)$ 2개 요소)의 더 큰 크기를 차지합니다.마찬가지로:

$\displaystyle D_{3}(((a,b,e),d)=(D_{2}((a,b),d)\times 2+D_{2}(e,d)\times 1)/(2+1)=(32.5\times 2+43\times 1)/366)$

따라서 비례 평균은 $D_{1}$ 의 초기 거리({ $displaystyle D_{1$ 와 동일한 가중치를 부여합니다.이것이 수학적 절차가 아니라 초기 거리에 대해 방법이 가중치가 부여되지 않는 이유이다.

세 번째 단계

세 번째 클러스터링

업데이트된 거리 $D_{3}$ $D_{3}$ 3 $({$ D_ ${3$ 부터 시작하여 이전 세 단계를 다시 설명합니다.

	(a,b,e)	c	d
(a,b,e)	0	30	36
c	30	0	28
d	36	28	0

$D_{3}(c,d)=28$ 서 D $D_{3}(c,d)=28$ ( $D_{3}(c,d)=28$ , $D_{3}(c,d)=28$ ) $D_{3}(c,d)=28$ $D_{3}(c,d)=28$ ( \ $displaystyle$ $D$ $D_{3}(c,d)=28$ _ { $D_{3}(c,d)=28$ $3$ （ $c$ , d $D_{3}$ ) $= 28$ )은 $D_{3}(c,d)=28$ D $D_{3}$ 의 최소값이므로 $요소$ $c$ 와d { $displaystyle$ d $d$ 를 $d$ 합니다 $c$ .

세 번째 분기 길이 추정

$\displaystyle$ w는 $w$ c $\displaystyle$ $d$ 와 $c$ d $\displaystyle$ d가 현재 $d$ 연결되어 있는 $c$ 를 나타냅니다.c{\ $displaystyle$ c $}$ 및 $c$ $d$ {\ $displaystyle$ d $}$ 와 $d$ w {\ $displaystyle$ w $}$ 를 $w$ $c$ 하는 브런치의 길이는 $\delta (c,w)=\delta (d,w)=28/2=14$ ( $\delta (c,w)=\delta (d,w)=28/2=14$ , $\delta (c,w)=\delta (d,w)=28/2=14$ ) $\delta (c,w)=\delta (d,w)=28/2=14$ ( d $\delta (c,w)=\delta (d,w)=28/2=14$ , $\delta (c,w)=\delta (d,w)=28/2=14$ w ) $\delta (c,w)=\delta (d,w)=28/2=14$ $\delta (c,w)=\delta (d,w)=28/2=14$ / $\delta (c,w)=\delta (d,w)=28/2=14$ $=$ $\delta (c,w)=\delta (d,w)=28/2=14$ ( $displaystyle$ \ $displaystyle$ ( $c$ , $\delta (c,w)=\delta (d,w)=28/2=14$ w ) = $28$ / 2 = 14 $\delta (c,w)=\delta (d,w)=28/2=14$ ）（ displaystyledisplaystyle ( displaystyle ）））。

세 번째 거리 매트릭스 업데이트

갱신할 엔트리는 1개뿐입니다.단, $c$ 의 요소 $d$ 와 $c$ $d$ 의 평균 계산에서 각각1 $(\displaystyle$ 1)의 $d$ $1$ 기여도를 가지는 것에 주의해 주세요.

${\displaystyle D_{4}(c,d),(a,b),e)=(D_{3}(c,(a,b,e))\times 1+D_{3}(d,(a,b,e)\times 1)/(1+1)=(30\times 1+36\times 1)/233$

마지막 단계

$D_{4}$ $({$ 4 $D_{4}$ }) 매트릭스는 다음과 같습니다.

	(a,b,e)	(c,d)
(a,b,e)	0	33
(c,d)	33	0

$((a,b),e)$ ( ( ( $((a,b),e)$ a , $((a,b),e)$ ) $((a,b),e)$ , e ) $((a,b),e)$ { $displaystyle$ ( $a$ , b $((a,b),e)$ , e ) $(c,d)$ } $(c,d)$ ( $(c,d)$ c , $(c,d)$ ) { $displaystyle ( c$ , $d$ ) $(c,d)$ 에 $((a,b),e)$ 접속합니다.

$\displaystyle$ r은 (a $r$ $((a,b),e)$ $((a,b),e)$ $((a,b),e)$ $)$ { $displaystyle (a, b), e}$ 및 $(c,d)$ ( $(c,d)$ $)$ { $displaystyle (c,d)}$ 이 $(c,d)$ 연결되어 있는 (root) 노드를 나타냅니다. $($ $((a,b),e)$ , $((a,b),e)$ b $((a,b),e)$ , $((a,b),e)$ ) { $displaystyle ( a$ , $b$ ) $(c,d)$ 및 $((a,b),e)$ ( $(c,d)$ , $(c,d)$ ) { $displaystyle ( c$ , d $)}$ 를 r $(c,d)$ { $displaystyle$ r} $r$ $((a,b),e)$ 결합하는 브랜치에는 다음과 같은 $((a,b),e)$ 가 있습니다.

$\displaystyle \display ( ( ( a , b , e ) , r ) = \display ( ( c , d , r ) = 33 / 2 = 16 . 5 }$

나머지 2개의 분기 길이를 추정합니다.

$\displaystyle \displaystyle (v,r)=\display((a,b,e),r)-\display(e,v)=16.5-11=5.5}$

$\displaystyle \display(w,r)=\display(c,d),r)-\display(c,w)=16.5-14=2.5}$

UPGMA 덴드로그램

덴드로그램이 완료되었습니다.^[5]모든 팁(\ $displaystyle$ a $)$ 에서 $a$ e $\displaystyle$ e $e$ 은r\ $displaystyle$ r $:$

$\displaystyle \display (a,r)=\display (b,r)=\display (e,r)=\display (c,r)=\display (d,r)=16.5}$

따라서 덴드로그램은 가장 깊은 노드인r {\ $displaystyle$ r}에 $r$ 를 두고 있습니다.

다른 링크와의 비교

대체 링크 방식으로는 단일 링크 클러스터링, 완전 링크 클러스터링 및 WPGMA 평균 링크 클러스터링이 있습니다.다른 링크의 실장은 상기 알고리즘의 거리 매트릭스 갱신 단계에서 클러스터 간 거리를 계산하기 위해 다른 공식을 사용하는 것에 불과합니다.완전한 링크 클러스터링을 통해 단일 링크 클러스터링을 통해 형성된 클러스터는 각 클러스터의 많은 요소가 서로 매우 멀리 떨어져 있더라도 서로 근접하여 강제로 함께 결합될 수 있는 이른바 체인 현상이라는 대체 단일 링크 클러스터링 방법의 단점을 피할 수 있습니다.완전 연결은 ^[6]지름이 거의 같은 콤팩트한 군집을 찾는 경향이 있습니다.

동일한 거리 행렬에서 서로 다른 클러스터링 방법으로 얻은 덴드로그램 비교.


단일 링크 클러스터링	완전한 링크 클러스터링	평균 링크 클러스터링: WPGMA.	평균 링크 클러스터링: UPGMA.

사용하다

생태학에서는 관련 기술자 변수(종 구성 ^[7]등)의 쌍별 유사성에 기초하여 표본 추출 단위(식물도 등)를 분류하는 가장 일반적인 방법 중 하나이다.예를 들어, 그것은 해양 박테리아와 ^[8]원생 동물 사이의 영양적 상호작용을 이해하기 위해 사용되어 왔다.
생물정보학에서 UPGMA는 페네틱 트리(phenetic tree)의 생성에 사용됩니다.UPGMA는 처음에는 단백질 전기영동 연구에 사용하도록 설계되었지만, 현재는 보다 정교한 알고리즘을 위한 가이드 트리를 제작하는 데 가장 많이 사용됩니다.예를 들어 이 알고리즘은 시퀀스가 정렬되는 순서를 제안하기 때문에 시퀀스 정렬 절차에서 사용됩니다.실제로, 가이드 트리는 진화 속도나 계통 발생 친화성에 관계없이 가장 유사한 시퀀스를 그룹화하는 것을 목표로 하며, 그것이 바로 UPGMA의^[9] 목표이다.
계통유전학에서 UPGMA는 일정한 진화율(분자 클럭 가설)을 가정하고 모든 시퀀스가 동시에 샘플링되었으며, 이 가정이 테스트되고 사용되는 데이터 세트에 대해 정당화되지 않는 한 관계를 추론하는 데 잘 알려진 방법은 아니다.'엄격한 클럭' 하에서도 서로 다른 시간에 샘플링된 시퀀스가 울트라메트릭 트리로 이어지면 안 된다는 점에 유의하십시오.

시간의 복잡성

UPGMA 트리를 구축하기 위한 알고리즘의 간단한 실장에서는 $O(n^{3})$ O $(n$ 3)의 $O(n^{3})$ 시간 복잡도를 $O(n^{3})$ , 각 클러스터에 대해 히프를 사용하여 다른 클러스터와의 거리를 유지하면 O $O(n^{2}\log n)$ $O(n^{2}\log n)$ log $O(n^{2}\log n)$ n $O(n^{2}\log n)$ )의 시간이 단축됩니다.{n }\ $displaystyle$ O $(n^{$ $2$ }\ $log$ n $O(n^{2}\log n)$ Mion Murtag $O(n^{2})$ 가 $O(n^{2})$ 됩니다 $O(n^{2})$ $aystyle$ O $(n^{2})}$ 시공간 $O(n^{2})$ 알고리즘.^[10]

「」를 참조해 주세요.

레퍼런스

^ Sokal, Michener (1958). "A statistical method for evaluating systematic relationships". University of Kansas Science Bulletin. 38: 1409–1438.
^ Garcia S, Puigbò P. "DendroUPGMA: A dendrogram construction utility" (PDF). p. 4.
^ Erdmann VA, Wolters J (1986). "Collection of published 5S, 5.8S and 4.5S ribosomal RNA sequences". Nucleic Acids Research. 14 Suppl (Suppl): r1–59. doi:10.1093/nar/14.suppl.r1. PMC 341310. PMID 2422630.
^ Olsen GJ (1988). "Phylogenetic analysis using ribosomal RNA". Methods in Enzymology. 164: 793–812. doi:10.1016/s0076-6879(88)64084-5. PMID 3241556.
^ Swofford DL, Olsen GJ, Waddell PJ, Hillis DM (1996). "Phylogenetic inference". In Hillis DM, Moritz C, Mable BK (eds.). Molecular Systematics, 2nd edition. Sunderland, MA: Sinauer. pp. 407–514. ISBN 9780878932825.
^ Everitt, B. S.; Landau, S.; Leese, M. (2001). Cluster Analysis. 4th Edition. London: Arnold. p. 62–64.
^ Legendre P, Legendre L (1998). Numerical Ecology. Developments in Environmental Modelling. Vol. 20 (Second English ed.). Amsterdam: Elsevier.
^ Vázquez-Domínguez E, Casamayor EO, Català P, Lebaron P (April 2005). "Different marine heterotrophic nanoflagellates affect differentially the composition of enriched bacterial communities". Microbial Ecology. 49 (3): 474–85. doi:10.1007/s00248-004-0035-5. JSTOR 25153200. PMID 16003474. S2CID 22300174.
^ Wheeler TJ, Kececioglu JD (July 2007). "Multiple alignment by aligning alignments". Bioinformatics. 23 (13): i559–68. doi:10.1093/bioinformatics/btm226. PMID 17646343.
^ Murtagh F (1984). "Complexities of Hierarchic Clustering Algorithms: the state of the art". Computational Statistics Quarterly. 1: 101–113.

외부 링크

[1] Sokal, Michener (1958). "A statistical method for evaluating systematic relationships". University of Kansas Science Bulletin. 38: 1409–1438.

[2] Garcia S, Puigbò P. "DendroUPGMA: A dendrogram construction utility" (PDF). p. 4.

[Erdmann1986-3] Erdmann VA, Wolters J (1986). "Collection of published 5S, 5.8S and 4.5S ribosomal RNA sequences". Nucleic Acids Research. 14 Suppl (Suppl): r1–59. doi:10.1093/nar/14.suppl.r1. PMC 341310. PMID 2422630.

[Olsen1988-4] Olsen GJ (1988). "Phylogenetic analysis using ribosomal RNA". Methods in Enzymology. 164: 793–812. doi:10.1016/s0076-6879(88)64084-5. PMID 3241556.

[Swofford1996-5] Swofford DL, Olsen GJ, Waddell PJ, Hillis DM (1996). "Phylogenetic inference". In Hillis DM, Moritz C, Mable BK (eds.). Molecular Systematics, 2nd edition. Sunderland, MA: Sinauer. pp. 407–514. ISBN 9780878932825.

[6] Everitt, B. S.; Landau, S.; Leese, M. (2001). Cluster Analysis. 4th Edition. London: Arnold. p. 62–64.

[7] Legendre P, Legendre L (1998). Numerical Ecology. Developments in Environmental Modelling. Vol. 20 (Second English ed.). Amsterdam: Elsevier.

[8] Vázquez-Domínguez E, Casamayor EO, Català P, Lebaron P (April 2005). "Different marine heterotrophic nanoflagellates affect differentially the composition of enriched bacterial communities". Microbial Ecology. 49 (3): 474–85. doi:10.1007/s00248-004-0035-5. JSTOR 25153200. PMID 16003474. S2CID 22300174.

[pmid17646343-9] Wheeler TJ, Kececioglu JD (July 2007). "Multiple alignment by aligning alignments". Bioinformatics. 23 (13): i559–68. doi:10.1093/bioinformatics/btm226. PMID 17646343.

[10] Murtagh F (1984). "Complexities of Hierarchic Clustering Algorithms: the state of the art". Computational Statistics Quarterly. 1: 101–113.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

v t 계통학
관련 필드	계산 계통학 분자 계통학 클래디스트리스 분류법 진화분류학 계통학	진화생물학 포털
기본 개념	계통발생 분지형성 계통수 분해도 계통망 긴 가지 어트랙션 Clade vs Grade 계보 유령 혈통 유령 집단
추론 방법	최대 절약량 확률론적 방법 최대우도 베이지안 추론 거리 매트릭스 방법 네이버 가입 업그마 최소 제곱 삼분류 분석
최신 토픽	Phylo Code(필로코드) DNA바코딩 분자 계통학 계통학적 비교법 계통발생적 틈새보수주의 계통발생신호 계통학 소프트웨어 계통학 계통 지리학
그룹 특성	원시적인 플레시오몰피 심플시오몰피 파생된 아포몰피 Synapomorphy 자가형질
그룹 유형	단열식 의역적으로 다지성
명명법	계통명 크라운 그룹 자매그룹 기초 슈퍼트리
카테고리 공통

Search

업그마

네임스페이스

더

목차

알고리즘.

작업 예