이중 절단 및 결합 모델
Double Cut and Join Model이중 절단 및 결합(DCJ) 모델은 뉴클레오티드 시퀀스가 아닌 유전자 순서와 방향에 따라 게놈 사이의 편집 거리를 정의하는 데 사용되는 게놈 재배열 모델입니다.게놈의 기본 단위는 유전체 사이에서 보존되는 DNA의 최대 부분인 합성 블록입니다.그것은 원형 [1]중간체의 생성 및 흡수뿐만 아니라 역전, 전좌와 같은 게놈 재배열 작업으로 인한 변화에 초점을 맞춥니다.
게놈은 각 꼭짓점이 1도 또는 2도인 방향성 가장자리 레이블 그래프로 설명됩니다.모서리는 동기 블록으로 레이블이 지정되고, 차수 1의 정점은 텔로미어를 나타내며, 차수 2의 정점은 블록 간 인접 관계를 나타냅니다.이를 위해서는 게놈이 주기와 경로로 구성되어야 합니다.각각의 구성요소는 염색체라고 불립니다.각 가장자리의 시작은 꼬리라고 불리고, 각 가장자리의 끝은 머리라고 불립니다; 머리와 꼬리는 함께 사지라고 알려져 있습니다.꼭짓점은 블록의 머리와 꼬리 역할로 설명됩니다. 예를 들어, 그림에서 마커 1의 머리와 마커 2의 꼬리를 형성하는 인접은 라벨링(h1, t2)이고, 2의 머리에 의해 형성되는 텔로미어는 (h2)입니다.DCJ(Double Cut and Join) 작업은 다음 네 가지 변환 중 하나로 구성됩니다.
- 두 개의 인접 관계(a, b)와 (c, d)를 깨서 두 개의 인접 관계(a, c)와 (b, d)를 더 만들기
- (ii) (a, c) 또는 (b, c)와 같이 새로운 인접 관계와 텔로미어를 만들기 위해 인접 관계(a, b)와 텔로미어를 취하는 것.
- (iii) 두 개의 텔로미어(a)와 (b)를 취하고 새로운 인접 관계를 만들기(a, b)
- (iv) 두 텔로미어(a) 및 (b)를 생성하기 위해 인접 관계(a, b)를 끊습니다.
편집 거리인 이중 절단 및 결합 거리는 A 를로 하는 데 필요한 최소 DCJ 작업 수와 동일한 수 및 G_ {\를 가진 게놈 간에 정의됩니다.
수학적 결과
DCJ 거리는 메트릭 공간을 정의합니다.이를 확인하기 위해 먼저 G를 자체로 변경하기 위한 연산이 필요하지 않으므로 DCJ(G, G) = 0({{displaystyle d_{DCJ}(G, G)=0}, 만약 G1 ≠ G2({1}\neq G_{2})이면 DCJ(G1, G2) > 0({D_0}, D_G),G1 G_{1}을 다른 게놈으로 변환하기 위해서는 적어도 하나의 작업이 필요하기 때문이다.( 과 G_가 동일한 가장자리를 가진 게놈일 마다 가 항상 정의된다는 증거가 뒤따릅니다.)각 연산에는 역이 있습니다. (i)와 (ii)는 각각의 역이고 (iii)는 (iv)의 역입니다. ( ( {\}) =1삼각 부등식 DCJ (G1, G3) ≤ DCJ (G1, G2) + DCJ (G2, G3) \displaystyle d_{DCJ}(G_{1}, G_{3})\leq d_{DCJ}(G_{1}, G_{2}}+D_{J} G_{J} G_{G_1} 계열의 변환을 유지하기 때문이다o 따라서 을 (를) G3 으)로 하는 데 필요한 최소한의 작업 수는 이 값을 초과하면 안 됩니다.
동일한 합성 블록 세트를 가진 두 과 G_ 사이의 DCJ 거리를 계산하기 위해, 우리는 게놈의 인접 A 로 알려진 이분 멀티그래프를 구성합니다.인접 그래프의 꼭짓점 집합은 (V(G1), (G2) ) {\displaystyle (V(G_{1)}, (G_{2)}이며, 여기서 V(G1) {\displaystyle V(G_{1)}는 G1G_{1}의 꼭짓점 집합이고, V(G2) {G}는 G2}의 꼭짓점 집합이다 와 가 동일한 합성 블록의 끝단인 () E를 가집니다.와 가 두 개의 을 공유한다면 는 에 와 b 에 두 개의 가장자리를 더합니다.
A A =인 , 우리는 인접 그래프가 전적으로 두 텔로미어를 연결하는 길이 1의 경로와 두 인접을 연결하는 길이 2의 주기로 구성되어 있음을 알 수 있습니다. 사실을 사용하여 를할 수 있습니다 을 및 G_의 합성 블록 수, 를 인접 그래프의 사이클 수, 를 인접 그래프의 경로 수라고 . d - (+ /). {\}) = +증명에 따르면 각 DCJ 연산은 N- (+ / ){ / {\displaystyle G_{2 감소할 수 있으며, ≠ {\ G_2}}일 경우N -(+ I/2 ) {\+ I} 을 하는 연산이 존재합니다은 가를 을 증명합니다은 (는) 항상 정의되며, 계산 방법을 제공합니다.주기와 경로를 계산하기 은 (는) 선형 [3]시간으로 확인할 수 있습니다.
레퍼런스
- ^ Friedberg R, Darling AE, Yancopoulos S (2008). Genome rearrangement by the double cut and join operation. Each of these individual operations involves 2 cuts and 2 joins of the genomic DNA. Methods Mol Biol. Vol. 452. pp. 385–416. doi:10.1007/978-1-60327-159-2_18. PMID 18566774.
- ^ Yancopoulos S, Attie O, Friedberg R (2005). "Efficient sorting of genomic permutations by translocation, inversion and block interchange". Bioinformatics. 21 (16): 3340–3346. doi:10.1093/bioinformatics/bti535. PMID 15951307.
- ^ YAF 2005