시퀀스 호몰로지

Sequence homology
적색과 청색의 유전자 계통 발생은 회색종 계통 발생에서 분기한다.Top: 조상 유전자 복제는 두 개의 패럴로그를 생성한다(히스톤 H1.1과 1.2).종분화 이벤트는 두 딸 종(인간과 침팬지)에서 맞춤법을 생산합니다.바닥: 다른 종(대장균)에서, 유전자는 유사한 기능(히스톤과 같은 핵구조를 이루는 단백질)을 가지고 있지만, 별개의 진화적 기원을 가지고 있고, 유사체도 마찬가지이다.

시퀀스 호몰로지는 DNA, RNA 또는 단백질 염기서열 사이생물학적 호몰로지로, 생명의 진화 역사에서 공통 조상으로 정의된다.DNA의 두 세그먼트는 세 가지 현상 때문에 조상을 공유할 수 있다: 종분화 사건, 복제 사건, 또는 수평적(또는 수평적) 유전자 전달 사건.[1]

DNA, RNA 또는 단백질 사이의 호몰로지는 전형적으로 그들의 뉴클레오티드 또는 아미노산 배열 유사성에서 추론된다.유의한 유사성은 두 서열이 공통 조상 서열에서 진화적 변화에 의해 연관되어 있다는 강력한 증거이다.여러 시퀀스의 정렬은 각 시퀀스의 어떤 영역이 상동인지를 나타내기 위해 사용됩니다.

아이덴티티, 유사성 및 보존

포유류히스톤 단백질 배열입니다.배열은 단백질의 중간 120-180 아미노산 잔기이다.모든 시퀀스에서 보존되는 잔류물은 회색으로 강조 표시됩니다.아래 키는 보존 시퀀스(*), 보존 돌연변이(:), 반 보존 돌연변이(.) 및 비 보존 돌연변이([2] )를 나타냅니다.

"백분율 호몰로지"라는 용어는 종종 "순서 유사성"을 의미하는데, 이는 동일한 잔류물의 백분율(백분율 동일성) 또는 유사한 물리 화학적 특성(백분율 유사성)으로 보존된 잔류물의 백분율(예: 류신이소류신)을 "호몰로지"로지를 정량화하기 위해 사용된다.시퀀스 유사성이 관측치이기 때문에 위에 명시된 호몰로지의 정의에 따르면, 호몰로지가 [3]결론이다.시퀀스는 상동성이든 [3]아니든 상관없습니다.이것은 "백분율 호몰로지"라는 용어가 잘못된 [4]명칭이라는 것을 포함한다.

형태학적 및 해부학적 구조와 마찬가지로, 순서 유사성은 수렴 진화에 의해 발생할 수 있으며, 또는 짧은 순서와 마찬가지로 우연히 상동성이 아님을 의미한다.상동 배열 영역은 보존된 영역이라고도 합니다.이것은 특정 위치에 있는 아미노산이 기능적으로 동등한 물리 화학적 특성을 가진 다른 아미노산으로 대체되는 아미노산 배열의 보존과 혼동해서는 안 된다.

부분 호몰로지는 비교된 시퀀스의 세그먼트가 공유 원점을 가지고 있는 반면 나머지는 그렇지 않은 경우에 발생할 수 있습니다.이러한 부분 호몰로지는 유전자 융합 사건에서 비롯될 수 있다.

정형외과

Top: 조상 유전자가 복제되어 두 개의 패럴로그(Genes A와 B)를 생성한다.종분화 현상은 두 딸 종에서 맞춤법을 생산한다.아래: 다른 종에서, 관련이 없는 유전자는 유사한 기능을 가지고 있지만(유전자 C), 다른 진화적 기원을 가지고 있고, 유사체도 마찬가지입니다.

동종 배열은 종분화 사건에 의해 분리된 동일한 조상 배열의 후손으로 추정될 경우 직교한다: 종이 두 개의 다른 종으로 분리될 때, 두 개의 결과 종에서 단일 유전자의 복사는 직교라고 한다.직교 유전자 또는 직교 유전자는 마지막 공통 조상의 단일 유전자로부터의 수직 하강으로 유래된 다른 종의 유전자이다."정통학"이라는 용어는 분자 진화론자인 월터 [5]피치에 의해 1970년에 만들어졌다.

예를 들어, 식물 독감 조절 단백질은 아라비도시스(다세포 고등 식물)와 클라미도모나스(단세포 녹조) 모두에 존재한다.Chlamydomonas 버전은 더 복잡하다: 그것은 한 번이 아니라 두 번 막을 통과하고, 추가 도메인을 포함하며, 대체 스플라이싱을 거친다.그러나 그것은 유전 공학을 통해 조류에서 식물 게놈으로 옮겨진다면 훨씬 더 단순한 아라비도시스 단백질을 완전히 대체할 수 있다.유의한 배열 유사성과 공유 기능 영역은 이 두 유전자가 공통 조상으로부터 물려받은 직교 [6]유전자임을 나타낸다.

철자학은 엄격하게 조상의 관점에서 정의된다.유전자 복제와 유전자 재배열로 다른 유기체의 정확한 조상을 확인하기 어렵다는 점을 감안할 때 유사한 두 유전자가 직교한다는 가장 강력한 증거는 대개 유전자 계통의 계통 분석을 통해 찾을 수 있다.맞춤법은 항상 그렇지는 않지만 같은 기능을 [7]가지고 있는 경우가 많습니다.

직교 배열은 분류학적 분류와 유기체의 계통학 연구에 유용한 정보를 제공한다.유전적 발산 패턴은 유기체의 연관성을 추적하는 데 사용될 수 있다.매우 밀접하게 관련되어 있는 두 유기체는 두 개의 맞춤법 사이에서 매우 유사한 DNA 서열을 나타낼 가능성이 있습니다.반대로, 다른 유기체로부터 진화적으로 더 멀리 떨어져 있는 유기체는 [citation needed]연구되고 있는 맞춤법의 순서에서 더 큰 차이를 보일 가능성이 있다.

직교 유전자 데이터베이스

생물학과 생물정보학에 대한 그들의 엄청난 중요성을 감안할 때, 직교 유전자는 직교 유전자의 염기서열을 식별하고 분석하는 도구를 제공하는 몇 가지 전문 데이터베이스에 정리되어 있다.이러한 자원은 일반적으로 모든 쌍별 배열 비교의 경험적 분석을 사용하는 접근법과 계통 발생법을 사용하는 접근법으로 분류할 수 있는 접근법을 사용한다.시퀀스 비교 방법은 1997년 [8]COGs 데이터베이스에서 처음 개발되었습니다.이 방법들은 12개의 다른 데이터베이스로 확장 및 자동화되어 있으며, 가장 진보된 것은 AYbRAH Analysising Feathers by Reconstructuring Features of Homologs와[9] 현재 다음과 같은 데이터베이스이다.

  • 에그노[10][11]
  • 식물용 GreenPhylDB[12][13]
  • InParanoid는[14][15] 쌍별 직교 관계에 초점을 맞춥니다.
  • OHNOLOGS[16][17] 인간과 쥐를 포함한 척추동물 게놈의 전체 게놈 복제에서 유지되는 유전자의 저장소입니다.
  • OMA[18]
  • OrthoDB[19] 종 트리를 따라 맞춤법의 계층을 제공함으로써 맞춤법 개념이 다른 규격점에 상대적이라는 것을 인식한다.
  • OrthoInspector[20] 생명체의 3개 영역을 커버하는 4753개 유기체의 직교 유전자의 저장소입니다.
  • 맞춤법아이디[21][22]
  • 포유동물용 OrthoMaM[23][24][25]
  • OrthoMCL[26][27]
  • 반올림[28]

나무 기반 계통발생학적 접근법은 다음과 같은 데이터베이스와 소프트웨어 도구에 구현된 것과 같이 유전자 나무를 종 나무와 비교하여 유전자 복제 사건과의 분화를 구별하는 것을 목표로 한다.

하이브리드 접근법의 세 번째 범주는 휴리스틱 방법과 계통 발생 방법을 모두 사용하여 클러스터를 구성하고 트리를 결정합니다. 예를 들어 다음과 같습니다.

병변학

평행 유전자는 비교 대상 종의 마지막 공통 조상(LCA)에서 복제 이벤트를 통해 연관된 유전자이다.그들은 분리된 분화 사건 동안 중복된 유전자의 돌연변이로 인해 발생한다.LCA의 후손들이 원래 복제된 유전자의 돌연변이된 상동성 유전자를 공유하면, 그 유전자들은 [1]패럴로그로 간주된다.

예를 들어, LCA에서는 하나의 유전자(유전자 A)가 복제되어 별도의 유사한 유전자(유전자 B)가 만들어질 수 있으며, 이들 두 유전자는 계속해서 다음 세대에 전해질 것이다.종분화 동안, 한 환경은 유전자 A의 돌연변이(유전자 A1)를 선호하여 유전자 A1과 B를 가진 새로운 종을 생산할 것이다.그리고 나서, 다른 분화 사건에서, 한 환경은 유전자 A와 B1을 가진 새로운 종을 낳는 유전자 B의 돌연변이를 선호할 것이다.후손들의 유전자 A1과 B1은 두 [1]종의 마지막 공통 조상의 복제 이벤트를 통해 연관된 상동체이기 때문에 서로 평행하다.

패럴로그의 추가 분류에는 알로파라로그(out-paralogs)와 심볼파라로그(in-paralogs)가 포함됩니다.동종아날로그는 주어진 분화 사건 이전의 유전자 복제로부터 진화한 병렬로그이다.다시 말해, 동종아날로그는 비교 대상 생물의 LCA에서 발생한 복제 사건에서 진화한 병렬 로그이다.위의 예는 동종 카탈로그의 예시입니다.Symparalogs는 후속 종분화 사건에서 평행 유전자의 유전자 복제에서 진화한 평행종이다.위의 예에서, A1과 B 유전자를 가진 후손이 A1 유전자가 복제되는 또 다른 분화 현상을 겪으면, 새로운 종은 B, A1a, A1b 유전자를 갖게 된다.이 예에서 유전자 A1a와 A1b는 심볼로그이다.[1]

척추동물Hox 유전자는 일련의 병변으로 구성되어 있다.각 Hox 클러스터(HoxA, HoxB 등)는 다른 염색체 상에 있습니다.예를 들어 인간의 HoxA 클러스터는 7번 염색체에 있다.여기에 표시된 마우스 HoxA 클러스터는 11개의 평행 유전자가 있습니다(2개는 누락).[37]

평행 유전자는 전체 게놈의 구조를 형성할 수 있고, 따라서 게놈의 진화를 크게 설명할 수 있다.동물의 호메오박스(Hoomox) 유전자가 그 예입니다.이 유전자들은 염색체 에서 유전자 복제뿐만 아니라 전체 게놈 복제도 거쳤다.그 결과, 대부분의 척추동물의 Hox 유전자는 여러 염색체에 걸쳐 군집되어 HoxA-D 클러스터가 가장 [37]잘 연구되고 있다.

또 다른 예는 미오글로빈과 헤모글로빈코드하는 글로빈 유전자로 고대 패럴로그로 간주된다.마찬가지로, 네 가지 알려진 헤모글로빈 클래스(헤모글로빈 A, 헤모글로빈 A2, 헤모글로빈 B 및 헤모글로빈 F)는 서로 평행합니다.각각의 단백질은 산소 운반의 기본적인 기능을 제공하지만, 그것들은 이미 기능이 약간 분화되었습니다: 태아 헤모글로빈 (헤모글로빈 F)은 성인 헤모글로빈보다 산소에 대한 친화력이 더 높습니다.그러나 함수가 항상 보존되는 것은 아닙니다.예를 들어 인간 앤지오제닌리보핵산가수분해효소로부터 분리되었고, 두 개의 패럴로그는 3차 구조에서 유사한 상태를 유지하지만, 현재 세포 내에서의 기능은 상당히 다르다.[citation needed]

종종 철자가 유사한 분기의 병렬로그보다 기능적으로 더 유사하다고 주장하지만, 여러 논문이 이 [38][39][40]개념에 이의를 제기했다.

규정

패럴로그는 다른 조직 특이적 발현 패턴을 갖는 등 종종 다르게 조절된다(Hox 유전자 참조).그러나 단백질 수준에서도 다르게 조절될 수 있습니다.를 들어, 서브틸리스 바실루스는 글루탐산탈수소효소의 두 가지 평행도를 암호화한다.GudB는 구성적으로 전사되는 반면 RocG는 엄격하게 조절된다.활성 올리고머 상태에서 두 효소는 유사한 효소 속도를 보인다.그러나 효소 및 촉진제의 교환은 심각한 적합성 손실을 유발하며, 따라서 촉진제-효소 공진화를 나타낸다.단백질의 특성 분석 결과, RocG에 비해 GudB의 효소 활성은 글루탐산염과 [41]pH에 크게 의존한다는 것을 알 수 있다.

평행 염색체 영역

때때로, 염색체의 큰 영역은 같은 [42]게놈 내의 다른 염색체 영역과 유사한 유전자 성분을 공유합니다.그것들은 인간 게놈에서 잘 특징지어지며, 2R 가설을 뒷받침하는 증거로 사용되어 왔다.서로 다른 염색체에 관련된 유전자가 있는 중복, 3중복, 4중복 유전자 세트는 게놈 또는 염색체 복제의 잔재일 것으로 추측된다.일련의 병리학적 영역을 함께 병리학적 [43]영역이라고 부른다.유사성 지역의Well-studied 세트 인간의 염색체 2,7,12세에서 17의 지역 Hox 유전자 집단 콜라겐을 가지고 유전자, 케라틴 유전자와 인간의 염색체의 다른 중복 genes,[44]지역을 포함하는 4,5,8시와 10neuropeptide 수용체 유전자, NK클래스 호메오 박스 유전자와 더 많은 유전자 families,[45][46][47]과 인간의 부품이 포함된 포함한다. 13chromosomes,ParaHox 유전자와 그 [48]이웃을 포함하는 4, 5, X.인간 6번 염색체의 주요 조직적합성 복합체(MHC)는 1, 9, [49]19번 염색체의 병리학적 영역을 가지고 있다.인간 게놈의 많은 부분이 병리학적 [50]영역에 할당될 수 있는 것으로 보인다.

오놀로지

전체 게놈 복제 이벤트는 각 유전자의 두 의 오놀로그 복사본을 가진 게놈을 생성합니다.
종분화 현상은 두 딸 종에서 유전자의 철자를 생성한다.한 종에서 다른 종으로 수평적인 유전자 이동 이벤트는 유전자의 이질체를 게놈에 추가한다.
종분화 현상은 두 딸 종에서 유전자의 철자를 생성한다.이들 종의 후속 교배는 두 종의 각 유전자의 상동성 카피를 가진 하이브리드 게놈을 생성한다.

오놀로거스 유전자는 2R 전유전자 복제의 과정에서 유래한 평행 유전자이다.그 이름은 켄 [51]울프가 오노 스스무에게 경의를 표하기 위해 처음 지어졌습니다.오놀로그는 게놈의 모든 오놀로그가 같은 시간 동안 분화되었기 때문에 진화 분석에 유용하다.오놀로그는 또한 암, 우성 유전 질환, 병원성 복제 번호의 [52][53][54][55][56]변화 등과 더 큰 연관성을 보이는 것으로 알려져 있다.

Xenology

두 유기체 사이의 수평적 유전자 이동에 의해 생기는 상동성을 이질체라고 한다.만약 새로운 환경이 수평으로 움직이는 유전자에 대해 크게 다르다면, Xenologs는 다른 기능을 가질 수 있다.하지만, 일반적으로, 제놀로그는 두 유기체 모두에서 비슷한 기능을 가지고 있다.이 용어는 월터 [5]피치에 의해 만들어졌다.

동음이의학

상동 염색체 또는 염색체의 일부는 이종교배와 이질 다배체를 거쳐 교배 게놈을 형성하며, 그들의 관계는 조상 [57]종에서 완전히 상동성이었다.알로폴리플로이드에서 각 부모 서브게놈 내의 상동염색체는 감수분열 에 충실하게 짝을 지어 디스코믹 유전으로 이어져야 한다.그러나 일부 알로폴리플로이드에서는 부모게놈의 상동염색체가 상동염색체만큼 서로 유사할 수 있으며, 4크로믹 유전으로 이어질 수 있다.감수분열 시 모솜 쌍성), 유전자 간 재조합[citation needed]출산율 감소.

배우자학

배우자학은 재결합하지 않는 이성 염색체 상의 상동 유전자 사이의 관계를 나타낸다.이 용어는 가르시아 모레노와 민델에 [58]의해 만들어졌다.2000. 생식세포는 유전적 성별 결정의 기원과 성염색체 간의 재조합 장벽에서 비롯된다.배우자의 예로는 [58]새의 CHDW와 CHDZ있다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b c d Koonin EV (2005). "Orthologs, paralogs, and evolutionary genomics". Annual Review of Genetics. 39: 309–38. doi:10.1146/annurev.genet.39.073003.114725. PMID 16285863.
  2. ^ "Clustal FAQ #Symbols". Clustal. Retrieved 8 December 2014.
  3. ^ a b Reeck GR, de Haën C, Teller DC, Doolittle RF, Fitch WM, Dickerson RE, et al. (August 1987). ""Homology" in proteins and nucleic acids: a terminology muddle and a way out of it". Cell. 50 (5): 667. doi:10.1016/0092-8674(87)90322-9. PMID 3621342. S2CID 42949514.
  4. ^ Holman, Christopher (2004-01-01). "Protein Similarity Score: A Simplified Version of the Blast Score as a Superior Alternative to Percent Identity for Claiming Genuses of Related Protein Sequences". Santa Clara High Technology Law Journal. 21 (1): 55. ISSN 0882-3383.
  5. ^ a b Fitch WM (June 1970). "Distinguishing homologous from analogous proteins". Systematic Zoology. 19 (2): 99–113. doi:10.2307/2412448. JSTOR 2412448. PMID 5449325.
  6. ^ Falciatore A, Merendino L, Barneche F, Ceol M, Meskauskiene R, Apel K, Rochaix JD (January 2005). "The FLP proteins act as regulators of chlorophyll synthesis in response to light and plastid signals in Chlamydomonas". Genes & Development. 19 (1): 176–87. doi:10.1101/gad.321305. PMC 540235. PMID 15630026.
  7. ^ Fang G, Bhardwaj N, Robilotto R, Gerstein MB (March 2010). "Getting started in gene orthology and functional analysis". PLOS Computational Biology. 6 (3): e1000703. Bibcode:2010PLSCB...6E0703F. doi:10.1371/journal.pcbi.1000703. PMC 2845645. PMID 20361041.
  8. ^ COG: 단백질의 직교군 클러스터
    Tatusov RL, Koonin EV, Lipman DJ (October 1997). "A genomic perspective on protein families". Science. 278 (5338): 631–7. Bibcode:1997Sci...278..631T. doi:10.1126/science.278.5338.631. PMID 9381173.
  9. ^ Correia K, Yu SM, Mahadevan R (January 2019). "AYbRAH: a curated ortholog database for yeasts and fungi spanning 600 million years of evolution". Database. 2019. doi:10.1093/database/baz022. PMC 6425859. PMID 30893420.
  10. ^ eg NOG: 유전자의 진화 계보: 비감독성 직교군
    Muller J, Szklarczyk D, Julien P, Letunic I, Roth A, Kuhn M, et al. (January 2010). "eggNOG v2.0: extending the evolutionary genealogy of genes with enhanced non-supervised orthologous groups, species and functional annotations". Nucleic Acids Research. 38 (Database issue): D190-5. doi:10.1093/nar/gkp951. PMC 2808932. PMID 19900971.
  11. ^ Powell S, Forslund K, Szklarczyk D, Trachana K, Roth A, Huerta-Cepas J, et al. (January 2014). "eggNOG v4.0: nested orthology inference across 3686 organisms". Nucleic Acids Research. 42 (Database issue): D231-9. doi:10.1093/nar/gkt1253. PMC 3964997. PMID 24297252.
  12. ^ GreenPhylDB
    Conte MG, Gaillard S, Lanau N, Rouard M, Périn C (January 2008). "GreenPhylDB: a database for plant comparative genomics". Nucleic Acids Research. 36 (Database issue): D991-8. doi:10.1093/nar/gkm934. PMC 2238940. PMID 17986457.
  13. ^ Rouard M, Guignon V, Aluome C, Laporte MA, Droc G, Walde C, et al. (January 2011). "GreenPhylDB v2.0: comparative and functional genomics in plants". Nucleic Acids Research. 39 (Database issue): D1095-102. doi:10.1093/nar/gkq811. PMC 3013755. PMID 20864446.
  14. ^ 인파라노이드:진핵생물 오솔로그군
    Ostlund G, Schmitt T, Forslund K, Köstler T, Messina DN, Roopra S, et al. (January 2010). "InParanoid 7: new algorithms and tools for eukaryotic orthology analysis". Nucleic Acids Research. 38 (Database issue): D196-203. doi:10.1093/nar/gkp931. PMC 2808972. PMID 19892828.
  15. ^ Sonnhammer EL, Östlund G (January 2015). "InParanoid 8: orthology analysis between 273 proteomes, mostly eukaryotic". Nucleic Acids Research. 43 (Database issue): D234-9. doi:10.1093/nar/gku1203. PMC 4383983. PMID 25429972.
  16. ^ Singh PP, Arora J, Isambert H (July 2015). "Identification of Ohnolog Genes Originating from Whole Genome Duplication in Early Vertebrates, Based on Synteny Comparison across Multiple Genomes". PLOS Computational Biology. 11 (7): e1004394. Bibcode:2015PLSCB..11E4394S. doi:10.1371/journal.pcbi.1004394. PMC 4504502. PMID 26181593.
  17. ^ "Vertebrate Ohnologs". ohnologs.curie.fr. Retrieved 2018-10-12.
  18. ^ Altenhoff AM, Glover NM, Train CM, Kaleb K, Warwick Vesztrocy A, Dylus D, et al. (January 2018). "The OMA orthology database in 2018: retrieving evolutionary relationships among all domains of life through richer web and programmatic interfaces". Nucleic Acids Research. 46 (D1): D477–D485. doi:10.1093/nar/gkx1019. PMC 5753216. PMID 29106550.
  19. ^ Zdobnov EM, Tegenfeldt F, Kuznetsov D, Waterhouse RM, Simão FA, Ioannidis P, et al. (January 2017). "OrthoDB v9.1: cataloging evolutionary and functional annotations for animal, fungal, plant, archaeal, bacterial and viral orthologs". Nucleic Acids Research. 45 (D1): D744–D749. doi:10.1093/nar/gkw1119. PMC 5210582. PMID 27899580.
  20. ^ Nevers Y, Kress A, Defosset A, Ripp R, Linard B, Thompson JD, et al. (January 2019). "OrthoInspector 3.0: open portal for comparative genomics". Nucleic Acids Research. 47 (D1): D411–D418. doi:10.1093/nar/gky1068. PMC 6323921. PMID 30380106.
  21. ^ 맞춤법아이디
    Chiu JC, Lee EK, Egan MG, Sarkar IN, Coruzzi GM, DeSalle R (March 2006). "OrthologID: automation of genome-scale ortholog identification within a parsimony framework". Bioinformatics. 22 (6): 699–707. doi:10.1093/bioinformatics/btk040. PMID 16410324.
  22. ^ Egan M, Lee EK, Chiu JC, Coruzzi G, Desalle R (2009). "Gene orthology assessment with OrthologID". In Posada D (ed.). Bioinformatics for DNA Sequence Analysis. Methods in Molecular Biology. Vol. 537. Humana Press. pp. 23–38. doi:10.1007/978-1-59745-251-9_2. ISBN 978-1-59745-251-9. PMID 19378138.
  23. ^ OrthoMaM
    Ranwez V, Delsuc F, Ranwez S, Belkhir K, Tilak MK, Douzery EJ (November 2007). "OrthoMaM: a database of orthologous genomic markers for placental mammal phylogenetics". BMC Evolutionary Biology. 7: 241. doi:10.1186/1471-2148-7-241. PMC 2249597. PMID 18053139.
  24. ^ Douzery EJ, Scornavacca C, Romiguier J, Belkhir K, Galtier N, Delsuc F, Ranwez V (July 2014). "OrthoMaM v8: a database of orthologous exons and coding sequences for comparative genomics in mammals". Molecular Biology and Evolution. 31 (7): 1923–8. doi:10.1093/molbev/msu132. PMID 24723423.
  25. ^ Scornavacca C, Belkhir K, Lopez J, Dernat R, Delsuc F, Douzery EJ, Ranwez V (April 2019). "OrthoMaM v10: Scaling-Up Orthologous Coding Sequence and Exon Alignments with More than One Hundred Mammalian Genomes". Molecular Biology and Evolution. 36 (4): 861–862. doi:10.1093/molbev/msz015. PMC 6445298. PMID 30698751.
  26. ^ OrthoMCL: 진핵유전체 Ortholog 그룹의 동정
    Chen F, Mackey AJ, Stoeckert CJ, Roos DS (January 2006). "OrthoMCL-DB: querying a comprehensive multi-species collection of ortholog groups". Nucleic Acids Research. 34 (Database issue): D363-8. doi:10.1093/nar/gkj123. PMC 1347485. PMID 16381887.
  27. ^ Fischer S, Brunk BP, Chen F, Gao X, Harb OS, Iodice JB, et al. (September 2011). "Using OrthoMCL to assign proteins to OrthoMCL-DB groups or to cluster proteomes into new ortholog groups". Current Protocols in Bioinformatics. Chapter 6 (1): Unit 6.12.1–19. doi:10.1002/0471250953.bi0612s35. ISBN 978-0471250951. PMC 3196566. PMID 21901743.
  28. ^ 반올림
    Deluca TF, Wu IH, Pu J, Monaghan T, Peshkin L, Singh S, Wall DP (August 2006). "Roundup: a multi-genome repository of orthologs and evolutionary distances". Bioinformatics. 22 (16): 2044–6. doi:10.1093/bioinformatics/btl286. PMID 16777906.
  29. ^ 트리 패밀리:트리 패밀리 데이터베이스
    van der Heijden RT, Snel B, van Noort V, Huynen MA (March 2007). "Orthology prediction at scalable resolution by phylogenetic tree analysis". BMC Bioinformatics. 8: 83. doi:10.1186/1471-2105-8-83. PMC 1838432. PMID 17346331.
  30. ^ 트리 패밀리:트리 패밀리 데이터베이스
    Ruan J, Li H, Chen Z, Coghlan A, Coin LJ, Guo Y, et al. (January 2008). "TreeFam: 2008 Update". Nucleic Acids Research. 36 (Database issue): D735-40. doi:10.1093/nar/gkm1005. PMC 2238856. PMID 18056084.
  31. ^ Schreiber F, Patricio M, Muffato M, Pignatelli M, Bateman A (January 2014). "TreeFam v9: a new website, more species and orthology-on-the-fly". Nucleic Acids Research. 42 (Database issue): D922-5. doi:10.1093/nar/gkt1055. PMC 3965059. PMID 24194607.
  32. ^ Ortho Finder:유전자 나무에서 추출한 정형외과
    Emms DM, Kelly S (November 2019). "OrthoFinder: phylogenetic orthology inference for comparative genomics". Genome Biology. 20 (1): 238. doi:10.1186/s13059-019-1832-y. PMC 6857279. PMID 31727128.
  33. ^ Vilella AJ, Severin J, Ureta-Vidal A, Heng L, Durbin R, Birney E (February 2009). "EnsemblCompara GeneTrees: Complete, duplication-aware phylogenetic trees in vertebrates". Genome Research. 19 (2): 327–35. doi:10.1101/gr.073585.107. PMC 2652215. PMID 19029536.
  34. ^ Thanki AS, Soranzo N, Haerty W, Davey RP (March 2018). "GeneSeqToFamily: a Galaxy workflow to find gene families based on the Ensembl Compara GeneTrees pipeline". GigaScience. 7 (3): 1–10. doi:10.1093/gigascience/giy005. PMC 5863215. PMID 29425291.
  35. ^ Sayers EW, Barrett T, Benson DA, Bolton E, Bryant SH, Canese K, et al. (January 2011). "Database resources of the National Center for Biotechnology Information". Nucleic Acids Research. 39 (Database issue): D38-51. doi:10.1093/nar/gkq1172. PMC 3013733. PMID 21097890.
  36. ^ Fulton DL, Li YY, Laird MR, Horsman BG, Roche FM, Brinkman FS (May 2006). "Improving the specificity of high-throughput ortholog prediction". BMC Bioinformatics. 7: 270. doi:10.1186/1471-2105-7-270. PMC 1524997. PMID 16729895.
  37. ^ a b Zakany J, Duboule D (August 2007). "The role of Hox genes during vertebrate limb development". Current Opinion in Genetics & Development. 17 (4): 359–66. doi:10.1016/j.gde.2007.05.011. PMID 17644373.
  38. ^ Studer RA, Robinson-Rechavi M (May 2009). "How confident can we be that orthologs are similar, but paralogs differ?". Trends in Genetics. 25 (5): 210–6. doi:10.1016/j.tig.2009.03.004. PMID 19368988.
  39. ^ Nehrt NL, Clark WT, Radivojac P, Hahn MW (June 2011). "Testing the ortholog conjecture with comparative functional genomic data from mammals". PLOS Computational Biology. 7 (6): e1002073. Bibcode:2011PLSCB...7E2073N. doi:10.1371/journal.pcbi.1002073. PMC 3111532. PMID 21695233.
  40. ^ Eisen J (20 September 2011). "Special Guest Post & Discussion Invitation from Matthew Hahn on Ortholog Conjecture Paper".
  41. ^ Noda-Garcia L, Romero Romero ML, Longo LM, Kolodkin-Gal I, Tawfik DS (July 2017). "Bacilli glutamate dehydrogenases diverged via coevolution of transcription and enzyme regulation". EMBO Reports. 18 (7): 1139–1149. doi:10.15252/embr.201743990. PMC 5494520. PMID 28468957.
  42. ^ Lundin LG (April 1993). "Evolution of the vertebrate genome as reflected in paralogous chromosomal regions in man and the house mouse". Genomics. 16 (1): 1–19. doi:10.1006/geno.1993.1133. PMID 8486346.
  43. ^ Coulier F, Popovici C, Villet R, Birnbaum D (December 2000). "MetaHox gene clusters". The Journal of Experimental Zoology. 288 (4): 345–51. doi:10.1002/1097-010X(20001215)288:4<345::AID-JEZ7>3.0.CO;2-Y. PMID 11144283.
  44. ^ Ruddle FH, Bentley KL, Murtha MT, Risch N (1994). "Gene loss and gain in the evolution of the vertebrates". Development. 1994: 155–61. doi:10.1242/dev.1994.Supplement.155. PMID 7579516.
  45. ^ Pébusque MJ, Coulier F, Birnbaum D, Pontarotti P (September 1998). "Ancient large-scale genome duplications: phylogenetic and linkage analyses shed light on chordate genome evolution". Molecular Biology and Evolution. 15 (9): 1145–59. doi:10.1093/oxfordjournals.molbev.a026022. PMID 9729879.
  46. ^ Larsson TA, Olsson F, Sundstrom G, Lundin LG, Brenner S, Venkatesh B, Larhammar D (June 2008). "Early vertebrate chromosome duplications and the evolution of the neuropeptide Y receptor gene regions". BMC Evolutionary Biology. 8: 184. doi:10.1186/1471-2148-8-184. PMC 2453138. PMID 18578868.
  47. ^ Pollard SL, Holland PW (September 2000). "Evidence for 14 homeobox gene clusters in human genome ancestry". Current Biology. 10 (17): 1059–62. doi:10.1016/S0960-9822(00)00676-X. PMID 10996074. S2CID 32135432.
  48. ^ Mulley JF, Chiu CH, Holland PW (July 2006). "Breakup of a homeobox cluster after genome duplication in teleosts". Proceedings of the National Academy of Sciences of the United States of America. 103 (27): 10369–10372. Bibcode:2006PNAS..10310369M. doi:10.1073/pnas.0600341103. PMC 1502464. PMID 16801555.
  49. ^ Flajnik MF, Kasahara M (September 2001). "Comparative genomics of the MHC: glimpses into the evolution of the adaptive immune system". Immunity. 15 (3): 351–62. doi:10.1016/S1074-7613(01)00198-4. PMID 11567626.
  50. ^ McLysaght A, Hokamp K, Wolfe KH (June 2002). "Extensive genomic duplication during early chordate evolution". Nature Genetics. 31 (2): 200–4. doi:10.1038/ng884. PMID 12032567. S2CID 8263376.
  51. ^ Wolfe K (May 2000). "Robustness--it's not where you think it is". Nature Genetics. 25 (1): 3–4. doi:10.1038/75560. PMID 10802639. S2CID 85257685.
  52. ^ Singh PP, Affeldt S, Cascone I, Selimoglu R, Camonis J, Isambert H (November 2012). "On the expansion of "dangerous" gene repertoires by whole-genome duplications in early vertebrates". Cell Reports. 2 (5): 1387–98. doi:10.1016/j.celrep.2012.09.034. PMID 23168259.
  53. ^ Malaguti G, Singh PP, Isambert H (May 2014). "On the retention of gene duplicates prone to dominant deleterious mutations". Theoretical Population Biology. 93: 38–51. doi:10.1016/j.tpb.2014.01.004. PMID 24530892.
  54. ^ Singh PP, Affeldt S, Malaguti G, Isambert H (July 2014). "Human dominant disease genes are enriched in paralogs originating from whole genome duplication". PLOS Computational Biology. 10 (7): e1003754. Bibcode:2014PLSCB..10E3754S. doi:10.1371/journal.pcbi.1003754. PMC 4117431. PMID 25080083.
  55. ^ McLysaght A, Makino T, Grayton HM, Tropeano M, Mitchell KJ, Vassos E, Collier DA (January 2014). "Ohnologs are overrepresented in pathogenic copy number mutations". Proceedings of the National Academy of Sciences of the United States of America. 111 (1): 361–6. Bibcode:2014PNAS..111..361M. doi:10.1073/pnas.1309324111. PMC 3890797. PMID 24368850.
  56. ^ Makino T, McLysaght A (May 2010). "Ohnologs in the human genome are dosage balanced and frequently associated with disease". Proceedings of the National Academy of Sciences of the United States of America. 107 (20): 9270–4. Bibcode:2010PNAS..107.9270M. doi:10.1073/pnas.0914697107. PMC 2889102. PMID 20439718.
  57. ^ Glover, Natasha M.; Redestig, Henning; Dessimoz, Christophe (2016). "Homoeologs: What Are They and How Do We Infer Them?". Trends in Plant Science. Cell Press. 21 (7): 609–621. doi:10.1016/j.tplants.2016.02.005. ISSN 1360-1385. PMC 4920642. PMID 27021699.
  58. ^ a b García-Moreno J, Mindell DP (December 2000). "Rooting a phylogeny with homologous genes on opposite sex chromosomes (gametologs): a case study using avian CHD". Molecular Biology and Evolution. 17 (12): 1826–32. doi:10.1093/oxfordjournals.molbev.a026283. PMID 11110898.