범게놈

Pan-genome
A가 개발을 주도하는 안비오 소프트웨어로 만든 스트렙토코쿠스 아가락티게놈의 판게놈 분석. 무라트 에렌.테텔린 외 연구진(2005)으로부터 얻은 게놈.[2]각 원은 하나의 게놈에 해당하며 각 반지름은 유전자 계열을 나타낸다.아래쪽과 오른쪽에는 핵심 게놈 계열이 국산화돼 있다.핵심에 있는 일부 가정은 게놈당 한 개 이상의 동질 유전자를 가지고 있을 수 있다.그림의 왼쪽 가운데에는 조개 게놈을 관찰한다.왼쪽 위에는 불필요한 게놈과 단골격의 가족이 보인다.

분자생물학과 유전학 분야에서 범게놈(pan-genome 또는 supragenome)은 쇄골 안에 있는 모든 변종유전자 전체 집합이다.더 일반적으로, 그것은 쇄골의 모든 게놈들의 결합이다.[2][3][4][5]범게놈은 모든 개인에게 존재하는 유전자를 포함하는 '핵심 판게놈', 둘 이상의 변종에 존재하는 유전자를 포함하는 '껍질 판게놈', 한 변종에서만 발견되는 유전자를 포함하는 '클라우드 판게놈'으로 분해할 수 있다.[3][4][6]일부 저자들은 또한 클라우드 게놈을 변종과 변종별 유전자의 하위집합에 존재하는 '불필수' 유전자를 포함하는 '액세서리 게놈'이라고 부른다.[2][3][4]부속 유전자가 "게놈 진화와 게놈과 환경 사이의 복잡한 상호작용으로 중요한 역할"[5]을 수행함에 따라 적어도 식물 게놈에서 '불필수'라는 용어의 사용이 의문시되고 있다는 점에 유의한다.판게놈의 연구 분야는 판게노믹스라고 불린다.[2]null

박테리아 종의 유전적 레퍼토리는 개별 변종의 유전자 함량보다 훨씬 크다.[7] 어떤 종은 판게놈을 개방(또는 광범위하게)하고, 다른 종은 판게놈을 폐쇄한다.[2]닫힌 범게놈을 가진 종의 경우 서열화된 게놈당(많은 변종의 염기서열 분석 후) 유전자가 거의 추가되지 않으며, 완전한 판게놈의 크기는 이론적으로 예측할 수 있다.열린 판게놈을 가진 종은 전체 판게놈의 크기를 예측하는 것은 불가능할 정도로 추가적인 염기서열 게놈당 충분한 유전자를 가지고 있다.[4]인구 규모와 틈새의 다재다능성은 범게놈 크기를 결정하는 데 가장 큰 영향을 미치는 요인으로 제시되어 왔다.[2]null

판게놈은 원래 박테리아고대의 종을 위해 만들어졌지만, 최근에는 특히 식물 종을 위해 진핵생성 판게놈들이 개발되었다.식물 연구는 범게놈 역학이 전이 가능한 요소들과 연관되어 있다는 것을 보여주었다.[8][9][10][11]범게놈의 중요성은 특히 메타게놈학과의 관련성과 함께 진화적인 맥락에서 발생하지만,[12] 보다 광범위한 게놈학 맥락에서도 사용된다.[13]테텔린과 메디니가 편집한 판게놈의 개념과 그 함의를 검토한 오픈 액세스북이 2020년 봄에 출판되었다.[14]null

어원

'팡게놈'이라는 용어는 2005년 테텔린 외 에 의해 현재의 의미로 정의되었다.[2] 이 용어는 'whole' 또는 '모든 것'을 의미하는 그리스어 παν에서 'pan'을 파생한 반면, 게놈은 유기체의 완전한 유전 물질을 묘사하기 위해 일반적으로 사용되는 용어다.테텔린 등은 특히 이 용어를 박테리아에 적용했는데, 판게놈에는 "모든 변종에 존재하는 유전자를 포함하는 핵심 게놈과 하나 이상의 변종에서 없는 유전자와 각 변종에 고유한 유전자로 구성된 불필요한 게놈"이 포함된다.[2]

판게놈의 일부

판게놈에서 우리는 세 가지 유전자를 식별할 수 있다.Core, Shell 및 Cloud 게놈.코어 게놈은 분석된 모든 게놈에 존재하는 유전자로 구성된다.시퀀싱 아티팩트로 인해 패밀리를 해제하지 않기 위해 일부 저자는 소프트코어(>95% 발생)를 고려한다.셸 게놈은 대다수의 게놈들이 공유하는 유전자로 구성된다(10~95% 발생).오직 하나의 게놈에 존재하는 유전자 계열 또는 <10% 발생>은 디스퓨전스 또는 클라우드 게놈으로 설명된다.

코어

테스트된 세트의 모든 게놈에 의해 공유되는 판게놈의 부분이다.일부 저자들은 핵심 판게놈을 하드코어로 구분했는데, 모든 게놈에 의해 공유되는 가족의 복사본이 적어도 한 개 이상 있는 호몰로겐 유전자와 소프트코어 또는 확장코어를 가진 [15]이들 가정은 일정 임계치 이상(90%)에 분포한다.처럼:<>에 존재에 대해 유전자 가족들;10%, 10~95%,>게놈들의 95%각각의에 해당하는"클라우드,""쉘,"과"코어"과 간균 손가락 선인장과 황색 포도상 구균의 그들 중 일부는 국제 공간 역에서 격리 pangenomes, 교습이 포함된 연구에서는 문턱이 pangenomes 분할을 위해 쓰였다.ly.[16]null

핵심 게놈 크기와 판게놈에 대한 비율은 여러 요인에 따라 다르지만, 특히 고려된 게놈의 계통생성적 유사성에 따라 달라진다.예를 들어, 두 개의 동일한 게놈의 핵심도 완전한 판게놈일 것이다.속 속의 핵은 항상 종의 핵 게놈보다 작을 것이다.핵심 게놈에 속하는 유전자는 흔히 집안 유지 기능과 혈통의 일차적인 신진대사와 관련이 있지만 그럼에도 불구하고, 핵심 유전자는 종족을 다른 속종, 즉 틈새 적응과 관련된 병균성일 수 있는 유전자를 일부 포함할 수도 있다.[17]null

껍질

판게놈에서 대다수의 게놈들이 공유하는 판게놈의 부분이다.[18]조개 게놈을 정의할 수 있는 보편적으로 인정되는 문턱은 없으며, 일부 저자들은 판게놈에서 50% 이상의 게놈을 공유한다면 유전자 집단을 조개 판게놈의 일부로 간주한다.[19]trpF gen.의 껍질을 여러 발전적인 역학에 의해 유전자 손실에 의한 노심 게놈의 곳은 이전에 부분은 혈통 Actinomyces,[20]의 트립 토판 오페론거나 불필요한 것 같은 게놈의 이전에 부분은 유전자 가족의 유전자 이득과 고정에 의해의 효소, 그런 것 경우에 예를 들어 가족 일부가 될 수 있는 사건ei몇종의 코리네박테리움종.[21]null

디퓨전스

불필요한 게놈은 판게놈에 있는 게놈의 최소 하위집합에 의해 공유되는 유전자군이며,[22] 단골격이나 유전자는 오직 하나의 게놈에만 존재한다.구름이나 말초 게놈으로도 알려져 있다.이 범주의 유전자 가족은 종종 생태적 적응과 관련이 있다.null

분류

a) 닫힌 판게놈은 큰 코어 게놈과 작은 액세서리 게놈으로 특징지어진다.b) 오픈 판게놈은 작은 코어 게놈과 큰 액세서리 게놈을 갖는 경향이 있다.c) 오픈 판게놈의 크기는 게놈을 추가할 때마다 증가하는 경향이 있는 반면, 닫힌 판게놈의 크기는 더 많은 게놈을 추가함에도 불구하고 점증하지 않는 경향이 있다.이러한 특성 때문에 닫힌 판게놈의 완전한 판게놈 크기를 예측할 수 있다.

범게놈은 힙 법칙의 알파 값을 기준으로 개방 또는 폐쇄로 분류할 수 있다: = - N

  • 유전자 패밀리 수입니다.
  • n 게놈 수입니다.
  • 비례 상수.
  • 유전자 계열 수 대 새로운 게놈의 곡선을 조정하기 위해 계산된 지수.
α  1 이면 판게놈은 열린 것으로 간주되며, > 1 \ \ \ \}이면 판게놈은 닫힌 것으로 간주된다.null

일반적으로 판게놈 소프트웨어는 데이터의 동작을 가장 잘 설명하는 힙 법칙의 매개변수를 계산할 수 있다.null

오픈 판게놈

개방 판게놈은 한 분류학 계통에서 새로운 유전자 집단의 수를 계속 증가시키고 이러한 증가는 판게놈에 얼마나 많은 새로운 게놈을 첨가했는지에 관계없이 점증하지 않는 것처럼 보일 때 발생한다.대장균은 판게노미가 열린 종의 한 예다.모든 대장균 게놈 크기는 4000~5000개 유전자의 범위에 있으며 약 2000개 게놈으로 이 종에 대해 추정된 판게놈 크기는 89,000개의 다른 유전자 계열에 의해 구성된다.[24]도메인 박테리아의 판게놈도 개방된 것으로 간주된다.null

클로즈드 판게놈

닫힌 판게놈은 새로운 게놈을 판게놈 분석에 편입할 때 유전자 계열이 거의 첨가되지 않는 혈통에서 발생하며 판게놈의 유전자 계열 총량은 한 숫자에 무증상으로 보인다.일부 생태적 틈새의 전문가인 기생충과 종은 판게놈을 닫는 경향이 있다고 여겨진다.포도상구균 루그두넨시스는 닫힌 범게놈을 가진 균등균의 예다.[25]null

역사

판게노메

원래의 판게놈 개념은 테텔린 등이 Streptococcus agalactiae의 8개 격리체의 게놈을 분석했을 때 개발되었다.[2] 그들은 모든 격리체가 공유하는 핵심 게놈을 설명했고, 여기서 모든 단일 게놈의 약 80%를 차지했으며, 부분 공유 및 변형 특유 유전자로 구성된 불필요한 게놈을 추가했다.외삽법은 S. Agalactiae 범게놈의 유전자 저장소가 방대하고 수백 개의 게놈을 염기서열해도 새로운 고유 유전자가 계속 확인될 것이라고 제안했다.[2]판게놈은 주어진 미생물 종의 염기서열 유전자에서 발견된 유전자의 전체로 구성되며, 새로운 유전자가 염기서열화되고 분석에 통합될 때 변화할 수 있다.null

슈퍼게놈은 특정 종이 접근할 수 있는 모든 유전자로 정의되며, 한 종의 모든 게놈의 염기서열이 사용 가능했다면 판게놈이다.메타산게놈은 메타게놈 표본에 적용되는 판게놈 분석으로, 여러 종의 유전자의 조합이 주어진 서식지에 대해 평가된다.

게놈 혈통의 판게놈은 내부 혈통 유전자 함량 변동을 설명한다.판게놈은 유전자 복제, 유전자 이득과 손실 역학, 선택과 표류에 의해 형성되는 이동 요소와의 게놈의 상호작용 때문에 진화한다.[26]일부 연구는 원핵생물 팡게놈은 적응적 진화의 결과물이지 종에게 새로운 틈새로 이주할 수 있는 능력을 부여하는 중립적 진화의 결과물이 아니라고 지적한다.[27]null

슈퍼게놈

슈퍼게놈은 한 종의 모든 게놈들이 서열화되었다면 진짜 판게놈 크기라고 생각할 수 있다.[28]그것은 특정 종에 의해 얻어지기 위해 접근 가능한 모든 유전자로 정의된다.직접 계산할 수는 없지만 사용 가능한 게놈 데이터에서 계산한 판게놈 크기로 그 크기를 추정할 수 있다.불필요한 게놈의 크기를 추정하는 것은 희귀한 유전자와 게놈의 발생에 의존하기 때문에 문제가 될 수 있다.2011년에는 유전체 유동성을 시퀀싱된 격리체군 사이의 유전자 수준 유사성을 분류하기 위한 조치로 제안되었다.[29] 어떤 라인에서는 박테리아 영역의 경우와 마찬가지로 슈퍼게놈은 무한하게 나타났다.[30][31]null

메타팡게놈

'메타팡게놈'은 유전자 군집과 게놈의 풍부함과 유행이 엽총 메타게놈을 통해 회복되는 환경과 연계해 판게놈을 분석한 결과로 정의됐다.[32]메타게놈과 판게놈의 결합, 일명 '메타팡게노믹스'라고도 불리며, 판게놈 유전자 풀의 서식지별 필터링에 대한 인구 수준의 결과가 드러난다.[33]null


다른 저자들은 메타벤게노믹스가 미개간 미생물에서 얻은 유전자 시퀀스를 메타게노믹스 접근법에 의해 통합함으로써 판게노메의 개념을 확장시킨다고 생각한다.메타벤게놈은 MAG(metagenome-assembly genome)와 재배된 미생물을 통해 얻은 게놈의 시퀀스 둘 다로 구성된다.[34]메타팡게노믹스는 공동체의 다양성, 미생물 틈새적응, 미생물 진화, 기능 활동, 공동체의 상호작용 네트워크 등을 평가하기 위해 적용되었다.[35]안비오 플랫폼은 판게놈을 생성해 메타벤게놈의 분석과 시각화를 통합하고 메타게놈과 연계해 연구하는 워크플로우를 개발했다.[32]

프로카료테판게놈

S. 폐렴 범게놈. (a) 시퀀싱된 게놈 수의 함수로써 새로운 유전자의 수.유전자의 수가 50을 넘으면 예측된 새로운 유전자의 수가 0으로 급격히 감소한다. (b) 염기서열화된 유전자의 수의 함수로써 핵심 유전자의 수가 급격히 감소한다.핵심 유전자의 개수는 게놈의 개수에 대해 1647개로 수렴된다.도나티 등으로부터.[36]

2018년, 이용 가능한 전체 게놈 서열 중 87%는 서로 다른 분류학 수준에서 프로카리오테 판게놈 계산에 흥미를 유발하는 박테리아였다.[22]2015년에 44종의 스트렙토코쿠스 진폐균의 판게놈은 각각의 새로운 게놈 서열로 발견된 새로운 유전자를 거의 보이지 않는다(그림 참조).실제로 게놈 수가 50개를 넘으면 예측된 새로운 유전자의 수가 0으로 떨어졌다(그러나 이는 모든 종에서 발견되는 패턴은 아니라는 점에 유의한다).이것은 폐렴이 '폐쇄 판게놈'[37]을 가지고 있다는 것을 의미할 것이다.S. 진폐증의 새로운 유전자의 주요 근원은 유전자가 수평으로 전달되는 스트렙토코쿠스 미티스였다.S. 진폐증의 범게놈 크기는 균주의 수에 따라 로그적으로 증가했고, 샘플링된 게놈의 다형성 부위의 수와 선형적으로 증가하여, 획득한 유전자가 클론의 나이에 비례하여 축적된다는 것을 시사했다.[36]프로카리오테 범게놈의 또 다른 예는 프로클로로코쿠스인데, 핵심 게놈 세트는 프로클로로코쿠스의 다른 생태형이 사용하는 판게놈보다 훨씬 작다.[38]알칼리겐스 [39]sp와 세라티아 sp와 같은 환경적 고립에서 열린 범게놈([40]pan-genome)이 관찰되어 공감하는 생활방식을 보이고 있다.그럼에도 불구하고, 인간으로부터 격리된 프레보텔라 박테리아에 대한 2015년 연구인 오픈 판게놈은 인간의 다른 신체 부위에서 파생된 종들의 유전자 레퍼토리를 비교했을 때, 살아있는 미생물을 자유롭게 하는 데만 국한되지 않는다.그것은 또한 광범위한 유전자 풀의 다양성을 보여주는 개방적인 범게놈을 보고했다.[41]null

고세아는 또한 약간의 고통스러운 연구들을 가지고 있다.할로박테리아 판게놈은 판게놈 하위 집합에서 코어(300), 가변 성분(소프트코어: 998, 클라우드:36531, 쉘:11784)의 유전자 계열을 보여준다.[42]null

에우카리오테판게놈

곰팡이, 동물, 식물과 같은 진핵생물도 판게놈의 증거를 보여주었다.판게놈 연구가 진행된 4종의 균류에서 유전자 모델의 80~90%가 핵심 유전자로 발견됐다.나머지 부속 유전자는 주로 병원체 발생과 항균 저항성에 관여했다.[43]null

동물에서 인간의 판게놈은 연구되고 있다.2010년에 한 연구는 완전한 인간 범게놈은 현존하는 참조 게놈에 존재하지 않는 새로운 배열의 약 19~40메가바이트를 포함할 것으로 추정했다.[44]2021년 휴먼 팡게놈 컨소시엄은 휴먼 팡게놈의 다양성을 인정한다는 목표를 갖고 있다.null

식물들 중에는, 디플로이드와 폴리플로이드 모두 모델 종에서 판게놈 연구의 예와 증가하는 작물 리스트가 있다.[10][45][46]새롭게 부상하는 식물 기반 개념은 뉴클레오티드 결합 류신 반복(NLR) 단백질의 레퍼토리인 범NLRome, 병원체 단백질을 인식하고 질병 내성을 부여하는 세포내 면역 수용체들이다.[47]null

바이러스판게놈

바이러스박테리아에서 16S의 경우처럼 크레이드가 광범위하게 공유하는 유전자를 반드시 가지고 있는 것은 아니며, 따라서 완전한 바이러스 도메인의 핵심 게놈은 비어 있다.그럼에도 불구하고, 몇몇 연구들은 몇몇 바이러스 계열의 판게놈을 계산했다.6종의 판도라비루스의 핵심 게놈은 352개의 유전자 계열로 구성되는데 판게놈의 4.7%에 불과해 개방 판게놈을 낳는다.[48]null

데이터 구조

염기서열화된 게놈의 수는 계속해서 증가하고 있다. "단순히 확립된 생물정보학 파이프라인을 확장하는 것만으로는 그러한 풍부한 게놈 데이터 세트의 잠재력을 최대한 활용하기에는 충분하지 않을 것"이다.[49]판게놈 그래프는 판게놈을 나타내고 판게놈에 읽기를 효율적으로 매핑하기 위해 고안된 새로운 데이터 구조다.그들은 에이젠가 외 연구진에 의해 검토되었다.

소프트웨어 도구

스트렙토코쿠스 아갈락티아의 게놈의 판게놈 분석.[2]BPGA 소프트웨어로 만든 계통 생성의 예.이 소프트웨어를 통해 우리는 핵심 게놈이나 판게놈의 군집화에 기반한 유전자를 만들 수 있다.핵심과 범상동적 재구성이 반드시 일치하는 것은 아니다.

판게놈에 대한 관심이 높아지면서 이런 종류의 데이터를 분석하는 데 도움이 되는 소프트웨어 도구가 여러 개 개발됐다.유전체 분석을 시작하는 첫 번째 단계는 게놈 주석의 균질화다.[23]GeneMark[51] 또는 RAST와 같이 사용되는 모든 게놈에 주석을 달기 위해 동일한 소프트웨어를 사용해야 한다.[52]2015년에 한 연구진은 연구자가 이용할 수 있는 다양한 종류의 분석과 도구를 검토했다.[53]판게놈을 분석하기 위해 개발된 소프트웨어에는 다음과 같은 7가지 종류가 있다.군집화된 동질 유전자를 식별하고, SNP를 식별하고, 판화학적 프로파일을 표시하고, 정맥 유전자/균형/이솔레이트 계열의 계통유전관계 구축, 기능 기반 검색, 주석 및/또는 큐레이션, 시각화 등을 담당한다.[53]null

2014년[53] 말 판게놈 분석을 위해 가장 많이 인용된 소프트웨어 도구는 판세크[54](Panseq)와 범게놈 분석 파이프라인(PGAP)이다.[55]다른 옵션으로는 원핵 게놈을 위한 BPGA – A 범게놈 분석 파이프라인,[56] GET_HOMLOGUES,[57] Roary 및 PanDelos가 있다.[58][59]2015년에는 원핵생물 판게놈과[60] 식물 범게놈에 대한 또 다른 리뷰가 발표되었다.[61]식물 판게놈을 위해 설계된 첫 번째 소프트웨어 패키지로는 PanTools.와 GET_HOMLOGUES-EST가 있었다.[62][11][57]2018년 panX는 유전자 계열의 진화이력을 검사할 수 있는 인터랙티브 웹 툴로 핵심 유전체 계통에 유전체 계통인 게놈의 정렬, 돌연변이의 매핑, 가족의 손익 추론 등을 표시할 수 있다.[63]2019년 OrthoVenn 2.0은 최대 12개의 게놈까지 Ven 도표에서 동질 유전자의 가족을 비교 시각화할 수 있도록 허용했다.2020년에는 시각화 워크플로우뿐만 아니라 판에노믹스, 메타페놀로믹스 분석을 포함하는 멀티노믹스 플랫폼으로 안비오(Anvi[1]'o)를 이용할 수 있었다.안비오에서는 게놈을 동심원 모양으로 표시하고 각 반지름은 유전자 계열을 나타내며, 이를 통해 인터랙티브 시각화에서 100개 이상의 게놈을 비교할 수 있다.null

2020년에는 유전자 기반 판게노믹 콘텐츠(GET_HOMLOGUES, PanDelos, Roary 등)를 추출하기 위한 툴의 컴퓨터 비교가 출시되었다.[65]도구를 방법론적 관점에서 비교하여 주어진 방법론을 다른 도구보다 능가하는 원인을 분석하였다.이 분석은 진화 매개변수의 변화에 의해 합성적으로 생성되는 다른 박테리아 집단을 고려하여 수행되었다.결과는 입력 게놈의 구성에 따라 달라지는 각 도구의 성능의 차이를 보여준다.null

BPGA 소프트웨어의 가능한 출력 예제.스트렙토코쿠스 아갈락티아의 게놈의 판게놈 분석.왼쪽에는 코어/불필수/유니크 게놈별 바둑항 분포가 표시된다.이 예에서 범주 복제, 재조합 및 수리는 고유한 유전자 계열에서 농축된다.오른쪽에는 전형적인 범/핵 플롯이 나타나는데, 더 많은 게놈들이 코어의 크기가 감소하고, 반대로 판게놈의 크기가 증가한다.[2]

참고 항목

참조

  1. ^ a b Eren AM, Kiefl E, Shaiber A, Veseli I, Miller SE, Schechter MS, et al. (January 2021). "Community-led, integrated, reproducible multi-omics with anvi'o". Nature Microbiology. 6 (1): 3–6. doi:10.1038/s41564-020-00834-3. PMC 8116326. PMID 33349678.
  2. ^ a b c d e f g h i j k l Tettelin, Hervé; Masignani, Vega; Cieslewicz, Michael J.; Donati, Claudio; Medini, Duccio; Ward, Naomi L.; Angiuoli, Samuel V.; Crabtree, Jonathan; Jones, Amanda L.; Durkin, A. Scott; DeBoy, Robert T. (2005-09-27). "Genome analysis of multiple pathogenic isolates of Streptococcus agalactiae: Implications for the microbial "pan-genome"". Proceedings of the National Academy of Sciences. 102 (39): 13950–13955. Bibcode:2005PNAS..10213950T. doi:10.1073/pnas.0506758102. ISSN 0027-8424. PMC 1216834. PMID 16172379.
  3. ^ a b c Medini D, Donati C, Tettelin H, Masignani V, Rappuoli R (December 2005). "The microbial pan-genome". Current Opinion in Genetics & Development. 15 (6): 589–94. doi:10.1016/j.gde.2005.09.006. PMID 16185861.
  4. ^ a b c d Vernikos G, Medini D, Riley DR, Tettelin H (February 2015). "Ten years of pan-genome analyses". Current Opinion in Microbiology. 23: 148–54. doi:10.1016/j.mib.2014.11.016. PMID 25483351.
  5. ^ a b Marroni F, Pinosio S, Morgante M (April 2014). "Structural variation and genome complexity: is dispensable really dispensable?". Current Opinion in Plant Biology. 18: 31–36. doi:10.1016/j.pbi.2014.01.003. PMID 24548794.
  6. ^ Wolf YI, Makarova KS, Yutin N, Koonin EV (December 2012). "Updated clusters of orthologous genes for Archaea: a complex ancestor of the Archaea and the byways of horizontal gene transfer". Biology Direct. 7: 46. doi:10.1186/1745-6150-7-46. PMC 3534625. PMID 23241446.
  7. ^ Mira A, Martín-Cuadrado AB, D'Auria G, Rodríguez-Valera F (2010). "The bacterial pan-genome:a new paradigm in microbiology". Int Microbiol. 13 (2): 45–57. doi:10.2436/20.1501.01.110. PMID 20890839.
  8. ^ Morgante M, De Paoli E, Radovic S (April 2007). "Transposable elements and the plant pan-genomes". Current Opinion in Plant Biology. 10 (2): 149–55. doi:10.1016/j.pbi.2007.02.001. PMID 17300983.
  9. ^ a b Gordon SP, Contreras-Moreira B, Woods DP, Des Marais DL, Burgess D, Shu S, et al. (December 2017). "Extensive gene content variation in the Brachypodium distachyon pan-genome correlates with population structure". Nature Communications. 8 (1): 2184. Bibcode:2017NatCo...8.2184G. doi:10.1038/s41467-017-02292-8. PMC 5736591. PMID 29259172.
  10. ^ a b Gordon SP, Contreras-Moreira B, Levy JH, Djamei A, Czedik-Eysenberg A, Tartaglio VS, et al. (July 2020). "Gradual polyploid genome evolution revealed by pan-genomic analysis of Brachypodium hybridum and its diploid progenitors". Nature Communications. 11 (1): 3670. Bibcode:2020NatCo..11.3670G. doi:10.1038/s41467-020-17302-5. PMC 7391716. PMID 32728126.
  11. ^ a b Contreras-Moreira B, Cantalapiedra CP, García-Pereira MJ, Gordon SP, Vogel JP, Igartua E, et al. (February 2017). "Analysis of Plant Pan-Genomes and Transcriptomes with GET_HOMOLOGUES-EST, a Clustering Solution for Sequences of the Same Species". Frontiers in Plant Science. 8: 184. doi:10.3389/fpls.2017.00184. PMC 5306281. PMID 28261241.
  12. ^ Reno ML, Held NL, Fields CJ, Burke PV, Whitaker RJ (May 2009). "Biogeography of the Sulfolobus islandicus pan-genome". Proceedings of the National Academy of Sciences of the United States of America. 106 (21): 8605–10. Bibcode:2009PNAS..106.8605R. doi:10.1073/pnas.0808945106. PMC 2689034. PMID 19435847.
  13. ^ Reinhardt JA, Baltrus DA, Nishimura MT, Jeck WR, Jones CD, Dangl JL (February 2009). "De novo assembly using low-coverage short read sequence data from the rice pathogen Pseudomonas syringae pv. oryzae". Genome Research. 19 (2): 294–305. doi:10.1101/gr.083311.108. PMC 2652211. PMID 19015323.
  14. ^ Tettelin H, Medini D (2020). Tettelin H, Medini D (eds.). The Pangenome (PDF). doi:10.1007/978-3-030-38281-0. ISBN 978-3-030-38280-3. PMID 32633908. S2CID 217167361.
  15. ^ a b Halachev MR, Loman NJ, Pallen MJ (2011). "Calculating orthologs in bacteria and Archaea: a divide and conquer approach". PLOS ONE. 6 (12): e28388. Bibcode:2011PLoSO...628388H. doi:10.1371/journal.pone.0028388. PMC 3236195. PMID 22174796.
  16. ^ Blaustein RA, McFarland AG, Ben Maamar S, Lopez A, Castro-Wallace S, Hartmann EM (2019). "Pangenomic Approach To Understanding Microbial Adaptations within a Model Built Environment, the International Space Station, Relative to Human Hosts and Soil". mSystems. 4 (1): e00281-18. doi:10.1128/mSystems.00281-18. PMC 6325168. PMID 30637341.
  17. ^ Mosquera-Rendón J, Rada-Bravo AM, Cárdenas-Brito S, Corredor M, Restrepo-Pineda E, Benítez-Páez A (January 2016). "Pangenome-wide and molecular evolution analyses of the Pseudomonas aeruginosa species". BMC Genomics. 17 (45): 45. doi:10.1186/s12864-016-2364-4. PMC 4710005. PMID 26754847.
  18. ^ Snipen L, Ussery DW (January 2010). "Standard operating procedure for computing pangenome trees". Standards in Genomic Sciences. 2 (1): 135–41. doi:10.4056/sigs.38923. PMC 3035256. PMID 21304685.
  19. ^ Sélem-Mojica N, Aguilar C, Gutiérrez-García K, Martínez-Guerrero CE, Barona-Gómez F (December 2019). "EvoMining reveals the origin and fate of natural product biosynthetic enzymes". Microbial Genomics. 5 (12): e000260. doi:10.1099/mgen.0.000260. PMC 6939163. PMID 30946645.
  20. ^ Juárez-Vázquez AL, Edirisinghe JN, Verduzco-Castro EA, Michalska K, Wu C, Noda-García L, et al. (March 2017). "Evolution of substrate specificity in a retained enzyme driven by gene loss". eLife. 6 (6): e22679. doi:10.7554/eLife.22679. PMC 5404923. PMID 28362260.
  21. ^ Noda-García L, Camacho-Zarco AR, Medina-Ruíz S, Gaytán P, Carrillo-Tripp M, Fülöp V, Barona-Gómez F (September 2013). "Evolution of substrate specificity in a recipient's enzyme following horizontal gene transfer". Molecular Biology and Evolution. 30 (9): 2024–34. doi:10.1093/molbev/mst115. PMID 23800623.
  22. ^ a b Vernikos GS (2020). "A Review of Pangenome Tools and Recent Studies". The Pangenome: 89–112. doi:10.1007/978-3-030-38281-0_4. ISBN 978-3-030-38280-3. PMID 32633917. S2CID 219011507.
  23. ^ a b Costa SS, Guimarães LC, Silva A, Soares SC, Baraúna RA (2020). "First Steps in the Analysis of Prokaryotic Pan-Genomes". Bioinformatics and Biology Insights. 14: 1177932220938064. doi:10.1177/1177932220938064. PMC 7418249. PMID 32843837.
  24. ^ Land M, Hauser L, Jun SR, Nookaew I, Leuze MR, Ahn TH, et al. (March 2015). "Insights from 20 years of bacterial genome sequencing". Functional & Integrative Genomics. 15 (2): 141–61. doi:10.1007/s10142-015-0433-4. PMC 4361730. PMID 25722247.
  25. ^ Argemi X, Matelska D, Ginalski K, Riegel P, Hansmann Y, Bloom J, et al. (August 2018). "Comparative genomic analysis of Staphylococcus lugdunensis shows a closed pan-genome and multiple barriers to horizontal gene transfer". BMC Genomics. 19 (1): 621. doi:10.1186/s12864-018-4978-1. PMC 6102843. PMID 30126366.
  26. ^ Brockhurst MA, Harrison E, Hall JP, Richards T, McNally A, MacLean C (October 2019). "The Ecology and Evolution of Pangenomes". Current Biology. 29 (20): R1094–R1103. doi:10.1016/j.cub.2019.08.012. PMID 31639358. S2CID 204823648.
  27. ^ McInerney JO, McNally A, O'Connell MJ (March 2017). "Why prokaryotes have pangenomes" (PDF). Nature Microbiology. 2 (4): 17040. doi:10.1038/nmicrobiol.2017.40. PMID 28350002. S2CID 19612970.
  28. ^ Koonin EV (June 2015). "The Turbulent Network Dynamics of Microbial Evolution and the Statistical Tree of Life". Journal of Molecular Evolution. 80 (5–6): 244–50. Bibcode:2015JMolE..80..244K. doi:10.1007/s00239-015-9679-7. PMC 4472940. PMID 25894542.
  29. ^ Kislyuk AO, Haegeman B, Bergman NH, Weitz JS (January 2011). "Genomic fluidity: an integrative view of gene diversity within microbial populations". BMC Genomics. 12 (12): 32. doi:10.1186/1471-2164-12-32. PMC 3030549. PMID 21232151.
  30. ^ Puigbò P, Lobkovsky AE, Kristensen DM, Wolf YI, Koonin EV (August 2014). "Genomes in turmoil: quantification of genome dynamics in prokaryote supergenomes". BMC Biology. 12 (66): 66. doi:10.1186/s12915-014-0066-4. PMC 4166000. PMID 25141959.
  31. ^ Lapierre P, Gogarten JP (March 2009). "Estimating the size of the bacterial pan-genome". Trends in Genetics. 25 (3): 107–10. doi:10.1016/j.tig.2008.12.004. PMID 19168257.
  32. ^ a b Delmont, TO; Eren, AM (2018). "Linking pangenomes and metagenomes: the Prochlorococcus metapangenome". PeerJ. 6: e4320. doi:10.7717/peerj.4320. PMC 5804319. PMID 29423345.
  33. ^ Utter, Daniel R.; Borisy, Gary G.; Eren, A. Murat; Cavanaugh, Colleen M.; Mark Welch, Jessica L. (2020-12-16). "Metapangenomics of the oral microbiome provides insights into habitat adaptation and cultivar diversity". Genome Biology. 21 (1): 293. doi:10.1186/s13059-020-02200-2. PMC 7739467. PMID 33323129.
  34. ^ Ma B, France M, Ravel J (2020). "Meta-Pangenome: At the Crossroad of Pangenomics and Metagenomics.". In Tettelin H, Medini D (eds.). The Pangenome: Diversity, Dynamics and Evolution of Genomes. Springer. pp. 205–218. doi:10.1007/978-3-030-38281-0_9. ISBN 978-3-030-38281-0. PMID 32633911. S2CID 219067583.
  35. ^ Zhong C, Chen C, Wang L, Ning K (2021). "Integrating pan-genome with metagenome for microbial community profiling". Computational and Structural Biotechnology Journal. 19: 1458–1466. doi:10.1016/j.csbj.2021.02.021. PMC 8010324. PMID 33841754.
  36. ^ a b Donati C, Hiller NL, Tettelin H, Muzzi A, Croucher NJ, Angiuoli SV, et al. (2010). "Structure and dynamics of the pan-genome of Streptococcus pneumoniae and closely related species". Genome Biology. 11 (10): R107. doi:10.1186/gb-2010-11-10-r107. PMC 3218663. PMID 21034474.
  37. ^ Rouli L, Merhej V, Fournier PE, Raoult D (September 2015). "The bacterial pangenome as a new tool for analysing pathogenic bacteria". New Microbes and New Infections. 7: 72–85. doi:10.1016/j.nmni.2015.06.005. PMC 4552756. PMID 26442149.
  38. ^ Kettler GC, Martiny AC, Huang K, Zucker J, Coleman ML, Rodrigue S, et al. (December 2007). "Patterns and implications of gene gain and loss in the evolution of Prochlorococcus". PLOS Genetics. 3 (12): e231. doi:10.1371/journal.pgen.0030231. PMC 2151091. PMID 18159947.
  39. ^ Basharat Z, Yasmin A, He T, Tong Y (2018). "Genome sequencing and analysis of Alcaligenes faecalis subsp. phenolicus MB207". Scientific Reports. 8 (1): 3616. Bibcode:2018NatSR...8.3616B. doi:10.1038/s41598-018-21919-4. PMC 5827749. PMID 29483539.
  40. ^ Basharat Z, Yasmin A (2016). "Pan-genome Analysis of the Genus Serratia". arXiv:1610.04160 [q-bio.GN].
  41. ^ Gupta VK, Chaudhari NM, Iskepalli S, Dutta C (March 2015). "Divergences in gene repertoire among the reference Prevotella genomes derived from distinct body sites of human". BMC Genomics. 16 (153): 153. doi:10.1186/s12864-015-1350-6. PMC 4359502. PMID 25887946.
  42. ^ Gaba S, Kumari A, Medema M, Kaushik R (December 2020). "Pan-genome analysis and ancestral state reconstruction of class halobacteria: probability of a new super-order". Scientific Reports. 10 (1): 21205. Bibcode:2020NatSR..1021205G. doi:10.1038/s41598-020-77723-6. PMC 7713125. PMID 33273480.
  43. ^ McCarthy CG, Fitzpatrick DA (February 2019). "Pan-genome analyses of model fungal species". Microbial Genomics. 5 (2). doi:10.1099/mgen.0.000243. PMC 6421352. PMID 30714895.
  44. ^ Li R, Li Y, Zheng H, Luo R, Zhu H, Li Q, Qian W, Ren Y, Tian G, Li J, Zhou G, Zhu X, Wu H, Qin J, Jin X, Li D, Cao H, Hu X, Blanche H, Cann H, Zhang X, Li S, Bolund L, Kristiansen K, Yang H, Wang J, Wang J (2010). "Building the sequence map of the human pan-genome". Nat Biotechnol. 28 (1): 57–63. doi:10.1038/nbt.1596. PMID 19997067. S2CID 205274447.
  45. ^ Gao L, Gonda I, Sun H, et al. (May 2019). "The tomato pan-genome uncovers new genes and a rare allele regulating fruit flavor". Nature Genetics. 51 (6): 1044–51. doi:10.1038/s41588-019-0410-2. PMID 31086351. S2CID 152283283.
  46. ^ Jayakodi M, Padmarasu S, Haberer G, et al. (Nov 2020). "The barley pan-genome reveals the hidden legacy of mutation breeding". Nature. 588 (7837): 284–9. Bibcode:2020Natur.588..284J. doi:10.1038/s41586-020-2947-8. PMC 7759462. PMID 33239781.
  47. ^ Van de Weyer AL, Monteiro F, Furzer OJ, Nishimura MT, Cevik V, Witek K, Jones JD, Dangl JL, Weigel D, Bemm F (August 2019). "A Species-Wide Inventory of NLR Genes and Alleles in Arabidopsis thaliana". Cell. 178 (5): 1260–72. doi:10.1016/j.cell.2019.07.038. PMC 6709784. PMID 31442410.
  48. ^ Aherfi S, Andreani J, Baptiste E, Oumessoum A, Dornas FP, Andrade AC, et al. (2018). "A Large Open Pangenome and a Small Core Genome for Giant Pandoraviruses". Frontiers in Microbiology. 9 (9): 1486. doi:10.3389/fmicb.2018.01486. PMC 6048876. PMID 30042742.
  49. ^ The Computational Pan-Genomics Consortium (January 2018). "Computational pan-genomics: status, promises and challenges". Briefings in Bioinformatics. 19 (1): 118–135. doi:10.1093/bib/bbw089. PMC 5862344. PMID 27769991.
  50. ^ Eizenga JM, Novak AM, Sibbesen JA, Heumos S, Ghaffaari A, Hickey G, et al. (August 2020). "Pangenome Graphs". Annual Review of Genomics and Human Genetics. 21: 139–162. doi:10.1146/annurev-genom-120219-080406. PMC 8006571. PMID 32453966.
  51. ^ Besemer J, Lomsadze A, Borodovsky M (June 2001). "GeneMarkS: a self-training method for prediction of gene starts in microbial genomes. Implications for finding sequence motifs in regulatory regions". Nucleic Acids Research. 29 (12): 2607–18. doi:10.1093/nar/29.12.2607. PMC 55746. PMID 11410670.
  52. ^ Aziz RK, Bartels D, Best AA, DeJongh M, Disz T, Edwards RA, et al. (February 2008). "The RAST Server: rapid annotations using subsystems technology". BMC Genomics. 9 (9): 75. doi:10.1186/1471-2164-9-75. PMC 2265698. PMID 18261238.
  53. ^ a b c Xiao J, Zhang Z, Wu J, Yu J (February 2015). "A brief review of software tools for pangenomics". Genomics, Proteomics & Bioinformatics. 13 (1): 73–6. doi:10.1016/j.gpb.2015.01.007. PMC 4411478. PMID 25721608.
  54. ^ Laing C, Buchanan C, Taboada EN, Zhang Y, Kropinski A, Villegas A, et al. (September 2010). "Pan-genome sequence analysis using Panseq: an online tool for the rapid analysis of core and accessory genomic regions". BMC Bioinformatics. 11 (1): 461. doi:10.1186/1471-2105-11-461. PMC 2949892. PMID 20843356.
  55. ^ Zhao Y, Wu J, Yang J, Sun S, Xiao J, Yu J (February 2012). "PGAP: pan-genomes analysis pipeline". Bioinformatics. 28 (3): 416–8. doi:10.1093/bioinformatics/btr655. PMC 3268234. PMID 22130594.
  56. ^ Chaudhari NM, Gupta VK, Dutta C (April 2016). "BPGA- an ultra-fast pan-genome analysis pipeline". Scientific Reports. 6 (24373): 24373. Bibcode:2016NatSR...624373C. doi:10.1038/srep24373. PMC 4829868. PMID 27071527.
  57. ^ a b Contreras-Moreira B, Vinuesa P (December 2013). "GET_HOMOLOGUES, a versatile software package for scalable and robust microbial pangenome analysis". Applied and Environmental Microbiology. 79 (24): 7696–701. Bibcode:2013ApEnM..79.7696C. doi:10.1128/AEM.02411-13. PMC 3837814. PMID 24096415.
  58. ^ Page AJ, Cummins CA, Hunt M, Wong VK, Reuter S, Holden MT, et al. (November 2015). "Roary: rapid large-scale prokaryote pan genome analysis". Bioinformatics. 31 (22): 3691–3. doi:10.1093/bioinformatics/btv421. PMC 4817141. PMID 26198102.
  59. ^ Bonnici V, Giugno R, Manca V (November 2018). "PanDelos: a dictionary-based method for pan-genome content discovery". BMC Bioinformatics. 19 (Suppl 15): 437. doi:10.1186/s12859-018-2417-6. PMC 6266927. PMID 30497358.
  60. ^ Guimarães LC, Florczak-Wyspianska J, de Jesus LB, Viana MV, Silva A, Ramos RT, et al. (August 2015). "Inside the Pan-genome - Methods and Software Overview". Current Genomics. 16 (4): 245–52. doi:10.2174/1389202916666150423002311. PMC 4765519. PMID 27006628.
  61. ^ Golicz AA, Batley J, Edwards D (April 2016). "Towards plant pangenomics" (PDF). Plant Biotechnology Journal. 14 (4): 1099–105. doi:10.1111/pbi.12499. PMID 26593040.
  62. ^ Sheikhizadeh S, Schranz ME, Akdel M, de Ridder D, Smit S (September 2016). "PanTools: Representation, Storage and Exploration of Pan-Genomic Data". Bioinformatics. 32 (17): i487–i493. doi:10.1093/bioinformatics/btw455. PMID 27587666.
  63. ^ Ding W, Baumdicker F, Neher RA (January 2018). "panX: pan-genome analysis and exploration". Nucleic Acids Research. 46 (1): e5. doi:10.1093/nar/gkx977. PMC 5758898. PMID 29077859.
  64. ^ Xu L, Dong Z, Fang L, Luo Y, Wei Z, Guo H, et al. (July 2019). "OrthoVenn2: a web server for whole-genome comparison and annotation of orthologous clusters across multiple species". Nucleic Acids Research. 47 (W1): W52–W58. doi:10.1093/nar/gkz333. PMC 6602458. PMID 31053848.
  65. ^ Bonnici V, Maresi E, Giugno R (2020). "Challenges in gene-oriented approaches for pangenome content discovery". Briefings in Bioinformatics. 22 (3). doi:10.1093/bib/bbaa198. ISSN 1477-4054. PMID 32893299.