3세대 시퀀싱

Third-generation sequencing

3세대 염기서열(장독서 염기서열이라고도 함)은 현재 활발하게 개발 중인 DNA 염기서열 분석법의 한 종류다.[1]

3세대 시퀀싱 기술은 2세대 시퀀싱보다 상당히 긴 읽기를 생성할 수 있다.[1] 그러한 이점은 게놈 과학과 생물학의 전반적인 연구 모두에 중대한 영향을 미친다. 그러나 3세대 시퀀싱 데이터는 기존 기술보다 오류율이 훨씬 높아 다운스트림 게놈 조립과 결과 데이터 분석이 복잡해질 수 있다.[2] 이들 기술은 활발한 개발이 진행 중이며 높은 에러율의 개선이 기대된다. 구조적 변종 호출과 같이 오류율에 더 내성이 있는 애플리케이션의 경우, 3세대 시퀀싱이 낮은 시퀀싱 적용범위에서도 기존 방법을 능가하는 것으로 밝혀졌다.[3]

현재 기술

2세대 플랫폼과는 다른 접근방식을 가진 시퀀싱 기술은 2008~2009년에 처음으로 "제3세대"로 기술되었다.[4]

현재 3세대 시퀀싱 기술 개발의 중심에는 태평양 생물과학, 옥스포드 나노포레 테크놀로지, 콴포포르(CA-USA), 스트라토스(WA-USA) 등 여러 기업이 있다. 이 회사들은 단일 DNA 분자의 염기서열 분석을 위해 근본적으로 다른 접근방식을 취하고 있다.

PacBio는 제로 모드 도파관의 특성을 바탕으로 단일 분자 실시간 시퀀싱(SMRT)의 시퀀싱 플랫폼을 개발했다. 신호는 zL 우물 바닥에 묶인 DNA 중합효소에 의해 통합된 각 뉴클레오티드로부터 형광 빛을 방출하는 형태다.

옥스포드 나노포어의 기술은 나노 크기의 모공 구조를 통해 DNA 분자를 통과시킨 다음 모공을 둘러싼 전기장의 변화를 측정하는 것을 포함하고 있는 반면, 콴포폴은 다른 독점적인 나노포어 접근법을 가지고 있다. Stratos Genomics는 나노포어 ssDNA 판독의 잡음 도전 신호를 우회하기 위해 중합체 삽입물인 "Xpandomers"로 DNA 베이스를 공간화한다.

헬리코스의 단일 분자 형광 접근법도 눈에 띄지만 2015년 가을부터 파산에 돌입했다.

이점

더 긴 읽기

현재 세대의 시퀀싱 기술에 비해, 3세대 시퀀싱은 훨씬 더 긴 읽기를 생산할 수 있는 분명한 이점을 가지고 있다. 이렇게 긴 읽기 길이는 현대 생물학 및 의학의 다른 중요한 영역들 중 게놈 조립, 대본 재구성 및 메타게노믹스를 둘러싼 수많은 컴퓨터 문제를 완화시킬 것으로 기대된다.[1]

영장류와 인간을 포함한 진핵 게놈은 복잡하고 오랜 기간 반복된 부위가 많다는 것은 잘 알려져 있다. 2세대 시퀀싱의 짧은 판독은 조립 및 유전자 변형 호출에 대한 긴 범위에 걸친 시퀀스를 유추하기 위해 근사적 전략에 의존해야 한다. 페어 엔드 읽기는 이러한 제한에 대처하기 위해 2세대 시퀀싱에 의해 활용되었다. 단, 쌍 끝의 정확한 조각 길이는 종종 알려져 있지 않으며 또한 근사치여야 한다. 긴 읽기 길이를 가능케 함으로써, 3세대 시퀀싱 기술은 분명한 이점을 가지고 있다.

후생유전학

후생유전학적 표지는 그 순서에 없는 DNA 분자에 대한 안정적이고 잠재적으로 유전적으로 변형될 수 있다. 유전자 발현에 영향을 미치는 것으로 밝혀진 CpG 현장의 DNA 메틸화가 그 예다. 히스톤 수정이 또 다른 예다. 현재 세대의 시퀀싱 기술은 후생유전자 표지의 탐지를 위해 Chip-sequencing과 같은 실험실 기술에 의존한다. 이 기술들은 DNA 가닥에 꼬리표를 붙이고, 마커가 들어 있는 파편을 부수고 여과하고, 그 다음에 순서를 정하는 것을 포함한다. 3세대 시퀀싱은 다른 네 개의 뉴클레오티드 베이스로부터의 독특한 신호 때문에 이러한 마커를 직접 검출할 수 있다.[5]

휴대성 및 속도

MinION Portable Gene Sequencer, Oxford Nanopore Technologies

3세대 시퀀싱 기술의 다른 중요한 장점으로는 휴대성과 시퀀싱 속도를 들 수 있다.[6] 2세대 시퀀싱에 비해 최소한의 샘플 사전 처리가 필요하기 때문에 더 작은 장비를 설계할 수 있다. 옥스포드 나노포어 테크놀로지는 최근 MinION 시퀀서를 상용화했다. 이 시퀀싱 기계는 일반 USB 플래시 드라이브와 거의 비슷한 크기로 노트북에 연결하여 쉽게 사용할 수 있다. 또 염기서열화 과정이 게놈 영역 전반에 걸쳐 평행하지 않기 때문에 실시간으로 데이터를 수집해 분석할 수 있었다. 3세대 시퀀싱의 이러한 이점은 신속하고 현장적인 데이터 수집 및 분석이 요구되는 병원 환경에 적합할 수 있다.

과제들

현재와 같이 3세대 염기서열 분석은 주로 뉴클레오티드 염기의 정확한 식별을 둘러싼 중요한 도전에 직면하고 있다. 오류율은 2세대 염기서열 분석과 비교했을 때 여전히 훨씬 높다.[2] 이것은 일반적으로 관련된 분자 기계의 불안정성 때문이다. 예를 들어 PacBio의 단일 분자 및 실시간 염기서열화 기술에서는 염기서열화 과정이 발생할수록 DNA 중합효소 분자가 점점 손상된다.[2] 또한 프로세스가 빠르게 진행되기 때문에, 개별 베이스가 발산하는 신호는 인접 베이스의 신호에 의해 흐릿해질 수 있다. 이것은 신호를 해독하고 결과적으로 그 순서를 유추하는 새로운 컴퓨터 문제를 야기한다. 예를 들어 Hidden Markov Models와 같은 방법들은 어느 정도 성공하면서 이 목적을 위해 활용되었다.[5]

평균적으로, 인간 인구의 다른 개인들은 그들의 유전자의 약 99.9%를 공유한다. 즉, 천 개의 베이스 중 대략 한 개 꼴로 두 사람 사이에 차이가 있을 것이다. 3세대 시퀀싱과 관련된 높은 오류율은 같은 종의 구성원들 사이에 존재하는 개별적 차이를 특징짓기 위한 목적으로 불가피하게 문제가 될 수 있다.

게놈 조립체

게놈 조립은 전체 게놈 DNA 서열을 재구성하는 것이다. 이것은 일반적으로 근본적으로 다른 두 가지 접근법으로 이루어진다.

참조정렬

참조 게놈을 사용할 수 있는 경우, 인간의 경우처럼, 새로 배열된 판독은 단순히 참조 게놈의 특성을 나타내기 위해 참조 게놈에 맞춰질 수 있다. 이러한 참조 기반 어셈블리는 빠르고 쉽지만 새로운 시퀀스와 큰 카피 번호 변형을 "히딩"한다는 단점이 있다. 게다가 참조 게놈은 대부분의 유기체에 아직 존재하지 않는다.

드 노보 조립체

De novo 어셈블리는 기준 정렬을 위한 대체 게놈 어셈블리 접근방식이다. 그것은 전체 게놈 서열을 완전히 원시 서열 판독에서 재구성하는 것을 말한다. 이 방법은 기준 게놈(reference genome)이 없거나, 메타게노믹스처럼 주어진 유기체의 종을 알 수 없거나, 기준 게놈 정렬에 의해 검출되지 않을 수 있는 관심 유전적 변형이 존재할 때 선택된다.

현재 세대의 시퀀싱 기술에 의해 생성된 짧은 읽기를 고려할 때, de novo 어셈블리는 주요한 계산상의 문제다. 그것은 보통 합리적인 중복이 있는 시퀀스 읽기를 찾고 연결하는 반복적인 프로세스에 의해 접근된다. de bruijn 그래프와 중복 배치 일치 그래프와 같은 다양한 계산 및 통계 기법이 이 문제를 해결하기 위해 활용되었다. 그럼에도 불구하고 진핵 게놈의 반복성이 매우 높기 때문에 de novo 조립체에서 게놈 서열을 정확하고 완전하게 재구성하는 것은 여전히 어려운 일이다. 정확한 조각 길이는 종종 알려져 있지 않고 대략적으로 추정되어야 하지만, 쌍 끝 판독은 가능한 해결책으로 제시되어 왔다.[7]

하이브리드 어셈블리 - 2세대 플랫폼에서 반바지 읽기와 함께 3세대 시퀀싱 플랫폼에서 읽기를 사용하는 것은 이전에 2세대 시퀀싱을 사용하여 조립된 게놈에 존재하는 모호성을 해결하기 위해 사용될 수 있다. 짧은 2세대 읽기도 긴 3세대 읽기에 존재하는 오류를 수정하는 데 사용되었다.

하이브리드 조립체

3세대 염기서열에 의해 제공되는 긴 읽기 길이는 de novo 게놈 조립체에서 현재 직면하고 있는 많은 난제를 완화시킬 수 있다. 예를 들어, 전체 반복 영역을 한 번의 판독으로 모호하지 않게 배열할 수 있다면, 계산 추론이 필요하지 않을 것이다. 높은 오류율 문제를 완화하기 위한 계산 방법이 제안되었다. 예를 들어, 한 연구에서, PacBio 염기서열을 이용한 미생물 게놈의 de novo 조립이 2세대 염기서열보다 우수하다는 것이 입증되었다.[8]

3세대 시퀀싱은 2세대 시퀀싱과 함께 사용할 수도 있다. 이 접근방식을 흔히 하이브리드 시퀀싱이라고 한다. 예를 들어, 3세대 시퀀싱의 긴 읽기는 2세대 시퀀싱을 사용하여 이전에 조립된 게놈에 존재하는 모호성을 해결하기 위해 사용될 수 있다. 반면에, 짧은 2세대 읽기는 긴 3세대 읽기에 존재하는 오류를 수정하기 위해 사용되었다. 일반적으로 이러한 하이브리드 접근방식은 de novo 게놈 조립을 상당히 향상시키는 것으로 나타났다.[9]

후생유전자 표식기

DNA 메틸화(DNAM) - CpG 현장에서 DNA를 공동 수정하여 첨부 메틸 그룹을 만드는 DNA 메틸화(DNAM)는 후생유전학 기계의 가장 잘 이해되는 성분이다. DNA 수정과 그에 따른 유전자 발현이 세포 유형에 따라 다를 수 있으며, 유전적 조상과 함께 시간적 발달은 환경적 자극에 의해 변화할 수 있으며 유전적으로 가능하다. DNAm 발견 후, 연구원들은 또한 DNAm이 암이나 자폐증과 같은 질병과의 상관관계를 발견했다.[10] 이 질병의 유전학 맥락에서 DNAm은 추가 연구의 중요한 길이다.

이점

현재 가장 일반적인 메틸레이션 상태 검사 방법은 Illumina 플랫폼에서 표준 2세대 염기서열 분석 전에 DNA를 파편화하는 검사를 필요로 한다. 짧은 읽기 길이의 결과로, 메틸화의 더 긴 패턴에 관한 정보가 손실된다.[5] 3세대 시퀀싱 기술은 앞서 언급한 분석 없이 단일 분자의 긴 읽기 실시간 시퀀싱 및 DNA 수정 검출 기능을 제공한다.[11]

PacBio SMRT 기술과 옥스포드 나노포어는 변형되지 않은 DNA를 사용하여 메틸화를 검출할 수 있다.

옥스포드 나노포어 테크놀로지스의 MinION은 DNAm을 검출하는 데 사용되었다. 각 DNA 가닥이 모공을 통과하면서 뉴클레오티드의 후생유전 변화에 민감하게 반응하는 것으로 밝혀진 전기신호를 생성하며, 5mC(5mC)의 DNA변형을 검출하기 위해 MinION 데이터를 분석하는 데 숨겨진 마르코프 모델(HM)을 사용하였다.[5] 이 모델은 합성 메틸화 대장균 DNA와 나노포어 기술에 의해 측정된 결과 신호를 사용하여 훈련되었다. 그리고 나서 훈련된 모델을 사용하여 이미 기준 메틸롬이 있는 인간 세포 라인에서 5mC의 MinION 게놈 판독값을 검출했다. 분류기는 무작위로 샘플링된 싱글톤 사이트에서 82%의 정확도를 가지며, 보다 엄격한 임계값을 적용하면 95%로 증가한다.[5]

다른 방법은 MinION 플랫폼을 사용하여 다양한 유형의 DNA 수정을 다룬다. 스토이버 외 연구진은 5mC와 함께 4-메틸시토신(4mC)과 6-메틸아데닌(6mA)을 검사했으며, 원시 MinION 데이터를 인간 친화적으로 직접 시각화하는 소프트웨어도 만들었다.[12] 여기서 그들은 알려진 메틸롬가진 대장균에서 5개의 염기쌍의 이벤트 창을 사용하여 원시 MinION 전기 신호를 분할하고 통계적으로 분석할 수 있다는 것을 발견했다. 간단한 Mann-Whitney U 테스트 대장균 시퀀스의 수정된 부분을 감지할 수 있을 뿐만 아니라 수정 사항을 4mC, 6mA 또는 5mC 영역으로 더 세분화할 수 있다.[12]

미래에는 MinION 원시 데이터가 DNA에서 많은 다른 후생유전학적 흔적을 검출하는 데 사용될 것으로 보인다.

PacBio 염기서열은 DNA 메틸화를 검출하는 데도 사용되었다. 이 플랫폼에서 형광등 펄스의 폭인 펄스 폭은 특정 베이스에 해당한다. 2010년에는 대조군 내 인터펄스 거리와 메틸화 시료 내에서의 거리가 다르고, 각 메틸화 유형별로 "신호" 펄스 폭이 있는 것으로 나타났다.[11] 2012년에는 PacBio 플랫폼을 사용하여 DNA 메틸전달효소의 결합 부위가 특징이었다.[13] 2015년 C Elegans에서 N6-methylation이 검출되었다.[14]배아줄기세포에서 PacBio 플랫폼을 이용한 N-아데닌에6 대한 DNA 메틸화가 2016년에 나타났다.[15]

중금속, 산화 또는 UV 손상으로 인한 다른 형태의 DNA 수정도 옥스포드 나노포어 및 PacBio 3세대 염기서열을 이용한 연구의 가능한 방법이다.

단점

MinION 원시 데이터에서는 중앙 신호에 대한 정규화와 같은 원시 데이터의 처리가 필요하여 기술의 실시간 성능이 저하되었다.[12] 전기 신호의 일관성은 여전히 문제가 되고 있어, 뉴클레오티드라고 정확히 부르기 어렵다. MinION은 처리량이 낮다. 중복 읽기는 여러 번 얻기 어렵기 때문에, 이것은 다운스트림 DNA 수정 검출의 정확성 문제로 이어진다. MinION 원시 데이터와 함께 사용되는 숨겨진 마르코프 모델과 통계적 방법 모두 탐지를 위한 DNA 수정의 반복적인 관찰을 요구하는데, 이는 개별 변형 뉴클레오티드가 여러 개의 게놈 복사본(예: 샘플의 여러 세포나 플라스미드)에 일관되게 존재해야 한다는 것을 의미한다.

PacBio 플랫폼의 경우에도 어떤 메틸화를 찾느냐에 따라 커버리지 니즈가 달라질 수 있다. 2017년 3월 현재 히스톤 수정과 같은 다른 후생유전적 요인은 3세대 기술을 사용하여 발견될 수 없다. 더 긴 메틸레이션 패턴은 종종 손실된다. 더 작은 콘티그들은 여전히 조립되어야 하기 때문이다.

성적 증명서

Transcriptomics는 주로 연구 중인 조직의 메신저 RNA 분자의 상대적 풍부함을 특징짓는 것으로서 transcriptom의 연구다. 분자생물학의 중심 도그마에 따르면, 유전자 정보는 이중 좌초된 DNA 분자에서 기능 단백질 분자로 쉽게 번역될 수 있는 단일 좌초된 mRNA 분자로 흐른다. 말단소립을 연구함으로써 유전자 표현의 규제에 대한 귀중한 통찰력을 얻을 수 있다.

유전자 수준과 같은 표현 수준은 2세대 염기서열로 다소 정확하게 묘사될 수 있지만, 대본 수준 정보는 여전히 중요한 과제로 남아 있다.[16] 그 결과, 분자생물학에서 대체적 스플리싱의 역할은 대부분 이해하기 어려운 상태로 남아있다. 3세대 시퀀싱 기술은 mRNA 분자의 전체 길이의 시퀀싱을 가능하게 함으로써 이 문제를 해결할 수 있는 유망한 가능성을 가지고 있다.

대체 스플라이싱

대체 스플리싱(AS)은 단일 유전자가 여러 개의 뚜렷한 mRNA 대본을 생성하여 결과적으로 다른 단백질 번역을 발생시키는 과정이다.[17] 일부 증거는 AS가 유비쿼터스 현상이며 특히 복잡한 진핵생물에서 유기체의 표현형을 결정하는데 핵심적인 역할을 할 수 있다고 시사한다; 모든 진핵생물은 AS를 겪을 수 있는 인트로 구성된 유전자를 포함하고 있다. 특히 인간 멀티 엑손 유전자의 95%에서 AS가 발생하는 것으로 추정됐다.[18] AS는 무수한 생물학적 과정에 영향을 미칠 수 있는 부인할 수 없는 잠재력을 가지고 있다. 이 분야에서 지식을 발전시키는 것은 일반적으로 생물학 연구에 중대한 영향을 미친다.

대본 재구성

현재 세대의 시퀀싱 기술은 단지 짧은 읽기만을 만들어내며, 구별되는 대본을 탐지하는 능력에 엄청난 제한을 두고 있다; 짧은 읽기는 결과적인 읽기 관찰을 야기할 수 있는 원래의 대본으로 역설계되어야 한다.[19] 이 작업은 대본에 걸쳐 매우 가변적인 표현 수준에 의해 더욱 복잡해지고, 결과적으로 유전자의 순서에 걸쳐 가변적인 읽기 커버에 의해 더욱 복잡해진다.[19] 또한, exon들은 개별적인 성적증명서들 사이에서 공유될 수 있으며, 명확한 추론은 본질적으로 불가능하게 한다.[17] 기존의 계산 방법은 여러 시퀀스 위치에서 짧은 읽기의 축적을 바탕으로 추론을 하며 가정을 단순화한다.[19] 커프스링크는 가능한 한 적은 수의 대본을 가지고 모든 읽기를 설명하려고 하면서 비논리적 접근법을 취한다.[20] 반면 스트링타이는 읽기를 조립하면서 동시에 대본적 여유도를 추정하려고 한다.[19] 이러한 방법들은 타당하기는 하지만, 실제 성적증명서를 항상 식별하는 것은 아닐 수 있다.

2008년에 발표된 한 연구는 기존의 25개의 서로 다른 대본 재구성 프로토콜을 조사했다.[16] 기존 방식은 상대적으로 전출자 개인의 검출 능력이 온전하지만 대본을 조립하는 데 약하다는 증거였다.[16] 이 추정치에 따르면, 선충 유전자의 경우 25개 프로토콜에 걸친 엑손 검출에 대한 평균 민감도는 80%이다.[16] 대조적으로 대본 식별 민감도는 65%로 감소한다. 인간의 경우, 이 연구는 엑손 검출 민감도가 평균 69%로 나타났으며 대본 검출 민감도는 평균 33%[16]에 불과했다고 보고했다. 다시 말해 인간에게 있어서 기존의 방법은 기존의 모든 성적증명서의 절반 이하를 식별할 수 있다.

3세대 시퀀싱 기술은 대본 수준의 mRNA 풍부성 추정뿐만 아니라 대본 검출 문제를 해결하는데 있어 유망한 가능성을 입증했다. 오류율이 높은 반면, 3세대 시퀀싱 기술은 훨씬 더 긴 읽기 길이를 생성할 수 있는 기능을 가지고 있다.[21] Pacific Bioscience는 iso-seq 플랫폼을 도입하여 mRNA 분자의 전체 길이를 시퀀싱할 것을 제안했다.[21] 옥스퍼드 나노포레도 비슷한 기술을 내놓을 것으로 예상된다. 오류율이 더 높은 문제는 추가 고품질 짧은 읽기를 통해 완화될 수 있다. 이 접근방식은 이전에 테스트를 거쳐 오류율을 3배 이상 감소시키는 것으로 보고되었다.[22]

메타게노믹스

메타게노믹스는 환경 샘플에서 직접 회수된 유전 물질을 분석하는 것이다.

이점

메타게노믹스에서 3세대 시퀀싱 기술의 가장 큰 장점은 2세대 기술과 비교한 시퀀싱 속도다. 효율적인 진단과 적시에 임상 조치를 할 수 있도록 임상 설정(즉, 병원체 식별)에서 시퀀싱 속도는 중요하다.

옥스퍼드 나노포어의 MinION은 2015년 복잡한 고배경 임상 샘플에서 병원체의 실시간 메타게놈 검출에 사용되었다.에볼라 바이러스(EBV) 판독은 데이터 획득 44초 만에 서열화됐다.[23] 판독치를 게놈에 균일하게 매핑하는 것이 있었다; 적어도 한 개의 판독치는 게놈의 88%에 매핑되었다. 1차 임상 샘플에서 직접 고정밀도(97~99% ID)에 가까운 바이러스 게놈의 염기서열 판독이 비교적 길다.[23]

미생물 공동체의 다양성 연구를 위한 일반적인 유전학적 표식은 16S 리보솜 RNA 유전자다. MinION과 PacBio의 SMRT 플랫폼 모두 이 유전자의 염기서열을 분석하기 위해 사용되었다.[24][25] 이러한 맥락에서 PacBio 오류율은 454 및 Illumina의 MiSeq 시퀀싱 플랫폼의 짧은 읽기 오류와 비교 가능하다.[citation needed]

단점

MinION의 높은 오류율(약 10~40%)은 단일 뉴클레오티드 분해능이 필요한 항균 저항 표지의 식별을 방해했다. 같은 이유로 진핵 병원균은 확인되지 않았다.[23] 동일한 플로우 셀을 재사용할 때(표준 워시 프로토콜이 작동하지 않음) 이월 오염의 용이성도 관심사다. 고유한 바코드는 더 많은 멀티플렉싱을 허용할 수 있다. 더욱이 박테리아, 곰팡이, 기생충에 대한 정확한 종별 식별을 수행하는 것은 매우 어려운 일이며, 게놈의 많은 부분을 공유하고 있으며, 일부 종은 <5% 정도밖에 차이가 나지 않는다.

베이스당 시퀀싱 비용은 여전히 MiSeq보다 상당히 많다. 그러나 생거 접근방식의 검출 한계 이하의 유기체에서 나오는 전체 길이의 시퀀스로 참조 데이터베이스를 보완하는 것은 메타게노믹스에서 유기체를 식별하는 데 큰 도움이 될 수 있다.[24]

참조

  1. ^ a b c Bleidorn, Christoph (2016-01-02). "Third generation sequencing: technology and its potential impact on evolutionary biodiversity research". Systematics and Biodiversity. 14 (1): 1–8. doi:10.1080/14772000.2015.1099575. ISSN 1477-2000. S2CID 85991118.
  2. ^ a b c Gupta, Pushpendra K. (2008-11-01). "Single-molecule DNA sequencing technologies for future genomics research". Trends in Biotechnology. 26 (11): 602–611. doi:10.1016/j.tibtech.2008.07.003. PMID 18722683.
  3. ^ Tham, Cheng Yong (2020-03-03). "NanoVar: accurate characterization of patients' genomic structural variants using low-depth nanopore sequencing". Genome Biology. 21 (Article number: 56). doi:10.1186/s13059-020-01968-7. PMC 7055087. PMID 32127024.
  4. ^ Check Hayden, Erika (2009-02-06). "Genome sequencing: the third generation". Nature News. 457 (7231): 768–769. doi:10.1038/news.2009.86. PMID 19212365.
  5. ^ a b c d e Simpson, Jared T.; Workman, Rachael; Zuzarte, Philip C.; David, Matei; Dursi, Lewis Jonathan; Timp, Winston (2016-04-04). "Detecting DNA Methylation using the Oxford Nanopore Technologies MinION sequencer". bioRxiv 10.1101/047142.
  6. ^ Schadt, E. E.; Turner, S.; Kasarskis, A. (2010-10-15). "A window into third-generation sequencing". Human Molecular Genetics. 19 (R2): R227–R240. doi:10.1093/hmg/ddq416. ISSN 0964-6906. PMID 20858600.
  7. ^ Li, Ruiqiang; Zhu, Hongmei; Ruan, Jue; Qian, Wubin; Fang, Xiaodong; Shi, Zhongbin; Li, Yingrui; Li, Shengting; Shan, Gao (2010-02-01). "De novo assembly of human genomes with massively parallel short read sequencing". Genome Research. 20 (2): 265–272. doi:10.1101/gr.097261.109. ISSN 1088-9051. PMC 2813482. PMID 20019144.
  8. ^ Chin, Chen-Shan; Alexander, David H.; Marks, Patrick; Klammer, Aaron A.; Drake, James; Heiner, Cheryl; Clum, Alicia; Copeland, Alex; Huddleston, John (2013-06-01). "Nonhybrid, finished microbial genome assemblies from long-read SMRT sequencing data". Nature Methods. 10 (6): 563–569. doi:10.1038/nmeth.2474. ISSN 1548-7091. PMID 23644548. S2CID 205421576.
  9. ^ Goodwin, Sara; Gurtowski, James; Ethe-Sayers, Scott; Deshpande, Panchajanya; Schatz, Michael C.; McCombie, W. Richard (2015-11-01). "Oxford Nanopore sequencing, hybrid error correction, and de novo assembly of a eukaryotic genome". Genome Research. 25 (11): 1750–1756. doi:10.1101/gr.191395.115. ISSN 1088-9051. PMC 4617970. PMID 26447147.
  10. ^ Fraser, Hunter B.; Lam, Lucia L.; Neumann, Sarah M.; Kobor, Michael S. (2012-02-09). "Population-specificity of human DNA methylation". Genome Biology. 13 (2): R8. doi:10.1186/gb-2012-13-2-r8. ISSN 1474-760X. PMC 3334571. PMID 22322129.
  11. ^ a b Flusberg, Benjamin A.; Webster, Dale R.; Lee, Jessica H.; Travers, Kevin J.; Olivares, Eric C.; Clark, Tyson A.; Korlach, Jonas; Turner, Stephen W. (2010-06-01). "Direct detection of DNA methylation during single-molecule, real-time sequencing". Nature Methods. 7 (6): 461–465. doi:10.1038/nmeth.1459. PMC 2879396. PMID 20453866.
  12. ^ a b c Stoiber, Marcus H.; Quick, Joshua; Egan, Rob; Lee, Ji Eun; Celniker, Susan E.; Neely, Robert; Loman, Nicholas; Pennacchio, Len; Brown, James B. (2016-12-15). "De novo Identification of DNA Modifications Enabled by Genome-Guided Nanopore Signal Processing". bioRxiv 10.1101/094672.
  13. ^ Clark, T. A.; Murray, I. A.; Morgan, R. D.; Kislyuk, A. O.; Spittle, K. E.; Boitano, M.; Fomenkov, A.; Roberts, R. J.; Korlach, J. (2012-02-01). "Characterization of DNA methyltransferase specificities using single-molecule, real-time DNA sequencing". Nucleic Acids Research. 40 (4): e29. doi:10.1093/nar/gkr1146. ISSN 0305-1048. PMC 3287169. PMID 22156058.
  14. ^ Greer, Eric Lieberman; Blanco, Mario Andres; Gu, Lei; Sendinc, Erdem; Liu, Jianzhao; Aristizábal-Corrales, David; Hsu, Chih-Hung; Aravind, L.; He, Chuan (2015). "DNA Methylation on N6-Adenine in C. elegans". Cell. 161 (4): 868–878. doi:10.1016/j.cell.2015.04.005. PMC 4427530. PMID 25936839.
  15. ^ Wu, Tao P.; Wang, Tao; Seetin, Matthew G.; Lai, Yongquan; Zhu, Shijia; Lin, Kaixuan; Liu, Yifei; Byrum, Stephanie D.; Mackintosh, Samuel G. (2016-04-21). "DNA methylation on N6-adenine in mammalian embryonic stem cells". Nature. 532 (7599): 329–333. Bibcode:2016Natur.532..329W. doi:10.1038/nature17640. ISSN 0028-0836. PMC 4977844. PMID 27027282.
  16. ^ a b c d e Steijger, Tamara; Abril, Josep F.; Engström, Pär G.; Kokocinski, Felix; The RGASP Consortium; Hubbard, Tim J.; Guigó, Roderic; Harrow, Jennifer; Bertone, Paul (2013-12-01). "Assessment of transcript reconstruction methods for RNA-seq". Nature Methods. 10 (12): 1177–1184. doi:10.1038/nmeth.2714. ISSN 1548-7091. PMC 3851240. PMID 24185837.
  17. ^ a b Graveley, Brenton R. (2001). "Alternative splicing: increasing diversity in the proteomic world". Trends in Genetics. 17 (2): 100–107. doi:10.1016/s0168-9525(00)02176-4. PMID 11173120.
  18. ^ Pan, Qun; Shai, Ofer; Lee, Leo J.; Frey, Brendan J.; Blencowe, Benjamin J. (2008-12-01). "Deep surveying of alternative splicing complexity in the human transcriptome by high-throughput sequencing". Nature Genetics. 40 (12): 1413–1415. doi:10.1038/ng.259. ISSN 1061-4036. PMID 18978789. S2CID 9228930.
  19. ^ a b c d Pertea, Mihaela; Pertea, Geo M.; Antonescu, Corina M.; Chang, Tsung-Cheng; Mendell, Joshua T.; Salzberg, Steven L. (2015-03-01). "StringTie enables improved reconstruction of a transcriptome from RNA-seq reads". Nature Biotechnology. 33 (3): 290–295. doi:10.1038/nbt.3122. ISSN 1087-0156. PMC 4643835. PMID 25690850.
  20. ^ Trapnell, Cole; Williams, Brian A.; Pertea, Geo; Mortazavi, Ali; Kwan, Gordon; van Baren, Marijke J.; Salzberg, Steven L.; Wold, Barbara J.; Pachter, Lior (2010-05-01). "Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation". Nature Biotechnology. 28 (5): 511–515. doi:10.1038/nbt.1621. ISSN 1087-0156. PMC 3146043. PMID 20436464.
  21. ^ a b Abdel-Ghany, Salah E.; Hamilton, Michael; Jacobi, Jennifer L.; Ngam, Peter; Devitt, Nicholas; Schilkey, Faye; Ben-Hur, Asa; Reddy, Anireddy S. N. (2016-06-24). "A survey of the sorghum transcriptome using single-molecule long reads". Nature Communications. 7: 11706. Bibcode:2016NatCo...711706A. doi:10.1038/ncomms11706. ISSN 2041-1723. PMC 4931028. PMID 27339290.
  22. ^ Au, Kin Fai; Underwood, Jason G.; Lee, Lawrence; Wong, Wing Hung (2012-10-04). "Improving PacBio Long Read Accuracy by Short Read Alignment". PLOS ONE. 7 (10): e46679. Bibcode:2012PLoSO...746679A. doi:10.1371/journal.pone.0046679. ISSN 1932-6203. PMC 3464235. PMID 23056399.
  23. ^ a b c Greninger, Alexander L.; Naccache, Samia N.; Federman, Scot; Yu, Guixia; Mbala, Placide; Bres, Vanessa; Stryke, Doug; Bouquet, Jerome; Somasekar, Sneha (2015-01-01). "Rapid metagenomic identification of viral pathogens in clinical samples by real-time nanopore sequencing analysis". Genome Medicine. 7: 99. doi:10.1186/s13073-015-0220-9. ISSN 1756-994X. PMC 4587849. PMID 26416663.
  24. ^ a b Schloss, Patrick D.; Jenior, Matthew L.; Koumpouras, Charles C.; Westcott, Sarah L.; Highlander, Sarah K. (2016-01-01). "Sequencing 16S rRNA gene fragments using the PacBio SMRT DNA sequencing system". PeerJ. 4: e1869. doi:10.7717/peerj.1869. PMC 4824876. PMID 27069806.
  25. ^ Benítez-Páez, Alfonso; Portune, Kevin J.; Sanz, Yolanda (2016-01-01). "Species-level resolution of 16S rRNA gene amplicons sequenced through the MinION™ portable nanopore sequencer". GigaScience. 5: 4. doi:10.1186/s13742-016-0111-z. ISSN 2047-217X. PMC 4730766. PMID 26823973.