적용 범위(유전자)
Coverage (genetics)DNA 염기서열의 탐지 범위(또는 깊이)는 재구성된 염기서열에서 주어진 뉴클레오티드를 포함하는 고유 판독치의 수입니다.[1][2] 딥 시퀀싱은 시퀀스의 각 영역에 대해 고유 판독 횟수가 많은 것을 목표로 하는 일반적인 개념을 말한다.[3]
이론적 근거
각 개개의 뉴클레오티드에 대한 염기서열 정확도가 매우 높지만, 게놈에서 뉴클레오티드가 매우 많다는 것은 개별 게놈의 염기서열 분석을 한 번만 하면 상당한 수의 염기서열 오류가 발생한다는 것을 의미한다. 게다가, 게놈의 많은 위치에는 희귀한 단일 뉴클레오티드 다형성(SNP)이 포함되어 있다. 따라서 시퀀싱 오류와 진정한 SNP를 구별하기 위해서는 개별 게놈을 대량으로 시퀀싱하여 시퀀싱 정확도를 더욱 높일 필요가 있다.
극심 시퀀싱
"초심층"이라는 용어는 혼합 모집단에서 시퀀스 변형을 탐지할 수 있는 더 높은 범위(>100배)를 가리킬 수도 있다.[4][5][6] 극단적으로, Maximum-Depth Sequenceing과 같은 오류 수정 시퀀싱 접근방식은 주어진 영역의 적용범위가 시퀀싱 머신의 처리량에 접근하여 10^8의 커버리지를 허용하도록 만들 수 있다.[7]
성적순서순서
RNA-Seq라고도 알려진 대본체의 심층 시퀀싱은 특정 세포 유형, 조직 또는 장기에서 특정 시간에 존재하는 RNA 분자의 시퀀스와 빈도를 모두 제공한다.[8] 개별 유전자에 의해 암호화된 mRNA의 수를 세면 표현형의 주요 원인이 되는 단백질 코딩 잠재력의 지표가 된다.[9] RNA 염기서열을 위한 방법 개선은 실험 방법과 계산 방법의 측면에서 모두 연구의 활성 영역이다.[10]
계산
전체 게놈의 평균 적용범위는 원본 게놈의 길이(G), 판독 횟수(N), 평균 판독 길이(L)를 로 계산할 수 있다 예를 들어 평균 길이 500 뉴클레오티드의 8개 판독에서 2,000개의 염기쌍을 재구성하는 가상 게놈은 2배의 붉은색을 띠게 된다.팔리지 않는 또한 이 매개변수는 판독으로 덮인 게놈의 백분율과 같은 다른 양을 추정할 수 있게 한다(때로는 범위 폭이라고도 함). 염기 호출과 조립의 오류를 극복할 수 있기 때문에 샷건 시퀀싱에서 높은 커버리지가 필요하다. DNA 염기서열 이론의 주제는 그러한 양의 관계를 다룬다.[2]
물리적 커버리지
때로는 시퀀스 커버리지와 물리적 커버리지 사이에서 구별된다. 여기서 시퀀스 적용 범위는 평균 베이스 읽기 횟수를 말하며, 물리적 적용 범위는 평균 베이스 읽기 또는 짝을 이룬 읽기 횟수를 의미한다.[2][11][12]
참조
- ^ "Sequencing Coverage". illumina.com. Illumina education. Retrieved 2020-10-08.
- ^ a b c Sims, David; Sudbery, Ian; Ilott, Nicholas E.; Heger, Andreas; Ponting, Chris P. (2014). "Sequencing depth and coverage: key considerations in genomic analyses". Nature Reviews Genetics. 15 (2): 121–132. doi:10.1038/nrg3642. PMID 24434847. S2CID 13325739.
- ^ Mardis, Elaine R. (2008-09-01). "Next-Generation DNA Sequencing Methods". Annual Review of Genomics and Human Genetics. 9 (1): 387–402. doi:10.1146/annurev.genom.9.081307.164359. ISSN 1527-8204. PMID 18576944.
- ^ Ajay SS, Parker SC, Abaan HO, Fajardo KV, Margulies EH (September 2011). "Accurate and comprehensive sequencing of personal genomes". Genome Res. 21 (9): 1498–505. doi:10.1101/gr.123638.111. PMC 3166834. PMID 21771779.
- ^ Mirebrahim, Hamid; Close, Timothy J.; Lonardi, Stefano (2015-06-15). "De novo meta-assembly of ultra-deep sequencing data". Bioinformatics. 31 (12): i9–i16. doi:10.1093/bioinformatics/btv226. ISSN 1367-4803. PMC 4765875. PMID 26072514.
- ^ Beerenwinkel, Niko; Zagordi, Osvaldo (2011-11-01). "Ultra-deep sequencing for the analysis of viral populations". Current Opinion in Virology. 1 (5): 413–418. doi:10.1016/j.coviro.2011.07.008. PMID 22440844.
- ^ Jee, J.; Rasouly, A.; Shamovsky, I.; Akivis, Y.; Steinman, S.; Mishra, B.; Nudler, E. (2016). "Rates and mechanisms of bacterial mutagenesis from maximum-depth sequencing". Nature. 534 (7609): 693–696. Bibcode:2016Natur.534..693J. doi:10.1038/nature18313. PMC 4940094. PMID 27338792.
- ^ Malone, John H.; Oliver, Brian (2011-01-01). "Microarrays, deep sequencing and the true measure of the transcriptome". BMC Biology. 9: 34. doi:10.1186/1741-7007-9-34. ISSN 1741-7007. PMC 3104486. PMID 21627854.
- ^ Hampton M, Melvin RG, Kendall AH, Kirkpatrick BR, Peterson N, Andrews MT (2011). "Deep sequencing the transcriptome reveals seasonal adaptive mechanisms in a hibernating mammal". PLOS ONE. 6 (10): e27021. Bibcode:2011PLoSO...627021H. doi:10.1371/journal.pone.0027021. PMC 3203946. PMID 22046435.
- ^ Heyer EE, Ozadam H, Ricci EP, Cenik C, Moore MJ (2015). "An optimized kit-free method for making strand-specific deep sequencing libraries from RNA fragments". Nucleic Acids Res. 43 (1): e2. doi:10.1093/nar/gku1235. PMC 4288154. PMID 25505164.
- ^ Meyerson, M.; Gabriel, S.; Getz, G. (2010). "Advances in understanding cancer genomes through second-generation sequencing". Nature Reviews Genetics. 11 (10): 685–696. doi:10.1038/nrg2841. PMID 20847746. S2CID 2544266.
- ^ Ekblom, Robert; Wolf, Jochen B. W. (2014). "A field guide to whole‐genome sequencing, assembly and annotation". Evolutionary Applications. 7 (9): 1026–42. doi:10.1111/eva.12178. PMC 4231593. PMID 25553065.