게놈 프로젝트

Genome project
인쇄될 때, 인간 게놈 배열은 100권의 밀착 인쇄된 거대한 책을 채운다.

게놈 프로젝트는 궁극적으로 생물(동물, 식물, 곰팡이, 박테리아, 고대인, 원시인 또는 바이러스)의 완전한 게놈 서열을 결정하고 단백질 코드 유전자와 다른 중요한 게놈 인코딩 [1]특징에 주석을 다는 것을 목표로 하는 과학적 노력입니다.유기체의 게놈 배열은 유기체의 각 염색체의 집단 DNA 배열을 포함한다.단일 염색체를 가진 박테리아에 대해 게놈 프로젝트는 그 염색체의 염기서열을 지도화하는 것을 목표로 할 것이다.게놈이 22쌍의 자동 염색체와 2개의 성 염색체를 포함하는 인간의 경우, 완전한 게놈 배열은 46개의 분리된 염색체 배열과 관련될 것이다.

Human Genome Project는 이미 생명과학 전반에 걸친 연구에 큰 영향을 미치고 있는 획기적인 게놈 프로젝트였으며, 수많은 의학 및 상업적인 [2]발전을 촉진할 수 있는 잠재력을 가지고 있습니다.

게놈 조립체

게놈 조립은 짧은 DNA 염기서열을 많이 가져다가 DNA가 유래한 원래의 염색체를 표현하기 위해 그것들을 다시 합치는 과정을 말한다.산탄총 염기서열 분석 프로젝트에서는, 한 소스의 모든 DNA가 먼저 수백만 개의 작은 조각으로 쪼개진다.이 조각들은 한 번에 최대 1000개의 뉴클레오티드 또는 염기를 읽을 수 있는 자동화된 염기서열 분석 기계에 의해 "읽기"됩니다.(아데닌, 구아닌, 시토신, 티민 등 4가지 염기가 AGCT로 나타난다.)게놈 조립 알고리즘은 모든 조각들을 서로 정렬하고, 짧은 두 개의 배열이나 읽기가 겹치는 모든 곳을 감지함으로써 작동합니다.이러한 중복된 읽기는 병합할 수 있으며 프로세스는 계속됩니다.

게놈 조립은 매우 어려운 계산 문제이며, 많은 게놈이 반복으로 알려진 동일한 배열의 많은 수를 포함하고 있기 때문에 더욱 어렵게 됩니다.이러한 반복은 수천 개의 뉴클레오티드의 길이가 될 수 있고, 어떤 것들은 수천 개의 다른 장소에서, 특히 식물과 동물의 큰 게놈에서 발생합니다.

결과(초안) 게놈 배열은 정보 배열된 콘티그들을 결합하고 연결 정보를 사용하여 발판을 생성함으로써 생산된다.비계는 "황금 경로"를 만드는 염색체의 물리적 지도를 따라 배치됩니다.

어셈블리 소프트웨어

원래, 대부분의 대규모 DNA 염기서열 분석 센터는 그들이 생산한 염기서열을 조립하기 위한 자체 소프트웨어를 개발했습니다.그러나 소프트웨어가 점점 복잡해지고 시퀀싱 센터의 수가 증가함에 따라 이는 변화했습니다.BGI가 인간 크기의 게놈의 de novo assembly, 얼라인먼트, SNP 검출, 재시퀀싱, 불순물 발견, 구조적 변이 [3][4][5]분석을 위해 개발한 이러한 조립자 Short Olygonucleotide Analysis Package의 예.

게놈 주석

1980년대 이후 분자생물학과 생물정보학은 DNA 주석의 필요성을 만들어냈다.DNA 주석 또는 게놈 주석은 생물학적 정보를 배열에 붙이는 것을 확인하는 과정이며, 특히 유전자의 위치를 확인하고 유전자가 무엇을 하는지 결정하는 과정이다.

완료 시기

게놈을 배열할 때, 일반적으로 배열하기 어려운 영역(종종 DNA가 매우 반복적인 영역)이 있습니다.따라서, '완성된' 게놈 배열은 거의 완전하지 않으며, '작업 초안'이나 '본질적으로 완전한'과 같은 용어들이 그러한 게놈 프로젝트의 상태를 더 정확하게 묘사하기 위해 사용되어 왔다.DNA 염기서열의 모든 염기쌍이 결정되었다고 해도, DNA 염기서열이 완전히 정확한 과정이 아니기 때문에 여전히 오류가 존재할 가능성이 있다.또한 완전한 게놈 프로젝트는 미토콘드리아엽록체의 염기서열을 포함해야 한다고 주장할 수 있다. 이 세포들은 그들만의 게놈을 가지고 있기 때문이다.

게놈 배열의 목적은 특정 게놈 배열의 완전한 유전자 세트에 대한 정보를 얻는 것이라고 종종 보고되고 있다.유전자를 암호화하는 게놈의 비율은 매우 작을 수 있다.그러나 코딩 영역만 따로 배열하는 것이 항상 가능한(또는 바람직한 것은 아닙니다.또한, 과학자들이 이 암호화되지 않은 DNA의 역할에 대해 더 많이 이해함에 따라, 주어진 유기체의 유전학과 생물학을 이해하는 배경으로서 완전한 게놈 서열을 갖는 것이 더 중요해질 것입니다.

많은 면에서 게놈 프로젝트는 유기체의 DNA 염기서열을 결정하는 것에 그치지 않는다.이러한 프로젝트에는 유전자가 게놈의 어디에 있는지, 그리고 그 유전자들이 무엇을 하는지 알아내기 위한 유전자 예측도 포함될 수 있다.또한 유전자가 실제로 어디에 있는지 알아내는 데 도움을 주기 위해 EST나 mRNA의 염기서열을 결정하는 관련 프로젝트도 있을 수 있다.

역사적 및 기술적 관점

역사적으로, 진핵생물 게놈의 염기서열을 분석할 때, 먼저 게놈 전체의 일련의 랜드마크를 제공하기 위해 게놈을 매핑하는 것이 일반적이었다.염색체의 염기서열을 한 번에 배열하는 것이 아니라, 한 조각 한 조각씩 배열할 것이다.테크놀로지의 변화, 특히 컴퓨터의 처리능력의 향상은 게놈을 한 번에 '샷건 배열'할 수 있음을 의미합니다(기존 접근법에 비해 이 접근법에는 주의사항이 있습니다).

DNA 염기서열 분석 기술의 발전으로 새로운 게놈 염기서열 분석 비용이 꾸준히 감소했으며, 새로운 기술은 게놈 염기서열 분석 속도를 훨씬 더 빠르게 할 수 있게 되었습니다.

연구기관들이 어떤 새로운 게놈을 배열할지를 결정할 때, 모델 유기체로서 매우 중요하거나 인간의 건강과 관련이 있는 종(예: 병원성 박테리아 또는 모기 같은 질병의 매개체) 또는 상업적 중요성을 지닌 종(예: 가축과 작물 식물)에 중점을 두고 있다.2차적인 강조는 게놈이 분자 진화의 중요한 질문에 답하는 데 도움이 되는 종(: 일반적인 침팬지)에 있다.

미래에는 게놈 배열이 훨씬 더 저렴해지고 빨라질 것 같다.이것은 완전한 게놈 배열을 같은 종의 많은 다른 개체로부터 결정할 수 있게 해줄 것이다.인간의 경우, 이것은 우리가 인간의 유전적 다양성의 측면을 더 잘 이해할 수 있게 해줄 것이다.

L1 Dominette 01449, 소 게놈 프로젝트 대상인 Hereford
자이언트 세쿼이아 게놈 배열은 세쿼이아/킹스캐니언 국립공원에 있는 1,360년 된 나무에서 수확한 수정 씨앗에서 추출되었습니다.

다음과 같은 많은 유기체가 게놈 프로젝트를 완료했거나 곧 완료할 예정입니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ Pevsner, Jonathan (2009). Bioinformatics and functional genomics (2nd ed.). Hoboken, N.J: Wiley-Blackwell. ISBN 9780470085851.
  2. ^ "Potential Benefits of Human Genome Project Research". Department of Energy, Human Genome Project Information. 2009-10-09. Archived from the original on 2013-07-08. Retrieved 2010-06-18.
  3. ^ Li R, Zhu H, Ruan J, Qian W, Fang X, Shi Z, Li Y, Li S, Shan G, Kristiansen K, Li S, Yang H, Wang J, Wang J (February 2010). "De novo assembly of human genomes with massively parallel short read sequencing". Genome Research. 20 (2): 265–272. doi:10.1101/gr.097261.109. ISSN 1549-5469. PMC 2813482. PMID 20019144.
  4. ^ a b Rasmussen M, Li Y, Lindgreen S, Pedersen JS, Albrechtsen A, Moltke I, Metspalu M, Metspalu E, Kivisild T, Gupta R, Bertalan M, Nielsen K, Gilbert MT, Wang Y, Raghavan M, Campos PF, Kamp HM, Wilson AS, Gledhill A, Tridico S, Bunce M, Lorenzen ED, Binladen J, Guo X, Zhao J, Zhang X, Zhang H, Li Z, Chen M, Orlando L, Kristiansen K, Bak M, Tommerup N, Bendixen C, Pierre TL, Grønnow B, Meldgaard M, Andreasen C, Fedorova SA, Osipova LP, Higham TF, Ramsey CB, Hansen TV, Nielsen FC, Crawford MH, Brunak S, Sicheritz-Pontén T, Villems R, Nielsen R, Krogh A, Wang J, Willerslev E (2010-02-11). "Ancient human genome sequence of an extinct Palaeo-Eskimo". Nature. 463 (7282): 757–762. Bibcode:2010Natur.463..757R. doi:10.1038/nature08835. ISSN 1476-4687. PMC 3951495. PMID 20148029.
  5. ^ Wang J, Wang W, Li R, Li Y, Tian G, Goodman L, Fan W, Zhang J, Li J, Zhang J, Guo Y, Feng B, Li H, Lu Y, Fang X, Liang H, Du Z, Li D, Zhao Y, Hu Y, Yang Z, Zheng H, Hellmann I, Inouye M, Pool J, Yi X, Zhao J, Duan J, Zhou Y, Qin J, Ma L, Li G, Yang Z, Zhang G, Yang B, Yu C, Liang F, Li W, Li S, Li D, Ni P, Ruan J, Li Q, Zhu H, Liu D, Lu Z, Li N, Guo G, Zhang J, Ye J, Fang L, Hao Q, Chen Q, Liang Y, Su Y, San A, Ping C, Yang S, Chen F, Li L, Zhou K, Zheng H, Ren Y, Yang L, Gao Y, Yang G, Li Z, Feng X, Kristiansen K, Wong GK, Nielsen R, Durbin R, Bolund L, Zhang X, Li S, Yang H, Wang J (2008-11-06). "The diploid genome sequence of an Asian individual". Nature. 456 (7218): 60–65. Bibcode:2008Natur.456...60W. doi:10.1038/nature07484. ISSN 0028-0836. PMC 2716080. PMID 18987735.
  6. ^ Ghosh, Pallab (23 April 2015). "Mammoth genome sequence completed". BBC News.
  7. ^ Yates, Diana (2009-04-23). "What makes a cow a cow? Genome sequence sheds light on ruminant evolution" (Press Release). EurekAlert!. Retrieved 2012-12-22.
  8. ^ Elsik, C. G.; Elsik, R. L.; Tellam, K. C.; Worley, R. A.; Gibbs, D. M.; Muzny, G. M.; Weinstock, D. L.; Adelson, E. E.; Eichler, L.; Elnitski, R.; Guigó, D. L.; Hamernik, S. M.; Kappes, H. A.; Lewin, D. J.; Lynn, F. W.; Nicholas, A.; Reymond, M.; Rijnkels, L. C.; Skow, E. M.; Zdobnov, L.; Schook, J.; Womack, T.; Alioto, S. E.; Antonarakis, A.; Astashyn, C. E.; Chapple, H. -C.; Chen, J.; Chrast, F.; Câmara, O.; et al. (2009). "The Genome Sequence of Taurine Cattle: A Window to Ruminant Biology and Evolution". Science. 324 (5926): 522–528. Bibcode:2009Sci...324..522A. doi:10.1126/science.1169588. PMC 2943200. PMID 19390049.
  9. ^ "2007 Release: Horse Genome Assembled". National Human Genome Research Institute (NHGRI). Retrieved 19 April 2018.
  10. ^ Scott, Alison D; Zimin, Aleksey V; Puiu, Daniela; Workman, Rachael; Britton, Monica; Zaman, Sumaira; Caballero, Madison; Read, Andrew C; Bogdanove, Adam J; Burns, Emily; Wegrzyn, Jill; Timp, Winston; Salzberg, Steven L; Neale, David B (November 1, 2020). "A Reference Genome Sequence for Giant Sequoia". G3: Genes, Genomes, Genetics. 10 (11): 3907–3919. doi:10.1534/g3.120.401612. PMC 7642918. PMID 32948606.

외부 링크