GC 콘텐츠

GC-content
AT와 GC 쌍을 나타내는 뉴클레오티드 결합.화살표는 수소 결합을 가리킵니다.

분자생물학과 유전학에서 GC-함유량(또는 구아닌-시토신 함량)은 구아닌(G) 또는 시토신(C)[1]인 DNA 또는 RNA 분자의 질소 염기의 백분율이다.이 척도는 DNA의 아데닌티민, RNA의 아데닌과 유라실을 포함한 암시된 4가지 총 염기 중 G 및 C 염기의 비율을 나타낸다.

GC 함량은 DNA 또는 RNA의 특정 조각 또는 전체 게놈에 대해 제공될 수 있다.단편을 참조할 때, 개별 유전자 또는 유전자(도메인), 유전자 그룹 또는 유전자 클러스터, 비부호화 영역 또는 프라이머와 같은 합성 올리고뉴클레오티드의 GC 함유량을 나타낼 수 있다.

구조.

질적으로 구아닌(G)과 시토신(C)은 서로 특정한 수소 결합을 거치고, 아데닌(A)은 DNA의 티민(T)과 RNA의 우라실(U)과 특이적으로 결합하며, 정량적으로 각 GC 염기쌍은 3개의 수소 결합으로 결합하고, AU 염기쌍은 2개의 수소 결합으로 결합한다.이 차이를 강조하기 위해 베이스 쌍은 종종 "GcC" 대 "A=T" 또는 "A=U"로 표현된다.

GC 함량이 낮은 DNA는 GC 함량이 높은 DNA보다 안정성이 떨어지지만, 수소 결합 자체는 분자 안정성에 특별히 큰 영향을 미치지 않으며, 대신 주로 염기 [2]쌓기의 분자 상호작용에 의해 발생한다.GC 함량이 높은 핵산에는 높은 내열성이 부여되어 있지만, GC 함량이 높은 DNA를 가진 세균의 적어도 일부 종은 보다 쉽게 자가분해를 일으켜 세포 [3]자체의 수명을 단축하는 것이 관찰되었다.GC 쌍의 내열성 때문에 한때 높은 GC 함량이 고온에 대한 적응이 필요하다고 추정되었지만,[4] 2001년에 이 가설이 반박되었다.그럼에도 불구하고, 더 높은 온도에서 원핵생물의 최적 성장과 리보솜 RNA, 전달 RNA 및 많은 다른 비코드 RNA[4][5]같은 구조 RNA의 GC 함량 사이에는 강한 상관관계가 있는 것으로 나타났다.AU 염기쌍은 GC 염기쌍보다 안정성이 떨어져 GC 함량이 높은 RNA 구조가 고온의 영향을 더 잘 견딜 수 있습니다.

최근 이중가닥 핵산의 열 안정성에 기여하는 가장 중요한 인자는 실제로 염기 사이의 수소 결합 수보다 인접한 염기의 염기 축적에 기인한다는 것이 입증되었다.외부 순환 그룹의 상대적 위치 때문에 AT 또는 AU 쌍보다 GC 쌍에 더 유리한 적층 에너지가 있습니다.또한 염기가 쌓이는 순서와 분자 전체의 [6]열안정성 사이에는 상관관계가 있다.

결정.

GC-content는 보통 백분율 값으로 표현되지만 비율(G+C 비율 또는 GC 비율이라고 함)로 표현될 수 있습니다.GC 콘텐츠의 퍼센티지는 다음과 같이 계산됩니다[7].

AT/GC 비율은 다음과 같이 계산됩니다[8].

+ + { { A + T { G + C )

GC 비율뿐만 아니라 GC 함량 백분율도 여러 가지 방법으로 측정할 수 있지만, 가장 간단한 방법 중 하나는 분광 광도법사용하여 DNA 이중 나선의 용해 온도를 측정하는 것입니다.260 nm의 파장에서 DNA의 흡광도는 충분히 [9]가열되었을 때 이중 가닥 DNA 분자가 두 개의 단일 가닥으로 분리될 때 상당히 급격히 증가한다.GC 비율을 결정하는 데 가장 일반적으로 사용되는 프로토콜은 대량의 [10]검체에 대해 흐름 세포 측정법을 사용합니다.

또 다른 방법으로 조사 대상 DNA 또는 RNA 분자가 신뢰성 있게 배열되어 있는 경우, GC 함량은 간단한 산술 또는 무료 온라인 GC 계산기 등의 다양한 공개 가능한 소프트웨어 도구를 사용하여 정확하게 계산할 수 있다.

게놈 콘텐츠

유전자 내 변동

게놈 내의 GC 비율은 현저하게 변동하는 것으로 밝혀졌다.보다 복잡한 유기체의 게놈 내에서의 GC 비율의 변화는 Isocore라고 [11]불리는 섬 영역과 모자이크 같은 형성을 초래합니다.이것은 [12]염색체의 염색 강도의 변화를 가져온다.GC가 풍부한 아이소코어는 전형적으로 그 안에 많은 단백질 코드 유전자를 포함하고 있으며, 따라서 이러한 특정 영역의 GC 비율 결정은 [13][14]게놈의 유전자가 풍부한 영역을 매핑하는 데 기여한다.

코드화 시퀀스

게놈 배열의 긴 영역 내에서 유전자는 게놈 전체의 백그라운드 GC 함량과 비교하여 높은 GC 함량을 갖는 것이 특징이다.유전자 코드 영역의 길이와 GC 비율의 증거는 코드 배열의 길이가 높은 G+C [15]함량에 정비례한다는 것을 보여주었다.이는 정지 코돈이 A와 T 뉴클레오티드에 치우침이 있어 배열이 짧을수록 AT [16]치우침이 높다는 사실을 지적해왔다.

포유류에서 1,000개 이상의 직교 유전자를 비교한 결과, 30% 미만에서 80% [17]이상 범위로 번째 코돈 위치 GC 함량의 유전자 내 변화가 두드러졌다.

유전자간 변이

GC 함량은 선택, 돌연변이 편향 및 편향된 재조합 관련 DNA [18]수복에 의해 기여될 것으로 예상되는 다른 유기체에 따라 가변적인 것으로 밝혀졌다.

인간 게놈의 평균 GC 함량은 100-Kb 조각에 걸쳐 35%에서 60%이며, 평균은 41%[19]이다.효모(Saccharomyces cerevisiae)의 GC 함량은 38%[20]이며, 또 다른 일반적인 모델 생물인 Thale cress(Arabidopsis taliana)의 GC 함량은 36%[21]이다.유전자 코드의 특성상 GC 함량이 0% 또는 100%에 육박하는 게놈을 갖는 것은 사실상 불가능하다.단, GC 함량이 극히 낮은 종은 Plasmodium falciparum(GC% = ~20%)[22]이며, 일반적으로 GC [23]부족 대신 AT가 풍부한 것으로 언급된다.

몇몇 포유류 종(예: 랫드, 마이크로배트, 텐렉, 토끼)은 독립적으로 유전자의 GC 함량이 현저하게 증가했다.이러한 GC 함량 변화는 종의 생명력 특성(예: 체질량 또는 수명) 및 게놈 [17]크기와 관련이 있으며, GC 편향 유전자 [24]변환이라고 불리는 분자 현상과 관련이 있을 수 있다.

적용들

분자생물학

중합효소 연쇄반응(PCR) 실험에서 프라이머로 알려진 짧은 올리고뉴클레오티드의 GC 함량은 종종 템플릿 DNA에 대한 아닐 온도를 예측하기 위해 사용됩니다.GC 함량 레벨이 높을수록 용해 온도가 상대적으로 높다는 것을 나타냅니다.

Illumina 시퀀싱과 같은 많은 시퀀스 기술에서는 GC 함량이 높은 시퀀스를 읽는 데 문제가 있습니다.조류 게놈은 그러한 많은 부분을 가지고 있는 것으로 알려져 있으며, 진화와 표현형으로부터 존재할 것으로 예상되지만 개선된 방법이 [25]사용될 때까지 배열되지 않는 "유전자 누락" 문제를 야기한다.

계통학

비핵종 분류법의 종 문제는 박테리아 분류에 다양한 제안을 이끌어냈고, 1987년 박테리아 체계학에 대한 접근법의 일치에 관한 특별 위원회는 높은 수준의 계층 [26]분류에 GC 비율을 사용할 것을 권고했다.예를 들어, 방선균은 "GC 함량이 높은 박테리아"[27]로 특징지어진다.스트렙토미세스 실리카르 A3(2)에서 GC 함량은 72%[28]이다.보다 신뢰할 수 있고 현대적인 분자 체계학 방법의 사용으로 방선균의 GC 함량 정의는 폐지되었고 이 분지의 GC 함량이 [29]낮은 박테리아가 발견되었다.

소프트웨어 도구

GCSpecies(GCSpecies)Sorter와[30] TopSort는[31] GC 함량에 따라 종을 분류하는 소프트웨어 도구입니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ GC의 정의– 뉴캐슬 대학의 CancerWeb 콘텐츠영국
  2. ^ Yakovchuk P, Protozanova E, Frank-Kamenetskii MD (2006). "Base-stacking and base-pairing contributions into thermal stability of the DNA double helix". Nucleic Acids Res. 34 (2): 564–74. doi:10.1093/nar/gkj454. PMC 1360284. PMID 16449200.
  3. ^ Levin RE, Van Sickle C (1976). "Autolysis of high-GC isolates of Pseudomonas putrefaciens". Antonie van Leeuwenhoek. 42 (1–2): 145–55. doi:10.1007/BF00399459. PMID 7999. S2CID 9960732.
  4. ^ a b Hurst LD, Merchant AR (March 2001). "High guanine-cytosine content is not an adaptation to high temperature: a comparative analysis amongst prokaryotes". Proc. Biol. Sci. 268 (1466): 493–7. doi:10.1098/rspb.2000.1397. PMC 1088632. PMID 11296861.
  5. ^ Galtier, N.; Lobry, J.R. (1997). "Relationships between genomic G+C content, RNA secondary structures, and optimal growth temperature in Prokaryotes". Journal of Molecular Evolution. 44 (6): 632–636. Bibcode:1997JMolE..44..632G. doi:10.1007/PL00006186. PMID 9169555. S2CID 19054315.
  6. ^ Yakovchuk, Peter; Protozanova, Ekaterina; Frank-Kamenetskii, Maxim D. (2006). "Base-stacking and base-pairing contributions into thermal stability of the DNA double helix". Nucleic Acids Research. 34 (2): 564–574. doi:10.1093/nar/gkj454. ISSN 0305-1048. PMC 1360284. PMID 16449200.
  7. ^ Madigan,MT. and Martinko JM. (2003). Brock biology of microorganisms (10th ed.). Pearson-Prentice Hall. ISBN 978-84-205-3679-8.
  8. ^ 미국 노스웨스턴 대학교, IL, GC 비율의 정의
  9. ^ Wilhelm J, Pingoud A, Hahn M (May 2003). "Real-time PCR-based method for the estimation of genome sizes". Nucleic Acids Res. 31 (10): e56. doi:10.1093/nar/gng056. PMC 156059. PMID 12736322.
  10. ^ Vinogradov AE (May 1994). "Measurement by flow cytometry of genomic AT/GC ratio and genome size". Cytometry. 16 (1): 34–40. doi:10.1002/cyto.990160106. PMID 7518377.
  11. ^ Bernardi G (January 2000). "Isochores and the evolutionary genomics of vertebrates". Gene. 241 (1): 3–17. doi:10.1016/S0378-1119(99)00485-0. PMID 10607893.
  12. ^ Furey TS, Haussler D (May 2003). "Integration of the cytogenetic map with the draft human genome sequence". Hum. Mol. Genet. 12 (9): 1037–44. doi:10.1093/hmg/ddg113. PMID 12700172.
  13. ^ Sumner AT, de la Torre J, Stuppia L (August 1993). "The distribution of genes on chromosomes: a cytological approach". J. Mol. Evol. 37 (2): 117–22. Bibcode:1993JMolE..37..117S. doi:10.1007/BF02407346. PMID 8411200. S2CID 24677431.
  14. ^ Aïssani B, Bernardi G (October 1991). "CpG islands, genes and isochores in the genomes of vertebrates". Gene. 106 (2): 185–95. doi:10.1016/0378-1119(91)90198-K. PMID 1937049.
  15. ^ Pozzoli U, Menozzi G, Fumagalli M, et al. (2008). "Both selective and neutral processes drive GC content evolution in the human genome". BMC Evol. Biol. 8: 99. doi:10.1186/1471-2148-8-99. PMC 2292697. PMID 18371205.
  16. ^ Wuitschick JD, Karrer KM (1999). "Analysis of genomic G + C content, codon usage, initiator codon context and translation termination sites in Tetrahymena thermophila". J. Eukaryot. Microbiol. 46 (3): 239–47. doi:10.1111/j.1550-7408.1999.tb05120.x. PMID 10377985. S2CID 28836138.
  17. ^ a b Romiguier, Jonathan; Ranwez, Vincent; Douzery, Emmanuel J. P.; Galtier, Nicolas (1 August 2010). "Contrasting GC-content dynamics across 33 mammalian genomes: Relationship with life-history traits and chromosome sizes". Genome Research. 20 (8): 1001–1009. doi:10.1101/gr.104372.109. ISSN 1088-9051. PMC 2909565. PMID 20530252.
  18. ^ Birdsell JA (1 July 2002). "Integrating genomics, bioinformatics, and classical genetics to study the effects of recombination on genome evolution". Mol. Biol. Evol. 19 (7): 1181–97. CiteSeerX 10.1.1.337.1535. doi:10.1093/oxfordjournals.molbev.a004176. PMID 12082137.
  19. ^ International Human Genome Sequencing Consortium (February 2001). "Initial sequencing and analysis of the human genome". Nature. 409 (6822): 860–921. Bibcode:2001Natur.409..860L. doi:10.1038/35057062. PMID 11237011.{{cite journal}}: CS1 maint: 작성자 파라미터 사용(링크) (876페이지)
  20. ^ NCBI의 사카로미세스 세레비시아에 대한 전체 게놈 데이터
  21. ^ NCBI의 아라비도시스 탈리아나의 전체 게놈 데이터
  22. ^ NCBI 플라스모듐 팔시파룸의 전체 게놈 데이터
  23. ^ Musto H, Cacciò S, Rodríguez-Maseda H, Bernardi G (1997). "Compositional constraints in the extremely GC-poor genome of Plasmodium falciparum" (PDF). Mem. Inst. Oswaldo Cruz. 92 (6): 835–41. doi:10.1590/S0074-02761997000600020. PMID 9566216.
  24. ^ Duret L, Galtier N (2009). "Biased gene conversion and the evolution of mammalian genomic landscapes". Annu Rev Genom Hum Genet. 10: 285–311. doi:10.1146/annurev-genom-082908-150001. PMID 19630562. S2CID 9126286.
  25. ^ Huttener R, Thorrez L, Veld TI et al. (2021). "Sequencing refractory regions in bird genomes are hotspots for accelerated protein evolution". BMC Ecol Evo. 21 (176). doi:10.1186/s12862-021-01905-7.{{cite journal}}: CS1 maint: 작성자 파라미터 사용(링크)
  26. ^ Wayne LG; et al. (1987). "Report of the ad hoc committee on reconciliation of approaches to bacterial systematic". International Journal of Systematic Bacteriology. 37 (4): 463–4. doi:10.1099/00207713-37-4-463.
  27. ^ NCBI의 택사노미
  28. ^ NCBI에서 Streptomyces coelcolor A3(2)의 전체 게놈 데이터
  29. ^ Ghai R, McMahon KD, Rodriguez-Valera F (2012). "Breaking a paradigm: Cosmopolitan and abundant freshwater actinobacteria are low GC". Environmental Microbiology Reports. 4 (1): 29–35. doi:10.1111/j.1758-2229.2011.00274.x. PMID 23757226.
  30. ^ Karimi K, Wuitchik D, Oldach M, Vize P (2018). "Distinguishing Species Using GC Contents in Mixed DNA or RNA Sequences". Evol Bioinform Online. 14 (January 1, 2018): 1176934318788866. doi:10.1177/1176934318788866. PMC 6052495. PMID 30038485.
  31. ^ Lehnert E, Mouchka M, Burriesci M, Gallo N, Schwarz J, Pringle J (2014). "Extensive differences in gene expression between symbiotic and aposymbiotic cnidarians". G3 (Bethesda). 4 (2): 277–95. doi:10.1534/g3.113.009084. PMC 3931562. PMID 24368779.

외부 링크

  1. 배열된 모든 원핵 생물의 GC 함량이 포함된 표
  2. NCBI 웹사이트의 GC 비율에 따른 세균 분류 브라우저.
  3. 다양한 종의 GC 비율.