시퀀싱

Sequencing

유전학과 생화학에서 염기서열결정이란 분지되지 않은 생체고분자의 1차 구조(때로는 1차 염기서열이라고 잘못 불리기도 함)를 결정하는 것을 의미한다.배열은 배열된 분자의 원자 수준 구조의 대부분을 간결하게 요약하는 배열로 알려진 상징적 선형 묘사를 낳는다.

DNA순서결정

DNA 배열은 주어진 DNA 조각의 뉴클레오티드 순서를 결정하는 과정이다.지금까지 대부분의 DNA 배열은 Frederick Sanger에 의해 개발연쇄 종단 방법을 사용하여 수행되었습니다.이 기술은 변형된 뉴클레오티드 기질을 이용한 DNA 합성 반응의 배열 특이 종단을 사용한다.그러나 파이로시퀀싱과 같은 새로운 시퀀싱 기술은 시퀀싱 시장에서 점점 더 많은 점유율을 차지하고 있습니다.현재 생어 DNA 염기서열 분석보다 더 많은 게놈 데이터가 파이로시퀀싱에 의해 생산되고 있다.파이로시퀀싱은 빠른 게놈시퀀싱을 가능하게 했다.박테리아 게놈은 이 기술로 한 번에 여러 번 염기서열을 분석할 수 있습니다.이 기술은 최근 [1]제임스 왓슨의 게놈 배열에도 사용되었다.

DNA의 배열은 생명체가 생존하고 번식하는 데 필요한 정보를 암호화한다.따라서 염기서열을 결정하는 것은 응용 대상뿐만 아니라 유기체가 사는 이유와 방법에 대한 기초 연구에 유용하다.DNA가 생물에게 갖는 중요한 중요성 때문에, DNA 배열에 대한 지식은 실질적으로 생물학적 연구의 모든 분야에서 유용하다.예를 들어, 의학에서는 유전자 질환의 식별, 진단 및 잠재적으로 치료제 개발에 사용될 수 있습니다.마찬가지로 병원균에 대한 연구는 전염병 치료로 이어질 수 있다.바이오 테크놀로지는 많은 유용한 제품과 서비스의 가능성을 가진 급성장하고 있는 분야입니다.

칼슨 곡선은 이코노미스트가 무어의 법칙과 동등한 생명공학적 현상을 설명하기 위해 만든 용어로 작가 롭 칼슨의 이름을 [3]따왔다.Carlson은 DNA 염기서열 분석 기술의 배증 시간(비용과 성능으로 측정)이 적어도 무어의 [4]법칙만큼 빠를 것이라고 정확하게 예측했습니다.칼슨 곡선은 DNA 배열, DNA 합성, 단백질 발현 및 단백질 구조를 결정하는 데 사용되는 다양한 물리적 및 계산 도구 등 다양한 기술의 비용 및 성능의 급격한 감소를 보여준다.

생어 시퀀싱

방사성 라벨이 부착된 시퀀싱 젤의 일부

체인 터미네이터 배열결정(Sanger 배열결정)에서 템플릿 DNA 상의 특정 부위에서 템플릿에 상보적인 짧은 올리고뉴클레오티드 '프라이머'를 사용하여 확장이 개시된다.올리고뉴클레오티드 프라이머는 DNA를 복제하는 효소인 DNA 중합효소를 사용하여 확장된다.프라이머 및 DNA 중합효소에는 4개의 디옥시뉴클레오티드 염기(DNA 구성 블록)와 함께 저농도의 종단 뉴클레오티드(가장 일반적으로 디옥시뉴클레오티드)가 포함된다.디옥시뉴클레오티드는 리보오스 분자의 2' 및 3' 위치에서 모두 OH 그룹에 부족하기 때문에 일단 DNA 분자 내에 삽입되면 더 이상 길어지는 것을 방지한다.4개의 디옥시리보뉴클레오티드만을 포함한 4개의 다른 혈관이 이용된다.DNA 중합효소에 의해 임의의 위치에 뉴클레오티드를 종단하는 사슬의 혼입은 주어진 디옥시리보뉴클레오티드로 종단하는 일련의 관련 DNA 단편을 낳는다.그런 다음 조각들은 전기영동에 의해 슬라브 폴리아크릴아미드 겔 또는 더 일반적으로 점성이 있는 폴리머로 채워진 좁은 유리관(모관)에서 크기로 분리된다.

염료 터미네이터 판독 예제의 시작 보기(확장하려면 클릭)

프라이머에 라벨을 붙이는 대신 터미네이터에 라벨을 붙이는 방법도 있습니다. 일반적으로 '염색 터미네이터 시퀀싱'이라고 합니다.이 접근법의 주요 장점은 라벨 부착 프라이머 접근법에 필요한 4가지가 아닌 완전한 시퀀싱 세트를 단일 반응으로 수행할 수 있다는 것이다.이것은 디데옥시뉴클레오티드 사슬 말단자 각각에 다른 파장에서 형광을 내는 별도의 형광 염료를 라벨링함으로써 달성된다.이 방법은 염료 프라이머 접근법보다 쉽고 빠르지만 대형 염료 체인 터미네이터의 통합에서 템플릿에 의존하는 차이로 인해 더 많은 불균일한 데이터 피크(높이 차이)를 생성할 수 있습니다.이 문제는 혼입 변동을 최소화하는 새로운 효소와 염료의 도입으로 현저하게 감소하였다.이 방법은 더 단순하고 저렴하기 때문에 현재 대부분의 시퀀싱 반응에 사용됩니다.그 주된 이유는 프라이머에 따로 라벨을 붙일 필요가 없기 때문이다(일회용 커스텀 프라이머에 상당한 비용이 들 수 있다). 단, 자주 사용되는 '범용' 프라이머에 대한 우려는 덜하다.이는 Illumina, 454, ABI, Helicos 및 Dover의 2세대 및 3세대 시스템의 비용 효율이 높아짐에 따라 빠르게 변화하고 있습니다.

파이로시퀀싱

파이로시퀀싱 방법은 뉴클레오티드 혼입 시 피로인산염 방출의 검출에 기초한다.파이로시퀀싱을 수행하기 전에 배열에 대한 DNA 가닥을 PCR에 의해 증폭해야 합니다.그런 다음 염기서열에서 뉴클레오티드가 첨가되어야 하는 순서(즉, G-A-T-C)를 선택한다.특정 뉴클레오티드가 첨가될 때, DNA 중합효소가 그것을 성장사슬에 포함시키면, 피로인산은 방출되고 ATP 술푸릴라아제에 의해 ATP로 전환된다.ATP는 루시페라아제를 통해 루시페라아제의 산화를 촉진한다; 이 반응은 파이로그램 피크로서 기록된 빛 신호를 생성한다.이와 같이 뉴클레오티드 혼입은 신호와 상관된다.광신호는 DNA 가닥의 합성 동안 통합된 뉴클레오티드의 양에 비례한다(즉, 통합된 두 개의 뉴클레오티드는 두 개의 파이로그램 피크에 해당한다).첨가된 뉴클레오티드가 DNA 분자에 통합되지 않을 때, 어떠한 신호도 기록되지 않습니다; 효소 아피라아제는 반응에 남아 있는 비통합 뉴클레오티드를 제거합니다.이 방법에는 형광 라벨이 부착된 뉴클레오티드나 겔 전기영동이 필요하지 않습니다.Pöl Nyrén과 Mostafa Ronaghi DNA에 의해 개발된 파이로시퀀싱은 Biotage(저스루풋 시퀀싱용)와 454 Life Science(고스루풋 시퀀싱용)에 의해 상용화되었습니다.후자의 플랫폼에서는, 1대의 머신으로 약 100 메가바이트(현재는 최대 400 메가바이트)의 시퀀스를 7시간에 걸쳐 실행할 수 있습니다.어레이 기반 방법(454 생명과학에 의해 상용화됨)에서 단일 가닥 DNA는 비즈로 아닐되어 EmPCR을 통해 증폭된다.이 DNA 결합 구슬들은 ATP의 존재 하에서 빛을 내는 효소와 함께 광섬유 칩의 웰에 놓입니다.유리 뉴클레오티드가 이 칩 위에 씻겨질 때, 뉴클레오티드가 그들의 상보적인 염기쌍과 결합할 때 ATP가 생성되면서 빛이 생성됩니다.1개 이상의 뉴클레오티드를 첨가하면 기기의 CCD카메라에 의해 기록된 광신호를 생성하는 반응을 일으킨다.신호 강도는 단일 뉴클레오티드 흐름에 통합된 호모폴리머 스트레칭과 같은 뉴클레오티드의 수에 비례합니다.[1]

진정한 단일 분자 배열 분석

대규모 시퀀스 처리

위의 방법들은 다양한 배열 방법을 기술하는 반면, 게놈의 많은 부분을 배열할 때는 별도의 관련 용어를 사용한다.몇몇 플랫폼이 엑솜 염기서열결정(유전자를 코드하는 모든 염색체에 걸친 모든 DNA의 서브셋) 또는 전체 게놈 염기서열결정(인간의 모든 핵 DNA 염기서열결정)을 수행하기 위해 개발되었다.

RNA순서결정

RNA는 세포에서 덜 안정적이고 또한 실험적으로 핵산가수분해효소 공격을 받기 쉽다.RNA는 DNA의 전사에 의해 생성되기 때문에, 그 정보는 이미 세포의 DNA에 존재한다.그러나 때로는 RNA 분자의 배열이 바람직하다.DNA 염기서열은 유기체의 유전자 프로파일을 제공하는 반면, RNA 염기서열은 세포에서 활발하게 발현되는 염기서열만을 반영한다.RNA를 배열하려면 먼저 샘플에서 추출한 RNA를 역전사하여 cDNA 단편을 생성하는 이 일반적입니다.그런 다음 위에서 설명한 대로 이 순서를 지정할 수 있습니다.세포에서 발현되는 RNA의 대부분은 리보솜 RNA 또는 작은 RNA로 세포 번역에는 해롭지만 종종 연구의 초점이 아니다.그러나 이 부분은 체외에서 제거되어 메신저 RNA를 풍부하게 할 수 있으며, 이는 일반적으로 관심 있는 것이다.엑손에서 파생된 이러한 mRNA는 나중에 특정 세포 기능을 지원하는 단백질로 번역됩니다.따라서 발현 프로파일은 특히 질병, 세포 행동, 시약 또는 자극에 대한 반응 연구에서 바람직한 세포 활동을 나타낸다.진핵생물 RNA 분자는 인트론이 제거되기 때문에 DNA 템플릿과 반드시 동일선상에 있는 것은 아니다.이것은 판독된 염기서열을 게놈에 다시 매핑하여 그 기원을 확인하는 데 특정한 복잡성을 준다.전체 전사체에 적용되는 차세대 시퀀싱의 기능에 대한 자세한 내용은 RNA-SeqMicroRNA 시퀀싱을 참조하십시오.

단백질 염기서열

단백질 시퀀싱을 수행하는 방법에는 다음이 포함됩니다.

단백질을 코드하는 유전자가 알려지면 현재 DNA 배열과 단백질 배열 추론이 훨씬 쉬워진다.위의 방법 중 하나에 의해 단백질의 아미노산 배열의 일부(종종 한쪽 끝)를 결정하는 것은 이 유전자를 가진 클론을 식별하기에 충분할 수 있다.

다당류 배열법

다당류 또한 생체 고분자이지만, 여러 가지 이유로 다당류의 '서열화'에 대해 말하는 것은 그리 흔한 일이 아니다.비록 많은 다당류가 선형이지만, 많은 다당류는 가지를 가지고 있다.많은 다른 단위(개별 단당류)를 사용할 수 있고 다양한 방법으로 결합할 수 있습니다.그러나, 여기에 나열된 다른 고분자들은 주로 하나의 진행 효소에 의해 '템플릿 의존' 방식으로 생성되는 반면, 다당류에서 각각의 개별 결합은 다른 효소에 의해 형성될 수 있기 때문이다.대부분의 경우 어셈블리는 고유하게 지정되지 않습니다. 어떤 효소가 작용하느냐에 따라 여러 개의 다른 단위 중 하나가 통합될 수 있습니다.이것은 유사한 분자의 패밀리를 형성하게 할 수 있다.이것은 식물성 다당류에 특히 해당된다.올리고당다당류구조결정방법은 NMR 분광법 및 메틸화 [5]분석포함한다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ Wheeler, David A.; Srinivasan, Maithreyan; Egholm, Michael; Shen, Yufeng; Chen, Lei; McGuire, Amy; He, Wen; Chen, Yi-Ju; Makhijani, Vinod (2008-04-17). "The complete genome of an individual by massively parallel DNA sequencing". Nature. 452 (7189): 872–876. Bibcode:2008Natur.452..872W. doi:10.1038/nature06884. ISSN 0028-0836. PMID 18421352.
  2. ^ Life 2.0(2006년 8월 31일).이코노미스트
  3. ^ 칼슨, 로버트 H. 생물은 테크놀로지:엔지니어링 라이프에 대한 약속, 위험 및 새로운 비즈니스.케임브리지, 매사추세츠: 하버드 UP, 2010.인쇄
  4. ^ Carlson, Robert (2003). "The Pace and Proliferation of Biological Technologies". Biosecurity and Bioterrorism: Biodefense Strategy, Practice, and Science. 1 (3): 203–214. doi:10.1089/153871303769201851. PMID 15040198.
  5. ^ "A practical guide to structural analysis of carbohydrates".

링크