유전자 발현 연쇄 분석

Serial analysis of gene expression
SAGE의 개요유기체 내에서 유전자는 (진핵생물에서) 전사되고 결합되어 성숙한 mRNA 전사물(빨간색)을 생성한다.mRNA는 유기체에서 추출되며, 역전사효소는 mRNA를 안정적인 이중가닥-cDNA(ds-cDNA; blue)로 복사하기 위해 사용된다.SAGE에서 ds-cDNA는 제한 효소(위치 'X' 및 'X'+11)에 의해 소화되어 11-뉴클레오티드 '태그' 단편을 생성한다.이러한 태그는 긴 판독 Sanger 시퀀싱을 사용하여 연결 및 배열됩니다(파란색의 다른 색조는 다른 유전자의 태그를 나타냅니다).시퀀스는 디콘볼루션되어 각 태그의 주파수를 찾습니다.태그 빈도는 태그가 [1]유래한 유전자의 전사에 대해 보고하는 데 사용될 수 있습니다.

SAGE(Sterial Analysis of Gene Expression)는 분자생물학자들이 관심 있는 샘플에서 메신저 RNA 집단의 스냅샷을 생성하기 위해 사용하는 전사체 기술이며, 이러한 전사체의 조각에 대응합니다.그 이후로 몇 가지 변형이 개발되었으며, 특히 보다 강력한 버전인 LongSAGE,[2] RL-SAGE 및 최신 SuperSAGE가 있습니다.[4]이들 중 다수는 긴 태그를 포착함으로써 기술을 향상시켰고, 출처 유전자의 보다 확실한 식별을 가능하게 했다.

개요

SAGE 실험은 간단히 다음과 같이 진행됩니다.

  1. 입력 샘플(예: 종양)의 mRNA를 분리하고 mRNA에서 cDNA를 합성하기 위해 역전사효소비오티닐화 프라이머를 사용한다.
  2. cDNA는 프라이머에 부착된 비오틴과의 상호작용을 통해 스트렙타비딘 비즈에 결합되고, 그런 다음 고정효소(AE)라고 불리는 제한 핵산가수분해효소를 사용하여 분해된다.절단 부위의 위치와 비드에 결합되어 있는 나머지 cDNA의 길이는 개별 cDNA(mRNA)마다 다릅니다.
  3. 그 후, 절단 부위에서 하류 쪽으로부터 절단된 cDNA는 폐기되고, 절단 부위에서 상류로 올라가는 나머지 고정 cDNA 단편은 반으로 분할되어 부착 부위에서 상류로 다음 순서로 여러 성분을 포함하는 2개의 어댑터 올리고뉴클레오티드(A 또는 B) 중 하나에 노출된다. 1) AE 부위에서 Al로 절단된 접착 말단.분해된 cDNA에 대한 부착이 낮다. 2) 인식 부위의 다운스트림(원래 cDNA/mRNA 배열 내) 약 15개의 뉴클레오티드를 절단하는 태그 부착 효소(TE)로 알려진 제한 엔도핵산가수분해효소 인식 부위. 3) 나중에 PCR을 통해 어댑터 A 또는 B에 고유한 짧은 프라이머 배열..
  4. 어댑터 결찰 후 TE를 사용하여 cDNA를 분해하여 비즈에서 제거하고 원래 cDNA의 약 11개 뉴클레오티드(15개 뉴클레오티드에서 AE 인식 부위에 해당하는 4개)의 짧은 "태그"만 남긴다.
  5. 절단된 cDNA 태그는 DNA 중합효소로 복구되어 뭉툭한 끝 cDNA 단편을 생성합니다.
  6. 이러한 cDNA 태그 조각(어댑터 프라이머, AE 및 TE 인식 부위 포함)은 결합되어 2개의 태그 시퀀스를 함께 끼우고 양쪽 끝에 어댑터 A와 B를 측면으로 합니다.디태그라고 불리는 이러한 새로운 구조는 앵커 A와 B의 특정 프라이머를 사용하여 PCR 증폭됩니다.
  7. 그런 다음 원래 AE를 사용하여 디태그를 절단하고 다른 디태그와 연결할 수 있습니다. 다른 디태그는 AE 인식 부위에 의해 분리된 각 디태그와 결합되어 cDNA 콘코메터를 생성합니다.
  8. 이 콘크리트들은 박테리아 복제를 통해 증폭을 위해 박테리아로 변형된다.
  9. 그런 다음 cDNA 응고체를 분리 및 배열할 수 있으며, 이러한 배열은 개별 태그의 재발을 정량화하는 컴퓨터 프로그램으로 분석할 수 있습니다.

분석.

SAGE의 출력은 짧은 시퀀스태그 목록과 관찰 횟수입니다.염기서열 데이터베이스를 사용하면 연구자는 보통 어느 정도 확신을 갖고 태그를 추출한 원래 mRNA(따라서 어떤 유전자)를 결정할 수 있다.

통계적 방법은 어떤 유전자가 더 많이 발현되는지를 결정하기 위해 서로 다른 샘플의 태그와 카운트 리스트에 적용될 수 있다.예를 들어, 정상 조직 샘플을 해당 종양과 비교하여 어떤 유전자가 더(또는 덜) 활성화되는지를 결정할 수 있습니다.

역사

1979년 하버드와 칼텍 팀은 mRNA의 DNA 복사를 체외로 만드는 기본 아이디어를 박테리아 플라스미드에 [5]있는 그러한 라이브러리로 확장했습니다.1982-1983년에 그러한 cDNA 라이브러리에서 무작위 또는 반랜덤 클론을 선택하여 시퀀싱을 한다는 아이디어는 Greg Sutcliffe와 [6]동료들에 의해 연구되었다. 그리고 Putney 등은 토끼 근육 cDNA [7]라이브러리에서 178개의 클론을 시퀀싱했다.1991년 애덤스와 동료들은 표현 시퀀스 태그(EST)라는 용어를 만들고 (600개의 [8]뇌 cDNA에서 시작) 프로젝트로서 cDNA의 보다 체계적인 시퀀싱을 시작했다.EST의 식별은 급속히 진행되어 현재는 공공 데이터베이스(: GenBank)에서 수백만 개의 EST를 이용할 수 있다.

1995년에는 태그 길이를 100~800bp에서 10~22bp로 줄이는 아이디어가 mRNA 조사 [9]비용을 절감하는 데 도움이 되었습니다.올해, 원본 SAGE 프로토콜은 존스 홉킨스 [9]대학의 종양학 센터에서 Victor Velculescu에 의해 출판되었습니다.SAGE는 원래 암 연구에 사용하기 위해 고안되었지만, 다른 질병과 다양한 유기체의 전사체를 설명하는 데 성공적으로 사용되어 왔다.

DNA 마이크로어레이와의 비교

이 기술의 일반적인 목표는 DNA 마이크로어레이와 유사합니다.단, SAGE 샘플링은 프로브에 대한 mRNA 출력의 하이브리드화가 아닌 시퀀싱 mRNA 출력에 기초하고 있기 때문에 전사 수준은 마이크로어레이보다 정량적으로 측정됩니다.또한 mRNA 배열을 사전에 알 필요가 없기 때문에 알려지지 않은 유전자나 유전자 변형을 발견할 수 있다.마이크로 어레이 실험은 비용이 많이 들기 때문에 대규모 연구에서는 일반적으로 SAGE를 사용하지 않습니다.유전자 발현을 정량화하는 것은 전사물의 수를 직접 계산하는 것과 관련이 있기 때문에 SAGE에서 더 정확하지만, 마이크로어레이의 스폿 강도는 비이산 구배에서 떨어지고 백그라운드 노이즈가 발생하기 쉽다.

변종 프로토콜

miRNA 클로닝

마이크로RNA, 줄여서 miRNA는 유전자 조절에 중요한 역할을 하는 것으로 밝혀진 RNA의 작은 세그먼트입니다.세포나 조직 내에서 miRNA를 복제하고 식별하기 위해 가장 일반적으로 사용되는 방법 중 하나는 Bartel Lab에서 개발되었고 Lau et al.에 의해 논문에 발표되었다.(2001).그 이후로 여러 변형 프로토콜이 생겨났지만 대부분은 동일한 기본 형식을 가지고 있습니다.절차는 SAGE와 매우 유사합니다: 작은 RNA를 분리한 다음 각각에 링커를 추가하고 RT-PCR에 의해 RNA가 cDNA로 변환됩니다.이어서 내부제한부위를 포함한 링커를 적절한 제한효소로 소화시켜 점착단을 결속시켜 응축체로 한다.연결 후, 조각들은 플라스미드로 결합되어 삽입물을 포함한 플라스미드의 많은 복사본을 생성하기 위해 박테리아를 변형시키는 데 사용됩니다.그런 다음 SAGE와 유사하게 miRNA가 존재하는 횟수를 세어 특정 miRNA의 발현 수준을 분석할 수 있다.

LongSAGE 및 RL-SAGE

LongSAGE는 20μg의 mRNA를 사용하여 수천 개의 [10]태그로 구성된 cDNA 라이브러리를 생성하는 더 높은 스루풋을 가진 2002년에 개발된 원래 SAGE의 보다 견고한 버전입니다.견고한 LongSage(RL-SAGE) LongSAGE 프로토콜이 더욱 향상되어 완전한 CDNA를 얻기 위해 이전 LongSAGE 삽입 크기 2μg mRNA보다 훨씬 작고 더 적은 수의 ditag 중합효소 연쇄 반응(PCR)을 사용합니다.[11]

슈퍼 SAGE

SuperSAGE는 파지 P1III-엔도핵산가수분해효소 EcoP15I를 사용하여 각 스크립트의 cDNA에서 26bp의 긴 시퀀스 태그를 잘라 이전 기술인 SAGE 및 LongSAGE에 [12]비해 태그 크기를 최소 6bp 확장한SAGE의 파생 모델입니다.태그 사이즈가 길수록 태그가 대응하는 스크립트에 보다 정확하게 할당됩니다.이는 각 베이스가 추가될 때마다 주석의 정밀도가 크게 향상되기 때문입니다.

원래의 SAGE 프로토콜과 마찬가지로, 무딘 끝 태그를 사용하여 이른바 디태그가 형성됩니다.단, SuperSAGE는 덜 랜덤한 LongSAGE 20 bp ditag-lation [13]중에 관찰되는 편견을 회피합니다.높은 처리량 시퀀싱 기술(차세대 시퀀싱, 즉 파이로시퀀싱)에 의한 직접 시퀀싱에 의해 수십만 또는 수백만 개의 태그를 동시에 분석할 수 있어 매우 정밀하고 정량적인 유전자 발현 프로파일을 생성할 수 있다.따라서, "디지털 유전자 발현 프로파일링"이라고도 불리는 태그 기반 유전자 발현 프로파일링은 오늘날 마이크로어레이[14][15]한계를 극복하는 가장 정확한 전사 프로파일을 제공할 수 있습니다.

3'end mRNA 시퀀싱, cDNA 엔드의 대규모 분석

2010년대 중반에 "디지털 유전자 발현 프로파일링"을 위해 "태그" 원리를 사용하지만 태그 효소는 사용하지 않는 차세대 시퀀싱과 결합된 여러 기술이 개발되었습니다."MCE" 접근법(=cDNA Ends의 대량 분석)은 스크립트의 마지막 1500bps에 태그를 생성합니다.이 기술은 더 이상 제한 효소에 의존하지 않으므로 cDNA 내 제한 부위의 부재 또는 위치와 관련된 편견을 회피한다.대신, cDNA는 랜덤으로 단편화되어 폴리A 꼬리를 운반하는 cDNA 분자의 5' 말단에서 3' 말단이 배열된다.태그의 시퀀스 길이는 자유롭게 선택할 수 있습니다.이것에 의해, 태그를 콘티그에 조립할 수 있어 태그의 주석을 큰폭으로 향상시킬 수 있다.따라서 MCE는 비모델 유기체의 분석에도 사용된다.또한 긴 콘티그에 다형을 선별할 수 있다.UTR은 개체 간 다형성을 많이 나타내기 때문에 MACE 접근방식은 대립 유전자 결정, 대립 유전자 특이적 유전자 발현 프로파일링 및 육종을 위한 분자 마커 탐색에 적용할 수 있다.또, 이 어프로치는, 전사물의 대체 폴리아데닐화를 결정할 수 있다.MCE는 3' 끝의 전사만 필요하므로, 일부 분해된 RNA라도 분해 의존 편향이 적은 상태로 분석할 수 있습니다.MCE 접근방식은 PCR 편향을 식별하기 위해 고유한 분자 식별자를 사용한다.[16]

「 」를 참조해 주세요.

레퍼런스

  1. ^ Shafee, Thomas; Lowe, Rohan (2017). "Eukaryotic and prokaryotic gene structure". WikiJournal of Medicine. 4 (1). doi:10.15347/wjm/2017.002. ISSN 2002-4436.
  2. ^ Saha S, et al. (2002). "Using the transcriptome to annotate the genome". Nat Biotechnol. 20 (5): 508–12. doi:10.1038/nbt0502-508. PMID 11981567. S2CID 12709815.
  3. ^ Gowda M; Jantasuriyarat C; Dean RA; Wang GL. (2004). "Robust-LongSAGE (RL-SAGE): a substantially improved LongSAGE method for gene discovery and transcriptome analysis". Plant Physiol. 134 (3): 890–7. doi:10.1104/pp.103.034496. PMC 389912. PMID 15020752.
  4. ^ Matsumura H; Ito A; Saitoh H; Winter P; Kahl G; Reuter M; Krüger DH; Terauchi R. (2005). "SuperSAGE". Cell Microbiol. 7 (1): 11–8. doi:10.1111/j.1462-5822.2004.00478.x. PMID 15617519. S2CID 221579149.
  5. ^ Sim GK; Kafatos FC; Jones CW; Koehler MD; Efstratiadis A; Maniatis T (December 1979). "Use of a cDNA library for studies on evolution and developmental expression of the chorion multigene families". Cell. 18 (4): 1303–16. doi:10.1016/0092-8674(79)90241-1. PMID 519770.
  6. ^ Sutcliffe JG; Milner RJ; Bloom FE; Lerner RA (August 1982). "Common 82-nucleotide sequence unique to brain RNA". Proc Natl Acad Sci U S A. 79 (16): 4942–6. Bibcode:1982PNAS...79.4942S. doi:10.1073/pnas.79.16.4942. PMC 346801. PMID 6956902.
  7. ^ Putney SD; Herlihy WC; Schimmel P (1983). "A new troponin T and cDNA clones for 13 different muscle proteins, found by shotgun sequencing". Nature. 302 (5910): 718–21. Bibcode:1983Natur.302..718P. doi:10.1038/302718a0. PMID 6687628. S2CID 4364361.
  8. ^ Adams MD, Kelley JM, Gocayne JD, et al. (June 1991). "Complementary DNA sequencing: expressed sequence tags and human genome project". Science. 252 (5013): 1651–6. Bibcode:1991Sci...252.1651A. doi:10.1126/science.2047873. PMID 2047873. S2CID 13436211.
  9. ^ a b Velculescu VE; Zhang L; Vogelstein B; Kinzler KW. (1995). "Serial analysis of gene expression". Science. 270 (5235): 484–7. Bibcode:1995Sci...270..484V. doi:10.1126/science.270.5235.484. PMID 7570003. S2CID 16281846.
  10. ^ a b 사하, S. 등(2002)."전사체를 사용하여 게놈에 주석을 다는 것"Nat Biotechnol 20(5): 508-512.
  11. ^ Gowda, M. 등(2004)."Robust-LongSAGE(RL-SAGE): 유전자 발견과 문자 전달 분석을 위한 상당히 개선된 LongSAGE 방법"식물 생리학 134(3): 890-897.
  12. ^ Matsumura, H.; Reich, S.; Ito, A.; Saitoh, H.; Kamoun, S.; Winter, P.; Kahl, G.; Reuter, M.; Krüger, D.; Terauchi, R. (2003). "Gene expression analysis of plant host-pathogen interactions by SuperSAGE". Proceedings of the National Academy of Sciences. 100 (26): 15718–15723. Bibcode:2003PNAS..10015718M. doi:10.1073/pnas.2536670100. PMC 307634. PMID 14676315.
  13. ^ Gowda, Malali; Jantasuriyarat, Chatchawan; Dean, Ralph A.; Wang, Guo-Liang (2004-03-01). "Robust-LongSAGE (RL-SAGE): A Substantially Improved LongSAGE Method for Gene Discovery and Transcriptome Analysis". Plant Physiology. 134 (3): 890–897. doi:10.1104/pp.103.034496. ISSN 1532-2548. PMC 389912. PMID 15020752.
  14. ^ Shendure, J. (2008). "The beginning of the end for microarrays?". Nature Methods. 5 (7): 585–7. doi:10.1038/nmeth0708-585. PMID 18587314. S2CID 29682662.
  15. ^ Matsumura, H.; Bin Nasir, K. H.; Yoshida, K.; Ito, A.; Kahl, G. N.; Krüger, D. H.; Terauchi, R. (2006). "SuperSAGE array: the direct use of 26-base-pair transcript tags in oligonucleotide arrays". Nature Methods. 3 (6): 469–74. doi:10.1038/nmeth882. PMID 16721381. S2CID 19160070.
  16. ^ Zawada, Adam (January 2014). "Massive analysis of cDNA Ends (MACE) and miRNA expression profiling identifies proatherogenic pathways in chronic kidney disease". Epigenetics. 9 (1): 161–172. doi:10.4161/epi.26931. PMC 3928179. PMID 24184689.

외부 링크