Transcriptomics 기술
Transcriptomics technologiestranscriptomics 기술은 유기체의 transcriptom을 연구하는데 사용되는 기법이며, 그 모든 RNA transcriptom의 합이다.유기체의 정보 내용은 그 게놈의 DNA에 기록되고 전사적으로 표현된다.여기서 mRNA는 정보망에서 일시적인 중간분자 역할을 하는 반면, 비코딩 RNA는 추가적인 다양한 기능을 수행한다.transcriptome은 셀에 존재하는 총 대본의 시간에 스냅숏을 캡처한다.transcriptomics 기술은 어떤 세포 과정이 활발하고 어떤 것이 휴면 상태인지에 대한 광범위한 설명을 제공한다.분자생물학의 주요 과제는 동일한 게놈이 어떻게 다른 세포 유형을 발생시킬 수 있는지와 유전자 발현이 어떻게 조절되는지를 이해하는 것이다.
전체 대본을 연구하기 위한 첫 번째 시도는 1990년대 초에 시작되었다.1990년대 후반 이후 이어진 기술 발전은 그 분야를 거듭 변화시켰고, transcriptomics를 생물과학의 광범위한 규율화했다.이 분야에는 미리 정해진 시퀀스 세트를 정량화하는 마이크로레이와 모든 대본을 기록하기 위해 고투과 시퀀스를 사용하는 RNA-Seq 두 가지 핵심 현대 기술이 있다.기술이 발전함에 따라 각 대본 실험에서 생성되는 데이터의 양이 증가했다.그 결과 점점 더 많은 양의 데이터를 보다 정확하고 효율적으로 분석하기 위해 데이터 분석 방법이 꾸준히 적용되어 왔다.연구자들에 의해 더 많은 수의 녹음파일들이 수집되고 공유되면서, 녹음파일 데이터베이스는 점점 더 유용성이 증가하고 있다.이전의 실험의 맥락 없이, 성적 증명서에 포함된 정보를 해석하는 것은 거의 불가능할 것이다.
다른 조직이나 조건, 또는 다른 시기에 유기체의 유전자의 발현을 측정하면 유전자가 어떻게 조절되는지에 대한 정보를 주고 유기체의 생물학의 세부사항을 드러낸다.그것은 또한 이전에 알려지지 않은 유전자의 기능을 유추하는 데 사용될 수 있다.성적 증명 분석은 다른 유기체에서 유전자 발현이 어떻게 변화하는지 연구할 수 있게 해 주었고 인간 질병의 이해에 중요한 역할을 했다.유전자 발현 전체를 분석하면 더 많은 표적 분석으로 확인할 수 없는 광범위한 조정 추세를 탐지할 수 있다.
역사
Transcriptomics는 10여 년마다 무엇이 가능한지를 재정의하고 이전의 기술을 쓸모없게 만든 새로운 기술의 개발에 의해 특징지어져 왔다.부분적인 인간 기록물을 포착하기 위한 첫 번째 시도는 1991년에 출판되었고 인간의 뇌에서 609 mRNA 시퀀스를 보고했다.[2]2008년에는 1만6천개의 유전자를 포괄하는 수백만 개의 대본 유래 시퀀스로 구성된 인간 대본 2개가 출판되었고,[3][4] 2015년까지 수백 명의 개인을 대상으로 대본 소본이 출판되었다.[5][6]다른 질병 상태, 조직 또는 심지어 단일 세포의 성적 증명서가 이제는 일상적으로 생성된다.[6][7][8]이러한 성적표현학의 폭발적 증가는 민감성과 경제성이 향상된 신기술의 급속한 발전에 의해 추진되었다.[9][10][11][12]
transcriptomics 이전
개별 성적표에 대한 연구는 어떤 성적 증명서학적 접근법이 이용되기 수십 년 전에 수행되고 있었다.실크못 mRNA 대본의 도서관은 1970년대 후반에 역대본효소를 이용한 보관을 위한 보완 DNA(cDNA)로 수집되어 전환되었다.[13]1980년대에는 생거법을 이용한 저쓰루 시퀀싱이 랜덤 대본의 시퀀싱에 사용되어 표현된 시퀀스 태그(EST)를 생산하였다.[2][14][15][16]합성(Solexa/Illumina)에 의한 시퀀싱과 같은 고처리 방식이 등장하기 전까지는 Sanger 시퀀싱 방식이 우세했다.EST는 1990년대에 전체 게놈의 염기서열 분석 없이 유기체의 유전자 성분을 파악하는 효율적인 방법으로 두각을 나타냈다.[16]개별 대본의 양은 Northern Blotting, 나일론 멤브레인 어레이 및 이후 역대본 정량화 PCR(Rverse transcriptase 정량화 PCR) 방법을 사용하여 정량화되었지만,[17][18] 이러한 방법은 고된 작업이며, 대본의 작은 부분만 캡처할 수 있다.[12]결과적으로, 전반적으로 성적 증명서를 표현하고 규제하는 방식은 고처리 기술이 개발되기 전까지는 알려지지 않았다.
초기 시도
"transcriptome"이라는 단어는 1990년대에 처음 사용되었다.[19][20]1995년에는 가장 초기 염기서열 기반 소포법 중 하나인 유전자 발현(SAGE)의 직렬 분석법이 개발되었는데, 이는 생거가 결합한 무작위 소포의 염기서열에 의해 작용하였다.[21]녹취록은 알려진 유전자에 맞춰 파편을 정량화했다.디지털 유전자 발현 분석이라고 불리는 고투과 시퀀싱 기술을 이용한 SAGE의 변종도 잠시 사용되었다.[9][22]그러나 이러한 방법들은 대본 전체의 높은 처리량 순서에 의해 대체되었는데, 이는 이음새 변종과 같은 대본 구조에 대한 추가 정보를 제공하였다.[9]
현대 기술 개발
RNA-Seq | 마이크로어레이 | |
---|---|---|
처리량 | 실험당[10] 1일~1주 | 실험당[10] 1~2일 |
입력RNA량 | 낮음 ~ 1ng 총 RNA[25] | 높음 ~ 1μg mRNA |
노동강도 | 높음(표본 작성 및 데이터 분석)[10][23] | 낮음[10][23] |
선행지식 | 참조 게놈/트랜픽셀 시퀀스는 유용하지만[23] 필요 없음 | 프로브[23] 설계 시 참조 게놈/트랜픽셀 필요 |
정량 정확도 | ~90%(순서 범위 제한)[27] | 90% (형광 검출 정확도에 의해 제한)[27] |
시퀀스 해상도 | RNA-Seq는 SNP 및 스플라이스 변형을 탐지할 수 있다(최대 99%[27]의 시퀀싱 정확도로 제한됨). | mRNA 스플라이스 변형을 감지할 수 있는 특수 어레이(프로브 설계 및 교차 하이브리드화로 제한됨)[27] |
민감도 | 백만 개당 1개의 대본(순서 포함에 따라 제한됨)[27] | 1,000개당 1개의 대본(대본, 형광 검출에 의해 제한됨)[27] |
동적 범위 | 100,000:1 (순서 범위 제한)[28] | 1,000:1 (형광 포화도에 의해 [28]제한됨 |
기술적 재현성 | >99%[29][30] | >99%[31][32] |
지배적인 현대 기술인 마이크로레이와 RNA-Seq는 1990년대 중반과 2000년대에 개발되었다.[9][33]일련의 보완적 프로브에 대한 혼합화를 통해 정의된 대본 집합의 다양성을 측정하는 마이크로아레이는 1995년에 처음 발표되었다.[34][35]마이크로 어레이 기술은 유전자당 비용과 노동력 절약을 크게 줄인 동시에 수천 개의 대본을 분석할 수 있게 했다.[36]점점이 있는 올리고뉴클레오티드 어레이와 Apfymetrix 고밀도 어레이 모두 2000년대 후반까지 전사 프로파일링을 위한 선택 방법이었다.[12][33]이 기간 동안, 모델이나 경제적으로 중요한 유기체에서 알려진 유전자를 덮기 위해 다양한 미세 광선이 생성되었다.어레이의 설계와 제조의 발전은 프로브의 특수성을 향상시켰고, 단일 어레이에서 더 많은 유전자를 테스트할 수 있게 했다.형광 검출의 발전은 저농도 성적표에 대한 민감도와 측정 정확도를 증가시켰다.[35][37]
RNA-Seq는 시험관내 RNA를 역순으로 변환하고 결과 cDNA를 염기서열화함으로써 달성된다.[10]대본 풍부함은 각 대본의 계수 수에서 도출된다.따라서 이 기술은 고투과 시퀀싱 기술의 발달에 많은 영향을 받아왔다.[9][11]MPSS(Massive Parallel signature sequence, MPSS)는 복잡한 일련의 잡종을 통해 16–20bp 시퀀스를 생성하는 것에 기초하는 초기 사례였으며,[38][note 1] 2004년에 아라비도피스 탈리아나에서 1만 개의 유전자의 발현을 검증하는 데 사용되었다.[39]가장 초기 RNA-Seq 작업은 2006년에 출판되었고, 454 기술을 사용하여 10만 개의 대본이 배열되었다.[40]이것은 상대적 대본 풍부함을 계량하기에 충분한 커버리지였다.RNA-Seq는 2008년 새로운 Solexa/Illumina 기술이 10억 개의 녹취록 시퀀스를 기록할 수 있게 한 이후 인기가 높아지기 시작했다.[4][10][41][42]이 산출량은 이제 인간 대본의 정량화와 비교를 가능하게 한다.[43]
데이터 수집
RNA 대본에 대한 데이터 생성은 개별 대본(EST 또는 RNA-Seq)의 시퀀싱 또는 순서 배열의 뉴클레오티드 프로브(마이크로레이)에 대한 대본 혼합의 두 가지 원칙 중 하나를 통해 달성될 수 있다.[23]
RNA의 격리
모든 대본법에서는 대본을 기록할 수 있으려면 먼저 RNA를 실험 유기체로부터 격리시켜야 한다.비록 생물학적 체계 믿을 수 없을 정도로 다양하다, RNA기술이 광범하게 p.을 통해 세포와 조직의 기계적 장애를 일으키고, RN아제의 거대 분자와 nucleotide 단지의chaotropic salts,[44]장애를 일으키고, RNA의 바람직하지 않은 생체 분자의 DNA를 포함한 이별로 혼란과 RNA의 농도를 포함하는 것과 유사하다유원지용액으로부터의 입면 또는 고체 매트릭스로부터의 용출.[44][45]격리된 RNA는 DNA의 흔적을 소화할 수 있도록 DNase로 추가로 치료될 수 있다.[46]총 RNA 추출물은 전형적으로 98% 리보솜 RNA이므로 메신저 RNA를 농축할 필요가 있다.[47]대본의 농축은 폴리A 친화법이나 시퀀스별 프로브를 이용한 리보솜 RNA의 고갈에 의해 수행될 수 있다.[48]분해된 RNA는 다운스트림 결과에 영향을 미칠 수 있다. 예를 들어, 분해된 샘플로 인한 mRNA 농축은 5'mRNA 단부의 고갈과 성적증명서의 길이에 걸쳐 불균일한 신호를 초래할 것이다.RNA 절연 전 조직의 스냅냉각이 대표적이며, 절연이 완료되면 RNase 효소에 대한 노출을 줄일 수 있도록 주의한다.[45]
표현된 시퀀스 태그
표현된 시퀀스 태그(EST)는 단일 RNA 대본에서 생성된 짧은 뉴클레오티드 시퀀스다.RNA는 결과물 cDNA의 염기서열을 정하기 전에 역분해효소 효소에 의해 보완 DNA(cDNA)로 먼저 복사된다.[16]EST는 그들이 온 유기체에 대한 사전 지식 없이 수집될 수 있기 때문에 유기체나 환경 샘플의 혼합물로 만들 수 있다.[49][16]현재는 더 높은 처리 방법이 사용되지만, EST 라이브러리는 일반적으로 초기 마이크로 배열 설계를 위한 시퀀스 정보를 제공했다. 예를 들어, 보리 마이크로 배열은 이전에 시퀀싱된 350,000개의 EST에서 설계되었다.[50]
유전자 발현의 직렬 및 캡 분석(SAGE/CAGE)
Serial analysis of gene expression (SAGE) was a development of EST methodology to increase the throughput of the tags generated and allow some quantitation of transcript abundance.[21] cDNA is generated from the RNA but is then digested into 11 bp "tag" fragments using restriction enzymes that cut DNA at a specific sequence, and 11 base pairs along fro그 순서에 따라.그런 다음 이러한 cDNA 태그는 긴 가닥(>500 bp)으로 서로 결합되고 저쓰루풋이지만 Sanger 시퀀싱과 같은 긴 읽기 길이 방법을 사용하여 시퀀싱된다.그런 다음 디콘볼루션이라는 프로세스에서 컴퓨터 소프트웨어를 사용하여 원래 11bp 태그로 다시 분할된다.[21]만약 고품질 참조 게놈을 이용할 수 있다면, 이 태그들은 게놈의 해당 유전자와 일치될 수 있다.참조 게놈을 사용할 수 없는 경우, 태그는 질병 상태에서 다르게 표시되는 것으로 확인될 경우 진단 마커로 직접 사용할 수 있다.[21]
캡 분석 유전자 표현법(CAGE)은 mRNA 대본의 5' 끝에서 태그만 배열하는 SAGE의 변형이다.[52]따라서 태그가 참조 게놈에 정렬되면 유전자의 전사 시작 부위가 식별될 수 있다.유전자 시작 사이트를 식별하는 것은 촉진자 분석과 전체 길이 cDNA 복제에 사용된다.
SAGE와 CAGE 방법은 단일 EST를 시퀀싱할 때 가능한 것보다 더 많은 유전자에 대한 정보를 생성하지만, 표본 준비와 데이터 분석은 일반적으로 더 노동 집약적이다.[52]
마이크로레이
원칙과 진보
마이크로레이는 "프로브"로 알려진 짧은 뉴클레오티드 과점선으로 구성되며, 일반적으로 유리 슬라이드의 격자로 배열된다.[53]대본 풍부함은 형광 라벨로 표시된 대본을 이 프로브에 혼합하여 결정한다.[54]배열의 각 프로브 위치에서 형광 강도는 해당 프로브 시퀀스에 대한 대본 풍부함을 나타낸다.[54]
마이크로레이는 예를 들어 주석이 달린 게놈 서열이나 배열용 탐침을 생성하는 데 사용할 수 있는 EST 라이브러리의 형태로 관심 유기체로부터 얻은 유전학적 지식을 필요로 한다.[36]
방법들
transcriptomics용 마이크로레이는 일반적으로 저밀도 점박이 배열 또는 고밀도 단탐사 배열의 두 가지 광범위한 범주 중 하나로 분류된다.대본 풍부함은 배열과 결합되는 불소 태그가 부착된 대본에서 도출된 형광의 강도로부터 유추된다.[36]
점박이 저밀도 배열은 일반적으로 유리 슬라이드 표면에 배열된 일련의 정제된 cDNA의 피콜리트레[note 2] 드롭을 특징으로 한다.[55]이러한 프로브는 고밀도 어레이보다 길며 대체 스플라이싱 이벤트를 식별할 수 없다.점형 배열은 두 개의 서로 다른 불소 형상을 사용하여 검체 및 대조 검체에 라벨을 붙이고 형광 비율을 사용하여 상대적인 풍요 측정값을 계산한다.[56]고밀도 어레이는 단일 형광 라벨을 사용하며, 각 샘플은 혼합되어 개별적으로 검출된다.[57]고밀도 어레이는 Apfymetrix GeneChip 어레이에 의해 대중화되었으며, 여기서 각 대본이 하나의 유전자를 함께 검사하는 여러 개의 짧은 25mer 프로브에 의해 정량화된다.[58]
님블젠 어레이는 마스크 없는 포토화학 방식으로 생산된 고밀도 어레이로, 소량 또는 다량으로 어레이를 유연하게 제조할 수 있도록 했다.이 어레이는 45~85m의 프로브에 10만s를 가졌으며 표현 분석을 위해 1색 라벨이 붙은 샘플과 혼합되었다.[59]일부 설계는 슬라이드당 최대 12개의 독립 어레이를 통합했다.
RNA-Seq
원칙과 진보
RNA-Seq는 RNA 추출물에 존재하는 대본을 포착하고 정량화하기 위한 계산 방법과 고투과 시퀀싱 방법론을 결합한 것을 말한다.[10]생성된 뉴클레오티드 시퀀스는 일반적으로 길이가 약 100bp이지만, 사용된 시퀀싱 방법에 따라 30bp에서 10,000bp 이상까지 범위가 될 수 있다.RNA-Seq는 대본에서 많은 짧은 조각이 있는 대본의 심층 샘플링을 활용하여 판독치를 참조 게놈 또는 서로 정렬하여 원본 RNA 대본의 컴퓨터 재구성을 가능하게 한다(de novo Assembly).[9]저유량 RNA와 고유량 RNA는 모두 마이크로어레이 녹음기보다 중요한 장점인 RNA-Seq 실험(역학 범위 5배)에서 정량화할 수 있다.또 입력 RNA의 경우 미세선(마이크로그램 수량)에 비해 RNA-Seq(나노그램 수량)의 양이 훨씬 적어 cDNA의 선형 증폭과 결합하면 세포구조를 단세포 수준까지 정밀하게 검사할 수 있다.[25][60]이론적으로 RNA-Seq에는 정량화 상한이 없으며, 비반복적 영역에서는 100bp 읽기에 대한 배경 잡음이 매우 낮다.[10]
RNA-Seq는 게놈 내에서 유전자를 식별하거나 특정 시점에 어떤 유전자가 활동하는지 식별하는 데 사용될 수 있으며, 판독 카운트를 사용하여 상대적인 유전자 발현 수준을 정확하게 모델링할 수 있다.RNA-Seq 방법론은 주로 처리량, 정확성, 읽기 길이를 증가시키는 DNA 염기서열 기술의 개발을 통해 지속적으로 개선되었다.[61]RNA-Seq는 2006년과 2008년 1차 서술 이후 2015년 극소수체학 기법으로 빠르게 채택돼 마이크로레이를 추월했다.[40][62][63]
개별 세포 수준의 대본 데이터 탐색은 RNA-Seq 라이브러리 준비 방법의 발전을 주도하여 감도의 극적인 발전을 가져왔다.단세포 대본은 현재 잘 설명되어 있고 심지어 고정된 조직에서 개별 세포의 대본을 직접 검사하는 RNA-Seq까지 확장되어 있다.[64]
방법들
RNA-Seq는 다양한 고처리 DNA 염기서열 기술의 빠른 발전과 함께 설립되었다.[65]단, 추출된 RNA 대본을 시퀀싱하기 전에 몇 가지 키 처리 단계를 수행한다.방법은 대본 농축, 단편화, 증폭, 단일 또는 쌍단 시퀀싱, 스트랜드 정보 보존 여부에 따라 다르다.[65]
RNA-Seq 실험의 민감도는 관심 있는 RNA의 부류를 풍부하게 하고 알려진 풍부한 RNA를 고갈시킴으로써 증가할 수 있다.mRNA 분자는 그들의 다-A 꼬리를 묶는 올리고뉴클레오티드 탐침을 사용하여 분리될 수 있다.또는 리보-배출은 풍부하지만 비정보적 리보솜 RNA(rRNA)를 세손의 특정 rRNA 시퀀스에 맞춘 탐침(예: 포유류 rRNA, 식물 rRNA)에 혼합하여 제거할 수 있다.그러나 리보-삭제는 또한 비특이적인 오프 타겟 성적서의 고갈을 통해 일부 편견을 일으킬 수 있다.[66]마이크로 RNA와 같은 작은 RNA는 젤 전기영양과 추출에 의해 그 크기에 따라 정화가 가능하다.
mRNA는 일반적인 고투과 시퀀싱 방법의 읽기 길이보다 길기 때문에, 대본은 보통 시퀀싱에 앞서 단편화된다.[67]단편화 방식은 도서관 건축 시퀀싱의 핵심 측면이다.단편화는 화학적 가수분해, 분무, 소닉 또는 체인-터미네이션 뉴클레오티드를 이용한 역전사에 의해 달성될 수 있다.[67]또는, 조각화와 cDNA 태깅은 전이효소 효소를 사용하여 동시에 수행될 수 있다.[68]
시퀀싱을 준비하는 동안 PCR에 의해 예상된 5' 및 3' 어댑터 시퀀스를 포함하는 조각에 대해 풍부하게 하기 위해 대본의 cDNA 복사본이 증폭될 수 있다.[69]또한 증폭은 극한 응용에서 50 pg 이하로 매우 낮은 RNA의 입력량을 염기서열화할 수 있도록 하기 위해 사용된다.[70]알려진 RNA의 스파이크인 제어장치는 GC-함량, 단편적 길이, 성적서 내의 단편적 위치에 의한 편향 등의 관점에서 도서관의 준비와 염기서열을 확인하기 위해 품질관리 평가에 사용할 수 있다.[71]고유분자 식별자(UMI)는 도서관 준비 과정에서 시퀀스 조각에 개별적으로 태그를 지정해 태그가 붙은 모든 파편이 고유하도록 하는 데 사용되는 짧은 무작위 시퀀스다.[72]UMI는 양적화를 위한 절대 척도, 도서관 건설 중에 도입된 후속 증폭 편향에 대해 교정할 수 있는 기회를 제공하고, 초기 표본 크기를 정확하게 추정한다.UMI는 입력 RNA의 양이 제한되고 샘플의 확장 증폭이 필요한 단세포 RNA-Seq transcriptomics에 특히 적합하다.[73][74][75]
일단 대본 분자가 준비되면 한 방향(단일 끝) 또는 양방향(쌍단 끝)으로 시퀀싱할 수 있다.단일 종단 시퀀스는 보통 생산에 더 빠르고, 쌍체 종단 시퀀싱보다 비용이 저렴하며, 유전자 발현 수준의 정량화에 충분하다.페어 엔드 시퀀싱은 보다 강력한 선형/조립체를 생성하며, 유전자 주석 및 대본 등소형 발견에 유용하다.[10]Strand 특정 RNA-Seq 방법은 시퀀싱된 대본의 Strand 정보를 보존한다.[76]스트랜드 정보가 없으면 판독은 유전자 위치에 맞춰질 수 있지만 유전자가 어느 방향으로 전사되는지는 알 수 없다.좌초-RNA-Seq는 서로 다른 방향으로 중복되는 유전자에 대한 전사 해독과 비모델 유기체에서 보다 강력한 유전자 예측을 하는 데 유용하다.[76]
플랫폼 | 상용 발매 | 일반적인 읽기 길이 | 실행당 최대 처리량 | 단일 읽기 정확도 | RNA-Seq는 NCBI SRA에 기록(2016년 10월)[79] |
---|---|---|---|---|---|
454 생명과학 | 2005 | 700 bp | 0.7 Gbp | 99.9% | 3548 |
일루미나 | 2006 | 50–300 bp | 900 Gbp | 99.9% | 362903 |
SOLiD | 2008 | 50 bp | 320 Gbp | 99.9% | 7032 |
이온 토렌트 | 2010 | 400 bp | 30Gbp | 98% | 1953 |
팩비오 | 2011 | 1만 bp | 2Gbp | 87% | 160 |
범례: NCBI SRA – 국립 생명공학 정보 시퀀스 읽기 보관 센터
현재 RNA-Seq는 시퀀싱에 앞서 RNA 분자를 cDNA 분자로 복사하는 것에 의존하고 있으므로, 후속 플랫폼은 전치사 데이터와 게놈 데이터에서 동일하다.결과적으로, DNA 염기서열 기술의 개발은 RNA-Seq의 결정적인 특징이었다.[78][80][81]나노포어 염기서열을 이용한 RNA의 직접 염기서열은 현재의 최첨단 RNA-Seq 기법을 나타낸다.[82][83]RNA의 나노포어 염기서열 분석은 cDNA 염기서열 분석 시 마스킹될 수 있는 변형된 염기서열을 검출할 수 있으며, 그렇지 않으면 편향을 일으킬 수 있는 증폭 단계도 제거할 수 있다.[11][84]
RNA-Seq 실험의 민감도와 정확도는 각 표본에서 얻은 판독치의 수에 따라 달라진다.[85][86]대본에 대한 충분한 커버리지를 보장하려면 많은 양의 읽기가 필요하며, 이를 통해 저농도 대본을 탐지할 수 있다.출력 범위가 제한된 시퀀싱 기술, 시퀀스 생성의 가변 효율, 가변 시퀀스 품질에 의해 실험 설계가 더욱 복잡해진다.이러한 고려사항들에 더하여, 모든 종은 다른 수의 유전자를 가지고 있기 때문에 효과적인 성적 증명서를 위한 맞춤형 시퀀스 수율을 필요로 한다.초기 연구들은 경험적으로 적절한 임계값을 결정했지만, 기술이 적절한 커버리지가 성숙함에 따라 성적표 포화에 의해 계산적으로 예측되었다.다소 반직관적으로, 저표현 유전자에서 미분표현 검출의 개선을 위한 가장 효과적인 방법은 판독치를 더하기보다는 생물학적 반복실험을 더 많이 추가하는 것이다.[87]현재 DNA요소 백과사전(ENCODE) 프로젝트에서 권장하는 벤치마크는 표준 RNA-Seq에 대한 엑소메 커버리지 70배, 희귀한 대본과 이소폼을 검출할 수 있는 최대 500배 엑소메 커버리지를 위한 것이다.[88][89][90]
데이터 분석
transcriptomics 방법은 매우 유사하며 마이크로 어레이와 RNA-Seq 실험 모두에 의미 있는 데이터를 생성하기 위해 상당한 연산이 필요하다.[91][92][93][94]마이크로 어레이 데이터는 고해상도 영상으로 기록돼 형상 검출과 스펙트럼 분석이 필요하다.[95]마이크로어레이 원시 이미지 파일의 크기는 각각 약 750MB인 반면 처리된 강도는 약 60MB이다.단일 대본과 일치하는 여러 개의 짧은 프로브를 통해 인트론-엑슨 구조에 대한 세부사항을 밝힐 수 있으며, 결과 신호의 진위를 결정하기 위해 통계적 모델이 필요하다.RNA-Seq 연구는 수십억 개의 짧은 DNA 시퀀스를 생성하는데, 이것은 수백만에서 수십억 개의 염기쌍으로 구성된 참조 게놈에 맞춰져야 한다.데이터 집합 내의 읽기 디노보 어셈블리는 매우 복잡한 시퀀스 그래프를 구성해야 한다.[96]RNA-Seq 연산은 매우 반복적이며 병렬 컴퓨팅의 이점을 제공하지만 현대 알고리즘은 소비자 컴퓨팅 하드웨어가 노보 독서의 조립이 필요 없는 단순한 transcriptomics 실험에 충분하다는 것을 의미한다.[97]인간 대본은 표본당 3천만 bp 시퀀스를 가진 RNA-Seq를 사용하여 정확하게 포착될 수 있다.[85][86]이 예제는 압축된 fastq 형식으로 저장할 경우 샘플당 약 1.8기가바이트의 디스크 공간이 필요할 것이다.각 유전자에 대한 처리된 카운트 데이터는 처리된 마이크로 어레이 강도와 동등하게 훨씬 더 작을 것이다.시퀀스 데이터는 시퀀스 읽기 보관소(SRA)와 같은 공용 저장소에 저장될 수 있다.[98]RNA-Seq 데이터 집합은 Gene Expression 옴니버스를 통해 업로드할 수 있다.[99]
이미지 처리
마이크로 어레이 이미지 처리는 이미지 내에서 형상의 정규 그리드를 정확하게 식별하고 각 형상에 대한 형광 강도를 독립적으로 정량화해야 한다.영상 아티팩트를 추가로 식별하고 전체 분석에서 제거해야 한다.형광 강도는 배열의 각 프로브의 시퀀스가 이미 알려져 있기 때문에 각 시퀀스의 풍부함을 직접적으로 나타낸다.[101]
RNA-seq의 첫 번째 단계에는 유사한 영상 처리도 포함되지만, 시퀀스 데이터로의 영상 변환은 일반적으로 기기 소프트웨어에 의해 자동으로 처리된다.Illumina sequence-by-synthesis 방법은 플로우 셀의 표면에 분산된 군집을 만들어낸다.[102]플로우 셀은 각 시퀀싱 사이클 동안 최대 4회까지 이미지화되며, 총 수십~ 수백 사이클의 사이클이 있다.플로우 셀 클러스터는 마이크로 어레이 스폿과 유사하며 시퀀싱 프로세스의 초기 단계에서 정확하게 식별되어야 한다.Roche의 파이로시퀀싱 방법에서 방출되는 빛의 세기는 균등분리기 반복에서 연속적인 뉴클레오티드의 수를 결정한다.이러한 방법에는 많은 변형이 있으며, 각각 결과 데이터에 대한 오류 프로필이 다르다.[103]
RNA-Seq 데이터 분석
RNA-Seq 실험은 유용한 정보를 얻기 위해 처리되어야 하는 많은 양의 원시 시퀀스 읽기를 생성한다.데이터 분석에는 일반적으로 실험 설계와 목표에 따라 달라지는 생물정보학 소프트웨어 도구(RNA-Seq 생물정보학 도구 목록 참조)의 조합이 필요하다.공정은 품질관리, 정렬, 정량화, 차등표현의 4단계로 나눌 수 있다.[104]대부분의 인기 있는 RNA-Seq 프로그램은 유닉스 환경 또는 R/바이오콘덕터 통계 환경 내에서 명령줄 인터페이스에서 실행된다.[93]
품질관리
시퀀스 판독이 완벽하지 않기 때문에 시퀀스 내 각 베이스의 정확도를 다운스트림 분석을 위해 추정할 필요가 있다.원시 데이터는 베이스콜에 대한 품질 점수가 높고, GC 콘텐츠가 예상 분포와 일치하며, 짧은 시퀀스 모티브(k-mer)[86]가 과대 표현되지 않으며, 읽기 중복률이 허용 가능할 정도로 낮다.시퀀스 품질 분석을 위해 FastQC와 FaQCs를 포함한 몇 가지 소프트웨어 옵션이 존재한다.[105][106]이상 징후는 이후 공정에서 제거(트리밍)하거나 특수 처리를 위해 태그가 붙을 수 있다.
정렬
판독 풍부함을 특정 유전자의 표현에 연결하기 위해, 대본 시퀀스는 참조 게놈에 정렬되거나 참조가 없는 경우 서로 정렬된다.[107][108][109]정렬 소프트웨어의 주요 과제는 수십억 개의 짧은 시퀀스를 의미 있는 시간 내에 정렬할 수 있는 충분한 속도, 진핵산 mRNA의 인트론 스플리싱(intron splicing)을 인식하고 처리할 수 있는 유연성, 그리고 그 지도를 여러 위치에 올바르게 할당하는 것이다.소프트웨어 발전은 이러한 문제를 크게 다루었고, 시퀀싱 읽기 길이의 증가는 모호한 읽기 정렬의 가능성을 감소시킨다.현재 사용 가능한 높은 처리량 시퀀스 얼라이너 목록은 EBI에 의해 유지된다.[110][111]
eukaryotes에서 도출된 1차 대본 mRNA 시퀀스를 참조 게놈으로 정렬하려면 성숙한 mRNA가 없는 인트론 시퀀스를 전문적으로 처리해야 한다.[112]짧은 읽기 얼라이너는 표준 스플라이스 사이트 시퀀스와 알려진 인트론 스플라이스 사이트 정보를 통해 알 수 있는 스플라이스 접합부를 식별하도록 특별히 설계된 추가 얼라인먼트를 수행한다.인트론 스플라이스 결합을 식별하면 읽기가 스플라이스 결합에 걸쳐 잘못 정렬되거나 잘못 폐기되는 것을 방지하여 더 많은 읽기가 참조 게놈에 정렬되도록 하고 유전자 표현 추정치의 정확도를 향상시킨다.유전자 조절은 mRNA 등성형 수준에서 발생할 수 있기 때문에, 스플라이스 인식 정렬은 또한 불룩 분석에서 손실될 수 있는 등성형 다양성 변화의 탐지를 허용한다.[113]
De novo 어셈블리는 레퍼런스 게놈을 사용하지 않고 전체 길이 대본 시퀀스를 구성하기 위해 서로 읽기를 정렬하는 데 사용될 수 있다.[114]de novo 어셈블리와 관련된 과제는 참조 기반 transcriptome에 비해 더 큰 연산 요건, 유전자 변형 또는 파편에 대한 추가 검증, 그리고 조립된 대본의 추가 주석 등을 포함한다.N50과 같은 성적표 어셈블리를 설명하는 데 사용되는 첫 번째 측정 기준은 오해의 소지가[115] 있는 것으로 나타났으며, 이제 개선된 평가 방법을 사용할 수 있다.[116][117]주석 기반 측정기준은 역호환 최고 적중 횟수와 같은 조립품 완전성에 대한 더 나은 평가다.일단 de novo를 조립하면, 이 어셈블리를 후속 시퀀스 정렬 방법과 정량적 유전자 발현 분석을 위한 기준으로 사용할 수 있다.
소프트웨어 | 방출된 | 마지막 업데이트 | 계산 효율 | 장단점 |
---|---|---|---|---|
벨벳 오아시스[118][119] | 2008 | 2011 | 로우, 싱글 스레드, 하이 RAM 요구 사항 | 원래의 짧은 읽기 조립자.그것은 이제 크게 대체되었다. |
SOAP데노버-트랜스[108] | 2011 | 2014 | 중간, 다중 스레드, 중간 RAM 요구 사항 | 짧은 읽기 조립자의 초기 예.그것은 성적 증명서 조립용으로 업데이트되었다. |
트랜스-ABYSS[120] | 2010 | 2016 | 중간, 다중 스레드, 중간 RAM 요구 사항 | 짧은 읽기에 적합하고 복잡한 대본 정보를 처리할 수 있으며, MPI-병렬 버전은 컴퓨팅 클러스터에 사용할 수 있다. |
삼위일체[121][96] | 2011 | 2017 | 중간, 다중 스레드, 중간 RAM 요구 사항 | 짧은 읽기에 적합하다.복잡한 대본은 다룰 수 있지만 기억력이 풍부하다. |
미라스트[122] | 1999 | 2016 | 중간, 다중 스레드, 중간 RAM 요구 사항 | 반복 시퀀스를 처리할 수 있고, 서로 다른 시퀀싱 형식을 결합하며, 광범위한 시퀀스 플랫폼을 수용할 수 있다. |
뉴블러[123] | 2004 | 2012 | 로우, 싱글 스레드, 하이 RAM 요구 사항 | Roche 454 sequencers의 전형적인 호모 폴리머 시퀀싱 오류를 수용하도록 전문화되었다. |
CLC 게놈 워크벤치[124] | 2008 | 2014 | 높은 RAM 요구 사항, 멀티스레드, 낮은 RAM 요구 사항 | 그래픽 사용자 인터페이스가 있고, 다양한 시퀀싱 기술을 결합할 수 있으며, 대본 특정 기능이 없으며, 사용하기 전에 라이센스를 구입해야 한다. |
SPAdes[125] | 2012 | 2017 | 높은 RAM 요구 사항, 멀티스레드, 낮은 RAM 요구 사항 | 단일 세포에 대한 transcriptomics 실험에 사용된다. |
RSEM[126] | 2011 | 2017 | 높은 RAM 요구 사항, 멀티스레드, 낮은 RAM 요구 사항 | 대안으로 분할된 대본의 빈도를 추정할 수 있다.사용자 친화적. |
스트링타이[97][127] | 2015 | 2019 | 높은 RAM 요구 사항, 멀티스레드, 낮은 RAM 요구 사항 | 참조 안내 및 de novo 조립 방법의 조합을 사용하여 대본을 식별할 수 있다. |
범례: RAM – RAM – RAM; MPI – 메시지 전달 인터페이스; EST – 표현된 시퀀스 태그
수량화
유전자, exon 또는 대본 수준에서 시퀀스 정렬의 정량화를 수행할 수 있다.[87]일반적인 출력물에는 소프트웨어에 제공된 각 형상에 대한 판독 카운트 표(예: 일반 형상 포맷 파일의 유전자에 대한 표)가 포함된다.예를 들어 Gene과 exon 읽기 계수는 HTSeq를 사용하여 꽤 쉽게 계산할 수 있다.[129]대본 레벨에서의 정량화는 더 복잡하며, 예를 들어 커프링크 소프트웨어를 사용하여 짧은 읽기 정보로부터 대본 등소형 풍부함을 추정하기 위한 확률론적 방법이 필요하다.[113]여러 위치에 균등하게 정렬된 판독값을 식별하여 제거하거나 가능한 위치 중 하나에 정렬하거나 가장 가능성이 높은 위치에 정렬해야 한다.
일부 정량화 방법은 판독치를 기준 시퀀스에 정확히 정렬해야 하는 필요성을 회피할 수 있다.칼리스토 소프트웨어 방식은 사이비정렬과 정량화를 결합해 토패트/수갑링크 소프트웨어가 사용하는 것과 같은 현대적 방법보다 2배 더 빠른 속도로 작동하는 한 단계로 계산 부담이 적다.[130]
미분식
각 대본의 정량적 계수를 이용할 수 있게 되면 데이터를 정규화, 모델링 및 통계적으로 분석하여 차등 유전자 발현을 측정한다.[107]대부분의 도구는 유전자 표를 읽고 숫자를 입력으로 읽지만, 커프스디프와 같은 일부 프로그램에서는 이진 정렬 지도 형식 읽기 정렬을 입력으로 받아들인다.이러한 분석의 최종 산출물은 치료법과 그 차이의 확률 추정치 사이의 차등 표현에 대한 관련 쌍별 테스트와 함께 유전자 목록이다.[131]
소프트웨어 | 환경 | 전문화 |
---|---|---|
커프스디프2[107] | 유닉스 기반 | mRNA의 대체 스플라이싱을 추적하는 대본 분석 |
엣지R[92] | R/바이오콘덕터 | 카운트 기반 게놈 데이터 |
DEseq2[132] | R/바이오콘덕터 | 유연한 데이터 유형, 낮은 복제 |
림마/붐[91] | R/바이오콘덕터 | 마이크로 어레이 또는 RNA-Seq 데이터, 유연한 실험 설계 |
볼가운[133] | R/바이오콘덕터 | 효율적이고 민감한 스크립트 검색, 유연성 |
범례: mRNA - 메신저 RNA.
확인
기록 분석은 독립적 기법(예: 정량적 PCR(qPCR))을 사용하여 검증할 수 있으며, 이를 인식 가능하고 통계적으로 평가할 수 있다.[134]유전자 발현은 관심 유전자와 통제 유전자에 대해 정의된 표준에 따라 측정된다.qPCR에 의한 측정은 RNA-Seq에 의해 얻어진 것과 유사하다. 여기서 qPCR은 주어진 샘플에서 목표 영역의 농도에 대한 값을 계산할 수 있다. 그러나, qPCR은 보통 3의 끝을 향해 300bp 이하의 증폭기로 제한된다.UTR.[135] 대본 ISO 형식의 검증이 필요한 경우, RNA-Seq 읽기 정렬의 검사는 최대의 차별을 위해 QPCR 프라이머가 배치될 수 있는 위치를 표시해야 한다.관심 유전자와 함께 복수의 제어 유전자의 측정은 생물학적 맥락 안에서 안정된 참조를 만들어낸다.[136]RNA-Seq 데이터의 qPCR 유효성검사는 일반적으로 서로 다른 RNA-Seq 방법들이 높은 상관관계를 갖는다는 것을 보여주었다.[62][137][138]
주요 유전자의 기능적 검증은 사후 기록적 계획을 위한 중요한 고려사항이다.관찰된 유전자 표현 패턴은 관심 유기체에 대한 독립적인 녹다운/구제 연구에 의해 표현형과 기능적으로 연계될 수 있다.[139]
적용들
진단 및 질병 프로파일링
기록학적 전략은 질병 진단 및 프로파일링을 포함한 다양한 생물 의학 연구 영역에 광범위하게 적용되어 왔다.[10][140]RNA-Seq 접근방식은 전사 시작 부위의 대규모 식별, 대체 촉진자 사용 및 새로운 스플리싱 변경을 허용했다.이러한 규제 요소는 인간의 질병에서 중요하며 따라서 그러한 변형을 정의하는 것은 질병 관련 연구의 해석에 매우 중요하다.[141]RNA-Seq는 질병과 연관된 단일 뉴클레오티드 다형성(SNP), 알레르기에 특화된 표현, 유전자 유착 등도 식별할 수 있어 질병 인과 변형의 이해에 기여할 수 있다.[142]
역트랜스포존은 역전사를 수반하는 과정을 통해 진핵 게놈 내에서 증식하는 전이성 원소다.RNA-Seq는 질병을 유발하는 다양한 후생유전학적 메커니즘에 의해 이웃 유전자의 전사에 영향을 미칠 수 있는 내생적 역트랜스포존스의 전사에 관한 정보를 제공할 수 있다.[143]마찬가지로 면역세포 집단을 해부하고 환자의 T세포와 B세포 수용체 레퍼토리를 시퀀싱하는 능력 때문에 RNA-Seq를 이용해 면역 관련 질병을 이해할 수 있는 잠재력이 급속히 확대되고 있다.[144][145]
인간 및 병원체 성적 증명서
인간 병원체의 RNA-Seq는 유전자 발현 변화를 정량화하고, 새로운 독성 인자를 식별하고, 항생제 내성을 예측하고, 호스트-병원성 면역 상호작용을 공개하는 확립된 방법이 되었다.[146][147]이 기술의 주요 목적은 최적화된 감염 관리 조치와 표적화된 개별 치료법을 개발하는 것이다.[145]
대본 분석은 주로 호스트나 병원체에 초점을 맞춰왔다.이중 RNA-Seq는 감염 과정 전반에 걸쳐 병원체와 호스트 양쪽의 RNA 발현에 동시에 적용되었다.이 기법은 초기 접촉부터 침입에 이르기까지 양 상호작용 파트너의 동적 반응과 이종 간 유전자 규제 네트워크와 숙주 면역 시스템에 의한 병원체 또는 간극의 최종 지속성을 연구할 수 있게 한다.[148][149]
환경에 대한 대응
transcriptomics는 생물학적, 아바이오틱스 환경적 스트레스에 반응하고 대항하는 유전자와 경로를 식별할 수 있게 한다.[150][139]transcriptomics의 비목표적 특성은 복잡한 시스템에서 새로운 전사 네트워크를 식별할 수 있게 한다.예를 들어, AP2-EREBP의 대본 등소형 역할 식별을 포함하여 서로 다른 개발 단계에서 병아리페라 선의 범위에 대한 비교 분석에서 가뭄 및 염분 응력과 관련된 구별되는 전사 프로파일을 식별했다.[150]진균 병원체 칸디다 알비칸에 의한 바이오필름 형성 중 유전자 발현 조사 결과, 바이오필름의 확립과 유지보수에 중요한 유전자의 공동 조절 세트가 밝혀졌다.[151]
또한 성적 증명서 프로파일링은 약물 내성의 메커니즘에 대한 중요한 정보를 제공한다.말라리아 원충 falciparum, 몹쓸 기생충 humans,[152]에서 말라리아에 책임이 있는 1000여개 소이의 해석 무성intraerythrocytic 개발 주기 동남에서 소이에 다북쑥 저항과 관련이 있는 초기 단계를 통해 펼쳐진 단백질 반응하고 천천히 진행의 upregulation를 확인했다.Asia의[153]
유전자 함수 주석
모든 성적 표현 기법은 유전자의 기능을 식별하고 특정 표현형을 담당하는 사람들을 식별하는 데 특히 유용했다.아라비도프스의 transcriptomics는 표현형과 함께 금속의 흡수, 내성, 그리고 동태와 관련된 금속과 관련된 유전자를 과대평가하는 에코타입이다.[154]서로 다른 조직에 걸친 RNA-Seq 데이터 집합의 통합은 상업적으로 중요한 유기체(예: 오이)[155] 또는 위협적인 종(예: 코알라)에서 유전자 기능의 주석을 개선하기 위해 사용되어 왔다.[156]
RNA-Seq 리드의 조합은 참조 게놈에[121] 의존하지 않기 때문에 존재하지 않거나 제대로 발달되지 않은 게놈 자원을 가진 비모델 유기체의 유전자 발현 연구에 이상적이다.예를 들어, 더글라스 전나무 번식 프로그램에 사용된 SNP의 데이터베이스는 염기서열 유전자가 없는 상태에서 de novo transcriptome 분석에 의해 만들어졌다.[157]마찬가지로 바닷가재에서 심장, 근육, 신경조직의 발달에 작용하는 유전자도 게놈 서열을 사용하지 않고 여러 조직 유형의 성적증명서를 비교해 확인하였다.[158]RNA-Seq는 또한 기존의 염기서열화된 게놈에서 이전에 알려지지 않았던 단백질 코딩 영역을 식별하는 데 사용될 수 있다.
Transcriptome 기반 노후 시계
개인의 노화 속도 측정 없이는 노화 관련 예방적 개입이 불가능하다.노화율을 측정하는 가장 최신의 복잡한 방법은 인간 노화의 다양한 생물학적 마커를 사용하는 것인데, 대상자의 나이를 예측하기 위해 어떤 유형의 오믹스 생물학적 데이터에 대해 훈련될 수 있는 심층 신경 네트워크의 활용에 기초한다.노화는 성적 증명서적 변화의 강력한 원동력인 것으로 나타났다.[159][160]녹취록을 기반으로 한 노후화된 시계는 데이터의 상당한 변동과 상대적으로 낮은 정확도로 어려움을 겪어왔다.그러나 시간적 스케일링과 이항성을 사용하여 생물학적 연령을 정확하게 예측하는 유전자 세트를 정의함으로써 이론적 한계에 가까운 평가에 도달할 수 있다.[159]
비코딩 RNA
Transcriptomics는 세포의 mRNA 함량에 가장 일반적으로 적용된다.그러나 단백질로 번역되지 않고 그 대신 직접적인 기능(예: 단백질 번역, DNA 복제, RNA 스플라이싱, 전사적 조절에서의 역할)을 갖는 비코딩 RNA(ncRNA)에도 동일한 기법이 동일하게 적용된다.[161][162][163][164]이러한 ncRNA 중 많은 수가 암, 심혈관, 신경계 질환을 포함한 질병 상태에 영향을 미친다.[165]
Transcriptome
transcriptomics 연구는 실험의 원래 목적을 훨씬 뛰어넘는 잠재적 응용을 가진 대량의 데이터를 생성한다.이와 같이 원시 또는 처리된 데이터는 더 넓은 과학 커뮤니티를 위한 효용성을 보장하기 위해 공공 데이터베이스에 보관될 수 있다.예를 들어 2018년 현재, Gene Expression Omnibus에는 수백만 개의 실험이 포함되어 있다.[166]
이름 | 호스트 | 데이터 | 설명 |
---|---|---|---|
진 표현 옴니버스[99] | 엔씨비 | 마이크로어레이 RNA-Seq | 모든 출처의 데이터를 수용하는 첫 번째 transcriptomics 데이터베이스.효과적인 해석과 반복성을 보장하기 위해 필요한 실험 메타데이터를 정의하는 MIAME 및 MINSEQE 커뮤니티 표준을 도입했다.[167][168] |
ArrayExpress[169] | ENA | 마이크로어레이 | Gene Expression 옴니버스로부터 데이터셋을 수입하고 직접 제출을 수락한다.처리된 데이터와 실험 메타데이터는 ArrayExpress에 저장되며, 원시 시퀀스 읽기는 ENA에 저장된다.MIAME 및 [167][168]MINSEQE 표준 준수 |
표현 아틀라스[170] | EBI | 마이크로어레이 RNA-Seq | 동물 및 식물을 위한 조직별 유전자 표현 데이터베이스.Gene Ontology 용어, InterPro 도메인 또는 경로의 기능적 농축과 같은 이차 분석 및 시각화를 표시한다.가능한 경우 단백질 풍부 데이터에 대한 링크 |
게네베스티게이터[171] | 비공개 큐레이터 | 마이크로어레이 RNA-Seq | 의료 및 식물 생물학 데이터에 초점을 맞춘 공개 기록 데이터셋의 수동 큐레이션 포함.개별 실험은 다양한 실험에서 유전자 발현을 비교할 수 있도록 전체 데이터베이스에 걸쳐 정규화된다.전체 기능성은 제한된 기능성에 대한 자유로운 접근과 함께 라이센스 구매가 필요하다. |
RefEx[172] | DDBJ | 전부 | 인간, 쥐, 그리고 쥐의 40개의 다른 장기의 성적 증명서.해부학적 구조의 3D 표현에 투영된 열맵으로 시각화된 유전자 표현. |
비코드[173] | noncode.org | RNA-Seq | tRNA 및 rRNA를 제외한 비코딩 RNA(ncRNA) |
Legend: NCBI – National Center for Biotechnology Information; EBI – European Bioinformatics Institute; DDBJ – DNA Data Bank of Japan; ENA – European Nucleotide Archive; MIAME – Minimum Information About a Microarray Experiment; MINSEQE – Minimum Information about a high-throughput nucleotide SEQuencing Experiment.
참고 항목
참조
본 기사는 CC BY 4.0 라이센스(2017년)에 따라 다음과 같은 출처에서 개작되었다(검토자 보고서: Rohan Lowe; Neil Shirley; Mark Bleackley; Stephen Dolan; Thomas Shafee (18 May 2017). "Transcriptomics technologies". PLOS Computational Biology. 13 (5): e1005457. doi:10.1371/JOURNAL.PCBI.1005457. ISSN 1553-734X. PMC 5436640. PMID 28545146. S2CID 3714586. Wikidata Q33703532.
- ^ "Medline trend: automated yearly statistics of PubMed results for any query". dan.corlan.net. Retrieved 2016-10-05.
- ^ a b Adams MD, Kelley JM, Gocayne JD, Dubnick M, Polymeropoulos MH, Xiao H, et al. (June 1991). "Complementary DNA sequencing: expressed sequence tags and human genome project". Science. 252 (5013): 1651–6. Bibcode:1991Sci...252.1651A. doi:10.1126/science.2047873. PMID 2047873. S2CID 13436211.
- ^ Pan Q, Shai O, Lee LJ, Frey BJ, Blencowe BJ (December 2008). "Deep surveying of alternative splicing complexity in the human transcriptome by high-throughput sequencing". Nature Genetics. 40 (12): 1413–5. doi:10.1038/ng.259. PMID 18978789. S2CID 9228930.
- ^ a b Sultan M, Schulz MH, Richard H, Magen A, Klingenhoff A, Scherf M, et al. (August 2008). "A global view of gene activity and alternative splicing by deep sequencing of the human transcriptome". Science. 321 (5891): 956–60. Bibcode:2008Sci...321..956S. doi:10.1126/science.1160342. PMID 18599741. S2CID 10013179.
- ^ Lappalainen T, Sammeth M, Friedländer MR, 't Hoen PA, Monlong J, Rivas MA, et al. (September 2013). "Transcriptome and genome sequencing uncovers functional variation in humans". Nature. 501 (7468): 506–11. Bibcode:2013Natur.501..506L. doi:10.1038/nature12531. PMC 3918453. PMID 24037378.
- ^ a b Melé M, Ferreira PG, Reverter F, DeLuca DS, Monlong J, Sammeth M, et al. (May 2015). "Human genomics. The human transcriptome across tissues and individuals". Science. 348 (6235): 660–5. Bibcode:2015Sci...348..660M. doi:10.1126/science.aaa0355. PMC 4547472. PMID 25954002.
- ^ Sandberg R (January 2014). "Entering the era of single-cell transcriptomics in biology and medicine". Nature Methods. 11 (1): 22–4. doi:10.1038/nmeth.2764. PMID 24524133. S2CID 27632439.
- ^ Kolodziejczyk AA, Kim JK, Svensson V, Marioni JC, Teichmann SA (May 2015). "The technology and biology of single-cell RNA sequencing". Molecular Cell. 58 (4): 610–20. doi:10.1016/j.molcel.2015.04.005. PMID 26000846.
- ^ a b c d e f McGettigan PA (February 2013). "Transcriptomics in the RNA-seq era". Current Opinion in Chemical Biology. 17 (1): 4–11. doi:10.1016/j.cbpa.2012.12.008. PMID 23290152.
- ^ a b c d e f g h i j k l Wang Z, Gerstein M, Snyder M (January 2009). "RNA-Seq: a revolutionary tool for transcriptomics". Nature Reviews Genetics. 10 (1): 57–63. doi:10.1038/nrg2484. PMC 2949280. PMID 19015660.
- ^ a b c Ozsolak F, Milos PM (February 2011). "RNA sequencing: advances, challenges and opportunities". Nature Reviews Genetics. 12 (2): 87–98. doi:10.1038/nrg2934. PMC 3031867. PMID 21191423.
- ^ a b c Morozova O, Hirst M, Marra MA (2009). "Applications of new sequencing technologies for transcriptome analysis". Annual Review of Genomics and Human Genetics. 10: 135–51. doi:10.1146/annurev-genom-082908-145957. PMID 19715439.
- ^ Sim GK, Kafatos FC, Jones CW, Koehler MD, Efstratiadis A, Maniatis T (December 1979). "Use of a cDNA library for studies on evolution and developmental expression of the chorion multigene families". Cell. 18 (4): 1303–16. doi:10.1016/0092-8674(79)90241-1. PMID 519770.
- ^ Sutcliffe JG, Milner RJ, Bloom FE, Lerner RA (August 1982). "Common 82-nucleotide sequence unique to brain RNA". Proceedings of the National Academy of Sciences of the United States of America. 79 (16): 4942–6. Bibcode:1982PNAS...79.4942S. doi:10.1073/pnas.79.16.4942. PMC 346801. PMID 6956902.
- ^ Putney SD, Herlihy WC, Schimmel P (April 1983). "A new troponin T and cDNA clones for 13 different muscle proteins, found by shotgun sequencing". Nature. 302 (5910): 718–21. Bibcode:1983Natur.302..718P. doi:10.1038/302718a0. PMID 6687628. S2CID 4364361.
- ^ a b c d Marra MA, Hillier L, Waterston RH (January 1998). "Expressed sequence tags—ESTablishing bridges between genomes". Trends in Genetics. 14 (1): 4–7. doi:10.1016/S0168-9525(97)01355-3. PMID 9448457.
- ^ Alwine JC, Kemp DJ, Stark GR (December 1977). "Method for detection of specific RNAs in agarose gels by transfer to diazobenzyloxymethyl-paper and hybridization with DNA probes". Proceedings of the National Academy of Sciences of the United States of America. 74 (12): 5350–4. Bibcode:1977PNAS...74.5350A. doi:10.1073/pnas.74.12.5350. PMC 431715. PMID 414220.
- ^ Becker-André M, Hahlbrock K (November 1989). "Absolute mRNA quantification using the polymerase chain reaction (PCR). A novel approach by a PCR aided transcript titration assay (PATTY)". Nucleic Acids Research. 17 (22): 9437–46. doi:10.1093/nar/17.22.9437. PMC 335144. PMID 2479917.
- ^ Piétu G, Mariage-Samson R, Fayein NA, Matingou C, Eveno E, Houlgatte R, Decraene C, Vandenbrouck Y, Tahi F, Devignes MD, Wirkner U, Ansorge W, Cox D, Nagase T, Nomura N, Auffray C (February 1999). "The Genexpress IMAGE knowledge base of the human brain transcriptome: a prototype integrated resource for functional and computational genomics". Genome Research. 9 (2): 195–209. doi:10.1101/gr.9.2.195. PMC 310711. PMID 10022985.
- ^ Velculescu VE, Zhang L, Zhou W, Vogelstein J, Basrai MA, Bassett DE, Hieter P, Vogelstein B, Kinzler KW (January 1997). "Characterization of the yeast transcriptome". Cell. 88 (2): 243–51. doi:10.1016/S0092-8674(00)81845-0. PMID 9008165. S2CID 11430660.
- ^ a b c d Velculescu VE, Zhang L, Vogelstein B, Kinzler KW (October 1995). "Serial analysis of gene expression". Science. 270 (5235): 484–7. Bibcode:1995Sci...270..484V. doi:10.1126/science.270.5235.484. PMID 7570003. S2CID 16281846.
- ^ Audic S, Claverie JM (October 1997). "The significance of digital gene expression profiles". Genome Research. 7 (10): 986–95. doi:10.1101/gr.7.10.986. PMID 9331369.
- ^ a b c d e f Mantione KJ, Kream RM, Kuzelova H, Ptacek R, Raboch J, Samuel JM, Stefano GB (August 2014). "Comparing bioinformatic gene expression profiling methods: microarray and RNA-Seq". Medical Science Monitor Basic Research. 20: 138–42. doi:10.12659/MSMBR.892101. PMC 4152252. PMID 25149683.
- ^ Zhao S, Fung-Leung WP, Bittner A, Ngo K, Liu X (2014). "Comparison of RNA-Seq and microarray in transcriptome profiling of activated T cells". PLOS ONE. 9 (1): e78644. Bibcode:2014PLoSO...978644Z. doi:10.1371/journal.pone.0078644. PMC 3894192. PMID 24454679.
- ^ a b Hashimshony T, Wagner F, Sher N, Yanai I (September 2012). "CEL-Seq: single-cell RNA-Seq by multiplexed linear amplification". Cell Reports. 2 (3): 666–73. doi:10.1016/j.celrep.2012.08.003. PMID 22939981.
- ^ Stears RL, Getts RC, Gullans SR (August 2000). "A novel, sensitive detection system for high-density microarrays using dendrimer technology". Physiological Genomics. 3 (2): 93–9. doi:10.1152/physiolgenomics.2000.3.2.93. PMID 11015604.
- ^ a b c d e f Illumina (2011-07-11). "RNA-Seq Data Comparison with Gene Expression Microarrays" (PDF). European Pharmaceutical Review.
- ^ a b Black MB, Parks BB, Pluta L, Chu TM, Allen BC, Wolfinger RD, Thomas RS (February 2014). "Comparison of microarrays and RNA-seq for gene expression analyses of dose-response experiments". Toxicological Sciences. 137 (2): 385–403. doi:10.1093/toxsci/kft249. PMID 24194394.
- ^ Marioni JC, Mason CE, Mane SM, Stephens M, Gilad Y (September 2008). "RNA-seq: an assessment of technical reproducibility and comparison with gene expression arrays". Genome Research. 18 (9): 1509–17. doi:10.1101/gr.079558.108. PMC 2527709. PMID 18550803.
- ^ SEQC/MAQC-III Consortium (September 2014). "A comprehensive assessment of RNA-seq accuracy, reproducibility and information content by the Sequencing Quality Control Consortium". Nature Biotechnology. 32 (9): 903–14. doi:10.1038/nbt.2957. PMC 4321899. PMID 25150838.
- ^ Chen JJ, Hsueh HM, Delongchamp RR, Lin CJ, Tsai CA (October 2007). "Reproducibility of microarray data: a further analysis of microarray quality control (MAQC) data". BMC Bioinformatics. 8: 412. doi:10.1186/1471-2105-8-412. PMC 2204045. PMID 17961233.
- ^ Larkin JE, Frank BC, Gavras H, Sultana R, Quackenbush J (May 2005). "Independence and reproducibility across microarray platforms". Nature Methods. 2 (5): 337–44. doi:10.1038/nmeth757. PMID 15846360. S2CID 16088782.
- ^ a b Nelson NJ (April 2001). "Microarrays have arrived: gene expression tool matures". Journal of the National Cancer Institute. 93 (7): 492–4. doi:10.1093/jnci/93.7.492. PMID 11287436.
- ^ Schena M, Shalon D, Davis RW, Brown PO (October 1995). "Quantitative monitoring of gene expression patterns with a complementary DNA microarray". Science. 270 (5235): 467–70. Bibcode:1995Sci...270..467S. doi:10.1126/science.270.5235.467. PMID 7569999. S2CID 6720459.
- ^ a b Pozhitkov AE, Tautz D, Noble PA (June 2007). "Oligonucleotide microarrays: widely applied—poorly understood". Briefings in Functional Genomics & Proteomics. 6 (2): 141–8. doi:10.1093/bfgp/elm014. PMID 17644526.
- ^ a b c Heller MJ (2002). "DNA microarray technology: devices, systems, and applications". Annual Review of Biomedical Engineering. 4: 129–53. doi:10.1146/annurev.bioeng.4.020702.153438. PMID 12117754.
- ^ McLachlan GJ, Do K, Ambroise C (2005). Analyzing Microarray Gene Expression Data. Hoboken: John Wiley & Sons. ISBN 978-0-471-72612-8.[페이지 필요]
- ^ Brenner S, Johnson M, Bridgham J, Golda G, Lloyd DH, Johnson D, Luo S, McCurdy S, Foy M, Ewan M, Roth R, George D, Eletr S, Albrecht G, Vermaas E, Williams SR, Moon K, Burcham T, Pallas M, DuBridge RB, Kirchner J, Fearon K, Mao J, Corcoran K (June 2000). "Gene expression analysis by massively parallel signature sequencing (MPSS) on microbead arrays". Nature Biotechnology. 18 (6): 630–4. doi:10.1038/76469. PMID 10835600. S2CID 13884154.
- ^ Meyers BC, Vu TH, Tej SS, Ghazal H, Matvienko M, Agrawal V, Ning J, Haudenschild CD (August 2004). "Analysis of the transcriptional complexity of Arabidopsis thaliana by massively parallel signature sequencing". Nature Biotechnology. 22 (8): 1006–11. doi:10.1038/nbt992. PMID 15247925. S2CID 15336496.
- ^ a b Bainbridge MN, Warren RL, Hirst M, Romanuik T, Zeng T, Go A, Delaney A, Griffith M, Hickenbotham M, Magrini V, Mardis ER, Sadar MD, Siddiqui AS, Marra MA, Jones SJ (September 2006). "Analysis of the prostate cancer cell line LNCaP transcriptome using a sequencing-by-synthesis approach". BMC Genomics. 7: 246. doi:10.1186/1471-2164-7-246. PMC 1592491. PMID 17010196.
- ^ Mortazavi A, Williams BA, McCue K, Schaeffer L, Wold B (July 2008). "Mapping and quantifying mammalian transcriptomes by RNA-Seq". Nature Methods. 5 (7): 621–8. doi:10.1038/nmeth.1226. PMID 18516045. S2CID 205418589.
- ^ Wilhelm BT, Marguerat S, Watt S, Schubert F, Wood V, Goodhead I, Penkett CJ, Rogers J, Bähler J (June 2008). "Dynamic repertoire of a eukaryotic transcriptome surveyed at single-nucleotide resolution". Nature. 453 (7199): 1239–43. Bibcode:2008Natur.453.1239W. doi:10.1038/nature07002. PMID 18488015. S2CID 205213499.
- ^ Sultan M, Schulz MH, Richard H, Magen A, Klingenhoff A, Scherf M, Seifert M, Borodina T, Soldatov A, Parkhomchuk D, Schmidt D, O'Keeffe S, Haas S, Vingron M, Lehrach H, Yaspo ML (August 2008). "A global view of gene activity and alternative splicing by deep sequencing of the human transcriptome". Science. 321 (5891): 956–60. Bibcode:2008Sci...321..956S. doi:10.1126/science.1160342. PMID 18599741. S2CID 10013179.
- ^ a b Chomczynski P, Sacchi N (April 1987). "Single-step method of RNA isolation by acid guanidinium thiocyanate-phenol-chloroform extraction". Analytical Biochemistry. 162 (1): 156–9. doi:10.1016/0003-2697(87)90021-2. PMID 2440339.
- ^ a b Chomczynski P, Sacchi N (2006). "The single-step method of RNA isolation by acid guanidinium thiocyanate-phenol-chloroform extraction: twenty-something years on". Nature Protocols. 1 (2): 581–5. doi:10.1038/nprot.2006.83. PMID 17406285. S2CID 28653075.
- ^ Grillo M, Margolis FL (September 1990). "Use of reverse transcriptase polymerase chain reaction to monitor expression of intronless genes". BioTechniques. 9 (3): 262, 264, 266–8. PMID 1699561.
- ^ Bryant S, Manning DL (1998). "Isolation of messenger RNA". RNA Isolation and Characterization Protocols. Methods in Molecular Biology. Vol. 86. pp. 61–4. doi:10.1385/0-89603-494-1:61. ISBN 978-0-89603-494-5. PMID 9664454.
- ^ Zhao W, He X, Hoadley KA, Parker JS, Hayes DN, Perou CM (June 2014). "Comparison of RNA-Seq by poly (A) capture, ribosomal RNA depletion, and DNA microarray for expression profiling". BMC Genomics. 15: 419. doi:10.1186/1471-2164-15-419. PMC 4070569. PMID 24888378.
- ^ 환경 샘플의 몇 가지 예는 바닷물, 토양 또는 공기를 포함한다.
- ^ Close TJ, Wanamaker SI, Caldo RA, Turner SM, Ashlock DA, Dickerson JA, Wing RA, Muehlbauer GJ, Kleinhofs A, Wise RP (March 2004). "A new resource for cereal genomics: 22K barley GeneChip comes of age". Plant Physiology. 134 (3): 960–8. doi:10.1104/pp.103.034462. PMC 389919. PMID 15020760.
- ^ a b c d e Lowe R, Shirley N, Bleackley M, Dolan S, Shafee T (May 2017). "Transcriptomics technologies". PLOS Computational Biology. 13 (5): e1005457. Bibcode:2017PLSCB..13E5457L. doi:10.1371/journal.pcbi.1005457. PMC 5436640. PMID 28545146.
- ^ a b Shiraki T, Kondo S, Katayama S, Waki K, Kasukawa T, Kawaji H, Kodzius R, Watahiki A, Nakamura M, Arakawa T, Fukuda S, Sasaki D, Podhajska A, Harbers M, Kawai J, Carninci P, Hayashizaki Y (December 2003). "Cap analysis gene expression for high-throughput analysis of transcriptional starting point and identification of promoter usage". Proceedings of the National Academy of Sciences of the United States of America. 100 (26): 15776–81. Bibcode:2003PNAS..10015776S. doi:10.1073/pnas.2136655100. PMC 307644. PMID 14663149.
- ^ Romanov V, Davidoff SN, Miles AR, Grainger DW, Gale BK, Brooks BD (March 2014). "A critical comparison of protein microarray fabrication technologies". The Analyst. 139 (6): 1303–26. Bibcode:2014Ana...139.1303R. doi:10.1039/c3an01577g. PMID 24479125.
- ^ a b Barbulovic-Nad I, Lucente M, Sun Y, Zhang M, Wheeler AR, Bussmann M (2006-10-01). "Bio-microarray fabrication techniques—a review". Critical Reviews in Biotechnology. 26 (4): 237–59. CiteSeerX 10.1.1.661.6833. doi:10.1080/07388550600978358. PMID 17095434. S2CID 13712888.
- ^ Auburn RP, Kreil DP, Meadows LA, Fischer B, Matilla SS, Russell S (July 2005). "Robotic spotting of cDNA and oligonucleotide microarrays". Trends in Biotechnology. 23 (7): 374–9. doi:10.1016/j.tibtech.2005.04.002. PMID 15978318.
- ^ Shalon D, Smith SJ, Brown PO (July 1996). "A DNA microarray system for analyzing complex DNA samples using two-color fluorescent probe hybridization". Genome Research. 6 (7): 639–45. doi:10.1101/gr.6.7.639. PMID 8796352.
- ^ Lockhart DJ, Dong H, Byrne MC, Follettie MT, Gallo MV, Chee MS, Mittmann M, Wang C, Kobayashi M, Horton H, Brown EL (December 1996). "Expression monitoring by hybridization to high-density oligonucleotide arrays". Nature Biotechnology. 14 (13): 1675–80. doi:10.1038/nbt1296-1675. PMID 9634850. S2CID 35232673.
- ^ Irizarry RA, Bolstad BM, Collin F, Cope LM, Hobbs B, Speed TP (February 2003). "Summaries of Affymetrix GeneChip probe level data". Nucleic Acids Research. 31 (4): 15e–15. doi:10.1093/nar/gng015. PMC 150247. PMID 12582260.
- ^ Selzer RR, Richmond TA, Pofahl NJ, Green RD, Eis PS, Nair P, Brothman AR, Stallings RL (November 2005). "Analysis of chromosome breakpoints in neuroblastoma at sub-kilobase resolution using fine-tiling oligonucleotide array CGH". Genes, Chromosomes & Cancer. 44 (3): 305–19. doi:10.1002/gcc.20243. PMID 16075461. S2CID 39437458.
- ^ Svensson V, Vento-Tormo R, Teichmann SA (April 2018). "Exponential scaling of single-cell RNA-seq in the past decade". Nature Protocols. 13 (4): 599–604. doi:10.1038/nprot.2017.149. PMID 29494575. S2CID 3560001.
- ^ Tachibana C (2015-08-18). "Transcriptomics today: Microarrays, RNA-seq, and more". Science. 349 (6247): 544. Bibcode:2015Sci...349..544T. doi:10.1126/science.opms.p1500095.
- ^ a b Nagalakshmi U, Wang Z, Waern K, Shou C, Raha D, Gerstein M, Snyder M (June 2008). "The transcriptional landscape of the yeast genome defined by RNA sequencing". Science. 320 (5881): 1344–9. Bibcode:2008Sci...320.1344N. doi:10.1126/science.1158441. PMC 2951732. PMID 18451266.
- ^ Su Z, Fang H, Hong H, Shi L, Zhang W, Zhang W, Zhang Y, Dong Z, Lancashire LJ, Bessarabova M, Yang X, Ning B, Gong B, Meehan J, Xu J, Ge W, Perkins R, Fischer M, Tong W (December 2014). "An investigation of biomarkers derived from legacy microarray data for their utility in the RNA-seq era". Genome Biology. 15 (12): 523. doi:10.1186/s13059-014-0523-y. PMC 4290828. PMID 25633159.
- ^ Lee JH, Daugharthy ER, Scheiman J, Kalhor R, Yang JL, Ferrante TC, Terry R, Jeanty SS, Li C, Amamoto R, Peters DT, Turczyk BM, Marblestone AH, Inverso SA, Bernard A, Mali P, Rios X, Aach J, Church GM (March 2014). "Highly multiplexed subcellular RNA sequencing in situ". Science. 343 (6177): 1360–3. Bibcode:2014Sci...343.1360L. doi:10.1126/science.1250212. PMC 4140943. PMID 24578530.
- ^ a b Shendure J, Ji H (October 2008). "Next-generation DNA sequencing". Nature Biotechnology. 26 (10): 1135–45. doi:10.1038/nbt1486. PMID 18846087. S2CID 6384349.
- ^ Lahens NF, Kavakli IH, Zhang R, Hayer K, Black MB, Dueck H, Pizarro A, Kim J, Irizarry R, Thomas RS, Grant GR, Hogenesch JB (June 2014). "IVT-seq reveals extreme bias in RNA sequencing". Genome Biology. 15 (6): R86. doi:10.1186/gb-2014-15-6-r86. PMC 4197826. PMID 24981968.
- ^ a b Knierim E, Lucke B, Schwarz JM, Schuelke M, Seelow D (2011). "Systematic comparison of three methods for fragmentation of long-range PCR products for next generation sequencing". PLOS ONE. 6 (11): e28240. Bibcode:2011PLoSO...628240K. doi:10.1371/journal.pone.0028240. PMC 3227650. PMID 22140562.
- ^ Routh A, Head SR, Ordoukhanian P, Johnson JE (August 2015). "ClickSeq: Fragmentation-Free Next-Generation Sequencing via Click Ligation of Adaptors to Stochastically Terminated 3'-Azido cDNAs". Journal of Molecular Biology. 427 (16): 2610–6. doi:10.1016/j.jmb.2015.06.011. PMC 4523409. PMID 26116762.
- ^ Parekh S, Ziegenhain C, Vieth B, Enard W, Hellmann I (May 2016). "The impact of amplification on differential expression analyses by RNA-seq". Scientific Reports. 6: 25533. Bibcode:2016NatSR...625533P. doi:10.1038/srep25533. PMC 4860583. PMID 27156886.
- ^ Shanker S, Paulson A, Edenberg HJ, Peak A, Perera A, Alekseyev YO, Beckloff N, Bivens NJ, Donnelly R, Gillaspy AF, Grove D, Gu W, Jafari N, Kerley-Hamilton JS, Lyons RH, Tepper C, Nicolet CM (April 2015). "Evaluation of commercially available RNA amplification kits for RNA sequencing using very low input amounts of total RNA". Journal of Biomolecular Techniques. 26 (1): 4–18. doi:10.7171/jbt.15-2601-001. PMC 4310221. PMID 25649271.
- ^ Jiang L, Schlesinger F, Davis CA, Zhang Y, Li R, Salit M, Gingeras TR, Oliver B (September 2011). "Synthetic spike-in standards for RNA-seq experiments". Genome Research. 21 (9): 1543–51. doi:10.1101/gr.121095.111. PMC 3166838. PMID 21816910.
- ^ Kivioja T, Vähärautio A, Karlsson K, Bonke M, Enge M, Linnarsson S, Taipale J (November 2011). "Counting absolute numbers of molecules using unique molecular identifiers". Nature Methods. 9 (1): 72–4. doi:10.1038/nmeth.1778. PMID 22101854. S2CID 39225091.
- ^ Tang F, Barbacioru C, Wang Y, Nordman E, Lee C, Xu N, Wang X, Bodeau J, Tuch BB, Siddiqui A, Lao K, Surani MA (May 2009). "mRNA-Seq whole-transcriptome analysis of a single cell". Nature Methods. 6 (5): 377–82. doi:10.1038/nmeth.1315. PMID 19349980. S2CID 16570747.
- ^ Islam S, Zeisel A, Joost S, La Manno G, Zajac P, Kasper M, Lönnerberg P, Linnarsson S (February 2014). "Quantitative single-cell RNA-seq with unique molecular identifiers". Nature Methods. 11 (2): 163–6. doi:10.1038/nmeth.2772. PMID 24363023. S2CID 6765530.
- ^ Jaitin DA, Kenigsberg E, Keren-Shaul H, Elefant N, Paul F, Zaretsky I, Mildner A, Cohen N, Jung S, Tanay A, Amit I (February 2014). "Massively parallel single-cell RNA-seq for marker-free decomposition of tissues into cell types". Science. 343 (6172): 776–9. Bibcode:2014Sci...343..776J. doi:10.1126/science.1247651. PMC 4412462. PMID 24531970.
- ^ a b Levin JZ, Yassour M, Adiconis X, Nusbaum C, Thompson DA, Friedman N, Gnirke A, Regev A (September 2010). "Comprehensive comparative analysis of strand-specific RNA sequencing methods". Nature Methods. 7 (9): 709–15. doi:10.1038/nmeth.1491. PMC 3005310. PMID 20711195.
- ^ Quail MA, Smith M, Coupland P, Otto TD, Harris SR, Connor TR, Bertoni A, Swerdlow HP, Gu Y (July 2012). "A tale of three next generation sequencing platforms: comparison of Ion Torrent, Pacific Biosciences and Illumina MiSeq sequencers". BMC Genomics. 13: 341. doi:10.1186/1471-2164-13-341. PMC 3431227. PMID 22827831.
- ^ a b Liu L, Li Y, Li S, Hu N, He Y, Pong R, Lin D, Lu L, Law M (2012). "Comparison of next-generation sequencing systems". Journal of Biomedicine & Biotechnology. 2012: 251364. doi:10.1155/2012/251364. PMC 3398667. PMID 22829749.
- ^ "SRA". Retrieved 2016-10-06.The NCBI Sequence Read Archive (SRA) was searched using “RNA-Seq[Strategy]” and one of "LS454[Platform]”, “Illumina[platform]”, "ABI Solid[Platform]”, "Ion Torrent[Platform]”, "PacBio SMRT"[Platform]” to report the number of RNA-Seq runs deposited for each platform.
- ^ Loman NJ, Misra RV, Dallman TJ, Constantinidou C, Gharbia SE, Wain J, Pallen MJ (May 2012). "Performance comparison of benchtop high-throughput sequencing platforms". Nature Biotechnology. 30 (5): 434–9. doi:10.1038/nbt.2198. PMID 22522955. S2CID 5300923.
- ^ Goodwin S, McPherson JD, McCombie WR (May 2016). "Coming of age: ten years of next-generation sequencing technologies". Nature Reviews Genetics. 17 (6): 333–51. doi:10.1038/nrg.2016.49. PMID 27184599. S2CID 8295541.
- ^ Garalde DR, Snell EA, Jachimowicz D, Sipos B, Lloyd JH, Bruce M, Pantic N, Admassu T, James P, Warland A, Jordan M, Ciccone J, Serra S, Keenan J, Martin S, McNeill L, Wallace EJ, Jayasinghe L, Wright C, Blasco J, Young S, Brocklebank D, Juul S, Clarke J, Heron AJ, Turner DJ (March 2018). "Highly parallel direct RNA sequencing on an array of nanopores". Nature Methods. 15 (3): 201–206. doi:10.1038/nmeth.4577. PMID 29334379. S2CID 3589823.
- ^ Loman NJ, Quick J, Simpson JT (August 2015). "A complete bacterial genome assembled de novo using only nanopore sequencing data". Nature Methods. 12 (8): 733–5. doi:10.1038/nmeth.3444. PMID 26076426. S2CID 15053702.
- ^ Ozsolak F, Platt AR, Jones DR, Reifenberger JG, Sass LE, McInerney P, Thompson JF, Bowers J, Jarosz M, Milos PM (October 2009). "Direct RNA sequencing". Nature. 461 (7265): 814–8. Bibcode:2009Natur.461..814O. doi:10.1038/nature08390. PMID 19776739. S2CID 4426760.
- ^ a b Hart SN, Therneau TM, Zhang Y, Poland GA, Kocher JP (December 2013). "Calculating sample size estimates for RNA sequencing data". Journal of Computational Biology. 20 (12): 970–8. doi:10.1089/cmb.2012.0283. PMC 3842884. PMID 23961961.
- ^ a b c Conesa A, Madrigal P, Tarazona S, Gomez-Cabrero D, Cervera A, McPherson A, Szcześniak MW, Gaffney DJ, Elo LL, Zhang X, Mortazavi A (January 2016). "A survey of best practices for RNA-seq data analysis". Genome Biology. 17: 13. doi:10.1186/s13059-016-0881-8. PMC 4728800. PMID 26813401.
- ^ a b Rapaport F, Khanin R, Liang Y, Pirun M, Krek A, Zumbo P, Mason CE, Socci ND, Betel D (2013). "Comprehensive evaluation of differential gene expression analysis methods for RNA-seq data". Genome Biology. 14 (9): R95. doi:10.1186/gb-2013-14-9-r95. PMC 4054597. PMID 24020486.
- ^ ENCODE Project Consortium; Aldred, Shelley F.; Collins, Patrick J.; Davis, Carrie A.; Doyle, Francis; Epstein, Charles B.; Frietze, Seth; Harrow, Jennifer; Kaul, Rajinder; Khatun, Jainab; Lajoie, Bryan R.; Landt, Stephen G.; Lee, Bum-Kyu; Pauli, Florencia; Rosenbloom, Kate R.; Sabo, Peter; Safi, Alexias; Sanyal, Amartya; Shoresh, Noam; Simon, Jeremy M.; Song, Lingyun; Altshuler, Robert C.; Birney, Ewan; Brown, James B.; Cheng, Chao; Djebali, Sarah; Dong, Xianjun; Dunham, Ian; Ernst, Jason; et al. (September 2012). "An integrated encyclopedia of DNA elements in the human genome". Nature. 489 (7414): 57–74. Bibcode:2012Natur.489...57T. doi:10.1038/nature11247. PMC 3439153. PMID 22955616.
- ^ Sloan CA, Chan ET, Davidson JM, Malladi VS, Strattan JS, Hitz BC, et al. (January 2016). "ENCODE data at the ENCODE portal". Nucleic Acids Research. 44 (D1): D726–32. doi:10.1093/nar/gkv1160. PMC 4702836. PMID 26527727.
- ^ "ENCODE: Encyclopedia of DNA Elements". encodeproject.org.
- ^ a b Ritchie ME, Phipson B, Wu D, Hu Y, Law CW, Shi W, Smyth GK (April 2015). "limma powers differential expression analyses for RNA-sequencing and microarray studies". Nucleic Acids Research. 43 (7): e47. doi:10.1093/nar/gkv007. PMC 4402510. PMID 25605792.
- ^ a b Robinson MD, McCarthy DJ, Smyth GK (January 2010). "edgeR: a Bioconductor package for differential expression analysis of digital gene expression data". Bioinformatics. 26 (1): 139–40. doi:10.1093/bioinformatics/btp616. PMC 2796818. PMID 19910308.
- ^ a b Huber W, Carey VJ, Gentleman R, Anders S, Carlson M, Carvalho BS, et al. (February 2015). "Orchestrating high-throughput genomic analysis with Bioconductor". Nature Methods. 12 (2): 115–21. doi:10.1038/nmeth.3252. PMC 4509590. PMID 25633503.
- ^ Smyth, G. K. (2005). "Limma: Linear Models for Microarray Data". Bioinformatics and Computational Biology Solutions Using R and Bioconductor. Statistics for Biology and Health. Springer, New York, NY. pp. 397–420. CiteSeerX 10.1.1.361.8519. doi:10.1007/0-387-29362-0_23. ISBN 9780387251462.
- ^ Steve., Russell (2008). Microarray Technology in Practice. Meadows, Lisa A. Burlington: Elsevier. ISBN 9780080919768. OCLC 437246554.
- ^ a b Haas BJ, Papanicolaou A, Yassour M, Grabherr M, Blood PD, Bowden J, Couger MB, Eccles D, Li B, Lieber M, MacManes MD, Ott M, Orvis J, Pochet N, Strozzi F, Weeks N, Westerman R, William T, Dewey CN, Henschel R, LeDuc RD, Friedman N, Regev A (August 2013). "De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis". Nature Protocols. 8 (8): 1494–512. doi:10.1038/nprot.2013.084. PMC 3875132. PMID 23845962.
- ^ a b Pertea M, Pertea GM, Antonescu CM, Chang TC, Mendell JT, Salzberg SL (March 2015). "StringTie enables improved reconstruction of a transcriptome from RNA-seq reads". Nature Biotechnology. 33 (3): 290–5. doi:10.1038/nbt.3122. PMC 4643835. PMID 25690850.
- ^ Kodama Y, Shumway M, Leinonen R (January 2012). "The Sequence Read Archive: explosive growth of sequencing data". Nucleic Acids Research. 40 (Database issue): D54–6. doi:10.1093/nar/gkr854. PMC 3245110. PMID 22009675.
- ^ a b Edgar R, Domrachev M, Lash AE (January 2002). "Gene Expression Omnibus: NCBI gene expression and hybridization array data repository". Nucleic Acids Research. 30 (1): 207–10. doi:10.1093/nar/30.1.207. PMC 99122. PMID 11752295.
- ^ Petrov A, Shams S (2004-11-01). "Microarray Image Processing and Quality Control". Journal of VLSI Signal Processing Systems for Signal, Image and Video Technology. 38 (3): 211–226. doi:10.1023/B:VLSI.0000042488.08307.ad. S2CID 31598448.
- ^ Petrov A, Shams S (2004). "Microarray Image Processing and Quality Control". The Journal of VLSI Signal Processing-Systems for Signal, Image, and Video Technology. 38 (3): 211–226. doi:10.1023/B:VLSI.0000042488.08307.ad. S2CID 31598448.
- ^ Kwon YM, Ricke S (2011). High-Throughput Next Generation Sequencing. Methods in Molecular Biology. Vol. 733. SpringerLink. doi:10.1007/978-1-61779-089-8. ISBN 978-1-61779-088-1. S2CID 3684245.
- ^ Nakamura K, Oshima T, Morimoto T, Ikeda S, Yoshikawa H, Shiwa Y, Ishikawa S, Linak MC, Hirai A, Takahashi H, Altaf-Ul-Amin M, Ogasawara N, Kanaya S (July 2011). "Sequence-specific error profile of Illumina sequencers". Nucleic Acids Research. 39 (13): e90. doi:10.1093/nar/gkr344. PMC 3141275. PMID 21576222.
- ^ Van Verk MC, Hickman R, Pieterse CM, Van Wees SC (April 2013). "RNA-Seq: revelation of the messengers". Trends in Plant Science. 18 (4): 175–9. doi:10.1016/j.tplants.2013.02.001. hdl:1874/309456. PMID 23481128.
- ^ Andrews S (2010). "FastQC: A Quality Control tool for High Throughput Sequence Data". Babraham Bioinformatics. Retrieved 2017-05-23.
- ^ Lo CC, Chain PS (November 2014). "Rapid evaluation and quality control of next generation sequencing data with FaQCs". BMC Bioinformatics. 15: 366. doi:10.1186/s12859-014-0366-2. PMC 4246454. PMID 25408143.
- ^ a b c Trapnell C, Hendrickson DG, Sauvageau M, Goff L, Rinn JL, Pachter L (January 2013). "Differential analysis of gene regulation at transcript resolution with RNA-seq". Nature Biotechnology. 31 (1): 46–53. doi:10.1038/nbt.2450. PMC 3869392. PMID 23222703.
- ^ a b Xie Y, Wu G, Tang J, Luo R, Patterson J, Liu S, Huang W, He G, Gu S, Li S, Zhou X, Lam TW, Li Y, Xu X, Wong GK, Wang J (June 2014). "SOAPdenovo-Trans: de novo transcriptome assembly with short RNA-Seq reads". Bioinformatics. 30 (12): 1660–6. arXiv:1305.6760. doi:10.1093/bioinformatics/btu077. PMID 24532719. S2CID 5152689.
- ^ Siadjeu, Christian; Mayland-Quellhorst, Eike; Pande, Shruti; Laubinger, Sascha; Albach, Dirk C. (2021). "Transcriptome Sequence Reveals Candidate Genes Involving in the Post-Harvest Hardening of Trifoliate Yam Dioscorea dumetorum". Plants. 10 (4): 787. doi:10.3390/plants10040787. PMC 8074181. PMID 33923758.
- ^ HTS 매퍼스.http://www.ebi.ac.uk/~nf/hts_mappers/
- ^ Fonseca NA, Rung J, Brazma A, Marioni JC (December 2012). "Tools for mapping high-throughput sequencing data". Bioinformatics. 28 (24): 3169–77. doi:10.1093/bioinformatics/bts605. PMID 23060614.
- ^ Trapnell C, Pachter L, Salzberg SL (May 2009). "TopHat: discovering splice junctions with RNA-Seq". Bioinformatics. 25 (9): 1105–11. doi:10.1093/bioinformatics/btp120. PMC 2672628. PMID 19289445.
- ^ a b Trapnell C, Williams BA, Pertea G, Mortazavi A, Kwan G, van Baren MJ, Salzberg SL, Wold BJ, Pachter L (May 2010). "Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation". Nature Biotechnology. 28 (5): 511–5. doi:10.1038/nbt.1621. PMC 3146043. PMID 20436464.
- ^ Miller JR, Koren S, Sutton G (June 2010). "Assembly algorithms for next-generation sequencing data". Genomics. 95 (6): 315–27. doi:10.1016/j.ygeno.2010.03.001. PMC 2874646. PMID 20211242.
- ^ O'Neil ST, Emrich SJ (July 2013). "Assessing De Novo transcriptome assembly metrics for consistency and utility". BMC Genomics. 14: 465. doi:10.1186/1471-2164-14-465. PMC 3733778. PMID 23837739.
- ^ Smith-Unna R, Boursnell C, Patro R, Hibberd JM, Kelly S (August 2016). "TransRate: reference-free quality assessment of de novo transcriptome assemblies". Genome Research. 26 (8): 1134–44. doi:10.1101/gr.196469.115. PMC 4971766. PMID 27252236.
- ^ Li B, Fillmore N, Bai Y, Collins M, Thomson JA, Stewart R, Dewey CN (December 2014). "Evaluation of de novo transcriptome assemblies from RNA-Seq data". Genome Biology. 15 (12): 553. doi:10.1186/s13059-014-0553-5. PMC 4298084. PMID 25608678.
- ^ Zerbino DR, Birney E (May 2008). "Velvet: algorithms for de novo short read assembly using de Bruijn graphs". Genome Research. 18 (5): 821–9. doi:10.1101/gr.074492.107. PMC 2336801. PMID 18349386.
- ^ Schulz MH, Zerbino DR, Vingron M, Birney E (April 2012). "Oases: robust de novo RNA-seq assembly across the dynamic range of expression levels". Bioinformatics. 28 (8): 1086–92. doi:10.1093/bioinformatics/bts094. PMC 3324515. PMID 22368243.
- ^ Robertson G, Schein J, Chiu R, Corbett R, Field M, Jackman SD, et al. (November 2010). "De novo assembly and analysis of RNA-seq data". Nature Methods. 7 (11): 909–12. doi:10.1038/nmeth.1517. hdl:1885/51040. PMID 20935650. S2CID 1034682.
- ^ a b Grabherr MG, Haas BJ, Yassour M, Levin JZ, Thompson DA, Amit I, Adiconis X, Fan L, Raychowdhury R, Zeng Q, Chen Z, Mauceli E, Hacohen N, Gnirke A, Rhind N, di Palma F, Birren BW, Nusbaum C, Lindblad-Toh K, Friedman N, Regev A (May 2011). "Full-length transcriptome assembly from RNA-Seq data without a reference genome". Nature Biotechnology. 29 (7): 644–52. doi:10.1038/nbt.1883. PMC 3571712. PMID 21572440.
- ^ Chevreux B, Pfisterer T, Drescher B, Driesel AJ, Müller WE, Wetter T, Suhai S (June 2004). "Using the miraEST assembler for reliable and automated mRNA transcript assembly and SNP detection in sequenced ESTs". Genome Research. 14 (6): 1147–59. doi:10.1101/gr.1917404. PMC 419793. PMID 15140833.
- ^ Margulies M, Egholm M, Altman WE, Attiya S, Bader JS, Bemben LA, et al. (September 2005). "Genome sequencing in microfabricated high-density picolitre reactors". Nature. 437 (7057): 376–80. Bibcode:2005Natur.437..376M. doi:10.1038/nature03959. PMC 1464427. PMID 16056220.
- ^ Kumar S, Blaxter ML (October 2010). "Comparing de novo assemblers for 454 transcriptome data". BMC Genomics. 11: 571. doi:10.1186/1471-2164-11-571. PMC 3091720. PMID 20950480.
- ^ Bankevich A, Nurk S, Antipov D, Gurevich AA, Dvorkin M, Kulikov AS, Lesin VM, Nikolenko SI, Pham S, Prjibelski AD, Pyshkin AV, Sirotkin AV, Vyahhi N, Tesler G, Alekseyev MA, Pevzner PA (May 2012). "SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing". Journal of Computational Biology. 19 (5): 455–77. doi:10.1089/cmb.2012.0021. PMC 3342519. PMID 22506599.
- ^ Li B, Dewey CN (August 2011). "RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome". BMC Bioinformatics. 12: 323. doi:10.1186/1471-2105-12-323. PMC 3163565. PMID 21816040.
- ^ Kovaka, Sam; Zimin, Aleksey V.; Pertea, Geo M.; Razaghi, Roham; Salzberg, Steven L.; Pertea, Mihaela (2019-07-08). "Transcriptome assembly from long-read RNA-seq alignments with StringTie2". bioRxiv: 694554. doi:10.1101/694554. Retrieved 27 August 2019.
- ^ Gehlenborg N, O'Donoghue SI, Baliga NS, Goesmann A, Hibbs MA, Kitano H, Kohlbacher O, Neuweger H, Schneider R, Tenenbaum D, Gavin AC (March 2010). "Visualization of omics data for systems biology". Nature Methods. 7 (3 Suppl): S56–68. doi:10.1038/nmeth.1436. PMID 20195258. S2CID 205419270.
- ^ Anders S, Pyl PT, Huber W (January 2015). "HTSeq—a Python framework to work with high-throughput sequencing data". Bioinformatics. 31 (2): 166–9. doi:10.1093/bioinformatics/btu638. PMC 4287950. PMID 25260700.
- ^ Bray NL, Pimentel H, Melsted P, Pachter L (May 2016). "Near-optimal probabilistic RNA-seq quantification". Nature Biotechnology. 34 (5): 525–7. doi:10.1038/nbt.3519. PMID 27043002. S2CID 205282743.
- ^ Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, Marth G, Abecasis G, Durbin R (August 2009). "The Sequence Alignment/Map format and SAMtools". Bioinformatics. 25 (16): 2078–9. doi:10.1093/bioinformatics/btp352. PMC 2723002. PMID 19505943.
- ^ Love MI, Huber W, Anders S (2014). "Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2". Genome Biology. 15 (12): 550. doi:10.1186/s13059-014-0550-8. PMC 4302049. PMID 25516281.
- ^ Frazee AC, Pertea G, Jaffe AE, Langmead B, Salzberg SL, Leek JT (March 2015). "Ballgown bridges the gap between transcriptome assembly and expression analysis". Nature Biotechnology. 33 (3): 243–6. doi:10.1038/nbt.3172. PMC 4792117. PMID 25748911.
- ^ Fang Z, Cui X (May 2011). "Design and validation issues in RNA-seq experiments". Briefings in Bioinformatics. 12 (3): 280–7. doi:10.1093/bib/bbr004. PMID 21498551.
- ^ Ramsköld D, Wang ET, Burge CB, Sandberg R (December 2009). "An abundance of ubiquitously expressed genes revealed by tissue transcriptome sequence data". PLOS Computational Biology. 5 (12): e1000598. Bibcode:2009PLSCB...5E0598R. doi:10.1371/journal.pcbi.1000598. PMC 2781110. PMID 20011106.
- ^ Vandesompele J, De Preter K, Pattyn F, Poppe B, Van Roy N, De Paepe A, Speleman F (June 2002). "Accurate normalization of real-time quantitative RT-PCR data by geometric averaging of multiple internal control genes". Genome Biology. 3 (7): RESEARCH0034. doi:10.1186/gb-2002-3-7-research0034. PMC 126239. PMID 12184808.
- ^ Core LJ, Waterfall JJ, Lis JT (December 2008). "Nascent RNA sequencing reveals widespread pausing and divergent initiation at human promoters". Science. 322 (5909): 1845–8. Bibcode:2008Sci...322.1845C. doi:10.1126/science.1162228. PMC 2833333. PMID 19056941.
- ^ Camarena L, Bruno V, Euskirchen G, Poggio S, Snyder M (April 2010). "Molecular mechanisms of ethanol-induced pathogenesis revealed by RNA-sequencing". PLOS Pathogens. 6 (4): e1000834. doi:10.1371/journal.ppat.1000834. PMC 2848557. PMID 20368969.
- ^ a b Govind G, Harshavardhan VT, ThammeGowda HV, Patricia JK, Kalaiarasi PJ, Dhanalakshmi R, Iyer DR, Senthil Kumar M, Muthappa SK, Sreenivasulu N, Nese S, Udayakumar M, Makarla UK (June 2009). "Identification and functional validation of a unique set of drought induced genes preferentially expressed in response to gradual water stress in peanut". Molecular Genetics and Genomics. 281 (6): 591–605. doi:10.1007/s00438-009-0432-z. PMC 2757612. PMID 19224247.
- ^ Tavassoly, Iman; Goldfarb, Joseph; Iyengar, Ravi (2018-10-04). "Systems biology primer: the basic methods and approaches". Essays in Biochemistry. 62 (4): 487–500. doi:10.1042/EBC20180003. ISSN 0071-1365. PMID 30287586. S2CID 52922135.
- ^ Costa V, Aprile M, Esposito R, Ciccodicola A (February 2013). "RNA-Seq and human complex diseases: recent accomplishments and future perspectives". European Journal of Human Genetics. 21 (2): 134–42. doi:10.1038/ejhg.2012.129. PMC 3548270. PMID 22739340.
- ^ Khurana E, Fu Y, Chakravarty D, Demichelis F, Rubin MA, Gerstein M (February 2016). "Role of non-coding sequence variants in cancer". Nature Reviews Genetics. 17 (2): 93–108. doi:10.1038/nrg.2015.17. PMID 26781813. S2CID 14433306.
- ^ Slotkin RK, Martienssen R (April 2007). "Transposable elements and the epigenetic regulation of the genome". Nature Reviews Genetics. 8 (4): 272–85. doi:10.1038/nrg2072. PMID 17363976. S2CID 9719784.
- ^ Proserpio V, Mahata B (February 2016). "Single-cell technologies to study the immune system". Immunology. 147 (2): 133–40. doi:10.1111/imm.12553. PMC 4717243. PMID 26551575.
- ^ a b Byron SA, Van Keuren-Jensen KR, Engelthaler DM, Carpten JD, Craig DW (May 2016). "Translating RNA sequencing into clinical diagnostics: opportunities and challenges". Nature Reviews Genetics. 17 (5): 257–71. doi:10.1038/nrg.2016.10. PMC 7097555. PMID 26996076.
- ^ Wu HJ, Wang AH, Jennings MP (February 2008). "Discovery of virulence factors of pathogenic bacteria" (PDF). Current Opinion in Chemical Biology. 12 (1): 93–101. doi:10.1016/j.cbpa.2008.01.023. PMID 18284925.
- ^ Suzuki S, Horinouchi T, Furusawa C (December 2014). "Prediction of antibiotic resistance by gene expression profiles". Nature Communications. 5: 5792. Bibcode:2014NatCo...5.5792S. doi:10.1038/ncomms6792. PMC 4351646. PMID 25517437.
- ^ Westermann AJ, Gorski SA, Vogel J (September 2012). "Dual RNA-seq of pathogen and host" (PDF). Nature Reviews. Microbiology. 10 (9): 618–30. doi:10.1038/nrmicro2852. PMID 22890146. S2CID 205498287.
- ^ Durmuş S, Çakır T, Özgür A, Guthke R (2015). "A review on computational systems biology of pathogen-host interactions". Frontiers in Microbiology. 6: 235. doi:10.3389/fmicb.2015.00235. PMC 4391036. PMID 25914674.
- ^ a b Garg R, Shankar R, Thakkar B, Kudapa H, Krishnamurthy L, Mantri N, Varshney RK, Bhatia S, Jain M (January 2016). "Transcriptome analyses reveal genotype- and developmental stage-specific molecular responses to drought and salinity stresses in chickpea". Scientific Reports. 6: 19228. Bibcode:2016NatSR...619228G. doi:10.1038/srep19228. PMC 4725360. PMID 26759178.
- ^ García-Sánchez S, Aubert S, Iraqui I, Janbon G, Ghigo JM, d'Enfert C (April 2004). "Candida albicans biofilms: a developmental state associated with specific and stable gene expression patterns". Eukaryotic Cell. 3 (2): 536–45. doi:10.1128/EC.3.2.536-545.2004. PMC 387656. PMID 15075282.
- ^ Rich SM, Leendertz FH, Xu G, LeBreton M, Djoko CF, Aminake MN, Takang EE, Diffo JL, Pike BL, Rosenthal BM, Formenty P, Boesch C, Ayala FJ, Wolfe ND (September 2009). "The origin of malignant malaria". Proceedings of the National Academy of Sciences of the United States of America. 106 (35): 14902–7. Bibcode:2009PNAS..10614902R. doi:10.1073/pnas.0907740106. PMC 2720412. PMID 19666593.
- ^ Mok S, Ashley EA, Ferreira PE, Zhu L, Lin Z, Yeo T, et al. (January 2015). "Drug resistance. Population transcriptomics of human malaria parasites reveals the mechanism of artemisinin resistance". Science. 347 (6220): 431–5. Bibcode:2015Sci...347..431M. doi:10.1126/science.1260403. PMC 5642863. PMID 25502316.
- ^ Verbruggen N, Hermans C, Schat H (March 2009). "Molecular mechanisms of metal hyperaccumulation in plants" (PDF). The New Phytologist. 181 (4): 759–76. doi:10.1111/j.1469-8137.2008.02748.x. PMID 19192189.
- ^ Li Z, Zhang Z, Yan P, Huang S, Fei Z, Lin K (November 2011). "RNA-Seq improves annotation of protein-coding genes in the cucumber genome". BMC Genomics. 12: 540. doi:10.1186/1471-2164-12-540. PMC 3219749. PMID 22047402.
- ^ Hobbs M, Pavasovic A, King AG, Prentis PJ, Eldridge MD, Chen Z, Colgan DJ, Polkinghorne A, Wilkins MR, Flanagan C, Gillett A, Hanger J, Johnson RN, Timms P (September 2014). "A transcriptome resource for the koala (Phascolarctos cinereus): insights into koala retrovirus transcription and sequence diversity". BMC Genomics. 15: 786. doi:10.1186/1471-2164-15-786. PMC 4247155. PMID 25214207.
- ^ Howe GT, Yu J, Knaus B, Cronn R, Kolpak S, Dolan P, Lorenz WW, Dean JF (February 2013). "A SNP resource for Douglas-fir: de novo transcriptome assembly and SNP detection and validation". BMC Genomics. 14: 137. doi:10.1186/1471-2164-14-137. PMC 3673906. PMID 23445355.
- ^ McGrath LL, Vollmer SV, Kaluziak ST, Ayers J (January 2016). "De novo transcriptome assembly for the lobster Homarus americanus and characterization of differential gene expression across nervous system tissues". BMC Genomics. 17: 63. doi:10.1186/s12864-016-2373-3. PMC 4715275. PMID 26772543.
- ^ a b Meyer DH, Schumacher B (2020). "BiT age: A transcriptome‐based aging clock near the theoretical limit of accuracy". Aging Cell. 20 (3): e13320. doi:10.1111/acel.13320. PMC 7963339. PMID 33656257.
- ^ Fleischer JG, Schulte R, Tsai HH, Tyagi S, Ibarra A, Shokhirev MN, Navlakha S (2018). "Predicting age from the transcriptome of human dermal fibroblasts". Genome Biology. 19 (1): 221. doi:10.1186/s13059-018-1599-6. PMC 6300908. PMID 30567591.
- ^ Noller HF (1991). "Ribosomal RNA and translation". Annual Review of Biochemistry. 60: 191–227. doi:10.1146/annurev.bi.60.070191.001203. PMID 1883196.
- ^ Christov CP, Gardiner TJ, Szüts D, Krude T (September 2006). "Functional requirement of noncoding Y RNAs for human chromosomal DNA replication". Molecular and Cellular Biology. 26 (18): 6993–7004. doi:10.1128/MCB.01060-06. PMC 1592862. PMID 16943439.
- ^ Kishore S, Stamm S (January 2006). "The snoRNA HBII-52 regulates alternative splicing of the serotonin receptor 2C". Science. 311 (5758): 230–2. Bibcode:2006Sci...311..230K. doi:10.1126/science.1118265. PMID 16357227. S2CID 44527461.
- ^ Hüttenhofer A, Schattner P, Polacek N (May 2005). "Non-coding RNAs: hope or hype?". Trends in Genetics. 21 (5): 289–97. doi:10.1016/j.tig.2005.03.007. PMID 15851066.
- ^ Esteller M (November 2011). "Non-coding RNAs in human disease". Nature Reviews Genetics. 12 (12): 861–74. doi:10.1038/nrg3074. PMID 22094949. S2CID 13036469.
- ^ "Gene Expression Omnibus". www.ncbi.nlm.nih.gov. Retrieved 2018-03-26.
- ^ a b Brazma A, Hingamp P, Quackenbush J, Sherlock G, Spellman P, Stoeckert C, Aach J, Ansorge W, Ball CA, Causton HC, Gaasterland T, Glenisson P, Holstege FC, Kim IF, Markowitz V, Matese JC, Parkinson H, Robinson A, Sarkans U, Schulze-Kremer S, Stewart J, Taylor R, Vilo J, Vingron M (December 2001). "Minimum information about a microarray experiment (MIAME)-toward standards for microarray data". Nature Genetics. 29 (4): 365–71. doi:10.1038/ng1201-365. PMID 11726920. S2CID 6994467.
- ^ a b Brazma A (May 2009). "Minimum Information About a Microarray Experiment (MIAME)--successes, failures, challenges". TheScientificWorldJournal. 9: 420–3. doi:10.1100/tsw.2009.57. PMC 5823224. PMID 19484163.
- ^ Kolesnikov N, Hastings E, Keays M, Melnichuk O, Tang YA, Williams E, Dylag M, Kurbatova N, Brandizi M, Burdett T, Megy K, Pilicheva E, Rustici G, Tikhonov A, Parkinson H, Petryszak R, Sarkans U, Brazma A (January 2015). "ArrayExpress update—simplifying data submissions". Nucleic Acids Research. 43 (Database issue): D1113–6. doi:10.1093/nar/gku1057. PMC 4383899. PMID 25361974.
- ^ Petryszak R, Keays M, Tang YA, Fonseca NA, Barrera E, Burdett T, Füllgrabe A, Fuentes AM, Jupp S, Koskinen S, Mannion O, Huerta L, Megy K, Snow C, Williams E, Barzine M, Hastings E, Weisser H, Wright J, Jaiswal P, Huber W, Choudhary J, Parkinson HE, Brazma A (January 2016). "Expression Atlas update—an integrated database of gene and protein expression in humans, animals and plants". Nucleic Acids Research. 44 (D1): D746–52. doi:10.1093/nar/gkv1045. PMC 4702781. PMID 26481351.
- ^ Hruz T, Laule O, Szabo G, Wessendorp F, Bleuler S, Oertle L, Widmayer P, Gruissem W, Zimmermann P (2008). "Genevestigator v3: a reference expression database for the meta-analysis of transcriptomes". Advances in Bioinformatics. 2008: 420747. doi:10.1155/2008/420747. PMC 2777001. PMID 19956698.
- ^ Mitsuhashi N, Fujieda K, Tamura T, Kawamoto S, Takagi T, Okubo K (January 2009). "BodyParts3D: 3D structure database for anatomical concepts". Nucleic Acids Research. 37 (Database issue): D782–5. doi:10.1093/nar/gkn613. PMC 2686534. PMID 18835852.
- ^ Zhao Y, Li H, Fang S, Kang Y, Wu W, Hao Y, Li Z, Bu D, Sun N, Zhang MQ, Chen R (January 2016). "NONCODE 2016: an informative and valuable data source of long non-coding RNAs". Nucleic Acids Research. 44 (D1): D203–8. doi:10.1093/nar/gkv1252. PMC 4702886. PMID 26586799.
메모들
추가 읽기
- Lowe R, Shirley N, Bleackley M, Dolan S, Shafee T (May 2017). "Transcriptomics technologies". PLOS Computational Biology. 13 (5): e1005457. Bibcode:2017PLSCB..13E5457L. doi:10.1371/journal.pcbi.1005457. PMC 5436640. PMID 28545146.
- 생명과학 참조모듈에서의 비교대역학 분석
- transcriptomics에 사용되는 소프트웨어: