팬텀

FANTOM

FANTOM(Functional Annotation of the Mouse/Mammalian Genome)은 2000년 일본 [1]RIKEN 연구소의 일원으로 설립된 국제 연구 컨소시엄이다.하야시자키 [2]그룹에 의해 생성된 마우스 cDNA 클론의 기능에 주석을 달기 위해, 최초의 회의에는 다양한 배경을 가진 국제 과학자가 모였다.FANTOM1의 초기 노력 이후, 이 컨소시엄은 포유류[1]게놈을 조절하는 메커니즘을 이해하는 여러 프로젝트를 발표했습니다.이들의 연구는 많은 양의 공유 데이터를 생성했으며 유전체 연구에서 생화학생물정보학적 방법론을 발전시키는 데 도움을 주었다.

FANTOM의 역사

토대

1995년, RIKEN 연구소의 연구원들은 의 게놈을 위한 전장 cDNA 백과사전을 만들기 시작했다.이 '마우스 백과사전 프로젝트'의 목표는 마우스 스크립트롬의 기능적 주석을 제공하는 것이었다.이 지도 제작은 유전자 발견, 질병을 유발하는 유전자 및 여러 걸친 호몰로지 이해에 귀중한 자원을 제공할 것이다.이것은 처음부터 만만치 않은 일이 될 것으로 약속되었다.현재의 방법론으로는 전체 길이의 cDNA 클론을 규모에 맞게 생성하기에 불충분했고, 주석의 자원으로 유용하게 쓰려면 여러 [1][2]분야의 전문가가 동의해야 할 것이다.

첫 번째 목표는 전체 길이 cDNA 라이브러리를 생성할 수 있는 방법을 개발하는 것이었다.당시 역전사효소 프로토콜은 mRNA의 2차 구조에 문제가 있어 정렬이 어려웠고 하류 분석에 추가적인 합병증을 유발했다.이 한계를 극복하기 위해, 트레할로스를 이용한 방법이 개발되어 역전사효소가 더 높은 온도에서 기능하여 2차 [3]구조를 완화시켰다.복제 cDNA 라이브러리의 구축을 지원하기 위해 다른 방법이 추가로 개발되었다.여기에는 전체 길이의 cDNA를 위해 선택하는 비오틴 기반 포획 시스템, 플라스미드에 cDNA를 전달할 때 편견을 최소화한 새로운 람다 파지 벡터, 그리고 아직 [1][2][4][5][6]배열되지 않은 cDNA를 농축하기 위한 반복 전략이 포함된다.

시퀀싱은 1998년에 시작되었고 빠르게 진행되어 광범위한 마우스 세포와 조직에 걸쳐 21,076개의 cDNA 클론을 포함하는 246개의 cDNA 라이브러리를 생성했다.이 단계는 대체로 성공적이었지만, 생물 정보 수준에서는 추가적인 제한에 직면했다.배열된 cDNA는 이용 가능한 데이터베이스(종 상동학 및 알려진 단백질 모티브 등)를 활용하여 유전자 온톨로지(GO) 프레임워크 내에서 유전자를 할당하는 반자동 방식으로 주석을 달았다.그러나, 많은 새로운 염기서열은 [1][2]BLAST가 유전자 데이터베이스에 대해 의미 있는 일치를 가지지 않았다.

Drosophila melanogaster의 첫 번째 게놈 주석 작업의 조직자인 Gerry Rubin과 상의한 후, 새로운 시퀀스에 컴퓨터 예측과 수동 큐레이션을 통합한 주석을 위한 강력한 시스템이 필요하다는 것이 명백해졌다.생물정보학, 유전학 및 기타 과학 분야의 전문가들로부터 의견을 구하고, RIKEN 그룹은 첫 번째 FANTOM 회의를 조직했습니다.

팬텀1

마우스 cDNA 클론의 주석을 용이하게 하기 위해 RIKEN 연구 그룹은 첫 회의 전에 FANTOM+라는 웹 기반 서비스를 개발했습니다.사용자는 모티브를 검색하고 사전 계산된 시퀀스 유사성 점수를 볼 수 있을 뿐만 아니라 다른 공용 데이터베이스를 쿼리하고 관련 주석을 FANTOM 데이터베이스에 통합할 수 있다.유전자의 할당과 기능적 주석을 위해서는 여러 생물정보학적 도구와 데이터베이스가 필요했다.주요 도구로는 BLASTN/BLASTX, FASTA/FASTY, DECORDER, EST-WISE HMER가 있으며, SwissProt, UniGene 및 NCBI-nr과 같은 핵산 및 단백질 데이터베이스가 모두 사용되었습니다.동시에, 마우스 게놈 정보학 그룹(MGI)의 협업을 통해 RIKEN 연구진은 두 [1][2]데이터베이스 간에 동일한 검증된 복제 세트를 확립할 수 있었다.

컴퓨터 방법론과 20,000개 이상의 cDNA 시퀀스를 갖춘 RIKEN 그룹은 2000년 8월 28일부터 9월 8일까지 츠쿠바시에서 제1회 FANTOM 회의를 개최하였다.전략에 대해 논의하고 리켄 클론의 주석을 실행하기 위해 다양한 국제 과학자들을 모집했다.조립된 계산 절차는 GO 용어를 사용하여 추정 함수를 할당하기 위해 시퀀스 비교 및 도메인 분석을 가능하게 했다.cDNA 클론의 용장성은 클러스터링 전략과 고유한 클론을 식별하기 위한 MGI 검증 세트에 대한 참조를 필요로 하는 과제를 낳았다.RIKEN 복제 세트는 조심스럽게 [1][2]과대평가되었지만 결국 15,295개의 유전자로 감소하였다.

RIKEN 정의의 개요

큐레이션 활동의 중심은 RIKEN 정의의 작성이었다.이것은 기존에 확립되어 있거나 잘 큐레이션된 지식에 우선순위를 두고 알려진 유전자를 기반으로 복제에 기능을 할당하는 계층적이고 체계적인 수단을 제공했다.분류의 계층적 특성은 배열이 여러 다른 유전자와 매우 유사할 때 일관성을 허용했다.중요한 것은, 배열 유사성이 발견되지 않은 경우, 정의는 예측된 단백질 모티브 시그니처에 기초한 추정 기능을 할당하고, 코드화 잠재력 및 표현된 배열 태그(EST) 데이터베이스와 일치시켰다.예측된 유사성이나 대표성이 없는 경우에만 클론은 '분류할 수 없는' 것으로 간주됩니다.[1][2]

RIKEN/FANTOM의 노력이 집약되어 2001년 Nature가 [7]출판되었습니다.그 결과 21,076개의 cDNA 클론을 4,012개의 GO 용어에 할당하고, 새로운 쥐 유전자와 단백질 모티브의 확인, 가능한 대체 스플라이스폼의 검출, 그리고 인간 질병 유전자와 직교하는 쥐 유전자의 발견이 포함되었다.게다가, 첫 번째 염기서열 분석된 인간 게놈은 일주일 후에 발표되었고 인간 [1][2][8]유전자의 수를 예측하기 위해 FANTOM의 결과를 통합했다.

팬텀2

전체 길이의 cDNA 라이브러리 생성을 위한 프로토콜을 확립하고 개선한 RIKEN 그룹은 계속해서 FANTOM 컬렉션에 추가했습니다.방법을 수정하여 희귀하고 긴 스크립트를 추가로 선택할 수 있게 하여 길이가 4kb 이상인 cDNA를 식별할 수 있게 했다.제2회 FANTOM 미팅은 2002년 5월에 개최되었습니다.그때까지 cDNA 클론 수는 39,694개 증가하여 총 60,[1][9]770개가 되었습니다.

FANTOM1에서 얻은 한 가지 통찰력은 마우스 트랜스크립텀에서 대체 폴리아데닐화가 일반적이라는 것입니다. 즉, 3' 엔드 클러스터링이 광범위한 중복을 초래한다는 을 의미합니다.이를 해결하기 위해 고유한 클론을 식별하기 위해 5' 엔드의 추가 시퀀싱을 수행했습니다.FANTOM2 출판물은 새로운 단백질 코드 기록의 상당한 추가에 기여했다.거의 틀림없이 FANTOM2의 가장 주목할 만한 결과는 길고 희귀한 전사를 선택하려는 노력이 상당한 양의 비단백질 코드 RNA를 [1][9]드러냈다는 것이다.

이번에도 FANTOM 컬렉션은 유익한 리소스임이 입증되었습니다.비부호화 RNA는 안티센스 RNA와 긴 비부호화 RNA(lncRNA)로 확인되었으며, 이는 잘 이해되지 않는 조절 [10][11]RNA 등급이었다.마우스 게놈의 첫 번째 공개된 시퀀스는 FANTOM에 [10]의해 확립된 주석을 사용했다.다른 노력들은 G 단백질 [1][12][13]결합 수용체와 같은 전체 단백질 패밀리를 설명할 수 있었다.

팬텀3

FANTOM의 궁극적인 목표는 전사의 조절적 상호작용을 포착하는 유전자 네트워크를 구축하고 이러한 상호작용을 세포 유형이나 상태에 따라 구별하는 것입니다.이 정도까지, 5' 끝의 시퀀스의 다형성 특성은 광범위한 매핑을 필요로 한다는 것을 깨달았다.Transcription Start Site(TSS; 문자 변환 시작 사이트)를 특징짓는 것으로, 프로모터를 특정해, 셀 타입간에 그 사용법을 구별할 수 있습니다.이것은 또한 시퀀싱 방법의 추가 개발이 필요하다는 것을 의미했다.전장 마우스 cDNA가 계속 생성되는 동안, RIKEN이 이끄는 연구원들은 그들의 [1]미래 연구의 대부분을 이끌 기술인 유전자 발현분석(CAGE)을 확립했다.

케이지의 개요

케이지 개발

CAGE는 FANTOM1용으로 개발된 개념의 연속체이며, 다음 프로젝트에서 5' mRNA을 캡처하기 위해 광범위하게 사용됩니다.지금까지의 풀렝스 cDNA 생성과는 달리 CACE에서는 20~27의 fragment(태그)를 조사합니다.이를 통해 프로모터 구조 및 활동을 포함한 [1]TSS 매핑을 위한 경제적이고 높은 스루풋 수단을 얻을 수 있었습니다.

일반적인 단계는 다음과 같습니다. cDNA는 랜덤 또는 올리고 dT 프라이머를 사용하여 mRNA에서 역전사됩니다.그런 다음 캡 트래퍼 방법을 사용하여 전체 길이 cDNA를 선택합니다.이는 5' 캡에 비오틴을 첨가한 후, cDNA에 교배되지 않은 단일 가닥 RNA를 제거하기 위해 RNase 소화 단계 후에 스트렙타비딘 비즈로 후속 포획하는 것을 포함한다.캡 트래핑 후, cDNA는 RNA-cDNA 하이브리드로부터 분리된다.cDNA의 5' 말단에 비오티닐화 된 이중가닥 CACE 링커를 결속하여 cDNA의 제2가닥을 합성한다.이 결과 이중 가닥 DNA는 Mme1 핵산가수분해효소로 소화되어 CAGE 링커를 절단하고 20-27bp CAGE 태그를 생성한다.제2링커는 3' 엔드에 부가되어 PCR에 의해 태그가 증폭된다.마지막으로 5' 및 3' 링커에서 CAGE 태그가 해제됩니다.그런 다음 태그를 시퀀싱, 연결 또는 [4][14][15][16]복제할 수 있습니다.당시 CAGE는 [1]RIKEN에 의해 이미 확립된 RISA 384 캐피럴리 시퀀서를 사용하여 수행되었다.

CAGE 프래그먼트 매핑

검출

CAGE의 개발은 많은 이정표적 발견을 낳았습니다.중요한 것은, RNA가 이전에 생각했던 것보다 포유류의 트랜스크립텀에 훨씬 더 풍부하다는 것이 밝혀졌고, 이는 게놈이 [1]널리 전사되었다는 것을 깨닫는 것을 동반했다.CACE, 유전자 식별 서명, 유전자 시그니처 클로닝의 방법을 조합하여 포유류의 게놈의 '전사 풍경'을 지도화하여 전사 제어 신호의 패턴과 생성되는 [17]전사를 특징지었다.쥐의 게놈에 있는 것으로 추정되는 2만2000개의 유전자보다 훨씬 더 많은 전사가 존재하며, 이러한 전사인 단위들 중 상당수는 대체 촉진제와 폴리아데닐화 부위가 있는 것으로 밝혀졌다.

나아가 공통 발현 영역과 조절 이벤트를 공유하는 전사체 군집인 전사림(transcription forest)이 전사 사막([17]transcription daserts)으로 분리돼 게놈의 63%를 차지하는 것으로 밝혀졌다.공동발표된 출판물에 따르면, 이들 숲의 많은 문자에는 안티센스 전사가 나타나며, 대부분의 센스/반센스 쌍에는 일치된 [18]규정이 나타난다.또 다른 주목할 만한 결과는 많은 비부호화 RNA가 동적으로 발현되고, 많은 RNA가 3' 미번역 영역에서 시작되며,[17] 여러 종에 걸쳐 위치적으로 보존된다는 것을 보여주었다.

FANTOM3에서 나온 세 번째 이정표 논문은 포유류의 프로모터 아키텍처와 [19]진화에 대해 조사했습니다.그것은 두 종류의 포유동물 발기인을 설립하였다.첫 번째는 TATA의 풍부한 프로모터이며, 시작 사이트가 명확하게 정의되어 있습니다.이러한 촉진제들은 진화적으로 보존되고 조직 특이적 유전자와 더 일반적으로 연관되어 있다.두 번째, 그리고 더 일반적인 등급인 광범위한 CpG 리치 프로모터는 플라스틱이며 진화가 가능하며 광범위한 세포와 조직으로 표현된다.이 연구는 또한 CpG가 풍부한 프로모터가 양방향(감각-안티센스 쌍을 생성)일 수 있으며 후생유전학적 제어가 매우 민감하여 적응 진화의 잠재적 구성요소임을 보여주었다.

FANTOM3의 미팅은 2004년 9월에 개최되었습니다.FANTOM3에서 생성된 위성 간행물 모음이 PLoS Genetics에 게재되었습니다.그들은 프로모터 특성, 엑손 길이 및 의사 [20][21]전달 RNA에 대한 추가 연구를 포함한다.

팬텀4

차세대 시퀀싱의 등장은 CAGE 기술의 발전에 큰 도움이 되었습니다.FANTOM 그룹은 Roche-454 시퀀서를 사용하여 deep CAGE를 개발하여 [22]샘플당 100만 개 이상의 태그로 CAGE의 throughput을 증가시켰습니다.이러한 깊이에서, 연구자들은 이제 유전자 조절 상호작용의 네트워크를 구축하기 시작할 수 있다.FANTOM4 미팅은 2006년 12월에 개최되었습니다.

이전의 FANTOM 프로젝트에서는 다양한 세포 유형을 조사했지만, FANTOM4의 목적은 세포 분화를 촉진하는 역학에 대해 깊이 탐구하는 것이었습니다.분석은 인간 THP-1 세포주에 국한되어 단세포가 되는 단세포시간 경과 데이터를 제공했다.DeepCage는 TSS를 단일 뉴클레오티드 분해능으로 해결하여 전사 인자(TF)가 결합하는 위치를 정확히 파악했습니다.세포 분화에 따른 시간 의존성 유전자 발현 변화를 감시함으로써 어떤 조절 모티브가 발현 변화를 예측하는지, TF 활성의 시간 의존성 및 TF 표적 [23]유전자에 대한 추론을 제공하였다.이러한 노력은 문자 변환 규제 네트워크를 만들어 냈고, 차별화 과정이 매우 복잡하고 긍정적인 규제 상호작용과 부정적인 규제 상호작용을 모두 실행하는 대규모 TF에 의해 추진된다는 것을 입증했다.

FANTOM4는 또한 역트랜스포존 전사 및 전사 개시 RNA(tiRNA)에 대한 우리의 이해를 증가시켰다.레트로트랜스포존은 포유류 게놈의 반복적인 요소에 기여하고 유전체 진화와 같은 여러 생물학적 과정뿐만 아니라 대체 촉진제나 [24][25]엑손과 같은 구조에도 영향을 미칠 수 있습니다.레트로트랜스포존은 세포와 조직 고유의 방식으로 발현되며, 이전에 알려지지 않았던 약 250,000개의 레트로트랜스포존 구동 TSS가 확인되었다.[26]

역트랜스포존은 다양한 조직에서 [26]코딩 및 비코딩 RNA의 포유류의 전사 및 전사 조절에 영향을 미칠 수 있는 것으로 밝혀졌다.추가적인 노력은 전사 개시 RNA라고 불리는 유전학적으로 그리고 진화적으로 널리 퍼진 새로운 종류의 RNA를 발견했다.[27]이 종류의 RNA는 비교적 작고(약 18뉴클레오티드 길이), 일반적으로 CpG가 풍부한 프로모터의 TSS의 하류에서 발견된다.tiRNA는 풍부성이 낮고 RNA 중합효소 II 결합 및 TSS와 마찬가지로 고도로 발현된 유전자와 관련되어 있다.보다 최근의 연구는 tiRN이 후생유전 상태와 국소 크로마틴 [28]아키텍처를 변조할 수 있다는 것을 보여주었다.그러나 이러한 tiRNA는 규제적 역할을 하지 않으며 단순히 [1][27]전사 부산물일 수 있습니다.

이러한 초기 발견에 따라, 생쥐와 인간의 [29]조합 전사 조절 지도책이 RIKEN 연구자들에 의해 출판되었다.이 연구는 전사 복합체가 조직 정체성/세포 상태를 제어하기 위해 네트워크 내에서 상호작용할 수 있으며, 이러한 네트워크는 종종 조직/세포에 걸쳐 광범위하게 발현되는 '촉진자' 전사 인자에 의해 지배된다는 것을 보여주었다.측정된 조절 상호작용의 약 절반이 생쥐와 사람 사이에서 보존된 것으로 밝혀졌다.FANTOM4는 프로모터 아키텍처, miRNA 규제 및 게놈 규제 [30][31][32]블록과 같은 주제를 조사하는 수많은 위성 논문으로 이어졌습니다.

팬텀5

FANTOM의 다섯 번째 라운드는 가능한 [1]한 많은 세포 상태에 걸쳐 트랜스크립텀의 규제 환경에 대한 통찰력을 제공하는 것을 목표로 했습니다.공유 데이터의 관련 리소스 역할을 계속합니다.프로젝트는 두 단계로 구성되었다. 첫 번째 단계는 안정된 상태의 셀에 초점을 맞춘 것이고 두 번째 단계는 시간 데이터에 초점을 맞춘 것이다.차세대 염기 서열 분석의 발전 FANTOM5의 박학을 이루기 단일 분자 시퀀싱 RNA.[33]Samples의 100명에 가까운 쇼핑을 모든 인간의 장기뿐만 아니라 200명이 넘는 암 라인, 세포 분화, 마우스 dev의 30배 과정에서 수집된 것에서 TSS활동의 단일 기본 쌍 결의안을 허용하는 것으로 차입에 있었다.elo200개가 넘는 프라이머리 셀 타입이 포함되어 있습니다.[33][34]단계에 걸쳐 총 1,816개의 인간 샘플과 1,1016개의 마우스 샘플이 프로파일링되었습니다.

PANTOM5는 ENCODE 프로젝트와 비슷하지만 두 가지 점에서 다릅니다.첫째, ENCODE는 불멸화 세포주를 이용한 반면, FANTOM5는 세포 유형 동일성 유지를 담당하는 실제 생물학적 과정을 보다 반영하는 1차 세포와 조직에 초점을 맞췄다.둘째, ENCODE는 여러 게놈 분석을 사용하여 전사체와 후생유전자를 포착했다.FANTOM5는 크로마틴 [1]상태에 의해 정의된 세포 유형과 같은 특징을 추론하기 위해 다른 발표된 연구에 의존하여 오로지 트랜스크립트옴에만 초점을 맞췄다.FANTOM5 미팅은 2011년 10월에 개최되었습니다.

단계 1

FANTOM5의 첫 번째 단계에서는 975명의 사람과 399개의 마우스 샘플에 걸쳐 CAGE 프로파일링을 사용하여 다양한 정상 상태 세포 유형의 '스냅샷'을 촬영했습니다.이러한 초기 노력으로 두 개의 네이처 논문이 작성되었습니다. 하나는 포유류의 프로모터 풍경을 설명하고 다른 하나는 활성 [35][36]증강제를 설명했습니다.이들은 함께 다양한 세포 유형에 걸친 프로모터, 인핸서 및 TSS의 지도책을 제공하며, 전사 규제의 복잡한 경관을 연구하기 위한 '기준선' 역할을 합니다.구체적으로, 단일 분자 CACE 프로파일은 HeliScope 시퀀서를 사용하여 573개의 인간 1차 세포 샘플, 128개의 마우스 1차 세포 샘플, 250개의 암 세포주, 152개의 인간 사후 조직 및 271개의 마우스 개발 조직 [33][37]샘플에 걸쳐 생성되었다.

분해 피크 분석이라고 하는 CAGE 피크를 식별하는 새로운 방법이 개발되었습니다.CAGE 태그는 근접성에 따라 클러스터되며, 이어서 독립된 컴포넌트 분석을 통해 피크를 겹치지 않는 영역으로 분해합니다.피크가 TSS에 대응하도록 하기 위해 농축공정을 실시하고 EST, 히스톤H3 리신4 트리메틸화 마크 및 DNase 과민성 부위의 외부 데이터를 사용하여 피크가 진짜 TSS임을 [33]지지한다.

주요 발견에 따르면 전형적인 포유동물 프로모터는 [1][35]샘플 전체에서 다른 발현 패턴을 가진 여러 개의 TSS를 포함하고 있었다.이는 이러한 TSS가 근접한 거리에 있음에도 불구하고 별도로 규제된다는 것을 의미합니다.보편적으로 표현된 프로모터는 시퀀스 내에서 가장 높은 보존율을 보였지만, 세포 고유의 프로모터는 보존율이 낮았다.한층 더 현저한 결과는, 인핸서 유래 RNA(eRNA)가 세포/조직 고유의 방법으로 전사되어 그 인핸서의 [37]활성을 반영하고 있는 것을 시사했다.

단계 2

첫 번째 단계는 세포 상태의 안정적인 표현에 초점을 맞췄지만, 두 번째 단계는 시간 경과 데이터를 사용하여 세포 상태를 전환하는 동적 프로세스를 탐구하는 것으로 보았다.다시, CAGE가 사용되었습니다. 이번에는 408개의 뚜렷한 시점을 나타내는 다양한 세포 유형과 생물학적 자극을 다루는 19개의 인간 및 14개의 마우스 시간 코스가 사용되었습니다.여기에는 말기 운명에 대한 줄기세포 또는 기탁 전구세포의 분화뿐만 아니라 성장인자 또는 [1][33][38]병원체에 반응하는 완전히 분화된 세포가 포함되었다.

시간 0에 비해 발현 폴드 변화의 패턴을 검사하는 일련의 구별된 반응 클래스를 식별하기 위해 비감독 클러스터링이 수행되었다.이와 같이, 강화자, TF 발기인 및 비TF 발기인 등의 표현은 시간 코스의 처음 6시간의 시간적 척도로 일반화되었다.일반적으로 세포들의 가장 빠른 반응은 강화제에서 발생했으며, eRNA 농도는 시간 0 이후 15분 이내에 정점에 도달했다.심지어 '나중에' 반응을 나타내는 수업에서도, 인핸서는 가까운 프로모터보다 먼저 활성화되는 경향이 있었다.이 활성화의 지속성에서 가변성이 관찰되었다. 일부 강화제는 15분 버스트 후 기준선으로 빠르게 돌아갔으며, 다른 강화제는 프로모터 활성화 후에도 지속되었다.함께, 이것은 eRNA가 유전자 [38]활성을 조절하는 데 다른 역할을 할 수 있다는 것을 암시한다.

추가 작업

FANTOM 데이터베이스의 일반적인 데이터 공유 외에도 FANTOM5는 데이터 탐색을 위한 두 가지 생체 정보 툴을 도입했습니다.ZENBU는 추가 기능을 갖춘 게놈 브라우저입니다.사용자는 CAME, 쇼트RNA 및 ChIP-seq 실험의 BAM 파일을 업로드하여 시각적 비교 [39]중 품질 관리, 정규화, 피크 발견 및 주석을 수행할 수 있습니다.한편 SSTAR(샘플, 전사 개시 및 규정)는 FANTOM5 샘플과 그 게놈 특징을 탐색 [40]및 검색할 수 있도록 합니다.

FANTOM5에 의해 생산된 풍부한 데이터는 개발 과정과 같은 과정을 형성하는 규제 메커니즘을 설명하고자 하는 연구자들에게 계속해서 자원을 제공합니다.종종 특정 세포/조직 유형의 CAGE 데이터는 추가적인 후생유전학적 분석과 함께 사용된다. 이러한 예 중 하나는 과립구 [41]분화 중 DNA 메틸화와 CAGE 정의 조절 시퀀스의 상호작용을 설명한다.

FANTOM 그룹은 인핸서 및 프로모터 아틀라시스를 도입한 지 3년 후 FANTOM5 [42][43]데이터를 통합한 lncRNA 및 miRNA(microRNA)용 아틀라시스를 출시했습니다.가장 중요한 목표는 포유류 게놈의 전사에 대한 초기 관찰에 대한 더 많은 통찰력을 제공하는 것이었다.lncRNA 연구는 1,829개의 샘플에 걸쳐 27,919개의 인간 lncRNA 유전자를 특징지어 이 잘 이해되지 않는 RNA 클래스의 기능 관련성에 대한 연구를 자극했다.결과는 확인된 lncRNA의 69%가 잠재적 기능을 가지고 있다는 것을 시사했다. 그러나 나머지 31%가 가짜 전사 시작의 단순한 전사적 '소음'인지에 대해 언급하려면 더 많은 증거가 필요하다.miRNA 지도책에서는 1,357명의 인간과 804명의 쥐의 miRNA 프로모터를 확인했으며 두 종 사이의 강력한 염기서열 보존을 보여주었다.또한 1차 miRNA 발현을 성숙한 miRNA 수준의 대용물로 사용할 수 있다는 것이 입증되었다.

팬텀6

현재 FANTOM6는 인간 게놈에서 lncRNA의 역할을 체계적으로 특징짓는 것을 목표로 하고 있다.이러한 큰(200개 이상의 뉴클레오티드) 및 미번역 RNA의 생물학적 기능은 대부분 알려져 있지 않다.lncRNA를 조사한 몇 가지 저작물을 바탕으로 전사, 번역, 번역 후 수정 및 후생성 마크 조절에 관여하는 것으로 생각된다.그러나 이러한 추정 규제 상호작용의 범위와 범위에 대한 현재의 지식은 [1][44]기초적이다.

이번 FANTOM의 다음 번 공연에는 수많은 과제가 있습니다.특히, lncRNA는 보존이 부족하고 길이가 200에서 100만 개 이상에 이르는 등 크기가 매우 다양합니다.번역을 위해 세포졸에서 발견되는 코드 전사와 달리, lncRNA는 주로 RNA의 훨씬 더 복잡한 풍경인 에서 발견된다.일반적으로 lncRNA는 코드화된 전사체보다 발현 수준이 낮지만, 이 발현에는 세포 유형이나 핵 내의 국부화에 의해 가려질 수 있는 큰 변화가 있다.또한 기능 분류 lncRNA는 여전히 뜨거운 논란이 되고 있다. lncRNA가 공통 기능/메커니즘에 기반하여 그룹화될 수 있는지 또는 [1]활성 도메인별로 그룹화될 수 있는지 여부는 알려져 있지 않다.

FANTOM은 이러한 미지의 것들을 탐구하기 위해 세 갈래의 실험 전략을 제시했습니다.서로 다른 세포 타입의 기준 전사체 및 후생유전자 프로파일이 각 세포 타입의 기준선으로 구성된다.다음으로 이전 출판물, FANTOM5 데이터 및 추가 CAGE 프로파일링에서 식별된 lncRNA를 사용하여 세포 분자 표현형의 변화를 평가하기 위해 섭동 실험을 수행할 것이다.마지막으로, 보완 기술은 선택된 lncRNA [44]서브셋에 기능적으로 주석을 달거나 분류하는 데 사용된다.이러한 기술은 lncRNA 2차 구조, 단백질 및 염색질과의 관련성을 설명하고 [1]게놈 전체에 걸쳐 lncRNA의 장거리 상호작용을 매핑하는 것을 목표로 할 것이다.

레퍼런스

  1. ^ a b c d e f g h i j k l m n o p q r s t u v w x de Hoon, Michiel; Shin, Jay W.; Carninci, Piero (8 August 2015). "Paradigm shifts in genomics through the FANTOM projects". Mammalian Genome. 26 (9–10): 391–402. doi:10.1007/s00335-015-9593-8. PMC 4602071. PMID 26253466.
  2. ^ a b c d e f g h "FANTOM introduction". fantom.gsc.riken.jp.
  3. ^ Carninci, Piero; Nishiyama, Yoko; Westover, Arthur; et al. (20 January 1998). "Thermostabilization and thermoactivation of thermolabile enzymes by trehalose and its application for the synthesis of full length cDNA". Proceedings of the National Academy of Sciences of the United States of America. 95 (2): 520–524. Bibcode:1998PNAS...95..520C. doi:10.1073/pnas.95.2.520. ISSN 0027-8424. PMC 18452. PMID 9435224.
  4. ^ a b Carninci, Piero; Kvam, Catrine; Kitamura, Akiko; et al. (November 1996). "High-Efficiency Full-Length cDNA Cloning by Biotinylated CAP Trapper". Genomics. 37 (3): 327–336. doi:10.1006/geno.1996.0567. PMID 8938445.
  5. ^ Carninci, Piero; Shibata, Yuko; Hayatsu, Norihito; et al. (October 2000). "Normalization and Subtraction of Cap-Trapper-Selected cDNAs to Prepare Full-Length cDNA Libraries for Rapid Discovery of New Genes". Genome Research. 10 (10): 1617–1630. doi:10.1101/gr.145100. ISSN 1088-9051. PMC 310980. PMID 11042159.
  6. ^ Carninci, Piero; Shibata, Yuko; Hayatsu, Norihito; et al. (September 2001). "Balanced-Size and Long-Size Cloning of Full-Length, Cap-Trapped cDNAs into Vectors of the Novel λ-FLC Family Allows Enhanced Gene Discovery Rate and Functional Analysis". Genomics. 77 (1–2): 79–90. doi:10.1006/geno.2001.6601. PMID 11543636.
  7. ^ Kawai, J.; Shinagawa, A.; Shibata, K.; et al. (8 February 2001). "Functional annotation of a full-length mouse cDNA collection". Nature. 409 (6821): 685–690. Bibcode:2001Natur.409..685K. doi:10.1038/35055500. PMID 11217851.
  8. ^ Lander, Eric S.; Linton, Lauren M.; Birren, Bruce; Nusbaum, Chad; Zody, Michael C.; et al. (15 February 2001). "Initial sequencing and analysis of the human genome". Nature. 409 (6822): 860–921. doi:10.1038/35057062. PMID 11237011.
  9. ^ a b Okazaki, Y.; Furuno, M.; Kasukawa, T.; Adachi, J.; Bono, H.; et al. (5 December 2002). "Analysis of the mouse transcriptome based on functional annotation of 60,770 full-length cDNAs". Nature. 420 (6915): 563–573. Bibcode:2002Natur.420..563O. doi:10.1038/nature01266. PMID 12466851.
  10. ^ a b Numata, K. (2 June 2003). "Identification of Putative Noncoding RNAs Among the RIKEN Mouse Full-Length cDNA Collection". Genome Research. 13 (6): 1301–1306. doi:10.1101/gr.1011603. PMC 403720. PMID 12819127.
  11. ^ Kiyosawa, H. (2 June 2003). "Antisense Transcripts With FANTOM2 Clone Set and Their Implications for Gene Regulation". Genome Research. 13 (6): 1324–1334. doi:10.1101/gr.982903. PMC 403655. PMID 12819130.
  12. ^ Okazaki, Y. (2 June 2003). "A Guide to the Mammalian Genome". Genome Research. 13 (6): 1267–1272. doi:10.1101/gr.1445603.
  13. ^ Kawasawa, Y. (2 June 2003). "G Protein-Coupled Receptor Genes in the FANTOM2 Database". Genome Research. 13 (6): 1466–1477. doi:10.1101/gr.1087603. PMC 403690. PMID 12819145.
  14. ^ "RIKEN CAGE technology". www.osc.riken.jp (in Japanese). Archived from the original on 2017-10-09. Retrieved 2018-02-27.
  15. ^ Shiraki, T.; Kondo, S.; Katayama, S.; Waki, K.; Kasukawa, T.; Kawaji, H.; Kodzius, R.; Watahiki, A.; Nakamura, M.; Arakawa, T.; Fukuda, S.; Sasaki, D.; Podhajska, A.; Harbers, M.; Kawai, J.; Carninci, P.; Hayashizaki, Y. (8 December 2003). "Cap analysis gene expression for high-throughput analysis of transcriptional starting point and identification of promoter usage". Proceedings of the National Academy of Sciences. 100 (26): 15776–15781. Bibcode:2003PNAS..10015776S. doi:10.1073/pnas.2136655100. PMC 307644. PMID 14663149.
  16. ^ Kodzius, Rimantas; Kojima, Miki; Nishiyori, Hiromi; Nakamura, Mari; Fukuda, Shiro; Tagami, Michihira; Sasaki, Daisuke; Imamura, Kengo; Kai, Chikatoshi; Harbers, Matthias; Hayashizaki, Yoshihide; Carninci, Piero (March 2006). "CAGE: cap analysis of gene expression". Nature Methods. 3 (3): 211–222. doi:10.1038/nmeth0306-211. PMID 16489339. S2CID 32641130.
  17. ^ a b c Carninci, P.; Kasukawa, T.; Katayama, S.; Gough, J.; Frith, M. C.; Maeda, N.; Oyama, R.; Ravasi, T.; Lenhard, B.; Wells, C.; Kodzius, R.; Shimokawa, K.; Bajic, V. B.; Brenner, S. E.; Batalov, S.; Forrest, A. R.; Zavolan, M.; Davis, M. J.; Wilming, L. G.; Aidinis, V.; Allen, J. E.; Ambesi-Impiombato, A.; Apweiler, R.; Aturaliya, R. N.; Bailey, T. L.; Bansal, M.; Baxter, L.; Beisel, K. W.; Bersano, T.; et al. (2 September 2005). "The Transcriptional Landscape of the Mammalian Genome". Science. 309 (5740): 1559–1563. Bibcode:2005Sci...309.1559F. doi:10.1126/science.1112014. PMID 16141072. S2CID 8712839.
  18. ^ Katayama, S; Tomaru, Y; Kasukawa, T; et al. (2 September 2005). "Antisense Transcription in the Mammalian Transcriptome". Science. 309 (5740): 1564–1566. Bibcode:2005Sci...309.1564R. doi:10.1126/science.1112009. PMID 16141073. S2CID 34559885.
  19. ^ Carninci, Piero; Sandelin, Albin; Lenhard, Boris; Katayama, Shintaro; Shimokawa, Kazuro; et al. (2006). "Genome-wide analysis of mammalian promoter architecture and evolution". Nature Genetics. 38 (6): 626–635. doi:10.1038/ng1789. ISSN 1546-1718. PMID 16645617. S2CID 22205897.
  20. ^ "FANTOM3 - Papers". fantom.gsc.riken.jp.
  21. ^ "PLOS Genetics: Search Results FANTOM3". journals.plos.org.
  22. ^ de Hoon, Michiel; Hayashizaki, Yoshihide (April 2008). "Deep cap analysis gene expression (CAGE): genome-wide identification of promoters, quantification of their expression, and network inference". BioTechniques. 44 Supplement (4): 627–632. doi:10.2144/000112802. PMID 18474037.
  23. ^ Suzuki, Harukazu; Consortium, The FANTOM; Forrest, Alistair R R; et al. (2009). "The transcriptional network that controls growth arrest and differentiation in a human myeloid leukemia cell line". Nature Genetics. 41 (5): 553–562. doi:10.1038/ng.375. ISSN 1546-1718. PMC 6711855. PMID 19377474.
  24. ^ Kazazian, H. H. (12 March 2004). "Mobile Elements: Drivers of Genome Evolution". Science. 303 (5664): 1626–1632. Bibcode:2004Sci...303.1626K. doi:10.1126/science.1089670. PMID 15016989. S2CID 1956932.
  25. ^ Finnegan, David J. (June 2012). "Retrotransposons". Current Biology. 22 (11): R432–R437. doi:10.1016/j.cub.2012.04.025. PMID 22677280.
  26. ^ a b Faulkner, Geoffrey J; Kimura, Yasumasa; Daub, Carsten O; et al. (19 April 2009). "The regulated retrotransposon transcriptome of mammalian cells". Nature Genetics. 41 (5): 563–571. doi:10.1038/ng.368. PMID 19377475. S2CID 1150976.
  27. ^ a b Taft, Ryan J; Glazov, Evgeny A; Cloonan, Nicole; et al. (19 April 2009). "Tiny RNAs associated with transcription start sites in animals". Nature Genetics. 41 (5): 572–578. doi:10.1038/ng.312. PMID 19377478. S2CID 39181339.
  28. ^ Taft, Ryan J; Hawkins, Peter G; Mattick, John S; Morris, Kevin V (2011). "The relationship between transcription initiation RNAs and CCCTC-binding factor (CTCF) localization". Epigenetics & Chromatin. 4 (1): 13. doi:10.1186/1756-8935-4-13. PMC 3170176. PMID 21813016.
  29. ^ Ravasi, Timothy; Suzuki, Harukazu; Cannistraci, Carlo Vittorio; et al. (March 2010). "An Atlas of Combinatorial Transcriptional Regulation in Mouse and Man". Cell. 140 (5): 744–752. doi:10.1016/j.cell.2010.01.044. PMC 2836267. PMID 20211142.
  30. ^ Kratz, Anton; Arner, Erik; Saito, Rintaro; Kubosaki, Atsutaka; Kawai, Jun; Suzuki, Harukazu; Carninci, Piero; Arakawa, Takahiro; Tomita, Masaru; Hayashizaki, Yoshihide; Daub, Carsten O (2010). "Core promoter structure and genomic context reflect histone 3 lysine 9 acetylation patterns". BMC Genomics. 11 (1): 257. doi:10.1186/1471-2164-11-257. PMC 2867832. PMID 20409305.
  31. ^ Akalin, Altuna; Fredman, David; Arner, Erik; Dong, Xianjun; Bryne, Jan; Suzuki, Harukazu; Daub, Carsten O; Hayashizaki, Yoshihide; Lenhard, Boris (2009). "Transcriptional features of genomic regulatory blocks". Genome Biology. 10 (4): R38. doi:10.1186/gb-2009-10-4-r38. PMC 2688929. PMID 19374772.
  32. ^ "FANTOM 4 Publications". fantom.gsc.riken.jp.
  33. ^ a b c d e Noguchi, Shuhei; Arakawa, Takahiro; Fukuda, Shiro; et al. (29 August 2017). "FANTOM5 CAGE profiles of human and mouse samples". Scientific Data. 4: 170112. Bibcode:2017NatSD...470112N. doi:10.1038/sdata.2017.112. PMC 5574368. PMID 28850106.
  34. ^ Lizio, Marina; Harshbarger, Jayson; Shimoji, Hisashi; et al. (2015). "Gateways to the FANTOM5 promoter level mammalian expression atlas". Genome Biology. 16 (1): 22. doi:10.1186/s13059-014-0560-6. PMC 4310165. PMID 25723102.
  35. ^ a b The FANTOM Consortium the RIKEN PMI CLST (DGT); Forrest, A. R.; Kawaji, H.; Rehli, M.; Baillie, J. K.; De Hoon, M. J.; Haberle, V.; Lassmann, T.; Kulakovskiy, I. V.; Lizio, M.; Itoh, M.; Andersson, R.; Mungall, C. J.; Meehan, T. F.; Schmeier, S.; Bertin, N.; Jørgensen, M.; Dimont, E.; Arner, E.; Schmidl, C.; Schaefer, U.; Medvedeva, Y. A.; Plessy, C.; Vitezic, M.; Severin, J.; Semple, C.; Ishizu, Y.; Young, R. S.; Francescatto, M.; et al. (27 March 2014). "A promoter-level mammalian expression atlas". Nature. 507 (7493): 462–470. Bibcode:2014Natur.507..462T. doi:10.1038/nature13182. PMC 4529748. PMID 24670764.
  36. ^ Andersson, Robin; Gebhard, Claudia; Miguel-Escalada, Irene; et al. (27 March 2014). "An atlas of active enhancers across human cell types and tissues". Nature. 507 (7493): 455–461. Bibcode:2014Natur.507..455A. doi:10.1038/nature12787. PMC 5215096. PMID 24670763.
  37. ^ a b Kanamori-Katayama, M.; Itoh, M.; Kawaji, H.; et al. (19 May 2011). "Unamplified cap analysis of gene expression on a single-molecule sequencer". Genome Research. 21 (7): 1150–1159. doi:10.1101/gr.115469.110. PMC 3129257. PMID 21596820.
  38. ^ a b Arner, E.; Daub, C. O.; Vitting-Seerup, K.; et al. (12 February 2015). "Transcribed enhancers lead waves of coordinated transcription in transitioning mammalian cells". Science. 347 (6225): 1010–1014. Bibcode:2015Sci...347.1010A. doi:10.1126/science.1259418. PMC 4681433. PMID 25678556.
  39. ^ Severin, Jessica; Lizio, Marina; Harshbarger, Jayson; et al. (1 March 2014). "Interactive visualization and analysis of large-scale sequencing datasets using ZENBU". Nature Biotechnology. 32 (3): 217–219. doi:10.1038/nbt.2840. PMID 24727769. S2CID 26575621.
  40. ^ "FANTOM5_SSTAR". fantom.gsc.riken.jp.
  41. ^ Ronnerblad, M.; Andersson, R.; Olofsson, T.; et al. (26 March 2014). "Analysis of the DNA methylome and transcriptome in granulopoiesis reveals timed changes and dynamic enhancer methylation". Blood. 123 (17): e79–e89. doi:10.1182/blood-2013-02-482893. PMID 24671952.
  42. ^ Hon, Chung-Chau; Ramilowski, Jordan A.; Harshbarger, Jayson; et al. (1 March 2017). "An atlas of human long non-coding RNAs with accurate 5′ ends". Nature. 543 (7644): 199–204. Bibcode:2017Natur.543..199H. doi:10.1038/nature21374. PMC 6857182. PMID 28241135.
  43. ^ de Rie, Derek; Abugessaisa, Imad; Alam, Tanvir; et al. (21 August 2017). "An integrated expression atlas of miRNAs and their promoters in human and mouse". Nature Biotechnology. 35 (9): 872–878. doi:10.1038/nbt.3947. PMC 5767576. PMID 28829439.
  44. ^ a b "FANTOM - FANTOM6". fantom.gsc.riken.jp.