부호화
ENCODE![]() | |
---|---|
내용 | |
묘사 | 전체 게놈 데이터베이스 |
연락 | |
연구소 | 스탠퍼드 대학교 |
실험실. | 스탠포드 게놈 테크놀로지 센터:Cherry Lab; 이전 이름:캘리포니아 대학교 산타 크루즈 |
작가들 | 유리엘홍 외 17명[1] |
주요 인용문 | PMID 26980513 |
발매일 | 2010년 |
접근 | |
웹 사이트 | encodeproject |
ENCODE(Encyclopedia of DNA Elements)는 인간 게놈의 기능적 요소를 식별하는 것을 목표로 하는 공공 연구 프로젝트입니다.
ENCODE는 또한 "게노믹스 데이터 분석을 위한 커뮤니티 자원, 소프트웨어, 도구 및 방법, 데이터 분석과 [2]해석에 따른 제품"을 생성함으로써 추가적인 생물의학 연구를 지원한다.
ENCODE의 현재 단계(2016-2019)는 세포 유형, 데이터 유형, 분석의 수를 증가시킴으로써 자원에 깊이를 더하고 있으며, 현재 마우스 [2]게놈 검사 지원을 포함하고 있다.
역사
ENCODE는 미국 [3][4][5][6][7]국립 인간 게놈 연구소(NHGRI)에 의해 2003년 9월에 시작되었습니다.Human Genome Project의 후속 조치인 ENCODE 프로젝트는 인간 게놈의 모든 기능적 요소를 식별하는 것을 목표로 합니다.
이 프로젝트에는 전세계 연구 그룹 컨소시엄이 참여하며, 이 프로젝트에서 생성된 데이터는 공용 데이터베이스를 통해 액세스할 수 있습니다.ENCODE의 최초 릴리스는 2013년이었으며, 이후 컨소시엄 멤버들과 ENCODE 데이터에 액세스하기 위해 포털을 사용하는 더 넓은 과학자 커뮤니티의 권고에 따라 변경되어 왔다.ENCODE의 두 부분으로 구성된 목표는 "실험 프로토콜, 분석 절차 및 데이터 자체"를 위한 공개적인 데이터베이스 역할을 하는 것이며, "같은 인터페이스가 데이터의 출처를 기록하고 생물학적 [8]관점에서 해석의 정당성을 입증하는 신중하게 큐레이션된 메타데이터를 제공해야 한다."이 프로젝트는 2017년 [9]2월에 네 번째 단계를 시작했다.
모티베이션과 중요성
인간은 약 20,000개의 단백질 코드 유전자를 가지고 있는 것으로 추정되는데, 이것은 인간 게놈의 약 1.5 퍼센트를 차지한다.ENCODE 프로젝트의 주요 목표는 게놈의 나머지 구성 요소의 역할을 결정하는 것입니다. 이 구성 요소의 대부분은 전통적으로 "정크"로 간주되었습니다.단백질 코드 유전자의 활성과 발현은 조절체 - 촉진제, 전사 조절 배열, 염색질 구조와 히스톤 변형 영역과 같은 다양한 DNA 요소에 의해 조절될 수 있습니다.유전자 활성 조절의 변화는 단백질 생산과 세포 과정을 방해하고 질병을 일으킬 수 있다고 생각됩니다.이러한 조절 요소의 위치와 그것들이 유전자 전사에 어떻게 영향을 미치는지 결정하는 것은 특정 유전자의 발현 변화와 질병의 [10]발달 사이의 연관성을 드러낼 수 있다.
ENCODE는 또한 게놈이 인간의 건강에 어떻게 영향을 미치는지 과학계가 더 잘 이해할 수 있도록 하고 "이러한 [4]질병을 예방하고 치료하기 위한 새로운 치료법의 개발을 촉진하기 위한" 포괄적인 자원으로서 의도되어 있다.

ENCODE 컨소시엄
ENCODE 컨소시엄은 주로 미국 국립 인간 게놈 연구소(NHGRI)의 자금 지원을 받은 과학자로 구성되어 있다.프로젝트에 기여하는 다른 참가자는 컨소시엄 또는 분석 작업 그룹에 참여하게 됩니다.
파일럿 단계는 8개의 연구 그룹과 12개의 그룹으로 구성되어 ENCODE 기술 개발 단계에 참여했습니다.2007년 이후 시범 단계가 공식적으로 끝나면서 참여 인원은 전 세계 32개 연구소에 있는 440명으로 늘어났다.현재 컨소시엄은 다양한 업무를 수행하는 여러 센터로 구성되어 있습니다.
ENCODE는 IHEC([12]International Human Epigenome Consortium)의 회원입니다.
NHGRI의 ENCODE 지원 연구 제품에 대한 주요 요구사항은 게놈 연구를 촉진하기 위해 모든 연구자에게 자유롭고 접근성이 높은 방식으로 공유되어야 한다는 것이다.ENCODE 연구는 게놈 분석과 관련된 소프트웨어,[2] 방법, 데이터 및 기타 도구의 재현성과 투명성을 가능하게 합니다.
ENCODE 프로젝트
ENCODE는 현재 파일럿 단계와 테크놀로지 개발 단계([13]동시에 개시) 및 생산 단계)의 4가지 단계로 구현되어 있습니다.네 번째 단계는 세 번째 단계의 연속이며, 백과사전에 대한 기능적 특성 분석과 추가적인 통합 분석을 포함합니다.
시험 단계의 목표는 인간 게놈의 넓은 영역을 정확하고 포괄적으로 특징짓기 위해 비용 효율적이고 높은 처리량으로 조합하여 적용할 수 있는 일련의 절차를 식별하는 것이었다.파일럿 단계에서는 기능 시퀀스를 검출하기 위한 현재의 툴 세트의 갭을 밝혀야 했으며, 그 시점에서 사용된 일부 방법이 비효율적이거나 대규모 활용에 적합하지 않은지도 밝혀야 했다.이러한 문제 중 일부는 알려진 기능 서열을 식별하거나 새로운 기능 게놈 요소를 발견하는 능력을 향상시키는 새로운 실험실 및 계산 방법을 고안하는 것을 목표로 하는 ENCODE 기술 개발 단계에서 다루어져야 했다.처음 두 단계의 결과에 따라 비용 효율적이고 포괄적인 [4]생산 단계에서 인간 게놈의 나머지 99%를 분석하기 위한 최선의 경로가 결정되었습니다.
ENCODE 단계I 프로젝트:파일럿 프로젝트
파일럿 단계에서는 기존 방법을 테스트하고 비교하여 인간 게놈 배열의 정의된 부분을 엄격하게 분석했습니다.개방형 컨소시엄으로 조직되어 다양한 배경과 전문성을 가진 조사관들을 모아 다양한 기술, 기술, 전략의 상대적 장점을 평가하였다.프로젝트의 동시 기술 개발 단계에서는 기능 요소를 식별하는 새로운 높은 스루풋 방법을 개발하는 것이 목표였습니다.이러한 노력의 목표는 인간 게놈의 모든 기능적 요소를 포괄적으로 식별할 수 있는 일련의 접근방식을 식별하는 것이었다.국립인간게놈연구소(NHGRI)는 ENCODE 시범 프로젝트를 통해 인간 게놈 전체를 분석하고 게놈 염기서열에서 기능적 요소를 식별하는 능력의 격차를 찾기 위해 다양한 접근법의 능력을 평가했습니다.
ENCODE 파일럿 프로젝트 과정은 인간 게놈에 주석을 달기 위한 많은 방법을 평가하기 위해 컴퓨터 과학자와 실험 과학자 사이의 긴밀한 상호작용을 포함했다.인간 게놈의 약 1%(30Mb)를 나타내는 일련의 영역이 파일럿 프로젝트의 대상으로 선정되어 모든 ENCODE 파일럿 프로젝트 조사자에 의해 분석되었습니다.이러한 지역에서 ENCODE 참가자들에 의해 생성된 모든 데이터는 공개 데이터베이스에 [6][14]빠르게 공개되었습니다.
대상 선택
ENCODE 파일럿 프로젝트에서 사용하기 위해 인간 게놈의 정의된 영역(전체 인간 게놈의 약 1%인 30Mb)이 선택되었다.이들 영역은 인간 DNA에서 다양한 기능적 요소를 찾기 위한 다양한 방법 및 기술의 효과와 효율성을 테스트하고 평가하는 기초가 되었다.
대상 선택을 시작하기 전에 30Mb 시퀀스의 50%는 수동으로 선택하고 나머지 시퀀스는 무작위로 선택하기로 결정했다.수동으로 선택된 영역에 대한 두 가지 주요 기준은 1) 잘 연구된 유전자 또는 기타 알려진 배열 요소의 존재와 2) 상당량의 비교 배열 데이터의 존재였다.총 14.82Mb의 시퀀스는 이 접근방식을 사용하여 수동으로 선택되었으며 크기가 500kb에서 2Mb 사이즈의 14개의 타깃으로 구성되어 있습니다.
30Mb의 염기서열 중 나머지 50%는 유전자 밀도와 비이성 보존 수준에 기초한 계층화 무작위 샘플링 전략에 따라 선택된 30, 500kb 영역으로 구성되었다.이러한 특정 기준을 사용하는 결정은 유전자 및 기타 기능 요소의 함량이 매우 다양한 게놈 영역의 양호한 샘플링을 보장하기 위해 이루어졌다.인간 게놈은 1) 유전자 밀도, 2) 직교 마우스 게놈 배열에 대한 비이성 보존 수준(아래 참조)의 두 축을 따라 상위 20%, 중간 30%, 하위 50%의 세 부분으로 나누어 총 9개의 지층으로 구분하였다.각 층에서 3개의 랜덤 영역이 파일럿 프로젝트에 선택되었습니다.수동 선택이 불충분한 계층에 대해 네 번째 영역을 선택함으로써 총 30개 지역이 되었다.모든 계층에 대해 예상치 못한 기술적 문제가 발생할 경우 사용할 수 있도록 "백업" 영역이 지정되었습니다.
보다 상세한 계층화 기준은 다음과 같습니다.
- 유전자 밀도:영역의 유전자 밀도 점수는 Ensembl 데이터베이스의 유전자 또는 UCSC Genome Browser 데이터베이스의 인간 mRNA best BLAT(BLAST-like alignment tool) 정렬에 의해 커버된 염기의 백분율이었다.
- 비정상 보존:그 지역은 125개의 베이스를 가진 겹치지 않는 하위 창으로 나뉘었다.마우스 시퀀스와 함께 기본 정렬이 75% 미만으로 표시된 하위 창은 폐기되었습니다.나머지 하위 창에서는 생쥐에 대한 기본 정체성이 80% 이상이고 Ensembl 유전자, GenBank mRNA BLASTZ 정렬, Fgenesh+ 유전자 예측, TwinScan 유전자 예측, 스플라이스 EST 정렬 또는 반복 시퀀스(DNA)에 해당하지 않는 백분율이 비예측 보존 점수로 사용되었다.
위의 점수는 게놈 전체에 걸쳐 완료된 시퀀스의 500kb 창 내에서 중복되지 않는 범위 내에서 계산되었으며, 각 창을 [15]지층에 할당하는 데 사용되었다.
파일럿 단계 결과
파일럿 단계가 성공적으로 완료되어 결과는 2007년 6월 네이처지[6] 및 게놈 [16]리서치 특집호에 게재되었습니다.첫 번째 논문에 게재된 결과는 다음과 같은 [6]주요 분야에서 인간 게놈 기능에 대한 집합적인 지식을 발전시켰습니다.
- 인간 게놈은 침투적으로 전사되며, 대부분의 베이스가 적어도 하나의 1차 전사물과 관련지어지고 많은 전사물이 확립된 단백질 코드 궤적에 원위부를 연결한다.
- 많은 새로운 비단백질 코드 전달물이 확인되었으며, 이러한 중복되는 단백질 코드 위치 및 이전에는 전사적으로 침묵하는 것으로 생각되었던 게놈 영역에 위치한 다른 것들과 함께 확인되었습니다.
- 이전에 인식되지 않았던 수많은 전사 시작 부위가 확인되었으며, 그 중 다수는 잘 알려진 촉진제와 유사한 크로마틴 구조와 배열 특이적 단백질 결합 특성을 보여준다.
- 문자 변환 시작 사이트를 둘러싼 규제 시퀀스는 업스트림 영역에 치우치지 않고 대칭적으로 분산됩니다.
- 크로마틴 접근성 및 히스톤 수정 패턴은 전사 시작 부위의 존재와 활성 모두를 매우 예측한다.
- 원위부 DNaseI 과민성 부위는 촉진제로부터 확실하게 구별되는 특징적인 히스톤 수정 패턴을 가지고 있다. 이러한 원위부위 중 일부는 절연체 기능과 일치하는 마크를 보인다.
- DNA 복제 타이밍은 염색질 구조와 관련이 있다.
- 게놈 내 염기의 총 5%는 포유동물에서 진화적 제약 하에 있는 것으로 자신 있게 식별될 수 있다. 이러한 제약된 염기의 약 60%에 대해서는 지금까지 수행된 실험 분석 결과에 기초하여 기능의 증거가 있다.
- 실험 분석에 의해 기능하는 것으로 식별된 게놈 영역과 진화적 제약 하에 있는 유전자 영역 사이에 일반적인 중복이 있지만, 이러한 실험적으로 정의된 영역 내의 모든 염기가 제약의 증거를 보이는 것은 아니다.
- 다른 기능성 요소들은 인간 집단 전체에 걸쳐 배열의 가변성과 게놈의 구조적으로 가변적인 영역 내에 존재할 가능성에서 크게 다르다.
- 놀랍게도, 많은 기능적 요소들이 포유류의 진화에 있어 겉으로 보기에 제약이 없는 것처럼 보입니다.이것은 생화학적으로 활성화되어 있지만 유기체에 특별한 이점을 제공하지 않는 많은 중성 원소의 가능성을 시사한다.이 풀은 자연 선택을 위한 '창고' 역할을 할 수 있으며, 잠재적으로 혈통 고유의 요소 및 기능적으로는 보존되지만 종 간에는 비정통적인 요소의 원천으로 작용할 수 있다.
ENCODE 단계 II 프로젝트:생산 단계 프로젝트

2007년 9월, 국립 인간 게놈 연구소(NHGRI)는 ENCODE 프로젝트의 생산 단계에 자금을 대기 시작했습니다.이 단계에서는 전체 게놈을 분석하고 "추가 시험 규모 연구"[17]를 수행하는 것이 목표였다.
파일럿 프로젝트와 마찬가지로, 생산 활동은 오픈 컨소시엄으로 구성되어 있습니다.2007년 10월 NHGRI는 4년간 [18]총 8000만달러 이상의 보조금을 지급했다.생산 단계에는 데이터 조정 센터, 데이터 분석 센터 및 기술 개발 [19]작업도 포함됩니다.당시 이 프로젝트는 전 세계 32개 연구소에서 440명의 과학자가 참여한 진정한 글로벌 기업으로 발전했습니다.파일럿 단계가 완료되면 2007년에 프로젝트가 "확대"되어 신세대 시퀀싱 머신을 통해 막대한 이익을 얻었습니다.그리고 그 데이터는 실로 거대했습니다.연구자는 약 15테라바이트의 원시 데이터를 생성했습니다.
2010년까지 ENCODE 프로젝트에 의해 1,000개 이상의 게놈 전체 데이터 세트가 생성되었다.함께, 이러한 데이터 세트는 어떤 영역이 RNA로 전사되는지, 어떤 영역이 특정 유형의 세포에 사용되는 유전자를 제어할 가능성이 있는지, 그리고 어떤 영역이 다양한 단백질과 연관되어 있는지를 보여준다.ENCODE에 사용되는 1차 측정법은 ChIP-seq, DNase I 과민성, RNA-seq 및 DNA 메틸화 측정법이다.
생산 단계 결과
2012년 9월, 이 프로젝트는 훨씬 더 광범위한 결과를 발표했는데, Nature 6편, Genome Biology 6편, Genome Research [20]18편의 특별호 등 여러 저널에 동시 게재된 30편의 논문을 발표했다.
저자들은 전체 인간 게놈에서 기능 요소에 주석을 달도록 설계된 1,640개의 데이터 세트의 생산과 초기 분석을 설명했으며, 세포 유형 내의 다양한 실험, 147개의 다른 세포 유형을 포함하는 관련 실험 및 게놈의 후보 영역과 같은 다른 자원과 모든 ENCODE 데이터를 통합했다.와이드 어소시에이션 스터디(GWAS) 및 진화적 제약 영역.이러한 노력들이 함께 인간 게놈의 조직과 기능에 관한 중요한 특징들을 밝혀냈으며,[21] 그 개요는 다음과 같이 요약되었다.
- 인간 게놈의 대다수(80.4%)는 적어도 하나의 세포 유형에서 적어도 하나의 생화학적 RNA 및/또는 염색질 관련 이벤트에 참여한다.게놈의 대부분은 조절 사건에 가깝다: 게놈의 95%는 DNA-단백질 상호작용의 8kb 이내에 있고(결합 ChIP-seq 모티브 또는 DNaseI 발자국에 의해 측정됨), 99%는 ENCODE에 의해 측정된 생화학 사건 중 적어도 1.7kb 이내에 있다.
- 영장류 특유의 요소뿐만 아니라 검출 가능한 포유류의 제약이 없는 요소들은 전체적으로 음성 선택의 증거를 보여준다. 따라서 이들 중 일부는 기능할 것으로 예상된다.
- 게놈을 7개의 염색질 상태로 분류하는 것은 초기 399,124개의 강화제 같은 특징을 가진 영역과 70,292개의 촉진제 같은 특징을 가진 영역, 그리고 수십만 개의 정지된 영역을 암시한다.고해상도 분석을 통해 게놈은 뚜렷한 기능적 특성을 가진 수천 개의 좁은 상태로 세분화됩니다.
- 프로모터에서 염색질 마크 및 전사 인자(TF) 결합과 RNA 배열 생성 및 처리를 정량적으로 상관할 수 있으며, 프로모터 기능이 RNA 발현 변동의 대부분을 설명할 수 있음을 나타냅니다.
- 개별 게놈 배열에서 코드화되지 않은 많은 변종들은 ENCODE 주석이 달린 기능 영역에 있다. 이 숫자는 적어도 단백질 코드화 유전자에 있는 것만큼이나 크다.
- GWAS에 의한 질병과 관련된 SNP는 비부호화 기능 요소 내에서 농축되며, 대부분은 단백질 부호화 유전자 밖에 있는 ENCODE 정의 영역 또는 그 근처에 존재한다.많은 경우 질병 표현형은 특정 세포형 또는 TF와 관련될 수 있다.
가장 놀라운 발견은 생물학적으로 활성화된 인간 DNA의 비율이 가장 낙관적인 이전의 추정치보다 상당히 높다는 것이다.개요 논문에서, ENCODE Consortium은 그 [21]구성원들이 게놈의 80% 이상에 생화학 기능을 할당할 수 있었다고 보고했다.이것의 대부분은 게놈의 1% 미만을 구성하는 코드 DNA의 발현 수준을 조절하는 것과 관련이 있는 것으로 밝혀졌다.
"백과사전"의 가장 중요한 새로운 요소는 다음과 같습니다.
- DNase 1 과민성 부위의 포괄적인 지도. 일반적으로 유전자와 인접해 있으며 화학적 요인이 발현에 영향을 미칠 수 있도록 하는 조절 DNA의 표시입니다.이 지도는 이전에 알려진 거의 모든 [22]유적과 새로운 유적지를 포함하여 거의 3백만 개의 유적지를 확인했다.
- DNA 결합 단백질에 대한 인식 모티브를 형성하는 짧은 DNA 배열 사전.약 840만 개의 그러한 배열이 발견되었는데, 이는 엑솜 크기의 대략 두 배 크기인 총 DNA의 일부를 구성한다.수천 명의 전사 추진자들이 판에 박힌 50개의 베이스 페어 [23]풋프린트를 사용하는 것으로 밝혀졌다.
- 인간 전사인자 네트워크의 아키텍처, 즉 유전자의 발현을 촉진하거나 억제하기 위해 DNA에 결합하는 인자의 예비 스케치.네트워크는 매우 복잡한 것으로 판명되었습니다.다양한 레벨로 동작하는 요인뿐만 아니라 다양한 [24]타입의 피드백 루프도 다수 있었습니다.
- RNA로 변환될 수 있는 인간 게놈의 분율 측정.이 분율은 총 DNA의 75% 이상을 합산할 것으로 추정되었으며, 이는 이전의 추정치보다 훨씬 높은 값이다.이 프로젝트는 또한 다양한 [25]위치에서 생성되는 RNA 전사물의 종류를 특징짓기 시작했다.
데이터 관리 및 분석
생성된 다양한 데이터를 캡처, 저장, 통합 및 표시하는 것은 어렵습니다.ENCODE Data Coordination Center(DCC; 데이터 조정 센터)는 연구소에서 생성된 데이터를 컨소시엄에 정리하여 표시하고 일반에 공개할 때 데이터가 특정 품질 기준을 충족하도록 보장합니다.연구소가 데이터를 제출하기 전에 DCC와 연구소는 실험 파라미터와 관련 메타데이터를 정의하는 데이터 계약 초안을 작성합니다.DCC 는, 계약과의 정합성을 확보하기 위해서, 착신 데이터를 검증합니다.또한 적절한 Ontologies를 [26]사용하여 모든 데이터에 주석을 달 수 있습니다.그런 다음 예비 검사를 위해 데이터를 테스트 서버에 로드하고, 랩과 조정하여 데이터를 일관된 트랙 세트로 구성합니다.트랙이 준비되면 DCC Quality Assurance 팀은 일련의 무결성 검사를 수행하고 데이터가 다른 브라우저 데이터와 일치하는 방식으로 표시되는지 확인합니다.또한 가장 중요한 것은 메타데이터와 함께 제공되는 설명 텍스트가 사용자에게 유용한 방식으로 표시되는지 확인하는 것입니다.데이터는 UCSC Genome Browser 웹사이트에 공개됩니다.이러한 체크가 모두 완료된 후에만 공개됩니다.이와 동시에 데이터는 다양한 생산 연구소의 분석 팀과 다른 연구원으로 구성된 컨소시엄인 ENCODE 데이터 분석 센터에 의해 분석됩니다.이러한 팀은 새로운 분석의 데이터를 분석하고, 모범 사례를 결정하며, 표준화된 피크 호출자 및 정렬 파일업의 [27]신호 생성과 같은 일관된 분석 방법 세트를 생성하기 위한 표준화된 프로토콜을 개발합니다.
국립 인간 게놈 연구소(NHGRI)는 ENCODE를 "지역 자원 프로젝트"로 식별했습니다.이 중요한 개념은 Ft.에서 열린 국제 회의에서 정의되었습니다.Lauderdale은 2003년 1월 광범위한 과학계의 자원으로서 주요 효용이 되는 데이터, 시약 또는 기타 재료 세트를 만들기 위해 특별히 고안 및 구현된 연구 프로젝트입니다.따라서 ENCODE 데이터 릴리스 정책에서는 검증된 데이터는 퍼블릭데이터베이스에 저장되며 모든 사람이 [27]제한 없이 사용할 수 있도록 규정되어 있습니다.
기타 프로젝트
세 번째 단계가 계속됨에 따라, ENCODE 컨소시엄은 ENCODE 프로젝트와 병행하는 목표를 가진 추가 프로젝트에 참여하게 되었습니다.이러한 프로젝트 중 일부는 ENCODE의 두 번째 단계의 일부였습니다.
modENcode 프로젝트
MODel 유기체 ENCyclopedia Of DNA Elements (modENcode) 프로젝트는 선택된 유기체 게놈의 기능 요소, 특히 Drosophila melanogaster와 Caenorhabditis [28]elegans의 식별을 목표로 하는 원래의 ENCODE 프로젝트의 계속이다.모델 유기체로의 확장은 [28]인간에게는 어렵거나 불가능한 ENCODE 프로젝트의 계산 및 실험 결과의 생물학적 검증을 가능하게 한다.modENcode 프로젝트에 대한 자금 지원은 2007년 NIH(National Institutes of Health)에 의해 발표되었으며,[29][30] 미국의 여러 다른 연구 기관이 포함되어 있습니다.이 프로젝트는 2012년에 완성되었다.
2010년 말, modENcode 컨소시엄은 [31][32]사이언스에 웜과 파리 게놈의 주석과 통합 분석에 관한 출판물과 함께 첫 번째 결과 세트를 발표했습니다.이들 출판물의 데이터는 modENcode 웹사이트에서 [33]구할 수 있습니다.
modENcode는 리서치 네트워크로서 운영되었으며, 컨소시엄은 웜과 파리로 구분된 11개의 주요 프로젝트로 구성되었습니다.프로젝트 범위는 다음과 같습니다.
- 유전자 구조
- mRNA 및 ncRNA 표현 프로파일링
- 전사율 바인딩 사이트
- 히스톤의 변경과 치환
- 염색질 구조
- DNA 복제 시작 및 타이밍
- 카피 번호의 변동.[34]
현대의
modERN은 규제 네트워크의 모델 유기체 백과사전의 줄임말로 modENcode 프로젝트에서 분기되었습니다.이 프로젝트는 C. elegans와 Drosophila 그룹을 병합하고 각 유기체의 추가적인 전사 인자 결합 부위의 식별에 초점을 맞추고 있다.프로젝트는 ENCODE의 Phase III와 동시에 시작되어 [35]2017년에 종료될 예정입니다.지금까지 이 프로젝트는 198개의 [36]실험을 발표했으며 약 500개의 다른 실험들이 DCC에 의해 제출되어 현재 처리되고 있다.
유전자 조절 유전체학
2015년 초 NIH는 유전자 조절 유전체학([37]GGR) 프로그램을 시작했다.3년 동안 진행될 이 프로그램의 목표는 유전자 발현을 제어하는 메커니즘을 더 잘 이해하기를 바라면서 인체의 다른 시스템에서의 유전자 네트워크와 경로를 연구하는 것이다.ENCODE 프로젝트는 GGR과는 별개이지만 ENCODE DCC는 ENCODE [38]포털에서 GGR 데이터를 호스트하고 있습니다.
로드맵
2008년 NIH는 "기초 생물학 및 질병 지향 [39]연구를 촉진하기 위한 인간 후생유전학 데이터의 공공 자원"을 생산하는 것을 목표로 하는 Roadmap 에피게노믹스 매핑 컨소시엄을 시작했다.2015년 2월 컨소시엄은 '111개의 기준 인간 후생유전자의 통합 분석'이라는 제목의 기사를 발표하여 컨소시엄의 목적을 달성하였다.컨소시엄은 127개의 참조 후생유전자에 걸쳐 정보와 주석이 달린 규제 요소를 통합했으며, 그 중 16개는 ENCODE [40]프로젝트의 일부였다.Roadmap 프로젝트의 데이터는 Roadmap 포털 또는 ENCODE 포털에서 찾을 수 있습니다.

fruitENcode 프로젝트
과일ENCODE: 과일의 숙성을 위한 DNA 요소의 백과 사전은 다른 개발 단계에서 모든 다육 과일의 종에 대해 DNA 메틸화, 히스톤 수정, DHS, 유전자 발현, 전사 인자 결합 데이터 세트를 생성하는 것을 목표로 하는 식물 ENCODE 프로젝트입니다.프리리스 데이터는 과일에서 찾을 수 있습니다.ENCODE 포털
프로젝트에 대한 비판
컨소시엄은 ENCODE 프로젝트가 아직 끝나지 않았다고 주장하지만, 발표된 논문과 발표에 따른 뉴스 보도에 대한 많은 반응은 호의적이었다.네이처 에디터와 ENCODE의 저자들은 수개월에 걸쳐 협력해, 가능한 한 큰 주목을 받아, 연구 커뮤니티 뿐만이 아니라, 일반의 주목을 끌고 있습니다」[42]인간 게놈의 80%가 생화학적 기능을[21] 가지고 있다는 ENCODE 프로젝트의 주장은 프로젝트의 결과를 정크 [43][44]DNA의 죽음으로 이끈 것으로 묘사한 대중 언론에 의해 빠르게 받아들여졌다.
그러나 대부분의 게놈이 "기능적"이라는 결론은 ENCODE 프로젝트가 "기능적", 즉 전사된 모든 것은 기능적이어야 한다는 자유적 정의를 사용했다는 이유로 비판을 받아왔다.이 결론은 비교 유전체학에서 얻은 게놈 보존 추정치에 기초한 널리 받아들여진 견해에도 불구하고, 전사된 의사 유전자와 같은 많은 DNA 요소들이 그럼에도 불구하고 기능하지 않는다는 결론에 도달했다.게다가 ENCODE 프로젝트는 특이성보다 민감성을 강조하여 많은 잘못된 [45][46][47]긍정을 탐지할 수 있습니다.세포 라인과 전사 인자의 다소 자의적인 선택과 적절한 제어 실험의 부족은 무작위 DNA가 ENCODE와 같은 '기능적' [48]동작을 모방하는 ENCODE에 대한 추가적인 주요 비판이었다.
일부 비판에 대해, 다른 과학자들은 생화학 테스트에 의해 인간 게놈에서 직접 관찰되는 광범위한 전사와 결합이 유전체 보존 추정치보다 더 정확한 유전 기능의 지표라고 주장했다. 왜냐하면 보존 추정치는 모두 상대적이고 믿을 수 없는 것 때문에 맞추기가 어렵기 때문이다.심지어 밀접하게 연관된 종들의 게놈 크기에서의 ble 변화는 부분적으로 동질적이며,[49][50] 이러한 추정치는 게놈의 기능에 대한 직접적인 테스트에 기초하지 않는다.보존 추정치는 게놈에서 가능한 기능적 요소를 식별하기 위한 단서를 제공하기 위해 사용될 수 있지만,[50] 게놈에 존재할 수 있는 기능적 요소의 총량을 제한하거나 제한하지는 않습니다.게다가, 비평가들에 의해 논란이 되고 있는 게놈의 대부분은 유전자 발현과 같은 후생적 조절과 관련이 있는 것으로 보이며 복잡한 [49][51]유기체의 발달에 필요한 것으로 보인다.기능성 속성의 증가가 이전 수십 년간의 [49][51]연구에 의해 예견되었기 때문에 ENCODE 결과는 반드시 예상하지 못한 것은 아니었다.또한, 다른 사람들은 ENCODE 프로젝트가 처음부터 진화적 기능 요소가 아닌 게놈에서 생물의학적으로 관련된 기능 요소를 찾는 것에 기반을 둔 범위를 가지고 있다는 점에 주목했다. 진화적 선택은 기능을 확립하는 데 충분하지도 않고 필요하지도 않기 때문에 반드시 동일한 것은 아니다.이것은 관련 기능에 대한 매우 유용한 프록시이지만 불완전한 프록시이며 유일한 [52]프록시만이 아닙니다.
"기능"이라는 단어의 정의에 대한 불만에 대해 일부에서는 ENCODE가 그 의미를 정의했고 ENCODE의 범위가 게놈에서 생물의학적으로 관련된 기능적 요소를 찾고 있었기 때문에 프로젝트의 결론은 "게놈의 80%가 관련 생화학에 관여하고 있다"고 해석해야 한다.생물 의학 연구와 관련된 것으로 간주되는 현상에 인과적 역할을 할 가능성이 매우 높은 교정 활동"[52]이완 Birney 중 하나인 ENCODE 연구원은"기능"실용적으로 어떤 실험에서 다른 수업:RNA" 넓은"히스톤 변경" 좁은"히스톤 변경 DNaseI 극도로 민감한 사이트, 전사 인자 ChIP-seq 봉우리 DNaseI Footprints, 전사 F을 포함했다"생화학적 활동 특정한"에 사용했다행동하다또는 바운드 모티브, 엑손.[53]
2014년, ENCODE 연구원들은 문헌에서 게놈의 기능적인 부분이 사용된 접근법에 따라 이전 연구에서 다르게 확인되었다고 언급했다.인간 게놈의 기능적인 부분을 식별하기 위해 사용되는 세 가지 일반적인 접근법이 있다: 유전자 접근법(표현형의 변화에 의존), 진화 접근법(보존에 의존), 그리고 생화학적 접근법(생화학적 테스트에 의존하며 ENCODE에 의해 사용되었다.세 가지 모두 한계가 있다: 유전학적 접근은 유기체에 물리적으로 나타나지 않는 기능적 요소를 놓칠 수 있다, 진화적 접근은 심지어 밀접하게 관련된 종의 게놈이 상당히 다르기 때문에 정확한 다종 배열의 사용, 그리고 생화학적 접근은 높은 재현성을 가지고 있지만,생화학적 서명이 항상 자동적으로 기능을 나타내는 것은 아니다.그들은 진화적, 유전적 증거와 대조적으로, 생화학적 데이터는 기초적인 DNA 요소들에 의해 제공되는 분자 기능과 그것들이 작용하는 세포 유형 모두에 대한 단서를 제공하며 궁극적으로 세 가지 접근법 모두가 인간 생물학과 질병에서 기능할 수 있는 영역을 식별하기 위해 상호 보완적인 방법으로 사용될 수 있다고 결론지었다.또한, 그들은 ENCODE에 의해 제공된 생화학 지도가 이러한 시그니처가 분자,[50] 세포 및 유기적 기능과 어떻게 관련되어 있는지를 테스트하기 위한 출발점을 제공하기 때문에 이 프로젝트에서 가장 가치 있는 것이라고 언급했다.
이 프로젝트는 높은 비용(총 4억 달러)과 생산성이 높은 연구자 주도의 [54]연구비를 빼앗는 빅 사이언스를 선호한다는 비판도 받고 있다.파일럿 인코드 프로젝트에는 약 5,500만 달러가 소요되었습니다.스케일 업은 약 1억 3,000만 달러였으며, 미국 국립 인간 게놈 연구소 NHGRI는 다음 단계에서 최대 1,2300만 달러를 수여할 수 있었습니다.일부 연구자들은 그 투자에 대한 확실한 수익률이 아직 보이지 않는다고 주장한다.ENCODE가 중요한 역할을 하는 논문을 찾기 위해 문헌을 뒤지려는 시도가 있었고, 2012년 이후 300개의 논문이 있었으며, 그 중 110개는 ENCODE 자금 지원이 없는 연구소에서 나왔다.또 다른 문제는 ENCODE가 ENCODE 프로젝트 전용의 고유한 이름이 아니기 때문에 'Encode'라는 단어는 많은 유전학 및 유전학 [55]문헌에 등장한다는 것입니다.
또 다른 주요 비판은 결과가 프로젝트에 소요된 시간을 정당화하지 못하고 프로젝트 자체가 본질적으로 불가능하다는 것입니다.HGP(Human Genome Project)와 자주 비교되며 HGP의 다음 단계라고 불리기도 하지만 HGP에는 현재 ENCODE에 없는 명확한 엔드포인트가 있었습니다.
저자들은 과학적 관심사에 공감하는 동시에 인터뷰와 ENCODE 세부사항을 과학 대중뿐만 아니라 대중 매체에 설명함으로써 그들의 노력을 정당화하려고 하는 것 같다.그들은 또한 DNA가 생명의 유전 물질이라는 것을 깨닫고 나서 인간 게놈 염기서열까지 반세기 이상이 걸렸다고 주장한다. 그래서 다음 세기를 위한 그들의 계획은 염기서열 [55]자체를 이해하는 것이 될 것이다.
팩터북
ENCODE 프로젝트에서 생성된 전사인자 바인딩 데이터의 분석은 현재 웹 액세스 가능한 저장소 FactorBook에서 이용할 수 있습니다.[56]기본적으로 Factorbook.org은 ENCODE 컨소시엄에 의해 생성된 문자 변환 요소 바인딩 데이터를 위한 Wiki 기반 데이터베이스입니다.첫 번째 릴리스에서 Factorbook의 내용은 다음과 같습니다.
- 다수의 인간 세포 라인의 119 TF에 대한 457개의 ChIP-seq 데이터 세트
- TF 결합 영역 주위에 히스톤 변형과 뉴클레오솜 배치의 평균 프로필
- 영역과 모티브 [57]사이트 간의 거리 및 방향 선호도에서 풍부한 시퀀스 모티브.
「 」를 참조해 주세요.
레퍼런스
- ^ Hong EL, Sloan CA, Chan ET, Davidson JM, Malladi VS, Strattan JS, Hitz BC, Gabdank I, Narayanan AK, Ho M, Lee BT, Rowe LD, Dreszer TR, Roe GR, Podduturi NR, Tanaka F, Hilton JA, Cherry JM (January 2016). "Principles of metadata organization at the ENCODE data coordination center. (2016 update)". Database. 2016: baw001. doi:10.1093/database/baw001. PMC 4792520. PMID 26980513.
- ^ a b c "Data Use, Software, and Analysis Release Policies – ENCODE". www.encodeproject.org. Retrieved 2021-12-18.
- ^ Raney BJ, Cline MS, Rosenbloom KR, Dreszer TR, Learned K, Barber GP, Meyer LR, Sloan CA, Malladi VS, Roskin KM, Suh BB, Hinrichs AS, Clawson H, Zweig AS, Kirkup V, Fujita PA, Rhead B, Smith KE, Pohl A, Kuhn RM, Karolchik D, Haussler D, Kent WJ (January 2011). "ENCODE whole-genome data in the UCSC genome browser (2011 update)". Nucleic Acids Res. 39 (Database issue): D871–5. doi:10.1093/nar/gkq1017. PMC 3013645. PMID 21037257.
- ^ a b c The ENCODE Project Consortium (2004). "The ENCODE (ENCyclopedia Of DNA Elements) Project". Science. 306 (5696): 636–640. Bibcode:2004Sci...306..636E. doi:10.1126/science.1105136. PMID 15499007. S2CID 22837649.
- ^ ENCODE Project Consortium (2011). Becker PB (ed.). "A User's Guide to the Encyclopedia of DNA Elements (ENCODE)". PLOS Biology. 9 (4): e1001046. doi:10.1371/journal.pbio.1001046. PMC 3079585. PMID 21526222.
- ^ a b c d ENCODE Project Consortium, Birney E, Stamatoyannopoulos JA, Dutta A, Guigó R, Gingeras TR, Margulies EH, Weng Z, Snyder M, Dermitzakis ET, et al. (2007). "Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project". Nature. 447 (7146): 799–816. Bibcode:2007Natur.447..799B. doi:10.1038/nature05874. PMC 2212820. PMID 17571346.
- ^ Guigó R, Flicek P, Abril JF, Reymond A, Lagarde J, Denoeud F, Antonarakis S, Ashburner M, Bajic VB, Birney E, Castelo R, Eyras E, Ucla C, Gingeras TR, Harrow J, Hubbard T, Lewis SE, Reese MG (2006). "EGASP: The human ENCODE Genome Annotation Assessment Project". Genome Biology. 7: S2.1–31. doi:10.1186/gb-2006-7-s1-s2. PMC 1810551. PMID 16925836.
- ^ Davis, Carrie A.; Hitz, Benjamin C.; Sloan, Cricket A.; Chan, Esther T.; Davidson, Jean M.; Gabdank, Idan; Hilton, Jason A.; Jain, Kriti; Baymuradov, Ulugbek K.; Narayanan, Aditi K.; Onate, Kathrina C. (2018-01-04). "The Encyclopedia of DNA elements (ENCODE): data portal update". Nucleic Acids Research. 46 (D1): D794–D801. doi:10.1093/nar/gkx1081. ISSN 1362-4962. PMC 5753278. PMID 29126249.
- ^ "The ENCODE Project: ENCyclopedia Of DNA Elements". www.genome.gov. Retrieved 2016-05-13.
- ^ Saey, Tina Hesman (6 October 2012). "Team releases sequel to the human genome". Society for Science & the Public. Retrieved 18 October 2012.
- ^ "Fig. 3: Publications using ENCODE data. Nature". Natureevents Directory. ISSN 1476-4687.
- ^ GmbH, Eurice. "United States of America · IHEC". ihec-epigenomes.org. Retrieved 2017-07-18.
- ^ "ENCODE Project". www.genome.gov. Archived from the original on 2016-05-17. Retrieved 2016-05-16.
- ^ ENCODE Program Staff (2012-10-18). "ENCODE: Pilot Project: overview". National Human Genome Research Institute.
- ^ ENCODE Program Staff (2012-02-19). "ENCODE: Pilot Project: Target Selection". National Human Genome Research Institute.
- ^ Weinstock GM (2007). "ENCODE: More genomic empowerment". Genome Research. 17 (6): 667–668. doi:10.1101/gr.6534207. PMID 17567987.
- ^ "Genome.gov ENCODE and modENCODE Projects". The ENCODE Project: ENCyclopedia Of DNA Elements. United States National Human Genome Research Institute. 2011-08-01. Retrieved 2011-08-05.
- ^ "National Human Genome Research Institute - Organization". The NIH Almanac. United States National Institutes of Health. Retrieved 2011-08-05.
- ^ "Genome.gov ENCODE Participants and Projects". The ENCODE Project: ENCyclopedia Of DNA Elements. United States National Human Genome Research Institute. 2011-08-01. Retrieved 2011-08-05.
- ^ Ecker JR, Bickmore WA, Barroso I, Pritchard JK, Gilad Y, Segal E (September 2012). "Genomics: ENCODE explained". Nature. 489 (7414): 52–5. Bibcode:2012Natur.489...52E. doi:10.1038/489052a. PMID 22955614. S2CID 5366257.
- ^ a b c Bernstein BE, Birney E, Dunham I, Green ED, Gunter C, Snyder M (September 2012). "An integrated encyclopedia of DNA elements in the human genome". Nature. 489 (7414): 57–74. Bibcode:2012Natur.489...57T. doi:10.1038/nature11247. PMC 3439153. PMID 22955616.
- ^ Thurman RE, Rynes E, Humbert R, Vierstra J, Maurano MT, Haugen E, Sheffield NC, Stergachis AB, Wang H, et al. (September 2012). "The accessible chromatin landscape of the human genome". Nature. 489 (7414): 75–82. Bibcode:2012Natur.489...75T. doi:10.1038/nature11232. PMC 3721348. PMID 22955617.
- ^ Neph S, Vierstra J, Stergachis AB, Reynolds AP, Haugen E, Vernot B, Thurman RE, John S, Sandstrom R, et al. (September 2012). "An expansive human regulatory lexicon encoded in transcription factor footprints". Nature. 489 (7414): 83–90. Bibcode:2012Natur.489...83N. doi:10.1038/nature11212. PMC 3736582. PMID 22955618.
- ^ Gerstein MB, Kundaje A, Hariharan M, Landt SG, Yan KK, Cheng C, Mu XJ, Khurana E, Rozowsky J, et al. (September 2012). "Architecture of the human regulatory network derived from ENCODE data". Nature. 489 (7414): 91–100. Bibcode:2012Natur.489...91G. doi:10.1038/nature11245. PMC 4154057. PMID 22955619.
- ^ Djebali S, Davis CA, Merkel A, Dobin A, Lassmann T, Mortazavi A, Tanzer A, Lagarde J, Lin W, et al. (September 2012). "Landscape of transcription in human cells". Nature. 489 (7414): 101–8. Bibcode:2012Natur.489..101D. doi:10.1038/nature11233. PMC 3684276. PMID 22955620.
- ^ Malladi VS, Erickson DT, Podduturi NR, Rowe LD, Chan ET, Davidson JM, Hitz BC, Ho M, Lee BT, Miyasato S, Roe GR, Simison M, Sloan CA, Strattan JS, Tanaka F, Kent WJ, Cherry JM, Hong EL (2015). "Ontology application and use at the ENCODE DCC". Database (Oxford). 2015. doi:10.1093/database/bav010. PMC 4360730. PMID 25776021.
- ^ a b Brian J. Raney; et al. (2010-10-30). "ENCODE whole-genome data in the UCSC genome browser (2011 update)". Nucleic Acids Res. Nucleic Acids Research. 39 (Database issue): D871–5. doi:10.1093/nar/gkq1017. PMC 3013645. PMID 21037257.
- ^ a b "The modENCODE Project: Model Organism ENCyclopedia Of DNA Elements (modENCODE)". NHGRI website. Retrieved 2008-11-13.
- ^ "modENCODE Participants and Projects". NHGRI website. Retrieved 2008-11-13.
- ^ "Berkeley Lab Life Sciences Awarded NIH Grants for Fruit Fly, Nematode Studies". Lawrence Berkeley National Laboratory website. 2007-05-14. Retrieved 2008-11-13.
- ^ Gerstein MB, Lu ZJ, Van Nostrand EL, Cheng C, Arshinoff BI, Liu T, Yip KY, Robilotto R, Rechtsteiner A, et al. (2010). "Integrative Analysis of the Caenorhabditis elegans Genome by the modENCODE Project". Science. 330 (6012): 1775–1787. Bibcode:2010Sci...330.1775G. doi:10.1126/science.1196914. PMC 3142569. PMID 21177976.
- ^ modENCODE Consortium, Roy S, Ernst J, Kharchenko PV, Kheradpour P, Negre N, Eaton ML, Landolin JM, Bristow CA, Ma L, et al. (2010). "Identification of Functional Elements and Regulatory Circuits by Drosophila modENCODE". Science. 330 (6012): 1787–1797. Bibcode:2010Sci...330.1787R. doi:10.1126/science.1198374. PMC 3192495. PMID 21177974.
- ^ "modENCODE". The National Human Genome Research Institute.
- ^ Celniker S (2009-06-11). "Unlocking the secrets of the genome". Nature. 459 (7249): 927–930. Bibcode:2009Natur.459..927C. doi:10.1038/459927a. PMC 2843545. PMID 19536255.
- ^ "RePORT ⟩ RePORTER".
- ^ "Search – ENCODE".
- ^ "2015 Release: NIH grants aim to decipher the language of gene regulation". www.genome.gov. Archived from the original on 2016-04-06.
- ^ "Search – ENCODE".
- ^ "Roadmap Epigenomics Project - Home".
- ^ Kundaje, Anshul; Meuleman, Wouter; Ernst, Jason; Bilenky, Misha; Yen, Angela; Heravi-Moussavi, Alireza; Kheradpour, Pouya; Zhang, Zhizhuo; Wang, Jianrong; Ziller, Michael J.; Amin, Viren; Whitaker, John W.; Schultz, Matthew D.; Ward, Lucas D.; Sarkar, Abhishek; Quon, Gerald; Sandstrom, Richard S.; Eaton, Matthew L.; Wu, Yi-Chieh; Pfenning, Andreas R.; Wang, Xinchen; Claussnitzer, Melina; Liu, Yaping; Coarfa, Cristian; Harris, R. Alan; Shoresh, Noam; Epstein, Charles B.; Gjoneska, Elizabeta; Leung, Danny; et al. (2015). "Integrative analysis of 111 reference human epigenomes". Nature. 518 (7539): 317–330. Bibcode:2015Natur.518..317.. doi:10.1038/nature14248. PMC 4530010. PMID 25693563.
- ^ Cho, Young-Dan; Kim, Woo-Jin; Ryoo, Hyun-Mo; Kim, Hong-Gee; Kim, Kyoung-Hwa; Ku, Young; Seol, Yang-Jo (2021-04-26). "Current advances of epigenetics in periodontology from ENCODE project: a review and future perspectives". Clinical Epigenetics. 13 (1): 92. doi:10.1186/s13148-021-01074-w. ISSN 1868-7083. PMC 8077755. PMID 33902683. S2CID 233402899.
- ^ Maher B (2012-09-06). "Fighting about ENCODE and junk". News Blog. Nature Publishing Group.
- ^ Kolata G (2012-09-05). "Far From 'Junk,' DNA Dark Matter Proves Crucial to Health". The New York Times.
- ^ Gregory TR (2012-09-06). "The ENCODE media hype machine". Genomicron.
- ^ Graur D, Zheng Y, Price N, Azevedo RB, Zufall RA, Elhaik E (2013). "On the immortality of television sets: "function" in the human genome according to the evolution-free gospel of ENCODE". Genome Biol Evol. 5 (3): 578–90. doi:10.1093/gbe/evt028. PMC 3622293. PMID 23431001.
- ^ Moran LA (2013-03-15). "Sandwalk: On the Meaning of the Word "Function"". Sandwalk.
- ^ Gregory TR (2013-04-11). "Critiques of ENCODE in peer-reviewed journals. « Genomicron". Genomicron. Archived from the original on 21 April 2013.
- ^ White MA, Myers CA, Corbo JC, Cohen BA (July 2013). "Massively parallel in vivo enhancer assay reveals that highly local features determine the cis-regulatory function of ChIP-seq peaks". Proc. Natl. Acad. Sci. U.S.A. 110 (29): 11952–7. Bibcode:2013PNAS..11011952W. doi:10.1073/pnas.1307449110. PMC 3718143. PMID 23818646.
- Mike White (17 July 2013). "Finding function in the genome with a null hypothesis". The Finch & Pea.
- ^ a b c Mattick JS, Dinger ME (2013). "The extent of functionality in the human genome". The HUGO Journal. 7 (1): 2. doi:10.1186/1877-6566-7-2. PMC 4685169.
- ^ a b c Kellis M, et al. (2014). "Defining functional DNA elements in the human genome". Proc. Natl. Acad. Sci. U.S.A. 111 (17): 6131–8. Bibcode:2014PNAS..111.6131K. doi:10.1073/pnas.1318948111. PMC 4035993. PMID 24753594.
- ^ a b Carey, Nessa (2015). Junk DNA: A Journey Through the Dark Matter of the Genome. Columbia University Press. ISBN 9780231170840.
- ^ a b Germain, Pierre-Luc; Ratti, Emanuele; Boem, Federico (November 2014). "Junk or Functional DNA? ENCODE and the Function Controversy". Biology & Philosophy. 29 (6): 807–831. doi:10.1007/s10539-014-9441-3. S2CID 84480632.
- ^ Birney, Ewan (September 5, 2012). "ENCODE: My own thoughts". Ewan's Blog: Bioinformatician at large.
- ^ Timpson T (2013-03-05). "Debating ENCODE: Dan Graur, Michael Eisen". Mendelspod.
- ^ a b Maher B (September 2012). "ENCODE: The human encyclopaedia". Nature. 489 (7414): 46–8. doi:10.1038/489046a. PMID 22962707.
- ^ 팩터북
- ^ Wang J (2012-11-29). "Factorbook.org: a Wiki-based database for transcription factor-binding data generated by the ENCODE consortium". Nucleic Acids Research. 41 (Database issue): D171-6. doi:10.1093/nar/gks1221. PMC 3531197. PMID 23203885.
외부 링크
- 공식 웹사이트
- ENCODE 프로젝트 간행물 공식 목록
- 국립 인간 게놈 연구소의 ENCODE 프로젝트
- UCSC 게놈 브라우저의 DNA 요소 백과사전
- Wellcome Trust Sanger Institute의 ENCODE/GENCODE 프로젝트
- ENCODE가 후원하는 입문 튜토리얼
- 팩터북
- 모뎀 코드
- Nature에서 ENCODE 스레드 탐색기(저널)