계산 후생유전학
Computational epigenetics계산 후생유전학은[1] 후생유전학 연구에서 통계적 방법과 수학적 모델링을 사용한다.최근 후생유전자 데이터 집합의 폭발적 증가로 인해, 후생유전자 연구의 모든 영역에서 연산 방법이 증가하는 역할을 한다.null
정의
계산 후생유전학 연구는 후생유전학 문제를 해결하기 위한 생물정보학 방법의 개발 및 적용과 후생유전학의 맥락에서 계산 데이터 분석 및 이론 모델링으로 구성된다.여기에는 히스톤과 DNA CpG 섬 메틸화의 효과 모델링이 포함된다.null
현재 연구 분야
후생유전자 데이터 처리 및 분석
후생유전자 정보의 게놈 범위 매핑을 위해 다양한 실험 기법이 개발되었으며,[3] 가장 널리 사용되는 기법은 Chip-on-chip, Chip-seq, bisulfite 시퀀싱이다.이 모든 방법은 대량의 데이터를 생성하며, 효율적인 데이터 처리 방법과 생물정보학적 방법에 의한 품질 관리 방법이 필요하다.null
후생유전자 예측
상당한 양의 생물정보학 연구는 게놈 서열의 특성으로부터 후생유전학적 정보를 예측하는 데 헌신했다.그러한 예측은 이중적인 목적에 도움이 된다.첫째, 정확한 후생유전자 예측은 실험 데이터를 어느 정도 대체할 수 있으며, 이는 특히 새로 발견된 후생유전자 메커니즘과 인간과 쥐 이외의 종과 관련이 있다.둘째로, 예측 알고리즘은 훈련 데이터로부터 후생유전자 정보의 통계적 모델을 구축하므로 후생유전자 메커니즘의 정량적 모델링을 위한 첫 번째 단계로 작용할 수 있다.DNA와 리신 메틸레이션과 아세틸레이션의 성공적인 컴퓨터 예측은 다양한 특징들의 조합에 의해 달성되었다.[4][5]
암 후생유전학에서의 적용
암에 대한 후생유전적 결함의 중요한 역할은 개선된 진단과 치료를 위한 새로운 기회를 열어준다.이러한 활발한 연구 영역은 생물정보학 분석에 특히 적합한 두 가지 질문을 야기한다.첫째, 종양 세포와 대조군(또는 다른 질병 하위 유형 사이의) 사이의 후생유전적 차이를 보이는 유전적 영역의 목록을 볼 때, 우리는 공통적인 패턴을 탐지하거나 암에 대한 이러한 영역의 기능적 관계의 증거를 찾을 수 있는가?둘째, 중요한 질병의 아형을 검출하고 분류함으로써 진단과 치료를 향상시키기 위해 생물정보학적 방법을 사용할 수 있는가?null
새로운 주제
계산 후생유전학 분야의 제1차 연구는 데이터 생성에 대한 실험 방법의 급속한 진전에 의해 추진되었는데, 이는 데이터 처리와 품질 관리를 위해 적절한 계산 방법을 필요로 했으며 후생유전학 정보의 유전적 분포를 이해하기 위한 수단으로서 후생유전학 예측 연구를 촉진시켰다.d는 암 후생유전학에 대한 초기 프로젝트의 기초를 제공했다.이러한 주제들은 계속해서 연구의 주요 분야로 될 것이며 후생유전 프로젝트에서 발생하는 후생유전학적 데이터의 양이 단지 상당한 생물정보학적 난제를 야기할 뿐이지만, 현재 몇 가지 추가적인 주제들이 등장하고 있다.null
- 후생적 규제 회로: 후생적 코드를 읽고 쓰고 실행하는 규제 네트워크를 역 엔지니어링하십시오.
- 모집단 후생유전학:후생유전자 데이터의 통합으로부터 규제 메커니즘을 분리하여 유전자 표현 프로파일 및 이종 모집단의 대규모 표본을 위한 하플로타입 맵.
- 진화 후생유전학:이종 간 비교를 통한 인간 후생유전자 규제(및 그 의학적 결과)에 대한 학습.
- 이론 모델링:규소 시뮬레이션에서 후생유전학적 메커니즘에 대한 기계론적 및 양적 이해 테스트.[6]
- 게놈 브라우저: 사용하기 쉬운 게놈 브라우저 환경 내에서 생물학자가 정교한 게놈 분석과 후생유전체 분석을 수행할 수 있는 새로운 웹 서비스의 혼합 개발.
- 의료 후생유전학:후생적 규제가 정신질환, 자가면역질환, 기타 복합질환에 관여한다는 강력한 정황증거가 있기 때문에 암 이외의 질병에서 역할을 하는 후생유전학적 메커니즘을 탐색하는 것이다.[citation needed]
후생유전학 데이터베이스
- MethDB[7] 48종, 1,511명, 조직 및 세포선 198개, 표현형 79개에 대한 DNA 메틸화 내용 데이터 19,905개와 메틸화 패턴 5,382개에 대한 정보가 수록되어 있다.
- Pubmeth[8] 다양한 암 유형의 메틸화 유전자에 대한 5,000개 이상의 기록을 포함한다.
- REBASE[9] GenBank에서 파생된 22,000개 이상의 DNA 메틸전달효소 유전자를 함유하고 있다.
- DeepBlue Epigenomic Database에는[10] 서로 다른 IHEC 멤버 파일의 후생유전학적 데이터가 여러 후생유전학적 마크로 나뉜 60,000개 이상의 실험 데이터가 포함되어 있다.DeepBlue는 또한 서버에서 데이터에 액세스하고 처리할 수 있는 API를 제공한다.
- MeInfoText[11] 205개의 인간 암 유형에 걸친 유전자 메틸화 정보가 들어 있다.
- MethPrimerDB[12] DNA 메틸화 분석을 위한 인간, 마우스 및 랫드의 259개의 프라이머 세트를 포함한다.
- 히스톤 데이터베이스[13] 히스톤 H1, 히스톤 H2에서 383, 히스톤 H2B에서 311, 히스톤 H3에서 1043, 히스톤 H4에서 198 등 최소 857종의 시퀀스를 포함한다.
- ChromDB[14] 광범위한 유기체에 대한 RNAi 관련 단백질을 포함하여 9,341개의 염색질 관련 단백질을 함유한다.
- CREMOFAC[15] eukaryotes에 1725개의 중복 및 720개의 비중복 크로마틴 제거 인자 시퀀스를 포함한다.
- 크렘빌 가족 후생유전학 실험실[16] 인간 염색체 21, 22, 남성 생식 세포와 일란성 쌍둥이 및 현기증성 쌍둥이의 DNA 메틸화 프로필을 포함한다.
- MethyLogiX DNA 메틸화 데이터베이스[17] 인간 염색체 21과 22의 DNA 메틸화 데이터, 남성 세균 세포, 라떼온셋 알츠하이머병 등이 들어 있다.
출처 및 추가 판독
- 본 기사의 원판은 2008년 1월호 생물정보학 저널에 실린 연산 후생유전학에 대한 검토 논문에 기초하였다.Bock, C.; Lengauer, T. (January 2008). "Computational epigenetics". Bioinformatics. 24 (1): 1–10. doi:10.1093/bioinformatics/btm546. PMID 18024971.. 본 검토서는 과학적 논문과 광범위한 배경 정보에 대하여 100개 이상의 참고자료를 제공한다.
- 2010년 1월호 생물정보학 저널: Lim S.J., T.W. 및 Tong, J.C. (2010) 연산 후생유전학: 새로운 과학 패러다임에 나타난 연산 후생유전학에 대한 검토 논문을 바탕으로 추가 데이터가 업데이트되고 추가되었다. 바이오 정보, 4: 331-337본 검토서는 >129 과학 논문에 대한 참조를 제공한다.오픈 액세스로 출판되며 출판사 웹페이지 http://bioinformation.net/004/007000042010.pdf에서 자유롭게 다운받을 수 있다.
참조
- ^ Bock, C; Lengauer T (2008). "Computational epigenetics". Bioinformatics. 24 (1): 1–10. doi:10.1093/bioinformatics/btm546. PMID 18024971.
- ^ Lim, S J; Tan T W; Tong J C (2010). "Computational epigenetics: the new scientific paradigm" (PDF). Bioinformation. 4 (7): 331–337. doi:10.6026/97320630004331. PMC 2957762. PMID 20978607.
- ^ Madrigal, P; Krajewski, P (July 2015). "Uncovering correlated variability in epigenomic datasets using the Karhunen-Loeve transform". BioData Mining. 8: 20. doi:10.1186/s13040-015-0051-7. PMC 4488123. PMID 26140054.
- ^ Shi, Shao-Yun; Jian-Ding Qiu; Xing-Yu Sun; Sheng-Bao Suo; Shu-Yun Huang; Ru-Ping Liang (2012). "PLMLA: prediction of lysine methylation and lysine acetylation by combining multiple features". Mol. BioSyst. 8 (1): 1520–1527. doi:10.1039/C2MB05502C. PMID 22402705. S2CID 6172534.
- ^ Zheng, Hao; Shi-Wen Jiang; Hongwei Wu (2011). "Enhancement on the Predictive Power of the Prediction Model for Human Genomic DNA Methylation". Biocomp'11: The 2011 International Conference on Bioinformatics and Computational Biology. S2CID 14599625.
- ^ Roznovat, I.A.; Ruskin H. J. (2013). "A Computational Model for Genetic and Epigenetic Signals in Colon Cancer". Interdisciplinary Sciences: Computational Life Sciences. 5 (3): 175–186. doi:10.1007/s12539-013-0172-y. PMID 24307409. S2CID 11867110.
- ^ DNA 메틸레이션 데이터베이스
- ^ 퍼브메스.조직
- ^ "Official REBASE Homepage the Restriction Enzyme Database NEB".
- ^ "DeepBlue Epigenomic Data Server".
- ^ "MeInfoText: associated gene methylation and cancer information from text mining". Archived from the original on 2016-03-03. Retrieved 2010-01-29.
- ^ "methPrimerDB: the DNA methylation analysis PCR primer database". Archived from the original on 2014-07-15. Retrieved 2010-01-29.
- ^ "Histone Database - Histone Database". Archived from the original on 2015-09-05. Retrieved 2010-01-29.
- ^ "ChromDB::Chromatin Database". Archived from the original on 2019-04-10. Retrieved 2010-01-29.
- ^ 크레모팍
- ^ http://www.epigenomics.ca
- ^ Methylation Database Wayback Machine에 2008-12-03 보관