피오크루즈 게놈 비교 프로젝트

Fiocruz Genome Comparison Project

피오크루즈 게놈 비교 프로젝트는 브라질의 오스왈도 크루즈 연구소(Oswaldo Cruz Institute)와 IBM의 월드 커뮤니티 그리드(World Community Grid)가 협력한 것으로,[1] SSEARCH를 이용해 많은 게놈의 유전자를 서로 비교하는 데이터베이스를 제작하기 위해 고안되었다.SSEARCH 프로그램은 단백질 배열과 다른 단백질 배열, 단백질 데이터베이스, DNA 또는 DNA 라이브러리 간에 엄격한 Smith-Waterman 정렬을 수행합니다.


프로젝트 내 계산의 특성상 분산 컴퓨팅을 쉽게 활용할 수 있습니다. 연구로 인한 인도주의적 이익과 더불어 World Community Grid(유휴 컴퓨터 클럭 시간을 사용하는 분산 컴퓨팅 그리드)는 Fiocruz 프로젝트를 실행하게 되었습니다.모든 제품은 WCG와의 계약에 의해 공개된다.

묘사

문제는 단백질 데이터베이스 항목에 매우 큰 정보 주체(구조적, 기능적, 상호 참조 등)가 첨부된다는 것입니다.입력된 정보는 업데이트 또는 수정되는 경우가 거의 없습니다.예측 단백질 함수의 이러한 주석은 종종 불완전하고, 비표준 명명법을 사용하거나, 이전의 때때로 잘못 주석된 시퀀스에서 상호 참조될 때 부정확할 수 있다.또한, 여러 구조 및/또는 기능 도메인으로 구성된 많은 단백질은 자동화된 시스템에 의해 간과된다.오늘날 비교정보는 유전체학 초기와 비교하면 엄청나다.하나의 오류가 복합되어 복잡해집니다.

게놈 비교 프로젝트는 모든 예측 단백질 염기서열을 쌍으로 완전히 비교하여 주석자 커뮤니티의 참조 저장소로 사용되는 (표준화된 Gene[2] Ontology와 함께) 지표를 얻습니다.그 프로젝트는 생물학자들에게 귀중한 데이터 소스를 제공한다.게놈 비교 프로젝트에서 사용되는 배열 유사도 비교 프로그램은 SSEARCH라고 불립니다.이 프로그램은 수학적으로 시퀀스 [3]쌍 사이의 최적의 국소 정렬을 찾으며 Smith-Waterman 알고리즘을 자유롭게 [4]구현할 수 있습니다.

SSEARCH의 사용은 정확한 주석, 불일치 보정, 그리고 알려지지 않은 기능의 가상의 단백질에 대한 가능한 기능 할당을 가능하게 한다.또한 여러 도메인과 기능적 요소를 가진 단백질이 올바르게 발견됩니다.심지어 원거리 관계도 감지된다.

「 」를 참조해 주세요.

메모들

  1. ^ SSEARCH 웹 페이지
  2. ^ Gene Ontology 웹사이트
  3. ^ W.R. 피어슨(1991) 유전체학 11:635–650
  4. ^ T. F. Smith and M. S. Waterman (1981) J. Mol. Biol, 147:195–197

외부 링크