진네트워크

GeneNetwork
진네트워크
개발자Tennessee 대학교의 GenNetwork 개발팀
안정적 해제
2.0 / 1994년 1월 15일; 28년(1994-01-15)
리포지토리github.com/genenetwork/genenetwork2
기록 위치JavaScript, HTML, Python, CSS, CoffeeScript, PHP
면허증아페로 일반 공중 면허증
웹사이트www.genenetwork.org

GeneNetwork시스템 유전학을 위한 결합된 데이터베이스와 오픈 소스 생물정보학 데이터 분석 소프트웨어 자원이다.[1]이 자원은 DNA 시퀀스 차이를 유전자와 단백질 표현의 해당 차이와 연관시키고 건강 및 질병 위험과 같은 특성의 변화에 연결하는 유전자 규제 네트워크를 연구하기 위해 사용된다.GeneNetwork의 데이터 세트는 일반적으로 인간, 생쥐와 쥐의 변종, 그리고 드로필라 멜라노가스터, 아라비도시스 탈리아나, 보리와 같은 다양한 유기체를 포함한 개인 그룹의 유전자형(예: SNP)과 표현형의 큰 모음으로 구성되어 있다.[2]유전자형을 포함하면 mRNA, 단백질, 대사물 수준의 개인 간 차이뿐만 아니라 세포 기능, 해부학, 생리학, 행동의 차이에도 기여하는 게놈의 그러한 영역을 발견하기 위해 웹 기반 유전자 매핑을 수행하는 것이 실용적이다.

역사

GeneNetwork의 개발은 1994년 웹 기반 마우스 게놈 사전(1994년)으로 테네시 대학 보건 과학 센터에서 시작되었다.[3]GeneNetwork는 바이오의학 연구 중 최초로 가장 오랫동안 지속적으로 운영되는 웹 서비스다[https://en.wikipedia.org/wiki/List_of_websites_founded_before_1995 참조].1999년에 휴대용 유전자 사전은 Kenneth F와 결합되었다.실시간 유전자 분석을 위한 온라인 시스템을 제작하기 위한 Many's Map Manager QT 매핑 프로그램.[4]2003년 초, 첫 번째 대형 Apfymetrix 유전자 발현 데이터 세트(whole mouse brain mRNA 및 조혈모세포)가 통합되어 이 시스템을 WebQ로 개칭하였다.TL.[5][6] GeneNetwork는 현재 국제 개발자 그룹에 의해 개발되었으며 유럽, 아시아, 오스트레일리아에 거울과 개발 사이트를 가지고 있다.생산 서비스는 유럽에 있는 백업 인스턴스와 함께 테네시 대학 보건 과학 센터의 시스템에서 호스트된다.

GeneNetwork의 현재 생산 버전(일명 GN2)이 2016년에 출시되었다.[7]현재 버전의 GeneNetwork는 이전 버전인 GN1과 동일한 데이터베이스를 사용하지만 훨씬 더 모듈화되고 유지관리가 가능한 오픈 소스 코드(GitHub에서 사용 가능)를 가지고 있다.GeneNetwork는 또한 다음을 위한 지원을 포함한 중요한 새로운 기능을 가지고 있다.

조직 및 사용

GeneNetwork는 두 가지 주요 구성 요소로 구성된다.

  • 대규모 개인 코호트에 대한 방대한 유전자, 유전체 및 표현형 데이터 모음
  • 분자 및 세포 네트워크와 유전자형 간 관계 분석을 가능하게 하는 정교한 통계 분석 및 유전자 매핑 소프트웨어

일반적으로 각 가족 또는 모집단에 대해 4가지 수준의 데이터를 얻는다.

  1. DNA 서열 및 유전자형
  2. 어레이, RNA-seq, 후생유전자, 단백질, 대사물 및 메타게놈 방법(분자 표현형)을 사용하여 생성되는 분자 표현 데이터
  3. 일반적인 의료 기록의 일부인 표준 정량적 표현형(예: 혈액 화학, 체중)
  4. 특성 및 데이터 세트에 대한 주석 파일 및 메타데이터

결합된 데이터 유형은 관계형 데이터베이스와 IPSF 파일 서버에 함께 저장되며, 개념적으로 종, 코호트 및 패밀리별로 구성되고 그룹화된다.이 시스템은 LAMP(소프트웨어 번들) 스택으로 구현된다.GitHub에서 Code와 MariaDB 데이터베이스의 단순화된 버전을 사용할 수 있다.

GeneNetwork는 주로 연구자들에 의해 사용되지만, 유전학 및 생물정보학(YouTube 사례 참조), 생물정보학, 생리학, 심리학 등의 학부 및 대학원 과정에도 성공적으로 채택되었다.[11]연구자와 학생은 일반적으로 한 가족 이상에서 유전자형 및 표현형 세트를 회수하고, 변수 간의 관계를 탐구하고 연관성 네트워크를 조립하기 위해 내장된 통계 및 매핑 기능을 사용한다.주요 단계에는 다음과 같은 요인의 분석이 포함된다.

  1. 특성의 변화 범위
  2. 특성 간 공분산(스캐터플롯 및 상관, 주성분 분석)
  3. 더 큰 특성의 네트워크 구조
  4. 시퀀스 차이와 표현형 차이 사이의 연관성에 대한 정량적 특성 위치 지도 및 원인 모델

데이터 원본

특성 및 분자표현 데이터 세트는 연구자가 직접 제출하거나 국립생명공학정보유전자표현 옴니버스 의 저장소에서 추출한다.데이터는 면역 시스템의 단일 세포 집단, 특정 조직(수막, 전두엽 피질)에서 전체 시스템(뇌, 폐, 근육, 심장, 지방, 신장, 꽃, 전체 식물 배아)에 이르는 다양한 세포와 조직을 다룬다.일반적인 데이터 집합은 수백 명의 완전 유전자형 개인을 포함하며 기술 및 생물학적 복제도 포함할 수 있다.유전자형과 표현형은 보통 동료가 검토한 논문에서 취해진다.GeneNetwork에는 여러 RNA 프로파일링 플랫폼(Affymetrix, Illumina, Agilent)에 대한 주석 파일이 포함되어 있다.RNA-seq와 정량적 단백질, 대사물, 후생유전학 및 메타게놈 데이터도 생쥐와 인간을 포함한 여러 종에 대해 이용할 수 있다.

도구 및 기능

현장에는 유전자 발현이나 다른 표현형식의 변동의 단순한 그래픽 표시에서부터 특성 쌍의 산포도(Pearson 또는 순위 순서), 단순하고 복잡한 네트워크 그래프의 구성, 주요 성분과 합성 특성 분석, 마커 레지스터를 이용한 QTL 매핑 등 광범위한 기능에 대한 도구가 있다.인식적 상호작용에 대한 Resion, interval mapping 및 pair scanness.대부분의 기능은 최대 100가지 특성으로 작동하며, 몇 가지 기능은 전체 대소문자를 구분하여 작동한다.

데이터베이스는 메인 검색 페이지에서 탐색 및 검색할 수 있다.온라인 자습서를 이용할 수 있다.사용자는 기본 데이터 세트를 텍스트 파일, 엑셀 또는 네트워크 그래프의 경우 SBML다운로드할 수 있으며, 2017년 현재 GN2를 베타 릴리스로 이용할 수 있다.

코드

진네트워크(GeneNetwork)는 아페로 일반 공중 라이선스(AGPLv3)에 따라 출시된 오픈소스 프로젝트다.대부분의 코드는 파이톤으로 작성되지만, C, R, 자바스크립트로 작성된 모듈 및 기타 코드를 포함한다.코드는 주로 파이썬 2.4이다.GN2는 주로 Python 2.7에 Jinja2 HTML 템플릿)이 있는 플라스크 프레임워크로 작성되지만, 향후 몇 년 동안 Python 3.X로의 변환이 계획되어 있다.GN2는 R 프로그래밍 언어로 작성된 많은 통계 절차를 호출한다.2010년 원본 소스 코드는 소형 데이터베이스와 함께 SourceForge에서 사용할 수 있다.GN1은 2019년 GitHub를 통해 활발하게 유지되고 있는 반면 2020년 현재 모든 작업은 GN2에 집중되어 있다.

참고 항목

참조

  1. ^ Morahan, G; Williams, RW (2007). "Systems genetics: the next generation in genetics research?". Novartis Foundation Symposium. Novartis Foundation Symposia. 281: 181–8, discussion 188–91, 208–9. doi:10.1002/9780470062128.ch15. ISBN 9780470062128. PMID 17534074.
  2. ^ Druka, A; Druka, I; Centeno, AG; Li, H; Sun, Z; Thomas, WT; Bonar, N; Steffenson, BJ; Ullrich, SE; Kleinhofs, Andris; Wise, Roger P; Close, Timothy J; Potokina, Elena; Luo, Zewei; Wagner, Carola; Schweizer, Günther F; Marshall, David F; Kearsey, Michael J; Williams, Robert W; Waugh, Robbie (2008). "Towards systems genetic analyses in barley: Integration of phenotypic, expression and genotype data into GeneNetwork". BMC Genetics. 9: 73. doi:10.1186/1471-2156-9-73. PMC 2630324. PMID 19017390.
  3. ^ Williams, RW (1994). "The Portable Dictionary of the Mouse Genome: a personal database for gene mapping and molecular biology". Mammalian Genome. 5 (6): 372–5. doi:10.1007/bf00356557. PMID 8043953. S2CID 655396.
  4. ^ Chesler, EJ; Lu, L; Wang, J; Williams, RW; Manly, KF (2004). "WebQTL: rapid exploratory analysis of gene expression and genetic networks for brain and behavior". Nature Neuroscience. 7 (5): 485–6. doi:10.1038/nn0504-485. PMID 15114364. S2CID 20241963.
  5. ^ Chesler, EJ; Lu, L; Shou, S; Qu, Y; Gu, J; Wang, J; Hsu, HC; Mountz, JD; et al. (2005). "Complex trait analysis of gene expression uncovers polygenic and pleiotropic networks that modulate nervous system function". Nature Genetics. 37 (3): 233–42. doi:10.1038/ng1518. PMID 15711545. S2CID 13189340.
  6. ^ Bystrykh, L; Weersing, E; Dontje, B; Sutton, S; Pletcher, MT; Wiltshire, T; Su, AI; Vellenga, E; et al. (2005). "Uncovering regulatory pathways that affect hematopoietic stem cell function using 'genetical genomics'". Nature Genetics. 37 (3): 225–32. doi:10.1038/ng1497. PMID 15711547. S2CID 5622506.
  7. ^ Sloan, Z (2016). "GeneNetwork: framework for web-based genetics". The Journal of Open Source Software. 1 (2): 25. Bibcode:2016JOSS....1...25S. doi:10.21105/joss.00025.
  8. ^ Zhou, X (2014). "Efficient multivariate linear mixed model algorithms for genome-wide association studies". Nature Methods. 11 (2): 407–9. doi:10.1038/nmeth.2848. PMC 4211878. PMID 24531419.
  9. ^ Arends, D (2016). "Correlation Trait Loci (CTL) mapping: phenotype network inference subject to genotype". The Journal of Open Source Software. 1 (6): 87. Bibcode:2016JOSS....1...87A. doi:10.21105/joss.00087.
  10. ^ Ziebarth, JD (2013). "Bayesian Network Webserver: a comprehensive tool for biological network modeling". Bioinformatics. 29 (2 1): 2803–3. doi:10.1093/bioinformatics/btt472. PMID 23969134.
  11. ^ Grisham, W; Schottler, NA; Valli-Marill, J; Beck, L; Beatty, J (2010). "Teaching bioinformatics and neuroinformatics by using free web-based tools". CBE: Life Sciences Education. 9 (2): 98–107. doi:10.1187/cbe.09-11-0079. PMC 2879386. PMID 20516355.

외부 링크

관련자원

기타 시스템 유전학 및 네트워크 데이터베이스