단백질 아세포 국산화 예측
Protein subcellular localization prediction단백질 아세포 국산화 예측(또는 단지 단백질 국산화 예측)은 세포 내 단백질이 어디에 있는지 예측하는 것, 즉 세포 아세포 국산화 예측을 포함한다.null
일반적으로 예측 도구는 아미노산의 단백질 염기서열과 같은 단백질에 대한 정보를 입력 정보로 취하며, 핵, 소포체 망막, 골기 기구, 세포외 공간, 기타 오르간과 같은 출력으로 세포 내 예측 위치를 생성한다.세포에서 단백질을 대상으로 하는 결과를 정확하게 예측할 수 있는 도구를 만드는 것이 목적이다.null
단백질 아세포 국산화 예측은 단백질 함수와 게놈 주석 예측에 기반한 생체정보학의 중요한 성분으로 약물 표적 파악에 도움을 줄 수 있다.null
배경
실험적으로 단백질의 세포하위 국산화 여부를 결정하는 것은 힘들고 시간이 많이 걸리는 작업이 될 수 있다.형광현미경을 이용해 국소화를 보는 면역라벨링이나 태깅(녹색 형광 단백질 등)이 자주 사용된다.높은 처리량 대안은 예측을 사용하는 것이다.null
컴퓨터 과학의 새로운 접근법의 개발을 통해, 알려진 국산화 단백질의 증가된 데이터 집합과 결합하여, 계산 도구는 이제 많은 유기체에 빠르고 정확한 국산화 예측을 제공할 수 있다.이것은 생체정보학, 기계학습에 의해 성공적으로 도움을 받는 난제들 중 하나가 되는 세포 이하의 국산화 예측을 초래했다.null
현재 많은 예측 방법이 단백질 아세포 국산화 식별을 위한 일부 고처리 실험실 방법의 정확도를 초과하고 있다.[1][2][3]특히, 두 개 이상의 서로 다른 세포하위 위치 간에 동시에 존재하거나 이동할 수 있는 단백질을 다루는 데 사용할 수 있는 예측 변수가 개발되었다[4].예측된 지역화를 확인하기 위해서는 일반적으로 실험 검증이 필요하다.null
도구들
1999년에 PSORT는 세포이하의 국산화 예측을 위한 첫 번째 프로그램이었다.[5]인공신경망, 지원벡터머신, 단백질 모티브 등의 기법을 이용한 후속 툴과 웹사이트가 출시되었다.예측 변수는 다른 유기체의 단백질에 특화될 수 있다.일부는 진핵 단백질, 일부는 인간 단백질,[7] 그리고 일부는 식물 단백질에 특화되어 있다.[6][8]박테리아 국산화 예측 변수의 예측 방법과 그 정확성을 검토하였다.[9]2021년에는 인공신경망을 이용한 막단백질 예측 툴인 SCLpred-MEM이 발간되었다.[10] SCLpred-EMS는 인공신경망에 의해 구동되는 또 다른 도구로 단백질을 엔도엠브레인 시스템과 분비 경로(EMS)로 분류한다.[11]마찬가지로, 빛-관심은 기계 학습 방법을 사용하여 10개의 서로 다른 공통 하위 세포 위치를 예측한다.[12]null
단백질 아세포 위치 예측의 발달은 두 가지 종합 검토 기사로 요약되었다.[13][14]최근의 도구와 경험 보고서는 마인켄과 민의 최신 논문(2012년)에서 찾을 수 있다.null
적용
단백질의 세포하위 국산화 지식은 약물 발견 과정에서 표적 식별을 상당히 개선할 수 있다.예를 들어 분비 단백질과 혈장막 단백질은 세포외 공간이나 세포 표면에서 국산화되기 때문에 약물 분자에 의해 쉽게 접근할 수 있다.null
박테리아 세포 표면과 분비 단백질도 백신 후보나 진단 대상으로서의 잠재력에 관심이 있다.단백질의 이상 아세포 국산화 현상은 암이나 알츠하이머병과 같은 여러 질병의 세포에서 관찰되었다.특이한 환경에서 살아남을 수 있는 몇몇 고고학에서 분비된 단백질은 산업적으로 중요한 응용을 가지고 있다.null
예측을 사용함으로써 많은 수의 단백질을 평가하여 원하는 장소로 밀매되는 후보자들을 찾을 수 있다.null
데이터베이스
아세포 로컬리제이션 예측 결과는 데이터베이스에 저장할 수 있다.예로는 다종 데이터베이스 컴파트먼트, FunSecKB2, [15]식물 데이터베이스인 PlantSecKB,[16] 동물 및 인간 데이터베이스인 MetazSecKB,[17] 원생 데이터베이스인 ProtSecKB 등이 있다.[18]null
참조
- ^ Kaleel, M; Zheng, Y; Chen, J; Feng, X; Simpson, JC; Pollastri, G; Mooney, C (6 March 2020). "SCLpred-EMS: subcellular localization prediction of endomembrane system and secretory pathway proteins by Deep N-to-1 Convolutional Neural Networks". Bioinformatics. 36 (11): 3343–3349. doi:10.1093/bioinformatics/btaa156. hdl:10197/12182. PMID 32142105.
- ^ Rey S, Gardy JL, Brinkman FS (2005). "Assessing the precision of high-throughput computational and laboratory approaches for the genome-wide identification of protein subcellular localization in bacteria". BMC Genomics. 6: 162. doi:10.1186/1471-2164-6-162. PMC 1314894. PMID 16288665.
- ^ Kaleel, Manaz; Ellinger, Liam; Lalor, Clodagh; Pollastri, Gianluca; Mooney, Catherine (2021). "SCLpred-MEM: Subcellular localization prediction of membrane proteins by deep N-to-1 convolutional neural networks". Proteins: Structure, Function, and Bioinformatics. 89 (10): 1233–1239. doi:10.1002/prot.26144. PMID 33983651. S2CID 234484678.
- ^ Chou KC, Shen HB (2008). "Cell-PLoc: a package of Web servers for predicting subcellular localization of proteins in various organisms". Nature Protocols. 3 (2): 153–62. doi:10.1038/nprot.2007.494. PMID 18274516. S2CID 226104.
- ^ "Protein Subcellular Localization Prediction". www.ncbi.nlm.nih.gov. Retrieved 2016-12-31.
- ^ Chou KC, Wu ZC, Xiao X (2011). "iLoc-Euk: a multi-label classifier for predicting the subcellular localization of singleplex and multiplex eukaryotic proteins". PLOS ONE. 6 (3): e18258. Bibcode:2011PLoSO...618258C. doi:10.1371/journal.pone.0018258. PMC 3068162. PMID 21483473.
- ^ Shen HB, Chou KC (Nov 2009). "A top-down approach to enhance the power of predicting human protein subcellular localization: Hum-mPLoc 2.0". Analytical Biochemistry. 394 (2): 269–74. doi:10.1016/j.ab.2009.07.046. PMID 19651102.
- ^ Chou KC, Shen HB (2010). "Plant-mPLoc: a top-down strategy to augment the power for predicting plant protein subcellular localization". PLOS ONE. 5 (6): e11335. Bibcode:2010PLoSO...511335C. doi:10.1371/journal.pone.0011335. PMC 2893129. PMID 20596258.
- ^ Gardy JL, Brinkman FS (Oct 2006). "Methods for predicting bacterial protein subcellular localization". Nature Reviews. Microbiology. 4 (10): 741–51. doi:10.1038/nrmicro1494. PMID 16964270. S2CID 62781755.
- ^ Kaleel, Manaz; Ellinger, Liam; Lalor, Clodagh; Pollastri, Gianluca; Mooney, Catherine (2021). "SCLpred-MEM: Subcellular localization prediction of membrane proteins by deep N-to-1 convolutional neural networks". Proteins: Structure, Function, and Bioinformatics. 89 (10): 1233–1239. doi:10.1002/prot.26144. PMID 33983651. S2CID 234484678.
- ^ Kaleel, Manaz; Zheng, Yandan; Chen, Jialiang; Feng, Xuanming; Simpson, Jeremy C; Pollastri, Gianluca; Mooney, Catherine (1 June 2020). "SCLpred-EMS: subcellular localization prediction of endomembrane system and secretory pathway proteins by Deep N-to-1 Convolutional Neural Networks". Bioinformatics. 36 (11): 3343–3349. doi:10.1093/bioinformatics/btaa156. hdl:10197/12182. PMID 32142105.
- ^ Rost, Stark; Heinzinger, Dallago (26 April 2021). "Light Attention Predicts Protein Location from the Language of Life". Biorxiv. doi:10.1101/2021.04.25.441334. S2CID 233449747.
- ^ Nakai, K. 단백질 분류 신호 및 아세포 국산화 예측.단백질 화학, 2000, 54, 277-344
- ^ 츄, K. C.; 션, H. B. 리뷰:단백질 아세포 위치 예측의 최근 진전" 항문 생화학 2007, 370, 1-16
- ^ "FunSecKB2 (The Fungal Secretome and Subcellular Proteome KnowledgeBase 2.1)". bioinformatics.ysu.edu. Archived from the original on 2016-04-10. Retrieved 2017-09-17.
- ^ "PlantSecKB (The Plant Secretome and Subcellular Proteome KnowledgeBase)". bioinformatics.ysu.edu. Archived from the original on 2016-04-06. Retrieved 2017-09-17.
- ^ "MetazSecKB (The Metazoa (Human & Animal) Protein Subcelluar Location, Secretome and Subcellular Proteome Database)". bioinformatics.ysu.edu. Archived from the original on 2016-04-06. Retrieved 2017-09-17.
- ^ "ProtSecKB (The Protist Secretome and Subcellular Proteome KnowledgeBase)". proteomics.ysu.edu. Retrieved 2017-09-17.
추가 읽기
- Bork P, Dandekar T, Diaz-Lazcoz Y, Eisenhaber F, Huynen M, Yuan Y (Nov 1998). "Predicting function: from genes to genomes and back". Journal of Molecular Biology. 283 (4): 707–25. doi:10.1006/jmbi.1998.2144. PMID 9790834.
- Nakai K (2000). "Protein sorting signals and prediction of subcellular localization". Advances in Protein Chemistry. 54: 277–344. doi:10.1016/s0065-3233(00)54009-1. ISBN 0120342545. PMID 10829231.
- Emanuelsson O (Dec 2002). "Predicting protein subcellular localisation from amino acid sequence information". Briefings in Bioinformatics. 3 (4): 361–76. doi:10.1093/bib/3.4.361. PMID 12511065.
- Schneider G, Fechner U (Jun 2004). "Advances in the prediction of protein targeting signals". Proteomics. 4 (6): 1571–80. doi:10.1002/pmic.200300786. PMID 15174127. S2CID 7217647.
- Gardy JL, Brinkman FS (Oct 2006). "Methods for predicting bacterial protein subcellular localization". Nature Reviews. Microbiology. 4 (10): 741–51. doi:10.1038/nrmicro1494. PMID 16964270. S2CID 62781755.
- Chou KC, Shen HB (Nov 2007). "Recent progress in protein subcellular location prediction". Analytical Biochemistry. 370 (1): 1–16. doi:10.1016/j.ab.2007.07.006. PMID 17698024.