PSIPRED

PSIPRED
PSIPRED
원저작자
  • 데이비드 T. 존스
  • 대니얼 뷰찬
  • 팀 누겐트
  • 페데리코 미네치
  • 케빈 브라이슨
개발자University College London, 생물정보학 그룹
초기 릴리즈1999년; 23년 전(1999년)
안정된 릴리스
4.02 / 2018년 9월 26일, 3년 전(2018-09-26)[1]
기입처C
운영 체제Windows 2000, Unix
플랫폼x86, Java
크기14 MB
이용가능기간:영어
유형생물정보학 2차구조 예측
면허증.독자 사양 프리웨어 소스 코드
웹 사이트bioinf.cs.ucl.ac.uk/psipred

PSI-blast based secondary structure PRED(PSI-blast based secondary structure Predition, PSIPRED)는 단백질 구조를 조사하기 위해 사용되는 방법이다.알고리즘에 [2][3][4]인공신경망 기계학습법사용한다.이것은 1차 시퀀스에서 단백질의 2차 구조(베타 시트, 알파 헬리크스코일)를 예측할 수 있는 프론트 엔드 인터페이스 역할을 하는 웹 사이트를 특징으로 하는 서버 측 프로그램입니다.

PSIPRED는 웹 서비스 및 소프트웨어로 사용할 수 있습니다.소프트웨어는 소스 코드로 배포되며 기술적으로 독점 소프트웨어로서 라이센스가 부여됩니다.소프트웨어 및 그 결과를 영리 목적으로 배포하는 것을 금지함으로써 프리웨어 조항을 수정하거나 강제합니다.

이차 구조

2차 구조는 단백질과 핵산(DNA, RNA)과 같은 생체 고분자의 국소적인 부분의 일반적인 3차원 형태이다.그러나 3차원으로 간주되는 3차원 공간에서의 특정 원자 위치는 설명되지 않는다.2차 구조는 원자 분해능 구조에서 관찰된 바와 같이 생체 고분자의 수소 결합에 의해 공식적으로 정의될 수 있다.단백질에서 2차 구조는 골격 아미노기와 카르복실기 사이의 수소 결합 패턴에 의해 정의된다.반대로 핵산의 경우 2차 구조는 질소염기간의 수소결합으로 구성된다.수소결합 패턴이 크게 왜곡되어 2차 구조의 자동판정이 어려워질 수 있다.주어진 1차 구조 시퀀스만을 기반으로 단백질 2차 구조를 예측하기 위해 컴퓨터를 사용하려는 노력은 1970년대부터 [5]계속되고 있다.

2차 구조 예측은 단백질과 RNA 배열의 국소 2차 구조예측하는 것을 목표로 하는 생물 정보학에서의 일련의 방법을 포함한다. 각각 아미노산 또는 뉴클레오티드 배열에 대한 지식만을 기반으로 한다.단백질의 경우, 예측은 아미노산 배열의 영역을 매우 가능성이 높은 알파 헬리크스, 베타 가닥(흔히 확장 배치로 언급됨) 또는 회전으로 할당하는 것으로 구성됩니다.예측의 성공 여부는 단백질의 결정 구조에 적용된 DSSP 알고리즘의 결과와 비교하여 결정되며, 핵산의 경우 수소 결합 패턴으로 결정될 수 있다.특수 알고리즘은 단백질의 막 통과 헬리크스코일 코일 또는 RNA의 표준 마이크로 RNA 구조와 같은 특정 패턴을 검출하기 위해 개발되었습니다.

기본 정보

이 방법의 발상은 새로운 아미노산 배열의 2차 구조를 예측하기 위해 진화적으로 관련된 단백질의 정보를 사용하는 것이다.PSIBLAST는 관련 시퀀스를 찾고 위치별 스코어링 매트릭스를 작성하는 데 사용됩니다.이 매트릭스는 입력 [7]시퀀스의 2차 구조를 예측하기 위해 구축되고 훈련되는 인공 신경망[3][6]의해 처리된다. 즉, 기계 학습 방법이다.[8]

예측 알고리즘(방법)

예측 방법 또는 알고리즘은 시퀀스 프로파일 생성, 초기 2차 구조 예측예측 [9]구조 필터링의 3단계로 나뉩니다.PSIPRED는 PSIBLAST에 [3]의해 생성된 시퀀스프로파일을 정규화하기 위해 동작합니다.그리고 뉴럴 네트워킹을 이용하여 초기 2차 구조를 예측한다.배열 내의 각 아미노산에 대해 신경망은 15개의 산의 창을 통해 공급된다.추가된 정보가 첨부되어 창이 체인의 N 또는 C 종단에 걸쳐 있는지 여부를 나타냅니다.그 결과 315개의 입력 유닛으로 이루어진 최종 입력 레이어는 21개의 유닛으로 이루어진 15개의 그룹으로 분할됩니다.네트워크에는 75개의 유닛으로 이루어진 숨겨진 레이어가1개 있고 3개의 출력 노드(각 2차 구조 요소:나선, 시트, 코일)[6]가 있습니다.

제2뉴럴 네트워크는 제1네트워크의 예측구조를 필터링하기 위해 사용된다.이 네트워크에는 15개의 위치 창이 제공됩니다.체인 터미널에서 창 위치 표시기도 전송됩니다.그 결과 60개의 입력 유닛이 4개씩 15개의 그룹으로 분할됩니다.네트워크에는 60유닛의 숨겨진 레이어가 1개 있어 3개의 출력 노드(각 2차 구조 요소:[9] 나선, 시트, 코일)가 있습니다.

3개의 최종 출력 노드는 창의 중앙 위치에 대한 각 보조 구조 요소에 대한 점수를 제공합니다.PSIPRED는 점수가 가장 높은 2차 구조를 이용하여 단백질 [9]예측을 생성한다.Q3 값은 2차 구조 상태, 즉 Helix, Strand 및 [9]Coil에서 올바르게 예측된 잔류물의 비율입니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ "Index of /downloads/psipred". bioinfadmin.cs.ucl.ac.uk. Retrieved 26 April 2021.
  2. ^ Gajendra P. S. Raghava; Harpreet Kaur. "Prediction of beta turn types". Retrieved 5 May 2014.
  3. ^ a b c Yi-Ping Phoebe Chen (18 January 2005). Bioinformatics Technologies. Springer. p. 107. ISBN 978-3-540-20873-0.
  4. ^ Cuff, James A.; Barton, Geoffrey A. (15 August 2000). "Application of multiple sequence alignment profiles to improve protein secondary structure prediction". Proteins. 40 (3): 502–11. doi:10.1002/1097-0134(20000815)40:3<502::aid-prot170>3.0.co;2-q. PMID 10861942.
  5. ^ Heringa, Jaap (2000). "Computational Methods for Protein Secondary Structure Prediction Using Multiple Sequence Alignments". Current Protein & Peptide Science. 1 (3): 273–301(29). CiteSeerX 10.1.1.470.7673. doi:10.2174/1389203003381324. PMID 12369910.
  6. ^ a b S. C. Rastogi; Namitra Mendiratta; Parag Rastogi (22 May 2013). Bioinformatics: Methods and Applications: (Genomics, Proteomics and Drug Discovery). PHI Learning Pvt. Ltd. pp. 302–. ISBN 978-81-203-4785-4.
  7. ^ "PSIPRED Bioinformatic Technology". 10 April 2014. Retrieved 7 May 2014.
  8. ^ "PSIPRED overview". Retrieved 7 May 2014.
  9. ^ a b c d Jones, David T. (17 September 1999). "Protein Secondary Structure Prediction Based on Position-specific Scoring Matrices" (PDF). Journal of Molecular Biology. 292 (2): 195–202. doi:10.1006/jmbi.1999.3091. PMID 10493868. Retrieved 7 May 2014.