단백질 단편 라이브러리
Protein fragment library이 기사는 대부분의 독자들이 이해하기에는 너무 전문적일 수 있다.(2016년 11월 (이 및 ) |
단백질 골격 단편 라이브러리는 호몰로지 모델링,[1] de novo 구조 [2][3][4]예측 및 구조 [5]결정을 포함한 다양한 구조 생물학 애플리케이션에서 성공적으로 사용되어 왔다.이러한 fragment 라이브러리는 서치 공간의 복잡성을 줄임으로써 컨포메이션 공간을 보다 신속하게 검색할 수 있게 되어 보다 효율적이고 정확한 모델을 만들 수 있습니다.
동기
단백질은 이산적으로 모델링될 때 기하급수적인 수의 상태를 채택할 수 있다.일반적으로 단백질의 배치는 연결된 모든 원자 사이의 이면각, 결합 길이 및 결합 각도로 표현됩니다.가장 일반적인 단순화는 이상적인 결합 길이와 결합 각도를 가정하는 것입니다.그러나 이는 여전히 골격의 phi-psi 각도와 각 측쇄에 대해 최대 4개의 이면각을 남기 때문에 단백질의 가능한 k개의 상태가6*n 최악의 경우 복잡해진다. 여기서 n은 잔류물 수이고 k는 각 이면각으로 모델링된 이산 상태의 수이다.구조 공간을 줄이기 위해 모든 phi-psi 각도를 명시적으로 모델링하는 대신 단백질 단편 라이브러리를 사용할 수 있습니다.
단편은 펩타이드 골격의 짧은 부분으로, 일반적으로 5 ~ 15개의 잔류물 길이이며, 곁사슬을 포함하지 않는다.C-alpha 원자가 환원된 원자일 경우, 또는 모든 골격 중원자(N, C-alpha, C 카르보닐, O)의 위치를 지정할 수 있습니다.사이드 체인은 일반적으로 프래그먼트라이브러리 접근방식을 사용하여 모델링되지 않습니다.사이드 체인의 이산 상태를 모델링하려면 로타머 라이브러리 접근법을 [6]사용할 수 있습니다.
이 접근법은 국소적 상호작용이 전체적인 단백질 배열을 안정시키는 데 큰 역할을 한다는 가정 하에 작동한다.어떤 짧은 순서에서도, 분자 힘은 구조를 구속하고, 조각에 의해 모델링될 수 있는 소수의 가능한 형태만을 이끌어냅니다.사실, 레빈탈의 역설에 따르면, 단백질은 생물학적으로 합리적인 시간 내에 가능한 모든 형태를 표본으로 추출할 수 없다.국소적으로 안정된 구조는 탐색 공간을 줄이고 단백질이 밀리초 단위로 접히도록 할 것이다.
건설
이러한 단편들의 라이브러리는 단백질 데이터 뱅크(PDB)의 분석으로 구성됩니다.우선, PDB의 대표 서브셋이 선택되며, 이는 다양한 구조의 배열을 커버해야 하며, 바람직하게는 양호한 분해능으로 해야 한다.그런 다음 각 구조에 대해 연속된 n개의 모든 잔류물을 샘플 조각으로 취한다.그런 다음 샘플은 k-평균 클러스터링과 같은 알고리즘을 사용하여 공간 구성에서 서로 얼마나 유사한지에 따라 k개의 그룹으로 클러스터링된다.파라미터 n과 k는 어플리케이션에 따라 선택된다(아래의 복잡성에 대한 설명 참조).다음으로 클러스터의 중심은 fragment를 나타내는 것으로 간주됩니다.다른 기하학적 형상의 평균화에 의해 도출되었기 때문에, 중심부가 이상적인 결합 형상을 가지는 것을 보증하기 위해서, 한층 더 최적화를 실시할 수 있다.[7]
fragment는 본래 존재하는 구조에서 파생되기 때문에 그것들이 나타내는 backbone의 세그먼트는 사실적인 결합 형상을 가집니다.따라서 구성 각도의 전체 공간을 탐색할 필요가 없으며, 대부분의 경우 비현실적인 기하학적 구조를 초래할 수 있습니다.
위의 클러스터링은 잔류물의 식별에 관계없이 수행되거나 잔류물 [2]특이적일 수 있습니다.즉, 주어진 아미노산 입력 시퀀스에 대해 k-mer fragment에서 동일한 시퀀스를 가진 PDB에서 발견된 샘플만 사용하여 클러스터링을 유도할 수 있습니다.이것은 시퀀스 독립 프래그먼트라이브러리를 도출하는 것보다 더 많은 계산 작업을 필요로 하지만, 잠재적으로 더 정확한 모델을 생산할 수 있다.반대로 더 큰 샘플세트가 필요하기 때문에 완전한 커버리지에 도달하지 못할 수 있습니다.
사용 예: 루프 모델링
호몰로지 모델링에서 프래그먼트 라이브러리의 일반적인 적용은 구조의 루프를 모델링하는 것입니다.일반적으로 알파 나선형 및 베타 시트는 템플릿 구조에 대해 나사산되지만, 그 사이의 루프는 특정되지 않으므로 예측해야 합니다.최적의 구성으로 루프를 찾는 것은 NP-hard입니다.탐색할 필요가 있는 구성 공간을 줄이기 위해 루프를 일련의 겹치는 fragment로 모델링할 수 있습니다.그런 다음 공간을 샘플링할 수 있습니다. 또는 공간이 충분히 작으면 완전히 열거할 수 있습니다.
철저한 열거를 위한 한 가지 접근법은 다음과 같다.[1]루프 구축은 가능한 모든 fragment를 루프의 N 종단(앵커 포인트)에 있는 3개의 잔류물과 겹치는 것으로 시작합니다.다음으로, 제2의 fragment에 대해서 가능한 모든 선택지를 제1의 fragment에 맞추어(모든 가능한 선택지를), 제1의 fragment의 마지막 3개의 잔류물이 제2의 fragment의 처음 3개의 잔류물과 겹치도록 합니다.이것에 의해, fragment 체인은, fragment내와 fragment간의 양쪽 모두에서 사실적인 각도를 형성할 수 있습니다.그런 다음 올바른 잔류물 길이의 루프가 구성될 때까지 이 과정을 반복합니다.
루프는 N쪽 앵커에서 시작하여 C쪽 앵커에서 끝나야 합니다.따라서 각 루프는 그 마지막 몇 개의 잔류물이 C 터미널 앵커와 겹치는지 확인하기 위해 테스트해야 합니다.이러한 기하급수적인 수의 후보 루프가 루프를 닫는 경우는 거의 없습니다.닫히지 않는 루프를 걸러낸 후, 어떤 루프가 최적의 구성을 가지는지 판단해야 합니다. 이는 분자역학적인 힘장을 사용하여 가장 낮은 에너지를 갖는 것으로 결정됩니다.
복잡성
상태 공간의 복잡성은 단편 라이브러리를 사용한 후에도 잔류물의 수에 있어 여전히 기하급수적이다.단, 지수의 정도는 감소한다.라이브러리 내에 L개의 fragment가 있는 F-mer fragment 라이브러리의 경우, 그리고 각 fragment가 3개씩 겹치는 N개의 잔류물 체인을 모델링하기 위해 L개의 가능한 체인이 있을[N/(F-3)]+1 것이다.[7] 이는 복잡도가 N보다 작기 때문에 phi-psi 각도를 K 가능한 조합으로 명시적으로 모델링할 경우 K 가능성보다N 훨씬 적다.
프래그먼트 라이브러리의 크기인 L에서는 복잡도가 증가합니다.그러나 더 많은 fragment를 가진 라이브러리는 더 다양한 fragment 구조를 캡처하기 때문에 모델의 정확성과 서치 공간을 탐색하는 속도에서 트레이드오프가 발생합니다.이 선택에 따라 클러스터링을 수행할 때 사용되는 K가 결정됩니다.
또, 어느 고정 L에 대해서도, fragment의 길이가 길어질수록, 모델링 가능한 구조의 다양성이 저하한다.짧은 fragment는 긴 fragment보다 PDB에서 발견되는 다양한 구조를 커버할 수 있습니다.최근, 최대 길이 15의 라이브러리는 PDB에 있는 조각의 91%를 2.0 앵스트롬 이내로 모델링할 수 있는 것으로 나타났습니다.[8]
「 」를 참조해 주세요.
레퍼런스
- ^ a b 코로드니, R., 기바스, L., Levitt, M. 및 코흘, P.(2005년, 3월).생물학의 역운동학:단백질 루프 폐쇄 문제국제 로봇 연구 저널 24 (2-3), 151-163.
- ^ a b Simons, K., C., Huang, E. 및 Baker, D.(1997).유사한 국소 서열을 가진 단편으로부터 단백질 3차 구조의 조립체. 시뮬레이션 어닐링과 베이지안 스코어링 함수를 사용한다.J 몰 비올 268, 209-225
- ^ Bujnicki, J. (2006) 단편 재조합에 의한 단백질 구조 예측.Chem Bio Chem, 7, 19-27
- ^ Li, S. 등(2008) fragment-HMM: 단백질 구조 예측에 대한 새로운 접근법.단백질 과학. 17, 1925-1934
- ^ DiMaio, F., Shavlik, J., Phillips, G. 전자 밀도 맵에서 단백질 골격 추적에 대한 확률론적 접근법(2006).생물정보학 22(14), 81-89.
- ^ Canutescu, A., Shelenkov, A. 및 Dunbrack, R. (2003)단백질 측쇄 예측을 위한 그래프 이론 알고리즘.Protein Sci. 12, 2001–2014.
- ^ a b 콜로드니, R., 코흘, P., 기바스, L. 및 레빗(2005)단백질 조각의 작은 라이브러리가 토종 단백질 구조를 정확하게 모델링합니다.J Mol Biol 323, 297-307
- ^ Du, P., Andrec, M. 및 Levy, R. 단백질 데이터 뱅크에서 짧은 단백질 조각에 대응하는 모든 구조를 보았는가?업데이트.단백질 엔지니어링2003, 16(6) 407-414.