단백질 슈퍼패밀리
Protein superfamily단백질 슈퍼패밀리는 공통 조상을 추론할 수 있는 단백질의 가장 큰 그룹(분지)이다.일반적으로 이러한 공통 조상은 [2]배열 유사성이 명백하지 않더라도 구조적 정렬과[1] 기계적 유사성에서 추론된다.시퀀스 호몰로지는 (시퀀스 유사성이 낮기 때문에) 명확하지 않더라도 추론할 수 있습니다.슈퍼패밀리는 일반적으로 각 패밀리 내의 배열 유사성을 보여주는 여러 단백질 패밀리를 포함한다.단백질 클랜이라는 용어는 MEROPS 및 CAZy 분류 [2][3]시스템에 기반한 단백질 분해효소 및 글리코실 가수분해효소 수퍼패밀리에 일반적으로 사용됩니다.
신분증
단백질의 슈퍼패밀리는 여러 가지 방법을 사용하여 식별된다.밀접하게 관련된 구성원은 진화적으로 가장 다른 구성원을 그룹화하는 데 필요한 다양한 방법으로 식별할 수 있다.
시퀀스 유사성
역사적으로, 다른 아미노산 배열의 유사성은 호몰로지를 [5]추론하는 가장 일반적인 방법이었다.유사한 염기서열이 수렴 진화의 결과라기보다는 유전자 복제와 발산 진화의 결과일 가능성이 높기 때문에 염기서열 유사성은 관련성의 좋은 예측요소로 간주된다.아미노산 배열은 전형적으로 DNA 배열보다 더 보존되기 때문에(퇴화 유전 코드 때문에) 더 민감한 검출 방법이다.일부 아미노산은 유사한 특성(예: 전하, 소수성, 크기)을 가지고 있기 때문에, 그것들을 교환하는 보수적인 돌연변이는 종종 기능하기 위해 중립적이다.단백질의 가장 보존된 배열 영역은 종종 촉매 부위 및 결합 부위와 같은 기능적으로 중요한 영역에 해당하는데, 이러한 영역은 배열 변화에 덜 내성이 있기 때문이다.
호몰로지를 추론하기 위해 시퀀스 유사성을 사용하는 것은 몇 가지 제한이 있다.동일한 구조를 생성하도록 보장되는 시퀀스 유사성의 최소 수준은 없습니다.긴 진화 기간 동안, 관련 단백질은 서로 감지 가능한 배열 유사성을 보이지 않을 수 있다.삽입 및 삭제가 많은 시퀀스는 정렬이 어려울 수 있으므로 상동 시퀀스 영역을 식별하기 어려울 수도 있습니다.예를 들어 프로테아제 PA클랜에서는 슈퍼패밀리를 통해 단 하나의 잔류물도 보존되지 않으며, 촉매삼합체에도 보존되지 않는다.반대로, 슈퍼 패밀리를 구성하는 개별 패밀리는 배열 정렬에 기초하여 정의된다. 예를 들어 PA 클랜 내의 C04 단백질분해효소 패밀리는 다음과 같다.
그럼에도 불구하고, 알려진 염기서열의 수가 알려진 3차 [6]구조의 수를 훨씬 능가하기 때문에, 염기서열 유사성은 관련성을 추론하기 위해 가장 일반적으로 사용되는 증거의 형태이다.구조 정보가 없을 경우 배열 유사성은 슈퍼패밀리에 [6]할당될 수 있는 단백질의 한계를 제한한다.
구조 유사성

구조는 배열보다 훨씬 진화적으로 보존되어 매우 유사한 구조를 가진 단백질은 완전히 다른 배열을 [7]가질 수 있다.매우 긴 진화 기간 동안, 검출 가능한 아미노산 배열 보존을 나타내는 잔기는 극소수이지만, 2차 구조 요소 및 3차 구조 모티브는 고도로 보존된다.서핀 슈퍼패밀리에서 [9]볼 수 있듯이 단백질 구조의 일부 단백질[8] 역학 및 구조 변화도 보존될 수 있다.따라서 단백질 3차 구조는 단백질 배열에 관련성의 증거가 남아 있지 않은 경우에도 단백질 간의 호몰로지를 검출하기 위해 사용할 수 있다.DALI와 같은 구조 정렬 프로그램은 [10]유사한 주름을 가진 단백질을 찾기 위해 관심 단백질의 3D 구조를 사용합니다.그러나 드문 경우지만, 관련된 단백질은 구조적으로[11] 다르도록 진화할 수 있으며 관련성은 [12][13][14]다른 방법으로만 추론할 수 있다.
기계적 유사성
슈퍼패밀리 내 효소의 촉매 메커니즘은 일반적으로 보존되지만, 기질 특이성은 [15]크게 다를 수 있다.또한 촉매 잔류물은 단백질 [16]배열에서 동일한 순서로 발생하는 경향이 있습니다.PA 계열의 단백질 분해효소 내 패밀리의 경우 촉매작용을 수행하는 데 사용되는 촉매삼중잔기(catalystal triad leasisters)가 서로 다른 진화가 있었지만, 모든 구성원은 단백질, 펩타이드 또는 [17]아미노산에 대해 공유가 친핵성 촉매작용을 수행하기 위해 유사한 메커니즘을 사용한다.그러나 메커니즘만으로는 관련성을 추론하기에 충분하지 않다.일부 촉매 메커니즘은 독립적으로 여러 번 수렴적으로 진화하여 별도의 슈퍼 [18][19][20]패밀리를 형성하고, 일부 슈퍼 패밀리에서 다양한 메커니즘([15][21]종종 화학적으로 유사함)을 나타낸다.
진화적 의미
단백질 슈퍼패밀리는 공통 [22]조상을 식별하는 능력의 현재 한계를 나타냅니다.그들은 현재 가능한 직접적인 증거에 기초한 가장 큰 진화 집단이다.그러므로 그것들은 현재 연구되고 있는 가장 오래된 진화 사건들 중의 하나이다.어떤 슈퍼패밀리는 모든 생명의 왕국에 존재하는 구성원을 가지고 있는데, 이는 슈퍼패밀리의 마지막 공통 조상이 모든 생명의 마지막 공통 조상(LUCA)[23]이었음을 나타낸다.
슈퍼 패밀리 구성원들은 다른 종에 속할 수 있으며, 조상 단백질은 조상 종에 존재했던 단백질의 형태이다.반대로, 단백질은 같은 종에 속할 수 있지만, 유전자가 게놈에 중복된 단일 단백질에서 진화했다.
다양화
대부분의 단백질은 여러 개의 도메인을 포함한다.진핵생물 단백질의 66-80%가 다중 도메인을 가지고 있는 반면, 원핵생물 단백질의 약 40-60%는 다중 [5]도메인을 가지고 있다.시간이 지남에 따라 도메인의 많은 슈퍼 패밀리가 함께 혼합되었습니다.사실, "일관적으로 고립된 슈퍼 패밀리"[5]를 찾는 것은 매우 드문 일이다.[1] 도메인이 결합되면 N-to-C-terminal 도메인 순서('도메인 아키텍처')는 일반적으로 잘 보존됩니다.또한 자연에서 볼 수 있는 도메인 조합의 수는 가능성 수에 비해 적기 때문에 선택이 모든 [5]조합에 영향을 미친다는 것을 알 수 있습니다.
예
- α/β 가수분해효소슈퍼패밀리
- 구성원은 나선형으로 연결된 8개의 가닥을 포함하는 α/β 시트를 촉매 3중 잔류물과 동일한 [24]순서로 공유하며, 단백질 분해효소, 리파아제, 과산화효소, 에스테라아제,[25] 에폭시드 가수분해효소 및 탈할로게나아제 등의 활동을 포함한다.
- 알칼리인산가수분해효소슈퍼패밀리
- 부재는 공통기구에 [27]의해 공통의 혼합반응을 할 뿐만 아니라 αβα 샌드위치[26] 구조를 공유한다.
- 글로빈 슈퍼 패밀리
- 구성원은 8-알파 나선 구상 글로빈 접힘을 [28][29]공유합니다.
- 면역글로불린 슈퍼패밀리
- 부재는 2장의 역평행β스트랜드(Ig-fold)의 샌드위치 모양 구조를 공유하며 인식, 결합 및 [30][31]접착에 관여한다.
- PA 클랜
- 구성원은 키모트립신과 같은 이중 β배럴 접힘 및 유사한 단백질 분해 메커니즘을 공유하지만 배열 동일성은 10% 미만이다.씨족은 시스테인과 세린 프로테아제(다른 [2][32]친핵체)를 모두 포함하고 있다.
- 라스 슈퍼 패밀리
- 구성원은 5개의 [33]α-헬리에 의해 둘러싸인 6가닥 β 시트의 공통 촉매 G 도메인을 공유한다.
- RSH 슈퍼 패밀리
- 구성원들은 엄격한 응답으로 ppGpp 알람론을 가수분해 및/또는 합성하는 능력을 공유한다.[34]
- 세르핀 슈퍼 패밀리
- 구성원들은 큰 구조 변화를 겪을 수 있는 고에너지, 응력 접힘을 공유하며, 이것은 전형적으로 구조를 [9]파괴함으로써 세린과 시스테인 단백질 분해 효소를 억제하는 데 사용됩니다.
- TIM 배럴 슈퍼 패밀리
- 부재는 큰 αβ88 배럴 구조를 공유한다.그것은 가장 흔한 단백질 접힘 중 하나이며 이 슈퍼패밀리의 단열성은 여전히 [35][36]논란이 되고 있다.
단백질 슈퍼패밀리 자원
여러 생물학적 데이터베이스는 단백질 슈퍼패밀리와 단백질 접힘을 문서화합니다. 예를 들어 다음과 같습니다.
- Pfam - 정렬 및 HMM의 단백질 패밀리 데이터베이스
- PROSITE - 단백질 도메인, 패밀리 및 기능 사이트 데이터베이스
- PIRSF - 슈퍼 패밀리 분류 시스템
- PASS2 - 구조 슈퍼패밀리로서의 단백질 정렬 v2
- SUPER FAMILY - 모든 완전 배열 유기체에 대한 슈퍼 패밀리를 나타내는 HMM 라이브러리 및 (슈퍼 패밀리와 패밀리) 주석 데이터베이스
- SCOP 및 CATH - 단백질 구조를 슈퍼 패밀리, 패밀리 및 도메인으로 분류
마찬가지로 PDB에서 표적 구조에 대한 구조적 호몰로지를 가진 단백질을 검색하는 알고리즘이 있습니다. 예를 들어 다음과 같습니다.
- DALI - 거리 정렬 매트릭스 방법에 기반한 구조 정렬
「 」를 참조해 주세요.
레퍼런스
- ^ a b Holm L, Rosenström P (July 2010). "Dali server: conservation mapping in 3D". Nucleic Acids Research. 38 (Web Server issue): W545–9. doi:10.1093/nar/gkq366. PMC 2896194. PMID 20457744.
- ^ a b c Rawlings ND, Barrett AJ, Bateman A (January 2012). "MEROPS: the database of proteolytic enzymes, their substrates and inhibitors". Nucleic Acids Research. 40 (Database issue): D343–50. doi:10.1093/nar/gkr987. PMC 3245014. PMID 22086950.
- ^ Henrissat B, Bairoch A (June 1996). "Updating the sequence-based classification of glycosyl hydrolases". The Biochemical Journal. 316 (Pt 2): 695–6. doi:10.1042/bj3160695. PMC 1217404. PMID 8687420.
- ^ "Clustal FAQ #Symbols". Clustal. Archived from the original on 24 October 2016. Retrieved 8 December 2014.
- ^ a b c d Han JH, Batey S, Nickson AA, Teichmann SA, Clarke J (April 2007). "The folding and evolution of multidomain proteins". Nature Reviews Molecular Cell Biology. 8 (4): 319–30. doi:10.1038/nrm2144. PMID 17356578. S2CID 13762291.
- ^ a b Pandit SB, Gosar D, Abhiman S, Sujatha S, Dixit SS, Mhatre NS, Sowdhamini R, Srinivasan N (January 2002). "SUPFAM--a database of potential protein superfamily relationships derived by comparing sequence-based and structure-based families: implications for structural genomics and function annotation in genomes". Nucleic Acids Research. 30 (1): 289–93. doi:10.1093/nar/30.1.289. PMC 99061. PMID 11752317.
- ^ Orengo CA, Thornton JM (2005). "Protein families and their evolution-a structural perspective". Annual Review of Biochemistry. 74 (1): 867–900. doi:10.1146/annurev.biochem.74.082803.133029. PMID 15954844.
- ^ Liu Y, Bahar I (September 2012). "Sequence evolution correlates with structural dynamics". Molecular Biology and Evolution. 29 (9): 2253–63. doi:10.1093/molbev/mss097. PMC 3424413. PMID 22427707.
- ^ a b Silverman GA, Bird PI, Carrell RW, Church FC, Coughlin PB, Gettins PG, Irving JA, Lomas DA, Luke CJ, Moyer RW, Pemberton PA, Remold-O'Donnell E, Salvesen GS, Travis J, Whisstock JC (September 2001). "The serpins are an expanding superfamily of structurally similar but functionally diverse proteins. Evolution, mechanism of inhibition, novel functions, and a revised nomenclature". The Journal of Biological Chemistry. 276 (36): 33293–6. doi:10.1074/jbc.R100016200. PMID 11435447.
- ^ Holm L, Laakso LM (July 2016). "Dali server update". Nucleic Acids Research. 44 (W1): W351–5. doi:10.1093/nar/gkw357. PMC 4987910. PMID 27131377.
- ^ Pascual-García A, Abia D, Ortiz ÁR, Bastolla U (2009). "Cross-Over between Discrete and Continuous Protein Structure Space: Insights into Automatic Classification and Networks of Protein Structures". PLOS Computational Biology. 5 (3): e1000331. Bibcode:2009PLSCB...5E0331P. doi:10.1371/journal.pcbi.1000331. PMC 2654728. PMID 19325884.
- ^ Li D, Zhang L, Yin H, Xu H, Satkoski Trask J, Smith DG, Li Y, Yang M, Zhu Q (June 2014). "Evolution of primate α and θ defensins revealed by analysis of genomes". Molecular Biology Reports. 41 (6): 3859–66. doi:10.1007/s11033-014-3253-z. PMID 24557891. S2CID 14936647.
- ^ Krishna SS, Grishin NV (April 2005). "Structural drift: a possible path to protein fold change". Bioinformatics. 21 (8): 1308–10. doi:10.1093/bioinformatics/bti227. PMID 15604105.
- ^ Bryan PN, Orban J (August 2010). "Proteins that switch folds". Current Opinion in Structural Biology. 20 (4): 482–8. doi:10.1016/j.sbi.2010.06.002. PMC 2928869. PMID 20591649.
- ^ a b Dessailly, Benoit H.; Dawson, Natalie L.; Das, Sayoni; Orengo, Christine A. (2017), "Function Diversity Within Folds and Superfamilies", From Protein Structure to Function with Bioinformatics, Springer Netherlands, pp. 295–325, doi:10.1007/978-94-024-1069-3_9, ISBN 9789402410679
- ^ Echave J, Spielman SJ, Wilke CO (February 2016). "Causes of evolutionary rate variation among protein sites". Nature Reviews. Genetics. 17 (2): 109–21. doi:10.1038/nrg.2015.18. PMC 4724262. PMID 26781812.
- ^ Shafee T, Gatti-Lafranconi P, Minter R, Hollfelder F (September 2015). "Handicap-Recover Evolution Leads to a Chemically Versatile, Nucleophile-Permissive Protease". ChemBioChem. 16 (13): 1866–1869. doi:10.1002/cbic.201500295. PMC 4576821. PMID 26097079.
- ^ Buller AR, Townsend CA (February 2013). "Intrinsic evolutionary constraints on protease structure, enzyme acylation, and the identity of the catalytic triad". Proceedings of the National Academy of Sciences of the United States of America. 110 (8): E653–61. doi:10.1073/pnas.1221050110. PMC 3581919. PMID 23382230.
- ^ Coutinho PM, Deleury E, Davies GJ, Henrissat B (April 2003). "An evolving hierarchical family classification for glycosyltransferases". Journal of Molecular Biology. 328 (2): 307–17. doi:10.1016/S0022-2836(03)00307-3. PMID 12691742.
- ^ Zámocký M, Hofbauer S, Schaffner I, Gasselhuber B, Nicolussi A, Soudi M, Pirker KF, Furtmüller PG, Obinger C (May 2015). "Independent evolution of four heme peroxidase superfamilies". Archives of Biochemistry and Biophysics. 574: 108–19. doi:10.1016/j.abb.2014.12.025. PMC 4420034. PMID 25575902.
- ^ Akiva, Eyal; Brown, Shoshana; Almonacid, Daniel E.; Barber, Alan E.; Custer, Ashley F.; Hicks, Michael A.; Huang, Conrad C.; Lauck, Florian; Mashiyama, Susan T. (2013-11-23). "The Structure–Function Linkage Database". Nucleic Acids Research. 42 (D1): D521–D530. doi:10.1093/nar/gkt1130. ISSN 0305-1048. PMC 3965090. PMID 24271399.
- ^ Shakhnovich BE, Deeds E, Delisi C, Shakhnovich E (March 2005). "Protein structure and evolutionary history determine sequence space topology". Genome Research. 15 (3): 385–92. arXiv:q-bio/0404040. doi:10.1101/gr.3133605. PMC 551565. PMID 15741509.
- ^ Ranea JA, Sillero A, Thornton JM, Orengo CA (October 2006). "Protein superfamily evolution and the last universal common ancestor (LUCA)". Journal of Molecular Evolution. 63 (4): 513–25. Bibcode:2006JMolE..63..513R. doi:10.1007/s00239-005-0289-7. hdl:10261/78338. PMID 17021929. S2CID 25258028.
- ^ Carr PD, Ollis DL (2009). "Alpha/beta hydrolase fold: an update". Protein and Peptide Letters. 16 (10): 1137–48. doi:10.2174/092986609789071298. PMID 19508187.
- ^ Nardini M, Dijkstra BW (December 1999). "Alpha/beta hydrolase fold enzymes: the family keeps growing". Current Opinion in Structural Biology. 9 (6): 732–7. doi:10.1016/S0959-440X(99)00037-8. PMID 10607665.
- ^ "SCOP". Archived from the original on 29 July 2014. Retrieved 28 May 2014.
- ^ Mohamed MF, Hollfelder F (January 2013). "Efficient, crosswise catalytic promiscuity among enzymes that catalyze phosphoryl transfer". Biochimica et Biophysica Acta (BBA) - Proteins and Proteomics. 1834 (1): 417–24. doi:10.1016/j.bbapap.2012.07.015. PMID 22885024.
- ^ Branden C, Tooze J (1999). Introduction to protein structure (2nd ed.). New York: Garland Pub. ISBN 978-0815323051.
- ^ Bolognesi M, Onesti S, Gatti G, Coda A, Ascenzi P, Brunori M (February 1989). "Aplysia limacina myoglobin. Crystallographic analysis at 1.6 A resolution". Journal of Molecular Biology. 205 (3): 529–44. doi:10.1016/0022-2836(89)90224-6. PMID 2926816.
- ^ Bork P, Holm L, Sander C (September 1994). "The immunoglobulin fold. Structural classification, sequence patterns and common core". Journal of Molecular Biology. 242 (4): 309–20. doi:10.1006/jmbi.1994.1582. PMID 7932691.
- ^ Brümmendorf T, Rathjen FG (1995). "Cell adhesion molecules 1: immunoglobulin superfamily". Protein Profile. 2 (9): 963–1108. PMID 8574878.
- ^ Bazan JF, Fletterick RJ (November 1988). "Viral cysteine proteases are homologous to the trypsin-like family of serine proteases: structural and functional implications". Proceedings of the National Academy of Sciences of the United States of America. 85 (21): 7872–6. Bibcode:1988PNAS...85.7872B. doi:10.1073/pnas.85.21.7872. PMC 282299. PMID 3186696.
- ^ Vetter IR, Wittinghofer A (November 2001). "The guanine nucleotide-binding switch in three dimensions". Science. 294 (5545): 1299–304. Bibcode:2001Sci...294.1299V. doi:10.1126/science.1062023. PMID 11701921. S2CID 6636339.
- ^ Atkinson, Gemma C.; Tenson, Tanel; Hauryliuk, Vasili (2011-08-09). "The RelA/SpoT Homolog (RSH) Superfamily: Distribution and Functional Evolution of ppGpp Synthetases and Hydrolases across the Tree of Life". PLOS ONE. 6 (8): e23479. Bibcode:2011PLoSO...623479A. doi:10.1371/journal.pone.0023479. ISSN 1932-6203. PMC 3153485. PMID 21858139.
- ^ Nagano N, Orengo CA, Thornton JM (August 2002). "One fold with many functions: the evolutionary relationships between TIM barrel families based on their sequences, structures and functions". Journal of Molecular Biology. 321 (5): 741–65. doi:10.1016/s0022-2836(02)00649-6. PMID 12206759.
- ^ Farber G (1993). "An α/β-barrel full of evolutionary trouble". Current Opinion in Structural Biology. 3 (3): 409–412. doi:10.1016/S0959-440X(05)80114-9.
외부 링크
Wikimedia Commons의 단백질 슈퍼패밀리와 관련된 미디어