생화학에서의 페이지랭크 알고리즘
PageRank algorithm in biochemistryPageRank 알고리즘은 생화학 분야에서 몇 가지 응용 프로그램을 가지고 있다.("PageRank"는 구글 검색에서 웹 사이트의 결과에 순위를 매기기 위해 사용되는 알고리즘이지만 다른 목적에도 채택되었다.구글에 따르면 PageRank는 "웹사이트가 얼마나 중요한지에 대한 대략적인 추정치를 결정하기 위해 페이지에 대한 링크의 수와 품질을 세는 것"으로 작동한다.근본적인 가정은 더 중요한 웹사이트가 다른 웹사이트로부터 더 많은 링크를 받을 가능성이 있다는 것이다.)[1]
단백질 네트워크 분석 응용
PageRank 링크 분석 알고리즘의 상대적 중요도 측정 특성은 [2]단백질에서 새로운 가능한 약물 표적을 식별하는 데 사용될 수 있다.PageRank 기반 알고리즘은 대사 네트워크에서 노드의 들어오는 가장자리 수(인 도)만 고려하는 방법보다 병원체 유기체의 중요한 단백질 표적을 더 잘 식별할 수 있었다.그 이유는 이미 알려진 중요한 단백질 표적이 높은 정도를 가지고 있지 않고 또한 일부 허브를 교란시키는 것은 원치 않는 생리적인 [3]영향을 초래할 수 있기 때문이다.
묘사
대부분의 항생제를 임상적으로 사용하면 병원균의 돌연변이가 일어나 약물에 대한 내성이 생긴다.따라서 신약 개발은 항상 필요하다.현재 위협적인 질병(예: 결핵)에 대한 신약 개발의 잠재적 첫 단계는 질병의 원인 물질, 즉 병원성 미생물에서 새로운 약물 표적을 찾아 박테리아 또는 원생 기생충이 되게 하는 것이다.박테리아(또는 원생동물 기생충)에서 표적 단백질을 발견한 후, 사람들은 단백질에 결합하고 그것을 억제하는 작은 분자 약물 화합물을 설계할 수 있었다.
생물학적 네트워크[4][5][6][7] 데이터를 공개적으로 이용할 수 있기 때문에 신약 대상을 찾는 과정이 이전보다 더 쉬워진다.이용 가능한 대사 네트워크를 사용함으로써 PageRank와 같은 링크 분석 알고리즘으로 중요한 노드를 찾을 수 있습니다.최근 발표된 [8]논문에서 생화학 반응은 대사 네트워크의 노드로서 취급된다.이 다이렉트 네트워크에서 반응 A는 반응 B의 생성물이 기질 또는 보조인자로서 후자의 반응에 들어가면 반응 B에 대한 방향 엣지를 가진다.
약물 표적이 될 수 있는 중요한 노드를 선택하기 위해 높은 수준의 노드(허브, 들어오는 가장자리가 많은 노드)를 선택하는 것을 고려할 수 있다.그러나 [2] 많은 중요한 기능을 가진 허브 단백질을 대상으로 하는 것은 의도하지 않게 살아있는 세포에도 해를 끼칠 수 있음을 보여주었다.PageRank 기반 점수 매기기 방법은 허브가 아닌 중요한 노드를 검출할 수 있으므로 더 나은 약물 표적이 될 수 있다.
노드 A의 PageRank는 랜덤워커가 노드A에 [2]있는 고정 한계 확률 분포입니다.원래의 어플리케이션에서는, 퍼스낼라이제이션 벡터 w는 웹 서퍼의 개인적인 흥미를 포착했습니다.서퍼에 대한 흥미로운 웹사이트는 벡터 [8]w로 주어진 분포에서 더 높은 확률로 나타났습니다.이 대사망에서 w는 단백질로 개인화되며, w는 특정 질병의 단백질 분석에서 고농도로 나타나는 단백질의 경우 더 크다.이 개인화된 PageRank는 [2][8]질병과 관련된 다른 단백질을 식별할 수 있습니다.
그러나 중요한 노드를 식별하기 위해 개인화된 PageRank만 사용해도 허브는 여전히 [9]평균 높은 점수를 받습니다.대신 허브가 아닌 중요한 노드를 찾으려면 "상대화된 개인화된 PageRank", 즉 해당 노드를 가리키는 에지 수에 대한 개인화된 PageRank 점수를 사용하여 노드의 점수를 매기는 것을 고려해야 합니다.노드 v에 대한 상대적인 맞춤 PageRank(rPPR(v))는 다음과 같습니다.
여기서 PpageRank(v)는 노드 v의 개인화된 PageRank 점수이고 d_(v)는 노드 v의 개인화된 PageRank 점수입니다.이 방법을 사용하면 이미 검증된 수많은 약물 표적(예: 결핵균)을 찾을 수 있으므로 현재 알려지지 않은 새로운 표적도 [8]검출될 수 있는 것으로 나타났다.
레퍼런스
- ^ "Facts about Google and Competition". Archived from the original on 4 November 2011. Retrieved 12 July 2014.
- ^ a b c Ivan G, Grolmusz V(2011)."웹이 세포를 만났을 때: 단백질 상호작용 네트워크를 분석하기 위해 개인화된 페이지 랭크를 사용합니다."생물정보학 27(3): 405–7.[1]
- ^ 러셀 RB, 알로이 P (2008)."인터랙션 네트워크를 타겟으로 하여 조작합니다."낫케미칼 Biol 4: 666~673.[2]
- ^ Prasad TSK, Kandasamy K, Pandey A(2009)."시스템 생물학 발견 도구로서의 인간 단백질 참조 데이터베이스 및 인간 단백질 미디어"방법 Mol Biol 577: 67~79.[3]
- ^ 잔조니 A, 몬테치-팔라치 L, 쿤담 M, 아우시엘로 G, 헬머-시테리히 M 등(2002)."민트: 분자 상호작용 데이터베이스"FEBS Let 513 : 135 ~140.[4]
- ^ Xenarios I, Salwinski L, Duan XJ, Higney P, Kim SM 등(2002)."Dip, 상호작용하는 단백질의 데이터베이스: 단백질 상호작용의 세포 네트워크를 연구하기 위한 연구 도구입니다."핵산 분해능 30: 303–305.[5]
- ^ Farkas IJ, Korcsmaros T, Kovacs IA, Mihalik A, Palotai R, et al. (2011)."새로운 약물 표적 식별을 위한 네트워크 기반 도구"Sci 신호 4: pt3.[6]
- ^ a b c d Bahnky D, Ivan G, Grolmusz V(2013)."저급 네트워크 노드에 균등한 기회:대사 그래프에서 단백질 표적 식별을 위한 PageRank 기반 방법."PLoS ONE 8 (1) : e54204.[7]
- ^ Fortunato S, Boguna M, Flammini A, Menczer F (2008)."학위서 호출기 근사"컴퓨터 사이언스 강의 노트 4936 : 59 ~71 。[8]