페이지 순위

PageRank
Pagerank 알고리즘에 대한 간단한 설명입니다.백분율은 인식된 중요도를 나타내고 화살표는 하이퍼링크를 나타냅니다.

페이지 랭크(PageRank, PR)는 구글 검색에서 검색 엔진 결과에서 웹 페이지의 순위를 매기는 데 사용되는 알고리즘입니다.웹 페이지라는 용어와 공동 설립자인 래리 페이지의 이름을 모두 따 이름 지어졌습니다.페이지 랭크는 웹사이트 페이지의 중요도를 측정하는 방법입니다.구글에 의하면:

페이지 랭크는 페이지에 대한 링크의 수와 품질을 세어 웹사이트의 중요성을 대략적으로 추정하는 방법으로 작동합니다.근본적인 가정은 중요한 웹사이트일수록 다른 웹사이트로부터 더 많은 링크를 받을 가능성이 높다는 것입니다.[1]

현재 구글이 검색 결과를 주문하는 데 사용한 알고리즘은 페이지랭크뿐이 아니라 구글이 처음으로 사용한 알고리즘으로 가장 잘 알려져 있습니다.[2][3]2019년 9월 24일부로 페이지 랭크와 관련된 모든 특허가 만료되었습니다.[4]

묘사

페이지 랭크(PageRank)는 링크 분석 알고리즘으로, 월드 와이드 웹(World Wide Web)과 같은 하이퍼링크된 문서 집합의 각 요소에 수치 가중치를 부여하며, 집합 내에서 상대적인 중요도를 "측정"하기 위한 목적으로 사용됩니다.알고리즘은 상호 인용 및 참조가 있는 엔티티 모음에 적용할 수 있습니다.주어진 요소 E에 할당하는 수치 가중치를 E의 페이지 랭크라고 하며 PR ()로합니다 PR(

페이지 랭크는 cnn.com 또는 mayoclinic.org 과 같은 권한 허브를 고려하여 모든 월드 와이드 웹 페이지가 노드로, 하이퍼링크가 에지로 생성하는 웹 그래프를 기반으로 하는 수학적 알고리즘의 결과입니다.순위 값은 특정 페이지의 중요도를 나타냅니다.페이지에 대한 하이퍼링크는 지지 투표로 간주됩니다.페이지의 페이지 랭크는 재귀적으로 정의되며, 페이지에 연결되는 모든 페이지의 수와 페이지 랭크 메트릭("수신 링크")에 따라 달라집니다.페이지 순위가 높은 많은 페이지로 연결된 페이지는 높은 순위 자체를 받습니다.

페이지와 브린의 원래 논문 이후로 페이지 랭크에 관한 수많은 학술 논문들이 발표되었습니다.[5]실제로 페이지 랭크 개념은 조작에 취약할 수 있습니다.허위 영향을 받은 페이지 랭크를 파악하기 위한 연구가 진행되었습니다.목적은 거짓으로 영향을 받은 페이지 랭크 문서의 링크를 무시하는 효과적인 방법을 찾는 것입니다.[6]

웹 페이지를 위한 다른 링크 기반 순위 알고리즘으로는 존 클라인버그발명HITS 알고리즘, IBM CLEVER 프로젝트, TrustRank 알고리즘, Hummingbird 알고리즘,[8] 그리고 Salsa 알고리즘이 있습니다.[7]

역사

페이지 랭크의 알고리즘 뒤에 있는 고유값 문제는 많은 채점 문제에서 독립적으로 재발견되어 재사용되었습니다.1895년 에드먼드 란다우는 체스 토너먼트의 우승자를 결정하는 데 그것을 사용할 것을 제안했습니다.[9][10]고유값 문제는 1976년에 과학 저널의 순위를 매기는 과학적 저널을 작업한 가브리엘 핀스키와 프란시스 나린에 의해서도,[11] 1977년에 토마스 새티에 의해서 대안 선택에 가중치를 두는 그의 분석적 계층 과정의 개념에서,[12] 1995년에 브래들리 러브와 스티븐 슬로먼에 의해서도 개념의 인지 모델로서 제시되었습니다.중심성 [13][14]알고리즘

1996년 Robin Li에 의해 설계된 IDD Information Services의 "RankDex"라는 검색 엔진은 사이트 점수와 페이지 랭킹을 위한 전략을 개발했습니다.[15]Li는 그의 검색 메커니즘을 "링크 분석"이라고 불렀는데, 이것은 웹사이트에 얼마나 많은 다른 사이트들이 링크를 걸었는지에 따라 웹사이트의 인기를 순위를 매기는 것을 포함합니다.[16]페이지 랭킹과 사이트 점수 알고리즘을 갖춘 최초의 검색 엔진인 랭크덱스는 1996년에 출시되었습니다.[17]Li는 1997년에 RankDex에 이 기술에 대한 특허를 출원했고 1999년에 특허를 받았습니다.[18]그는 후에 2000년에 중국에서 바이두를 설립할 때 그것을 사용했습니다.[19][20]구글의 설립자인 래리 페이지는 페이지 랭크에 대한 그의 미국 특허들 중 일부에서 Li의 업적을 인용했습니다.[21][17][22]

래리 페이지(Larry Page)와 세르게이 브린(Sergey Brin)은 1996년 스탠포드 대학교에서 새로운 종류의 검색 엔진에 대한 연구 프로젝트의 일환으로 페이지 랭크(Page Rank)를 개발했습니다.Héctor Garcia-Molina: Stanford Computer Science 교수이자 Sergey의 조언자인 Héctor Garcia-Molina와의 인터뷰는 페이지 랭크 알고리즘의 발전에 대한 배경을 제공합니다.[24]세르게이 브린은 웹의 정보가 "링크 인기"에 의해 계층 구조로 정렬될 수 있다는 아이디어를 가지고 있었습니다. 즉, 페이지는 링크에 대한 링크가 많을수록 더 높은 순위를 차지합니다.[25]이 시스템은 Scott Hassan과 Alan Steremberg의 도움으로 개발되었으며, 페이지와 브린은 둘 다 구글 개발에 중요하다고 언급했습니다.[5]라지브 모트와니(Rajeev Motwani)와 테리 위노그라드(Terry Winograd)는 페이지 랭크(Page Rank)와 1998년에 발표된 구글 검색 엔진의 초기 프로토타입에 대해 설명하는 프로젝트에 대한 첫 번째 논문을 페이지 앤 브린(Page and Brin)[5]과 공동저자로 작성했습니다.그 직후, 페이지와 브린은 구글 검색 엔진의 배후에 있는 회사인 구글 주식회사를 설립했습니다.구글 검색 결과 순위를 결정하는 많은 요소 중 하나일 뿐이지만 페이지 랭크는 구글의 모든 웹 검색 도구에 대한 기초를 계속 제공합니다.[26]

"페이지 랭크"라는 이름은 개발자 래리 페이지(Larry Page)의 이름뿐만 아니라페이지의 개념에서도 사용됩니다.[27][28]이 단어는 구글(Google)의 상표이며, 페이지 랭크(PageRank) 프로세스는 특허를 받았습니다(미국 특허 6,285,999).하지만 이 특허는 구글이 아닌 스탠포드 대학에 할당된 것입니다.구글은 스탠포드 대학의 특허에 대한 독점적 사용권을 가지고 있습니다.이 대학은 특허 사용 대가로 180만주의 구글 주식을 받았습니다. 2005년에 3억 3천 6백만 달러에 그 주식을 팔았습니다.[29][30]

페이지 랭크는 1950년대 펜실베이니아 대학의 유진 가필드(Eugene Garfield)가 초기 개발한 인용 분석파도바 대학의 마시모 마르치오리(Massimo Marchiori)가 개발한 하이퍼 서치(Hyper Search)의 영향을 받았습니다.페이지 랭크가 소개된 같은 해(1998), 존 클라인버그(Jon Kleinberg)는 HITS에 관한 연구를 출판했습니다.구글의 설립자들은 그들의 원래 논문에서 가필드, 마르키오리, 클라인버그를 인용합니다.[5][31]

알고리즘.

페이지 순위 알고리즘은 임의로 링크를 클릭하는 사람이 특정 페이지에 도착할 가능성을 나타내는 데 사용되는 확률 분포를 출력합니다.페이지 랭크는 모든 크기의 문서 모음에 대해 계산할 수 있습니다.여러 연구 논문에서는 계산 과정 초기에 컬렉션에 있는 모든 문서들 간에 분포가 균등하게 나눠져 있다고 가정합니다.페이지 랭크 계산은 이론적 참값을 더 가깝게 반영하기 위해 대략적인 페이지 랭크 값을 조정하기 위해 컬렉션을 통과하는 "반복"이라고 불리는 여러 번의 패스를 필요로 합니다.

확률은 0과 1 사이의 숫자 값으로 표시됩니다. 0.5 확률은 일반적으로 어떤 일이 일어날 "50% 확률"로 표시됩니다.따라서 페이지 순위가 0.5인 문서는 임의 링크를 클릭하는 사람이 해당 문서로 이동할 확률이 50%임을 의미합니다.

단순 알고리즘

A, B, C, D 네 개의 웹 페이지로 구성된 작은 우주를 가정합니다.페이지에서 자체로의 링크는 무시됩니다.한 페이지에서 다른 페이지로의 여러 아웃바운드 링크는 단일 링크로 처리됩니다.PageRank는 모든 페이지에 대해 동일한 값으로 초기화됩니다.원래 형태의 PageRank에서는 모든 페이지에 대한 PageRank의 합계가 그 당시의 웹 페이지의 총 수이였기 때문에 이 예제의 각 페이지는 초기값이 1이 됩니다.그러나 이후 버전의 페이지 순위와 이 절의 나머지 부분에서는 0과 1 사이의 확률 분포를 가정합니다.따라서 이 예제의 각 페이지에 대한 초기 값은 0.25입니다.

다음 반복 시 지정된 페이지에서 아웃바운드 링크의 대상으로 전송되는 페이지 랭크는 모든 아웃바운드 링크에서 동일하게 분할됩니다.

시스템의 유일한 링크가 페이지 B, C, D에서 A로 이어졌을 경우, 각 링크는 다음 반복 시 0.25 PageRank를 A로 전송하여 총 0.75가 됩니다.

대신 B페이지C페이지A페이지에 링크를, C페이지는 A페이지에 링크를, D페이지는 3페이지 모두에 링크를 가지고 있다고 가정해 보겠습니다.따라서 첫 번째 반복 시 페이지 B는 기존 값의 절반(0.125)을 페이지 A에 전달하고 나머지 절반(0.125)을 페이지 C에 전달합니다.C 페이지는 기존 값(0.25)을 링크하는 유일한 페이지인 A에 모두 전달합니다.D는 세 개의 아웃바운드 링크를 가지고 있었기 때문에 기존 값의 3분의 1(약 0.083)을 A로 전송합니다.이 반복이 완료되면 페이지 A는 약 0.458의 페이지 랭크를 갖게 됩니다.

즉, 아웃바운드 링크에 의해 부여된 페이지 랭크는 문서 자신의 페이지 랭크 점수를 아웃바운드 링크 L()의 수로 나눈 값과 같습니다.

일반적인 경우 페이지 u에 대한 페이지 랭크 값은 다음과 같이 나타낼 수 있습니다.

)=\

즉, 페이지 u에 대한 페이지 랭크 값은 집합 B(페이지u u와 링크하는 모든 페이지를 포함하는 집합)에 포함된 각 페이지 v에 대한 페이지 랭크 값에 종속되며, 페이지 v의 링크L(v)로 나뉩니다.

감쇠 계수

페이지 랭크 이론은 임의로 링크를 클릭하는 가상 서퍼가 결국 클릭을 중단한다는 이론입니다.어떤 단계에서든 작업자가 링크를 계속 따라갈 확률은 감쇠 계수입니다.대신 임의의 페이지로 점프할 확률은 1 - d입니다. 여러 연구에서 다양한 감쇠 계수를 테스트했지만 일반적으로 감쇠 계수는 0.85 정도로 설정된다고 가정합니다.[5]

감쇠 계수를 1에서 뺀 후(그리고 알고리즘의 일부 변형에서는 결과를 컬렉션의 문서 수(N)로 나눈 후 이 항이 감쇠 계수와 들어오는 PageRank 점수의 합의 곱에 추가됩니다).그것은,

따라서 모든 페이지의 페이지 순위는 대부분 다른 페이지의 페이지 순위에서 파생됩니다.감쇠 계수는 도출된 값을 아래쪽으로 조정합니다.그러나 원래의 논문은 다음과 같은 공식을 제공하여 약간의 혼란을 야기시켰습니다.

그들 사이의 차이점은 첫 번째 공식의 페이지 랭크 값이 1이 되는 반면, 두 번째 공식에서 각 페이지 랭크는 N을 곱하고 합은 N이 된다는 것입니다. 페이지와 브린의 논문에서 "모든 페이지 랭크의 합은 1이다"[5]라는 문장과 다른 구글 직원들의[32] 주장은 위 공식의 첫 번째 변형을 지지합니다.

페이지와 브린은 가장 유명한 논문 "대규모 하이퍼텍스트 웹 검색 엔진의 해부학"에서 두 공식을 혼동했는데, 여기서 그들은 후자의 공식이 웹 페이지에 대한 확률 분포를 형성한다고 잘못 주장했습니다.[5]

Google은 웹을 크롤링하고 인덱스를 재구축할 때마다 페이지 랭크 점수를 다시 계산합니다.Google이 컬렉션의 문서 수를 늘리면 모든 문서에 대해 페이지 랭크의 초기 근사치가 줄어듭니다.

이 공식은 몇 번의 클릭 후 대상 사이트에 도달한 후 랜덤 페이지로 전환하는 랜덤 서퍼의 모델을 사용합니다.페이지의 PageRank 값은 링크를 클릭하여 랜덤 서퍼가 해당 페이지에 착지할 가능성을 반영합니다.상태가 페이지이고 전환이 페이지 간의 연결인 마르코프 체인으로 이해할 수 있는데, 이는 모두 동일하게 발생 가능성이 높습니다.

페이지에 다른 페이지에 대한 링크가 없으면 싱크가 되므로 랜덤 서핑 프로세스가 종료됩니다.랜덤 서퍼가 싱크 페이지에 도착하면 랜덤으로 다른 URL을 선택하고 다시 서핑을 계속합니다.

PageRank를 계산할 때 아웃바운드 링크가 없는 페이지는 컬렉션의 다른 모든 페이지에 링크 아웃되는 것으로 가정합니다.따라서 PageRank 점수는 다른 모든 페이지에서 균등하게 나뉩니다.즉, 싱크가 아닌 페이지를 공정하게 처리하기 위해 이러한 랜덤 전환은 웹의 모든 노드에 추가됩니다.이 잔차 확률 d는 보통 평균 서퍼가 브라우저의 북마크 기능을 사용하는 빈도에서 추정한 0.85로 설정됩니다.따라서 방정식은 다음과 같습니다.

여기서 (는) 중인 페이지이고, {\ 페이지의 아웃바운드 링크 수입니다 (는) 총 페이지 수입니다.

PageRank 값은 각 열이 최대 1개가 되도록 재정렬된 수정된 인접 행렬의 우세한 오른쪽 고유 벡터의 항목입니다.따라서 페이지 랭크는 특히 우아한 메트릭이 됩니다. 고유 벡터는

여기서 R은 방정식의 해입니다.

여기서 인접 함수 ℓ 은(는) 페이지 j에서 i로의 아웃바운드 링크 수와 페이지 j의 전체 아웃바운드 링크 수 사이의 비율입니다.page 에 연결되지 않고 각 j에 대해 정규화되면인접 함수는 0입니다.

1 ( ) })=

즉, 각 열의 원소는 최대 1이므로 행렬은 확률 행렬입니다(자세한 내용은 아래 계산 섹션 참조).따라서 이는 네트워크 분석에서 일반적으로 사용되는 고유 벡터 중심성 측도의 변형입니다.

위의 수정된 인접 행렬의 큰 고유 갭 때문에,[33] 페이지 랭크 고유 벡터의 값은 단지 몇 번의 반복 내에서 높은 정확도 내로 근사화될 수 있습니다.

Google의 설립자들은 원래 논문에서 3억 2,200만 개의 링크(가장자리 내 및 가장자리 외부)로 구성된 네트워크의 페이지 랭크 알고리즘이 52번의 반복에서 허용 한도 내로 수렴한다고 보고했습니다.[31]위의 절반 크기의 네트워크에서 수렴은 약 45회 반복되었습니다.이 데이터를 통해, 그들은 알고리즘이 매우 잘 확장될 수 있으며, ⁡ n 에서 매우 큰 네트워크에 대한 확장 계수는 대략 선형일 것이라고 결론지었습니다 여기서 n은 네트워크 크기입니다.

마코프 이론의 결과, 페이지의 페이지 랭크는 많은 클릭 수 후 해당 페이지에 도달할 확률임을 알 수 있습니다. -1 {\ t과 동일한 경우에 발생합니다. t 페이지에서 자신으로 다시 돌아오는 데 필요한 클릭 수(또는 임의 점프)의 예상치입니다.

페이지 랭크의 주요 단점 중 하나는 오래된 페이지를 선호한다는 것입니다.좋은 페이지라도 기존 사이트(Wikipedia와 같이 페이지가 빽빽하게 연결된 사이트)의 일부가 아니면 링크가 많지 않습니다.

페이지 랭크의 연산을 가속화하기 위한 몇 가지 전략이 제안되었습니다.[34]

검색 결과 순위를 개선하고 광고 링크를 수익화하기 위해 페이지 랭크를 조작하기 위한 다양한 전략이 공동으로 사용되었습니다.이러한 전략은 페이지 랭크 개념의 신뢰성에 심각한 영향을 미쳤습니다.[citation needed] 페이지 랭크 개념은 웹 커뮤니티에서 실제로 어떤 문서를 높게 평가하는지를 결정하기 위해 사용됩니다.

2007년 12월 유료 텍스트 링크를 판매하는 사이트에 적극적으로 불이익을 주기 시작한 이후, 구글은 페이지 랭크를 인위적으로 부풀리기 위해 고안된 링크 팜과 다른 계획들과 싸웠습니다.구글이 링크 팜 및 기타 페이지 랭크 조작 도구를 식별하는 방법은 구글의 영업 비밀 중 하나입니다.

계산

페이지 랭크는 반복적으로 계산할 수도 있고 대수적으로 계산할 수 있습니다.반복 방법은 거듭제곱 방법 또는 거듭제곱 방법으로 볼 수 있습니다.수행되는 기본적인 수학적 연산은 동일합니다.

반복적인

= t=에서 일반적으로 초기 확률 분포가 가정됩니다

) ) = {\

여기서 N은 총 페이지 수이고, 시간 0에서 페이지 i입니다.

위에서 상세히 설명한 바와 같이, 각 시간 단계에서 계산 결과가 산출됩니다.

여기서 d는 댐핑 팩터,

또는 행렬 표기법으로

(+ ) d ( t)+ -d ) = ) +

(1)

여기서 ( )= ( ; ) )= 는) 하나만 포함하는 길이 의 열 벡터입니다.

행렬 (가) 정의되었습니다.

예.,

여기서 는 그래프의 인접 행렬을 나타내고, 대각선에 바깥쪽 차수가 있는 대각선 행렬입니다.

확률 계산은 한 시점의 각 페이지에 대해 수행된 다음 다음 시점에 대해 반복됩니다.일부 작은 ϵ 의 경우 계산이 종료됩니다.

(+ )- R( )< ) -

즉, 수렴을 가정할 때.

동력방식

이(가 전이 확률인 경우, 즉 열 stoch적이고 가) 확률 분포인 경우( = {\ = = 1 {\ {E} {R} = \mathbf다음 식 (2)는 다음과 같습니다.

( + -d ) = : R =\=:{\}.

(3)

따라서 페이지 랭크 의 주 고유 벡터입니다 이를 빠르고 쉽게 계산할 수 있는 방법은 거듭제곱법을 사용하는 것입니다. 임의의 벡터 ( 부터 시작하여 M {\ {M을 연속으로 적용합니다.

( + ) ^ ( ) ) = {\

까지

( t+ )- x t )< -

식 (3)에서 괄호 안의 오른쪽에 있는 행렬은 다음과 같이 해석될 수 있습니다.

d -d) = (

여기서 는) 초기 확률 분포입니다.n 본건

: 1 :={\

마지막으로, 에 값이 0인 열만 있는 경우, 초기 벡터P {\ \ {으)로 대체해야 합니다 즉,

: + }:={\

여기서 D 다음과 같이 정의됩니다.

: D}}:=\

와 함께

이 경우 을(를) 사용하는 위의 두 계산은 결과가 정규화된 경우에만 동일한 페이지 순위를 부여합니다.

거듭제곱 R = R R _ {}} =} { \mathbf { _ = {\ _ { ebra . {\textrm {}}.

실행

파이썬

수입품 울렁울적인 ~하듯이 np  데프 호출기 랭크(M, num_반복: 인트 = 100, d: 흘러가다 = 0.85):     """"PageRank 알고리즘은 명시적인 반복 횟수를 사용합니다.인접 행렬의 노드(페이지) 순위를 반환합니다.  매개변수 ---------- M : numpy 배열 여기서 M_i,j는 'j'에서 'i'로의 링크를 나타내며, 이는 모든 'j'에 대한 것입니다. sum(i, M_i,j) = 1 num_반복: int, 선택사항 반복 횟수(기본값 100) d : float, 옵션 감쇠 계수(기본값 0.85)  돌아온다 ------- 누피 배열 v_i가 [0, 1]에서 i번째 순위가 되도록 순위 벡터, v를 1로 합하다  """     N = M.모양.[1]     v = np.하나(N) / N     M_모자 = (d * M + (1 - d) / N)     위해서 i 인에 범위(num_반복):         v = M_모자 @ v     돌아가다 v  M = np.배열하다([[0, 0, 0, 0, 1],               [0.5, 0, 0, 0, 0],               [0.5, 0, 0, 0, 0],               [0, 1, 0.5, 0, 0],               [0, 0, 0.5, 1, 0]]) v = 호출기 랭크(M, 100, 0.85) 

이 예제는 수렴하는 데 ≈13 반복이 필요합니다.

변주곡

무방향 그래프의 페이지 순위

무방향 그래프 의 페이지 랭크는 G 의 정도 분포와 통계적으로 가깝지만 일반적으로 동일하지 않습니다[37] (가) 위에 정의된 페이지 랭크 벡터이고, (가) 차수 분포 벡터인 경우

여기서 deg는 정점 의 정도를 나타내고,E 는 그래프의 가장자리 집합입니다. 그러면 = Y = {1의 경우 다음을 나타냅니다

즉, 무방향 그래프의 페이지 랭크는 그래프가 정규인 경우, 즉 모든 정점이 동일한 차수를 갖는 경우에만 차수 분포 벡터와 같습니다.

두 종류의 순위를 매기는 객체

Daugulis는 두 개의 상호작용하는 객체 그룹의 순위를 매기는 경우에 대한 PageRank의 일반화를 설명했습니다.[39]응용 프로그램에서는 객체 쌍에 가중치 관계가 정의된 두 종류의 객체를 갖는 시스템을 모델링해야 할 수도 있습니다.이로 인해 이분 그래프를 고려하게 됩니다.이러한 그래프의 경우 정점 분할 집합에 해당하는 두 개의 관련 양 또는 음이 아닌 축소 행렬을 정의할 수 있습니다.두 그룹의 개체 순위를 이 행렬의 최대 양의 고유 값에 해당하는 고유 벡터로 계산할 수 있습니다.노름 고유 벡터는 페론 또는 페론-프로베니우스 정리에 의해 고유합니다.예: 소비자 및 제품.관계 가중치는 제품 소비율입니다.

페이지 랭크 계산을 위한 분산 알고리즘

Sarma et al. 은 네트워크에서 노드의 페이지 랭크(PageRank)를 계산하기 위한 두 의 랜덤 워크 기반 분산 알고리즘을 설명합니다.[40]한 알고리즘은 임의의 그래프(방향 또는 무방향)에서 높은 Oϵ n /⁡ ) {\n /\ 라운드를 수행합니다. 여기서 n은 네트워크 크기이고 ϵ }은 페이지 랭크 계산에 사용되는 재설정 확률( ϵ 1 -입니다.또한 무방향 그래프에서 /ϵ O라운드를 수행하는 더 빠른 알고리즘을 제시합니다.두 알고리즘 모두에서 각 노드는 라운드당 네트워크 크기인 n개의 폴리논리적인 비트 수를 처리하여 전송합니다.

구글 툴바

Google 툴바에는 방문한 페이지의 페이지 랭크를 0(가장 인기 없음)에서 10(가장 인기 있음) 사이의 정수로 표시하는 페이지 랭크 기능이 오랫동안 있었습니다.구글은 웹사이트의 가치를 대략적으로 나타내는 것으로만 간주되는 툴바 페이지 랭크 값을 결정하는 구체적인 방법을 공개하지 않았습니다."Toolbar Pagerank"는 Google Webmaster Tools 인터페이스를 통해 검증된 사이트 유지관리자에게 제공되었습니다.그러나 2009년 10월 15일, 구글의 한 직원은 회사가 웹마스터 도구 섹션에서 페이지 랭크를 삭제한 것을 확인하면서, "우리는 오랫동안 사람들에게 페이지 랭크에 너무 집중해서는 안 된다고 말해왔습니다.많은 사이트 소유자들이 이것이 자신들이 추적해야 할 가장 중요한 지표라고 생각하는 것 같은데, 이는 단순히 사실이 아닙니다."[41]

"Toolbar Pagerank"는 매우 드물게 업데이트되었습니다.그것은 2013년 11월에 마지막으로 업데이트 되었습니다.2014년 10월, 매트 커츠는 또 다른 페이저랭크 업데이트가 오지 않을 것이라고 발표했습니다.[42]2016년 3월 구글은 이 기능을 더 이상 지원하지 않을 것이며, 기본 API는 곧 작동을 중단할 것이라고 발표했습니다.[43]2016년 4월 15일, 구글은 구글 툴바에서 페이지 랭크 데이터의 표시를 껐지만,[44] 페이지 랭크는 검색 결과의 콘텐츠 순위를 매기는 데 내부적으로 계속 사용되었습니다.[45]

SERP 순위

검색 엔진 결과 페이지(SERP)는 검색 엔진이 키워드 쿼리에 응답하여 반환하는 실제 결과입니다.SERP는 연관된 텍스트 스니펫, 유료 광고, 특징 스니펫 및 Q&A가 포함된 웹 페이지에 대한 링크 목록으로 구성됩니다.웹 페이지의 SERP 랭크는 해당 링크를 SERP에 배치하는 것을 의미하며, 여기서 배치가 높으면 SERP 랭크가 높아지는 것을 의미합니다.웹 페이지의 SERP 순위는 페이지 순위뿐만 아니라 비교적 크고 지속적으로 조정된 요소 집합(200 이상)의 함수입니다.[46][unreliable source?]검색 엔진 최적화(SEO)는 웹 사이트 또는 웹 페이지 세트의 SERP 순위에 영향을 주는 것을 목표로 합니다.

키워드에 대한 Google SERP에서 웹 페이지의 위치는 권한 및 인기라고도 알려진 관련성 및 평판에 따라 달라집니다.페이지 랭크(PageRank)는 구글이 웹페이지의 평판을 평가하는 지표입니다.키워드가 아닌 특정 단어입니다.Google은 웹페이지와 웹사이트 권한을 조합하여 키워드를 놓고 경쟁하는 웹페이지의 전반적인 권한을 결정합니다.[47]웹사이트의 홈페이지 페이지 순위는 구글이 웹사이트 권한을 위해 제공하는 가장 좋은 지표입니다.[48]

Google Places가 주류 유기농 SERP에 도입된 후, PageRank 이외에도 수많은 다른 요소들이 지역 비즈니스 결과에서 기업의 순위를 정하는 데 영향을 미칩니다.[49]구글은 Q&A #2016년 3월 페이지 랭크 감가상각 이유를 상세히 설명하면서 링크와 콘텐츠를 상위 랭킹 요소로 발표했습니다.랭크브레인은 2015년 10월 초에 #3 랭킹 팩터로 발표된 바 있어, 상위 3개의 팩터는 구글에 의해 공식적으로 확인되었습니다.[50]

구글 디렉터리 페이지 랭크

구글 디렉토리 페이지 랭크는 8단위로 측정되었습니다.녹색 막대 마우스 위에 숫자 페이지 순위 값이 표시되는 Google 도구 모음과 달리 Google 디렉토리에는 숫자 값이 표시되지 않고 막대만 표시됩니다.구글 디렉토리는 2011년 7월 20일에 폐쇄되었습니다.[51]

거짓 또는 스푸핑된 페이지 순위

툴바에 표시된 페이지 랭크는 쉽게 스푸핑할 수 있는 것으로 알려졌습니다.HTTP 302 응답 또는 "새로 고침" 메타 태그를 통해 한 페이지에서 다른 페이지로 리디렉션하면 원본 페이지가 대상 페이지의 페이지 순위를 획득하게 됩니다.따라서 PR 0이 있고 수신 링크가 없는 새 페이지는 Google 홈 페이지로 리디렉션하여 PR 10을 획득할 수 있습니다.스푸핑은 일반적으로 구글 검색을 통해 소스 URL을 탐지할 수 있으며, 결과에 전혀 다른 사이트의 URL이 표시되면 후자의 URL이 리디렉션 대상을 나타낼 수 있습니다.

페이지 순위 조작

검색 엔진 최적화를 위해 일부 회사는 웹마스터에 높은 페이지 랭크 링크를 판매하겠다고 제안합니다.[52]더 높은 PR 페이지의 링크가 더 가치가 있다고 여겨지기 때문에, 링크가 더 비싼 경향이 있습니다.트래픽을 촉진하고 웹마스터의 링크 인기를 높이기 위해 품질 및 관련 사이트의 컨텐츠 페이지에 링크 광고를 구입하는 것이 효과적이고 실행 가능한 마케팅 전략이 될 수 있습니다.그러나 Google은 웹마스터에게 페이지 랭크와 평판을 제공하기 위한 목적으로 링크를 판매하거나 판매 중인 것으로 밝혀지면 링크가 평가절하될 것이라고 공개적으로 경고했습니다(다른 페이지의 페이지 랭크 계산에서 무시됨).사고파는 행위는 웹마스터 커뮤니티 전반에서 치열하게 논의되고 있습니다.구글은 웹마스터들에게 유료 링크에서 nofollow HTML 속성 값을 사용할 것을 권고했습니다.매트 커츠(Matt Cutts)[52]에 따르면, 구글은 이 시스템을 게임하려고 하는 웹마스터들을 염려하여 구글 검색 결과의 품질과 관련성을 떨어뜨린다고 합니다.

2019년 Google은 "링크 주스"를 통과하지 않으므로 SEO 링크 조작에 대한 가치가 없는 새로운 유형의 태그를 제공했습니다. 댓글과 같은 사용자 제작 콘텐츠에 대한 태그로 rel="ugc"를 제공하고 광고 또는 기타 유형의 후원 콘텐츠에 대한 rel="후원" 태그를 제공합니다.

SEO 목적으로 페이지 랭크가 덜 중요해졌지만, 더 인기 있는 웹사이트의 백링크의 존재는 웹페이지를 검색 순위에서 계속해서 더 높게 밀어 올립니다.[55]

방향 서퍼 모형

서퍼가 찾고 있는 페이지 내용과 쿼리 용어에 따라 페이지마다 확률적으로 이동하는 보다 지능적인 서퍼입니다.이 모델은 이름에서 알 수 있듯이 쿼리의 함수이기도 한 페이지의 쿼리 종속 PageRank 점수를 기반으로 합니다.다중항 쿼리인 = { ⋯ } Q =\{q 1,주어지면 서퍼는 일부 확률 분포에 따라 선택하고이 항을 사용하여 많은 단계에서 동작을 안내합니다.그런 다음 분포에 따라 다른 항을 선택하여 해당 항의 동작 등을 결정합니다.방문한 웹 페이지에 대한 결과 배포는 QD-PageRank입니다.[56]

사회적 구성요소

Katja Mayer는 PageRank를 다양한 관점과 생각을 한 곳에서 연결하기 때문에 소셜 네트워크로 봅니다.[57]사람들은 정보를 얻기 위해 페이지 랭크로 이동하고, 그 주제에 대해 의견을 가진 다른 저자들의 인용으로 넘쳐납니다.이것은 모든 것을 논의하고 수집하여 사고를 유발할 수 있는 사회적 측면을 만듭니다.페이지 랭크와 그것을 사용하는 사람들 사이에는 현대 사회의 변화에 끊임없이 적응하고 변화하면서 존재하는 사회적 관계가 있습니다.소시오메트리를 통해 페이지 랭크와 개인 간의 관계를 보는 것은 결과로 나타나는 연결을 심층적으로 살펴볼 수 있게 해줍니다.

[58] 마테오 파스퀴넬리는 페이지 랭크가 사회적 요소를 가지고 있다는 믿음의 근거가 주의력 경제의 개념에 있다고 생각합니다.주의 경제를 통해 사람들의 관심을 더 많이 받는 제품에 가치를 부여하고 페이지 순위의 맨 위에 있는 결과가 그 다음 페이지의 결과보다 더 많은 초점을 맞춥니다.따라서 페이지 순위가 높은 결과는 인간의 의식에 더 크게 진입할 것입니다.이러한 아이디어는 의사결정에 영향을 미칠 수 있으며, 뷰어의 동작은 페이지 순위와 직접적인 관련이 있습니다.그들의 위치가 사이트에 부착된 주의 경제성을 증가시킴에 따라 사용자의 주의를 끌 수 있는 잠재력이 더 높습니다.이 위치를 이용하면 더 많은 트래픽을 받을 수 있고 온라인 마켓플레이스에서 더 많은 구매를 할 수 있습니다.이러한 사이트의 페이지 순위를 통해 신뢰할 수 있으며 이러한 신뢰를 비즈니스 증가에 반영할 수 있습니다.

기타용도

페이지 랭크의 수학은 완전히 일반적이며 도메인의 그래프나 네트워크에 적용됩니다.따라서 PageRank는 현재 서지학, 소셜 및 정보 네트워크 분석, 링크 예측 및 추천에 정기적으로 사용되고 있습니다.그것은 도로망의 시스템 분석과 생물학, 화학, 신경과학, 물리학에 사용됩니다.[59]

과학연구 및 학술

페이지 랭크는 연구자들의 과학적 영향을 정량화하는 데 사용되어 왔습니다.개별 저자에게 전파되는 개별 출판물에 대한 순위 체계를 마련하기 위해 기본 인용 및 협업 네트워크는 페이지 랭크 알고리즘과 함께 사용됩니다.pagerank-index(Pi)로 알려진 새로운 지수는 h-index에 비해 h-index에 의해 나타나는 많은 단점들의 맥락에서 더 공정함을 보여줍니다.[60]

생물학의 단백질 네트워크 분석을 위해 페이지 랭크는 또한 유용한 도구입니다.[61][62]

모든 생태계에서 페이지 랭크의 수정된 버전은 환경의 지속적인 건강에 필수적인 종을 결정하는 데 사용될 수 있습니다.[63]

페이지 랭크의 이와 유사한 새로운 용도는 졸업생을 교수직에 배치한 기록을 기반으로 박사 학위 과정의 순위를 매기는 것입니다.페이지 랭크 용어에서, 학술 부서들은 교수진들을 서로(그리고 그들 자신으로부터) 고용함으로써 서로 연결됩니다.[64]

페이지 랭크의 버전은 최근 전통적인 ISI(Institute for Scientific Information) 영향 인자를 대체하기 위해 제안되었으며,[65] IgenfactorSCImago에서 구현되었습니다.저널에 인용된 총 숫자만 세는 것이 아니라, 각 인용의 "중요도"는 페이지 랭크 방식으로 결정됩니다.

신경과학에서, 신경 네트워크에서 뉴런의 페이지 랭크는 상대적인 발화율과 상관관계가 있는 것으로 밝혀졌습니다.[66]

인터넷 사용

개인화된 페이지 랭크는 사용자가 팔로우하고 싶어하는 다른 계정을 제공하기 위해 트위터에서 사용됩니다.[67]

스위프타입의 사이트 검색 상품은 홈페이지의 링크 수 등의 요소를 바탕으로 각 웹사이트의 중요도 신호를 보고 콘텐츠의 우선순위를 정하는 방식으로 '개별 웹사이트에 특화된 페이지 랭크'를 구축합니다.[68]

웹 크롤러는 웹 크롤러에서 방문할 URL을 결정할 때 사용하는 여러 중요 메트릭 중 하나로 페이지 랭크를 사용할 수 있습니다.Google을 작성할 때 사용된 초기 작업 문서[69] 중 하나는 효율적인 크롤링 스루 URL 순서입니다.[70] 이 문서에서는 Google이 얼마나 깊이 있고 어느 정도의 사이트를 크롤링할지 결정하기 위해 여러 가지 다양한 중요도 메트릭을 사용하는 방법에 대해 설명합니다.URL에 대한 인바운드 및 아웃바운드 링크 수, 사이트의 루트 디렉터리에서 URL까지의 거리 등이 나열되어 있지만 페이지 랭크는 이러한 여러 중요 메트릭 중 하나로 표시됩니다.

또한 페이지 순위는 Blogosphere와 같은 커뮤니티가 전체 웹 자체에 미치는 명백한 영향을 측정하는 방법론으로 사용될 수도 있습니다.따라서 이 접근 방식은 페이지 랭크를 사용하여 스케일이 없는 네트워크 패러다임을 반영하여 주의 분포를 측정합니다.[citation needed]

기타 어플리케이션

2005년 파키스탄의 Structural Deep Democracy라는 시범 연구에서 SD2[71][72] Contact Youth라는 지속 가능한 농업 그룹에서 리더십 선택에 사용되었습니다.SD2는 PageRank를 사용하여 과도적 대리투표를 처리하고 있으며, 투표자당 최소 2명의 초기 대리인을 의무화해야 한다는 추가적인 제약 조건을 가지고 있으며, 모든 투표자는 대리 후보자입니다.SD2 위에 전문가 프록시와 특정 문제에 대한 직접 투표를 추가하는 등 보다 복잡한 변형을 구축할 수 있지만, 기본적인 포괄적인 시스템으로서 SD2는 항상 일반론자 프록시를 사용해야 합니다.

스포츠에서 페이지 랭크 알고리즘은 미국 내셔널 풋볼 리그(NFL)의 팀,[73] 개별 축구 선수,[74] 다이아몬드 리그의 선수들의 성적 순위를 매기는 데 사용되었습니다.[75]

페이지 랭크는 개별 공간 또는 거리에 얼마나 많은 사람들(보행자 또는 차량)이 오는지를 예측하기 위해 공간 또는 거리의 순위를 매기는 데 사용되어 왔습니다.[76][77]어휘 의미론에서는 워드 센스 디시뮬레이션(Word Sense Disambiguation),[78] 시맨틱 유사성(Semantic similarity)을 수행하고,[79] 긍정성 또는 부정성과 같은 주어진 시맨틱 속성을 얼마나 강력하게 보유하고 있는지에 따라 워드넷 신세트의 순위를 자동으로 매기는 데 사용되었습니다.[80]

미행자 없음

2005년 초, 구글은 HTML 링크와 앵커 요소의 관계 속성에 대해 "nofollow"[81]라는 새로운 값을 구현하여 웹사이트 개발자와 블로거들이 페이지 랭크의 목적을 위해 구글이 고려하지 않는 링크를 만들 수 있도록 했습니다.스팸 탐지를 방지하기 위해 nofollow 관계를 추가했습니다.

예를 들어, 사람들은 그들의 페이지 랭크를 인위적으로 부풀리기 위해 그들의 웹사이트에 대한 링크로 많은 메시지 보드 게시물을 만들 수 있었습니다.nofollow 값을 사용하면 게시물의 모든 하이퍼링크에 "rel='nofollow'"를 자동으로 삽입하도록 메시지 보드 관리자가 코드를 수정할 수 있으므로 페이지 랭크가 특정 게시물의 영향을 받지 않도록 할 수 있습니다.그러나 이러한 회피 방법은 정당한 댓글의 링크 값을 감소시키는 등 여러 가지 단점도 있습니다.(참조: 블로그의 스팸#팔로우 안 함)

웹 사이트 내 페이지 간의 페이지 랭크 흐름을 수동으로 제어하기 위해 많은 웹 마스터가 페이지 랭크를 가장 중요한 페이지로 보내기 위해 전략적으로 웹 사이트의 특정 내부 링크에 노팔로우 속성을 배치하는 행위인 페이지 랭크 조각(PageRank Sculpting[82])을 수행합니다.이 전술은 nofollow 특성이 시작될 때부터 사용되었지만, Google이 nofollow로 페이지 랭크 전송을 차단해도 해당 페이지 랭크가 다른 링크로 리디렉션되지 않는다고 발표했기 때문에 더 이상 효과적이지 않을 수 있습니다.[83]

참고 항목

참고문헌

인용문

  1. ^ "Facts about Google and Competition". Archived from the original on 4 November 2011. Retrieved 12 July 2014.
  2. ^ Sullivan, Danny (2007-04-26). "What Is Google PageRank? A Guide For Searchers & Webmasters". Search Engine Land. Archived from the original on 2016-07-03.
  3. ^ Cutts, Matt. "Algorithms Rank Relevant Results Higher". Archived from the original on July 2, 2013. Retrieved 19 October 2015.
  4. ^ "US7058628B1 - Method for node ranking in a linked database - Google Patents". Google Patents. Archived from the original on January 16, 2020. Retrieved September 14, 2019.
  5. ^ a b c d e f g Brin, S.; Page, L. (1998). "The anatomy of a large-scale hypertextual Web search engine" (PDF). Computer Networks and ISDN Systems. 30 (1–7): 107–117. CiteSeerX 10.1.1.115.5930. doi:10.1016/S0169-7552(98)00110-X. ISSN 0169-7552. S2CID 7587743. Archived (PDF) from the original on 2015-09-27.
  6. ^ Gyöngyi, Zoltán; Berkhin, Pavel; Garcia-Molina, Hector; Pedersen, Jan (2006), "Link spam detection based on mass estimation", Proceedings of the 32nd International Conference on Very Large Data Bases (VLDB '06, Seoul, Korea) (PDF), pp. 439–450, archived (PDF) from the original on 2014-12-03.
  7. ^ "FAQ: All About The New Google "Hummingbird" Algorithm". Search Engine Land. 26 September 2013. Archived from the original on 23 December 2018. Retrieved 18 December 2018.
  8. ^ Wang, Ziyang. "Improved Link-Based Algorithms for Ranking Web Pages" (PDF). cs.nyu.edu. New York University, Department of Computer Science. Retrieved 7 August 2023.
  9. ^ Landau, Edmund (1895). "Zur relativen Wertbemessung der Turnierresultate". Deutsches Wochenschach. 11 (42): 51–54.
  10. ^ Sinn, Rainer; Ziegler, Günter M. (2022-10-31). "Landau on Chess Tournaments and Google's PageRank". arXiv:2210.17300 [math.HO].
  11. ^ Gabriel Pinski & Francis Narin (1976). "Citation influence for journal aggregates of scientific publications: Theory, with application to the literature of physics". Information Processing & Management. 12 (5): 297–312. doi:10.1016/0306-4573(76)90048-0.
  12. ^ Thomas Saaty (1977). "A scaling method for priorities in hierarchical structures". Journal of Mathematical Psychology. 15 (3): 234–281. doi:10.1016/0022-2496(77)90033-5. hdl:10338.dmlcz/101787.
  13. ^ Bradley C. Love & Steven A. Sloman. "Mutability and the determinants of conceptual transformability" (PDF). Proceedings of the Seventeenth Annual Conference of the Cognitive Science Society. pp. 654–659. Archived (PDF) from the original on 2017-12-23. Retrieved 2017-12-23.
  14. ^ "How a CogSci undergrad invented PageRank three years before Google". bradlove.org. Archived from the original on 2017-12-11. Retrieved 2017-12-23.
  15. ^ Li, Yanhong (August 6, 2002). "Toward a qualitative search engine". IEEE Internet Computing. 2 (4): 24–29. doi:10.1109/4236.707687.
  16. ^ "The Rise of Baidu (That's Chinese for Google)". The New York Times. 17 September 2006. Archived from the original on 27 June 2019. Retrieved 16 June 2019.
  17. ^ a b "About: RankDex" Wayback Machine, RankDex에서 2015-05-25 아카이브; 2014년 5월 3일 액세스.
  18. ^ USPTO, "하이퍼텍스트 문서 검색 시스템방법" 2011-12-05 Wayback Machine, 미국 특허 번호: 5920859, 발명자:리옌훙(李延hong), 신고일:1997년 2월 5일 발행일 : 1999년 7월 6일
  19. ^ Greenberg, Andy, "Google을 이기는 남자" 2009년 10월 05일, Wayback Machine에서 2013-03-08년 보관
  20. ^ "정보: RankDex" Wayback Machine, rankdex.com 에서 2012-01-20 아카이브
  21. ^ "Method for node ranking in a linked database". Google Patents. Archived from the original on 15 October 2015. Retrieved 19 October 2015.
  22. ^ Altucher, James (March 18, 2011). "10 Unusual Things About Google". Forbes. Archived from the original on 16 June 2019. Retrieved 16 June 2019.
  23. ^ Greg Wientjes. "Hector Garcia-Molina: Stanford Computer Science Professor and Advisor to Sergey". pp. minutes 25.45-32.50, 34.00–38.20. Retrieved 2019-12-06.
  24. ^ 페이지, Larry, , Stanford Digital Library Project, talk.1997년 8월 18일 (2002년 기록)
  25. ^ 오스트리아 그라츠 대학교의 187페이지 분량의 연구 2014-01-16 Wayback Machine에서 보관된 문서에는 구글에서 페이지 순위를 결정할 때 인간의 두뇌도 사용된다는 내용이 포함되어 있습니다.
  26. ^ "Our products and services". Archived from the original on 2008-06-23. Retrieved 2011-05-27.
  27. ^ David Vise & Mark Malseed (2005). The Google Story. Delacorte Press. p. 37. ISBN 978-0-553-80457-7.
  28. ^ "Google Press Center: Fun Facts". Archived from the original on 2001-07-15.
  29. ^ Lisa M. Krieger (1 December 2005). "Stanford Earns $336 Million Off Google Stock". San Jose Mercury News. Archived from the original on 8 April 2009. Retrieved 2009-02-25 – via cited by redOrbit.
  30. ^ Richard Brandt. "Starting Up. How Google got its groove". Stanford magazine. Archived from the original on 2009-03-10. Retrieved 2009-02-25.
  31. ^ a b Page, Lawrence; Brin, Sergey; Motwani, Rajeev; Winograd, Terry (1999). The PageRank citation ranking: Bringing order to the Web (Report). Archived from the original on 2006-04-27.1998년 1월 29일 기술 보고서로 Page, Lawrence; Brin, Sergey; Motwani, Rajeev; Winograd, Terry (1999). The PageRank citation ranking: Bringing order to the Web (Report). Archived from the original on 2006-04-27.발간됨 PDF 보관 2011-08-18 Wayback Machine
  32. ^ 매트 커츠의 블로그:Google에서 바로 보내드립니다. What You Need to Know Archived 2010-02-07 at the Wayback Machine, 슬라이드 15페이지 참조.
  33. ^ Taher Haveliwala & Sepandar Kamvar (March 2003). "The Second Eigenvalue of the Google Matrix" (PDF). Stanford University Technical Report: 7056. arXiv:math/0307056. Bibcode:2003math......7056N. Archived (PDF) from the original on 2008-12-17.
  34. ^ Gianna M. Del Corso; Antonio Gullí; Francesco Romani (2004). "Fast PageRank Computation Via a Sparse Linear System (Extended Abstract)". Algorithms and Models for the Web-Graph. pp. 118–130. CiteSeerX 10.1.1.58.9060. doi:10.1007/978-3-540-30216-2_10. ISBN 978-3-540-23427-2. Archived from the original on 2014-02-09. {{cite book}}: journal=무시됨(도움말)
  35. ^ Arasu, A. and Novak, J. and Tomkins, A. and Tomlin, J. (2002). "PageRank computation and the structure of the web: Experiments and algorithms". Proceedings of the Eleventh International World Wide Web Conference, Poster Track. Brisbane, Australia. pp. 107–117. CiteSeerX 10.1.1.18.5264.{{cite conference}}: CS1 유지 : 여러 이름 : 저자 목록 (링크)
  36. ^ Massimo Franceschet (2010). "PageRank: Standing on the shoulders of giants". arXiv:1002.2858 [cs.IR].
  37. ^ Nicola Perra and Santo Fortunato; Fortunato (September 2008). "Spectral centrality measures in complex networks". Phys. Rev. E. 78 (3): 36107. arXiv:0805.3322. Bibcode:2008PhRvE..78c6107P. doi:10.1103/PhysRevE.78.036107. PMID 18851105. S2CID 1755112.
  38. ^ Vince Grolmusz (2015). "A Note on the PageRank of Undirected Graphs". Information Processing Letters. 115 (6–8): 633–634. arXiv:1205.1960. doi:10.1016/j.ipl.2015.02.015. S2CID 9855132.
  39. ^ Peteris Daugulis; Daugulis (2012). "A note on a generalization of eigenvector centrality for bipartite graphs and applications". Networks. 59 (2): 261–264. arXiv:1610.01544. doi:10.1002/net.20442. S2CID 1436859.
  40. ^ Atish Das Sarma; Anisur Rahaman Molla; Gopal Pandurangan; Eli Upfal (2015). "Fast Distributed PageRank Computation". Theoretical Computer Science. 561: 113–121. arXiv:1208.3071. doi:10.1016/j.tcs.2014.04.003. S2CID 10284718.
  41. ^ Susan Moskwa. "PageRank Distribution Removed From WMT". Archived from the original on October 17, 2009. Retrieved October 16, 2009.
  42. ^ Bartleman, Wil (2014-10-12). "Google Page Rank Update is Not Coming". Managed Admin. Archived from the original on 2015-04-02. Retrieved 2014-10-12.
  43. ^ Schwartz, Barry (March 8, 2016). "Google has confirmed it is removing Toolbar PageRank". Search Engine Land. Archived from the original on March 10, 2016.
  44. ^ Schwartz, Barry (18 April 2016). "Google Toolbar PageRank officially goes dark". Search Engine Land. Archived from the original on 2016-04-21.
  45. ^ Southern, Matt (2016-04-19). "Google PageRank Officially Shuts its Doors to the Public". Search Engine Journal. Archived from the original on 2017-04-13.
  46. ^ Fishkin, Rand; Jeff Pollard (April 2, 2007). "Search Engine Ranking Factors - Version 2". seomoz.org. Archived from the original on May 7, 2009. Retrieved May 11, 2009.
  47. ^ 도버, D.검색 엔진 최적화의 비밀 인디애나폴리스와일리. 2011년.
  48. ^ 비니커, D.SEO를 위한 키워드 난이도 심사의 중요성Ed. Schwartz, M. 디지털 가이드북 제5권뉴스 프레스 페이지 160-164
  49. ^ "Ranking of listings : Ranking - Google Places Help". Archived from the original on 2012-05-26. Retrieved 2011-05-27.
  50. ^ Clark, Jack. "Google Turning Its Lucrative Web Search Over to AI Machines". Bloomberg. Archived from the original on 25 March 2016. Retrieved 26 March 2016.
  51. ^ 검색 엔진 워치: Google 디렉토리가 2011년 7월 25일 종료되었습니다.
  52. ^ a b "How to report paid links". mattcutts.com/blog. April 14, 2007. Archived from the original on May 28, 2007. Retrieved 2007-05-28.
  53. ^ "Google Link Scheme" Wayback Machine 링크에서 2020-05-21년 보관
  54. ^ "Evolving". Google Developers. Retrieved 2022-02-08.
  55. ^ "So...You Think SEO Has Changed". 19 March 2014. Archived from the original on 31 March 2014.
  56. ^ Matthew Richardson & Pedro Domingos, A. (2001). The Intelligent Surfer:Probabilistic Combination of Link and Content Information in PageRank (PDF). pp. 1441–1448. Archived (PDF) from the original on 2016-03-04.
  57. ^ Mayer, Katja (2009). Deep Search: The Politics of Search beyond Google, On the Sociometry of Search Engines. Studien Verlag.
  58. ^ Pasquinelli, Matteo (2009). Deep Search: The Politics of Search beyond Google, Diagram of the Cognitive Capitalism and the Rentier of the Common Intellect. Studien Verlag.
  59. ^ Gleich, David F. (January 2015). "PageRank Beyond the Web". SIAM Review. 57 (3): 321–363. arXiv:1407.5107. doi:10.1137/140976649. S2CID 8375649.
  60. ^ Senanayake, Upul; Piraveenan, Mahendra; Zomaya, Albert (2015). "The Pagerank-Index: Going beyond Citation Counts in Quantifying Scientific Impact of Researchers". PLOS ONE. 10 (8): e0134794. Bibcode:2015PLoSO..1034794S. doi:10.1371/journal.pone.0134794. ISSN 1932-6203. PMC 4545754. PMID 26288312.
  61. ^ G. Ivan & V. Grolmusz (2011). "When the Web meets the cell: using personalized PageRank for analyzing protein interaction networks". Bioinformatics. 27 (3): 405–7. doi:10.1093/bioinformatics/btq680. PMID 21149343.
  62. ^ D. Banky and G. Ivan and V. Grolmusz (2013). "Equal opportunity for low-degree network nodes: a PageRank-based method for protein target identification in metabolic graphs". PLOS ONE. 8 (1): 405–7. Bibcode:2013PLoSO...854204B. doi:10.1371/journal.pone.0054204. PMC 3558500. PMID 23382878.
  63. ^ Burns, Judith (2009-09-04). "Google trick tracks extinctions". BBC News. Archived from the original on 2011-05-12. Retrieved 2011-05-27.
  64. ^ Benjamin M. Schmidt & Matthew M. Chingos (2007). "Ranking Doctoral Programs by Placement: A New Method" (PDF). PS: Political Science and Politics. 40 (July): 523–529. CiteSeerX 10.1.1.582.9402. doi:10.1017/s1049096507070771. S2CID 6012229. Archived (PDF) from the original on 2015-02-13.
  65. ^ Johan Bollen, Marko A. Rodriguez, and Herbert Van de Sompel.; Rodriguez; Van De Sompel (December 2006). "MESUR: Usage-based metrics of scholarly impact". Proceedings of the 7th ACM/IEEE-CS joint conference on Digital libraries. pp. 669–687. arXiv:cs.GL/0601030. Bibcode:2006cs........1030B. doi:10.1145/1255175.1255273. ISBN 9781595936448. S2CID 3115544. {{cite book}}: journal=무시됨(도움말)CS1 유지 : 여러 이름 : 저자 목록 (링크)
  66. ^ Fletcher, Jack McKay and Wennekers, Thomas (2017). "From Structure to Activity: Using Centrality Measures to Predict Neuronal Activity". International Journal of Neural Systems. 28 (2): 1750013. doi:10.1142/S0129065717500137. PMID 28076982.{{cite journal}}: CS1 유지 : 여러 이름 : 저자 목록 (링크)
  67. ^ Gupta, Pankaj; Goel, Ashish; Lin, Jimmy; Sharma, Aneesh; Wang, Dong; Zadeh, Reza (2013). "WTF: The Who to Follow Service at Twitter". Proceedings of the 22nd International Conference on World Wide Web. ACM. pp. 505–514. doi:10.1145/2488388.2488433. ISBN 9781450320351. S2CID 207205045. Retrieved 11 December 2018.
  68. ^ Ha, Anthony (2012-05-08). "Y Combinator-Backed Swiftype Builds Site Search That Doesn't Suck". TechCrunch. Archived from the original on 2014-07-06. Retrieved 2014-07-08.
  69. ^ "Working Papers Concerning the Creation of Google". Google. Archived from the original on November 28, 2006. Retrieved November 29, 2006.
  70. ^ Cho, J., Garcia-Molina, H., and Page, L. (1998). "Efficient crawling through URL ordering". Proceedings of the Seventh Conference on World Wide Web. Brisbane, Australia. Archived from the original on 2008-06-03.{{cite book}}: CS1 maint: 위치 누락 게시자 (링크) CS1 maint: 여러 이름: 작성자 목록 (링크)
  71. ^ "Yahoo! Groups". Groups.yahoo.com. Archived from the original on 2013-10-04. Retrieved 2013-10-02.
  72. ^ "CiteSeerX — Autopoietic Information Systems in Modern Organizations". CiteSeerX 10.1.1.148.9274. {{cite journal}}:저널 요구사항 인용 journal=(도움말)
  73. ^ Zack, Laurie; Lamb, Ron; Ball, Sarah (2012-12-31). "An application of Google's PageRank to NFL rankings". Involve: A Journal of Mathematics. 5 (4): 463–471. doi:10.2140/involve.2012.5.463. ISSN 1944-4184.
  74. ^ Peña, Javier López; Touchette, Hugo (2012-06-28). "A network theory analysis of football strategies". arXiv:1206.6904 [math.CO].
  75. ^ Beggs, Clive B.; Shepherd, Simon J.; Emmonds, Stacey; Jones, Ben (2017-06-02). Zhou, Wei-Xing (ed.). "A novel application of PageRank and user preference algorithms for assessing the relative performance of track athletes in competition". PLOS ONE. 12 (6): e0178458. Bibcode:2017PLoSO..1278458B. doi:10.1371/journal.pone.0178458. ISSN 1932-6203. PMC 5456068. PMID 28575009.
  76. ^ B. Jiang (2006). "Ranking spaces for predicting human movement in an urban environment". International Journal of Geographical Information Science. 23 (7): 823–837. arXiv:physics/0612011. Bibcode:2006physics..12011J. doi:10.1080/13658810802022822. S2CID 26880621.
  77. ^ Jiang B.; Zhao S. & Yin J. (2008). "Self-organized natural roads for predicting traffic flow: a sensitivity study". Journal of Statistical Mechanics: Theory and Experiment. P07008 (7): 008. arXiv:0804.1630. Bibcode:2008JSMTE..07..008J. doi:10.1088/1742-5468/2008/07/P07008. S2CID 118605727.
  78. ^ 로베르토 나블리, 미렐라 라파타"감독되지 않은 단어 감각 명료화를 위한 그래프 연결성에 관한 실험적 연구" 웨이백 머신에서 2010-12-14 보관.IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 32(4), IEEE Press, 2010, pp. 678–692.
  79. ^ M. T. 필레바르, D.쥬겐스와 R.Navigli.정렬, 명확화 및 걷기: 의미적 유사성 측정을 위한 통합 접근법.Wayback Machine에서 2013-10-01 보관.제51회 ACL(Association for Computational Linguistics) 연차총회 의사록, 불가리아 소피아, 2013년 8월 4일-9일, pp. 1341-1351
  80. ^ Andrea Esuli & Fabrizio Sebastiani. "PageRanking WordNet synsets: An Application to Opinion-Related Properties" (PDF). In Proceedings of the 35th Meeting of the Association for Computational Linguistics, Prague, CZ, 2007, pp. 424–431. Archived (PDF) from the original on June 28, 2007. Retrieved June 30, 2007.
  81. ^ "Preventing Comment Spam". Google. Archived from the original on June 12, 2005. Retrieved January 1, 2005.
  82. ^ "PageRank Sculpting: Parsing the Value and Potential Benefits of Sculpting PR with Nofollow". SEOmoz. 14 October 2008. Archived from the original on 2011-05-14. Retrieved 2011-05-27.
  83. ^ "PageRank sculpting". Mattcutts.com. 2009-06-15. Archived from the original on 2011-05-11. Retrieved 2011-05-27.

원천

관련특허

외부 링크