Trust Rank

TrustRank

TrustRank는 유용한 페이지를 스팸으로부터 분리하기 위해 링크 분석을 수행하는 알고리즘으로 검색 엔진이 SERP(Search Engine Results Pages)에서 페이지 순위를 매길 수 있도록 지원합니다.이것은 반자동 프로세스로, 제대로 작동하기 위해서는 인간의 도움이 필요합니다.검색 엔진에는 웹 페이지의 품질을 측정할 때 사용하는 다양한 알고리즘과 순위 요소가 있습니다.Trust Rank도 그 중 하나입니다.

인터넷의 수동 검토는 비현실적이고 매우 비용이 많이 들기 때문에 TrustRank는 이 작업을 훨씬 더 빠르고 저렴하게 수행할 수 있도록 하기 위해 도입되었습니다.2004년 [1]미국 스탠퍼드 대학의 졸탄 경이, 헥터 가르시아 몰리나, 야후의 얀 페더슨 연구진이 웹 스팸과 TrustRank의 비교라는 논문에서 처음 소개했습니다.오늘날, 이 알고리즘은 야후와 구글과 같은 주요 웹 검색 엔진의 일부이다.[2]

웹 검색 엔진이 결과를 반환할 때 웹 페이지의 품질을 결정하는 데 도움이 되는 가장 중요한 요소 중 하나는 백링크입니다.검색 엔진은 SERP의 특정 웹 페이지에 플레이스를 할당할 때 백링크의 수와 품질을 고려합니다.많은스팸 페이지는 검색 엔진을 오도할 목적으로만 생성됩니다.주로 상업적 이유로 만들어진 이 페이지들은 검색 엔진의 결과 페이지에서 필요 이상으로 높은 순위를 얻기 위해 다양한 기술을 사용합니다.인간 전문가들이 스팸을 쉽게 식별할 수 있는 반면, 검색 엔진은 여전히 인간의 도움 없이 스팸을 하기 위해 매일 개선되고 있다.

순위를 향상시키는 인기 있는 방법 중 하나는 복잡한 연결 방식을 통해 문서의 인식 중요성을 높이는 것입니다.구글의 페이지랭크와 다른 검색 순위 알고리즘은 이러한 조작을 받고 있다.

TrustRank는 신뢰성에 따라 웹을 필터링하여 스팸을 퇴치하려고 합니다.이 방법에서는 전문가가 평가할 시드 페이지 세트를 선택해야 합니다.평판이 좋은 시드 페이지를 수동으로 식별하면 시드 세트에서 바깥쪽으로 확장되는 크롤이 마찬가지로 신뢰성이 높고 신뢰할 수 있는 페이지를 찾습니다.문서와 시드 세트 사이의 거리가 길어지면 TrustRank의 신뢰성이 떨어집니다.

이 논리는 반독점 순위라고 불리는 반대 방향으로도 작용한다.사이트가 스팸 리소스에 가까울수록 [3]스팸일 가능성도 높아집니다.

TrustRank 방법론을 제안한 연구진은 스팸 매스 측정 등 관련 주제를 평가함으로써 작업을 지속적으로 개선해 왔습니다.

참고 항목

레퍼런스

  1. ^ Gyongyi, Zoltan; Garcia-Molina, Hector (2004). Combating Web Spam with TrustRank (PDF). Proceedings of the 30th VLDB Conference. Toronto, Canada. Retrieved 26 May 2022.
  2. ^ 7603350, 라마나단 구하, "미국 특허: 7603350 - 신뢰에 근거한 검색 결과 순위", 2009년 10월 13일 발행
  3. ^ Krishnan, Vijay; Raj, Rashmi. "Web Spam Detection with Anti-Trust Rank" (PDF). Stanford University. Retrieved 11 January 2015.

외부 링크