수직 검색

Vertical search

수직 검색 엔진은 온라인 컨텐츠의 특정 세그먼트에 초점을 맞춘다는 점에서 일반적인 웹 검색 엔진과 다릅니다.전문 검색 엔진 또는 시사 검색 엔진이라고도 합니다.수직 콘텐츠 영역은 주제, 미디어 유형 또는 콘텐츠 장르에 기반할 수 있습니다.일반적인 분야에는 쇼핑, 자동차 산업, 법률 정보, 의료 정보, 학술 문헌, 구직 및 여행이 포함됩니다.수직 검색 엔진의 예로는 의회도서관, 모카보, 누로아, 트룰리아, 옐프 이 있다.

크롤러를 사용하여 월드 와이드 웹의 많은 부분을 인덱싱하려는 일반적인 웹 검색 엔진과 달리 수직 검색 엔진은 일반적으로 미리 정의된 토픽 또는 토픽 세트에 관련 웹 페이지만 인덱싱하는 집중형 크롤러를 사용합니다.일부 수직 검색 사이트는 개별 수직에 초점을 맞추고 다른 사이트는 단일 검색 엔진 내에 여러 수직 검색을 포함합니다.

혜택들

수직 검색은 일반 검색 엔진에 비해 몇 가지 잠재적인 이점을 제공합니다.

  • 범위가 한정되어 있기 때문에 정밀도가 향상됩니다.
  • 분류법이나 온톨로지 등 도메인 지식을 활용한다.
  • 특정 고유 사용자 작업 지원.

수직 검색은 기업, 정부 또는 기타 조직과 같은 관심 영역이 있는 기업 검색과 유사하다고 볼 수 있습니다.2013년에는 Find The Best와 같은 수직 검색 엔진을 통합한 소비자 가격 비교 웹사이트에서 대규모 벤처 캐피털 자금을 유치하여 수직 검색 기술의 [1][2]응용에 대한 성장 추세를 나타냈습니다.

도메인 고유의 검색

도메인 고유의 수직은 특정 토픽에 초점을 맞춥니다.John Battelle은 이것을 저서 The Search(2005)에서 설명하고 있습니다.

도메인 고유의 검색 솔루션은 하나의 지식 영역에 초점을 맞추어 맞춤형 검색 환경을 만듭니다. 도메인의 제한된 말뭉치와 개념 간의 명확한 관계 때문에 검색자에게 [3]매우 적절한 결과를 제공합니다.

모든 일반 검색 엔진은 문서를 수집하기 위해 모든 페이지와 검색을 너비 우선 방식으로 인덱싱합니다.도메인별 검색 엔진에서의 탐색은 특정 세트에 초점을 맞추어 문서의 작은 부분 집합을 보다 효율적으로 검색합니다.강화 학습 프레임워크로 달성한 스파킹은 폭 우선 [4]검색보다 3배 더 효율적인 것으로 나타났다.

DARPA의 Memex 프로그램

2014년 초 국방고등연구계획청(DARPA)은 웹사이트에 텍스트 기반 [5]검색의 한계를 극복하고 새로운 검색 기술을 개발하는 것을 목표로 하는 "메멕스 프로그램"의 예비 세부 사항을 요약한 성명을 발표했다.DARPA는 이 연구에서 개발된 Memex 기술을 딥 에서 정보를 검색할 수 있는 검색 엔진에 사용할 수 있기를 바라고 있습니다.이것은 구글이나 야후와 같은 상용 검색 엔진에서는 거의 도달할 수 없는 인터넷 부분입니다.DARPA의 웹사이트는 "사용자가 자신의 관심사와 관련된 정보의 서브셋을 빠르고 철저하게 정리하고 검색할 수 있도록 정보와 상호작용하고 공유하기 위한 더 나은 방법을 개발하는 것이 목표"[6]라고 기술하고 있다.2015년 Wired 기사에서 보도된 바와 같이, Memex 프로그램에서 개발되고 있는 검색 기술은 " 집행 기관과 다른 사람들이 불법 활동을 추적하는 데 도움이 되는 어두운 웹을 조명하고 온라인 데이터의 패턴과 관계를 밝혀내는 것을 목표로 한다."[7]DARPA는 이 프로그램이 상용 검색 엔진에 의해 사용되는 중앙 집중식 절차를 대체하는 것을 의도하고 있으며, "새로운 도메인별 인덱싱 및 검색 패러다임의 작성은 향상된 콘텐츠 검색, 정보 추출, 정보 검색, 사용자 협업 및 현재 검색 기능의 확장을 위한 메커니즘을 제공할 것입니다.특히 딥 웹, 다크 웹, 비전통적인(멀티미디어 등)[8] 콘텐츠에 대해 설명합니다."DARPA는 이 프로그램에 대한 설명에서 이 프로그램의 이름을 부시 대통령의 독창적인 메멕스 발명에 경의를 표하는 것으로 설명하고 있으며,[5] 이는 영감이 되었다.

2015년 4월, Memex의 일부가 오픈 [9]소스로 제공될 것이라고 발표되었습니다.모듈을 다운로드할 [8]수 있었다.

레퍼런스

  1. ^ Rao, Leena. "Data-Driven Comparison Shopping Platform FindTheBest Raises $11M From New World, Kleiner Perkins And Others". TechCrunch. Retrieved 27 May 2013.
  2. ^ HO, VICTORIA. "Asian Price Comparison Site Save 22 Gets Angel Round Of "Mid Six Figures"". Retrieved 27 May 2013.
  3. ^ Battelle, John (2005). The Search: How Google and its Rivals Rewrote the Rules of Business and Transformed Our Culture. New York: Portfolio.
  4. ^ McCallum, Andrew (1999). "A Machine Learning Approach to Building Domain-Specific Search Engines". IJCAI. 99: 662–667. CiteSeerX 10.1.1.88.3818.
  5. ^ a b "Memex Aims to Create a New Paradigm for Domain-Specific Search" (Press release). DARPA. February 9, 2014. Archived from the original on February 11, 2015. Retrieved February 11, 2015.
  6. ^ "Memex (Domain-Specific Search)". www.darpa.mil. Retrieved 2016-09-21.
  7. ^ Kim Zetter (February 2, 2015). "Darpa Is Developing a Search Engine for the Dark Web". Wired.
  8. ^ a b "Memex (Domain-Specific Search)". DARPA. Archived from the original on June 10, 2015. Retrieved April 20, 2015.
  9. ^ Forbes (April 17, 2015). "Watch Out Google, DARPA Just Open Sourced All This Swish 'Dark Web' Search Tech". Forbes. Retrieved April 20, 2015.