야시
YaCy원본 작성자 | 마이클 크리스틴 |
---|---|
개발자 | 야시 커뮤니티 |
최초 공개. | 2003;[1] | 전
안정적 해제 | 1.924 / 2020년 12월 14일; 전 |
리포지토리 | github |
기록 위치 | 자바 |
운영 체제 | 크로스 플랫폼 |
유형 | 오버레이 네트워크, 검색 엔진 |
면허증 | GPL-2.0 또는 라이터 |
웹사이트 | yacy |
YaCy("ya see"로 발음됨)는 P2P(Peer-to-Peer) 네트워크의 원리를 기반으로 구축된 무료 분산 검색 엔진이다.[2][3] 그것의 핵심은 2006년[update] 9월 현재 수백 대의 컴퓨터에 배포된 자바어로 쓰여진 컴퓨터 프로그램, 이른바 야씨피어(YaCy-peers)이다. 각 YaCy-peer는 P2P 네트워크의 원리를 사용하여 인터넷을 독립적으로 탐색하고, 발견된 웹 페이지를 분석하고 색인화하고, 색인 결과를 다른 YaCy-peer와 공유하는 공통 데이터베이스(일명 색인)에 저장한다. 누구나 자신의 인트라넷을 위한 검색 포털을 구축하고 공공 인터넷 검색을 명확히 하는데 사용할 수 있는 검색 엔진이다.
반분산 검색 엔진에 비해 야시 네트워크는 분산형 아키텍처를 가지고 있다. 모든 YaCy-peer는 동일하며 중앙 서버가 존재하지 않는다. 이는 컴퓨터에서 YaCy를 실행하는 사람이 방문한 웹 페이지를 색인화하여 탐색 모드 또는 로컬 프록시 서버로 실행될 수 있다. (사용자의 프라이버시를 보호하기 위한 여러 메커니즘이 제공된다.) 검색 기능에 대한 액세스는 검색어를 입력할 수 있는 검색 상자를 제공하고 검색 결과를 다른 인기 검색 엔진과 유사한 형식으로 반환하는 로컬 실행 웹 서버에 의해 이루어진다.
YaCy는 2003년에 Michael Christen에 의해 만들어졌다.[4]
시스템 구성 요소
YaCy 검색 엔진은 다음 네 가지 요소를 기반으로 한다.[5]
- 크롤러
- 웹 페이지 사이를 가로지르며 내용을 분석하는 검색 로봇.[6]
- 인덱서
- 역방향 단어 색인(RWI)을 작성한다. 즉, RWI의 각 단어에는 관련 URL 및 순위 정보가 수록되어 있다. 단어는 해시의 형태로 저장된다.[7]
- 검색 및 관리 인터페이스
- 로컬 HTTP 서블릿이 서블릿 엔진을 사용하여 제공하는 웹 인터페이스로 제작.[8]
- 데이터 스토리지
- 분산 해시 테이블을 사용하여 역방향 단어 색인 데이터베이스를 저장하는 데 사용된다.
검색엔진 기술
- YaCy는 사용자 인터페이스, 색인, 관리 및 모니터링을 갖춘 완전한 검색 어플라이언스다.
- YaCy는 웹 크롤러로 웹 페이지를 수집한다. 그런 다음 문서를 구문 분석하고 색인화하고 검색 색인을 로컬로 저장한다. 피어가 피어 네트워크의 일부인 경우 로컬 검색 색인도 해당 네트워크의 공유 색인으로 병합된다.
- 검색이 시작되면 로컬 인덱스가 YaCy 검색 네트워크의 피어에서 가져온 글로벌 검색 인덱스와 함께 기여한다.
- YaCy Grid는 YaCy 피어 투 피어 검색의 2세대 구현이다. YaCy Grid 설치는 MCP를 사용하여 통신하는 마이크로 서비스로 구성된다.
- YaCy Parser는 Docker를 사용하여 배포할 수 있는 마이크로 서비스다. 파서 컴포넌트가 시작되면 MCP를 검색하여 파서 컴포넌트에 연결한다. 기본적으로 로컬 호스트가 MCP를 검색하지만 직접 MCP를 구성할 수 있다.
YaCy 플랫폼 아키텍처
YaCy는 검색 엔진 인덱싱의 네트워킹, 관리 및 유지보수를 위해 블랙리스트 작성, 조정, 커뮤니티와의 커뮤니케이션 등 다양한 기술을 사용한다. YaCy가 이러한 작업을 수행하는 방법은 다음과 같다.
- 커뮤니티 구성 요소
- 웹 포럼[9]
- 통계
- XML API
- 유지 관리
- 웹 서버
- 인덱싱
- 밸런서가 있는 크롤러
- 피어 투 피어 서버 통신
- 콘텐츠 구성
- 블랙리스트 작성 및 필터링
- 검색 인터페이스
- 책갈피
- 검색 결과 모니터링
분배
YaCy는 Linux, Windows, Macintosh용 패키지와 Docker 이미지로도 이용 가능하다. YaCy는 또한 수동으로 컴파일하거나 타르볼을 사용하여 다른 운영 시스템에 설치할 수 있다.[10] YaCy는 Java 8이 필요하며 OpenJDK 8이 권장된다.
데비안 패키지는 프로젝트 웹 사이트의 하위 도메인에서 사용할 수 있는 리포지토리에서 설치할 수 있다.[11][12] 이 패키지는 아직 데비안 공식 패키지 리포지토리에 유지되지 않고 있다.[13]
참고 항목
- Duble – YaCy Search Engine Tool 위젯이 통합된 오픈 소스 웹 브라우저
참조
- ^ "Ich entwickle eine P2P-basierende Suchmaschine. Wer macht mit?". Heise Online (in German). 2003-12-15. Retrieved 2018-05-09.
- ^ "YaCy takes on Google with open source search engine". The Register. 2011-11-29. Retrieved 2012-04-16.
- ^ "YaCy: It's About Freedom, Not Beating Google". PC World. 2011-12-03. Retrieved 2012-04-16.
- ^ "Ich entwickle eine P2P-basierende Suchmaschine. Wer macht mit?". Heise Online (in German). 2003-12-15. Retrieved 2018-05-09.
- ^ "YaCy Technology Architecture". YaCy.net. Retrieved 2012-02-14.
- ^ GitHub: YaCy Grid Crawler, YaCy Search Engine, 2021-02-28, pp. yacy / yacy_grid_crawler, retrieved 2021-03-11
- ^ GitHub: YaCy Grid Parser, YaCy Search Engine, 2021-02-28, pp. The YaCy Grid is the second-generation implementation of YaCy, retrieved 2021-03-11
- ^ GitHub: YaCY Search, YaCy Search Engine, 2021-02-28, pp. yacy / yacy-search forked from cream/yacy-search, retrieved 2021-03-11
- ^ "forum.yacy.de". Retrieved 6 June 2017.
- ^ "Download - YaCy". yacy.net. Retrieved 2021-07-27.
- ^ "En:DebianInstall". YaCyWiki. Retrieved 6 October 2019.
- ^ "Dev:TaskSharing". YaCyWiki. Retrieved 6 October 2019.
- ^ "#452422 - RFP: yacy -- distributed web crawler and search engine". Debian Bug report logs. Retrieved 2 May 2020.
위키미디어 커먼즈에는 YaCy와 관련된 미디어가 있다. |