아파치 루세

Apache Lucene
루세네
Apache Lucene logo.svg
개발자아파치 소프트웨어 재단
초기 릴리즈1999; 23년 전 (1998년)
안정적 해제
9.1.0 / 2022년 3월 22일; 6일(2022-03-22)[1]
리포지토리
기록 위치자바
운영 체제크로스 플랫폼
유형검색색인
면허증아파치 라이선스 2.0
웹사이트lucene.apache.org

Apache Lucene무료 오픈소스 검색엔진 소프트웨어 라이브러리로, 원래 더그 커팅자바어로 썼다.아파치 소프트웨어 재단이 지원하고 아파치 소프트웨어 라이센스로 출시된다.루센은 비연구 검색 애플리케이션의 표준 기반으로 널리 사용되고 있다.[2][3][4]

Lucene은 Object Pascal, Perl, C#, C++, Python, Ruby, PHP를 포함한 다른 프로그래밍 언어에 포팅되어 있다.[5]

역사

Doug Cutting은 원래 1999년에 Lucene을 썼다.[6]루센은 이전에 제록스 PARC에서 2번, 애플에서 1번, 익사이츠에서 4번을 쓴 그의 다섯 번째 검색 엔진이었다.[7]그것은 처음에 SourceForge 웹사이트의 집에서 다운로드 받을 수 있었다.2001년 9월 Apache Software Foundation의 자카르타 오픈소스 Java 제품군에 가입하였고, 2005년 2월 자체 최고 수준의 아파치 프로젝트가 되었다.루세라는 이름은 더그 커팅의 아내의 중간 이름과 외할머니의 첫 번째 이름이다.[8]

루세네는 이전에는 루세네와 같은 여러 하위 프로젝트를 포함했다.NET, Mahout, Tika, Nutch.이 세 가지는 이제 독립된 최상위 프로젝트다.

2010년 3월에는 아파치솔러 검색 서버가 루세네 하위 프로젝트로 가입해 개발자 커뮤니티를 합병했다.

버전 4.0은 2012년 10월 12일에 발매되었다.[9]

2021년 3월 루세네는 로고를 바꾸었고, 아파치 솔러는 루세로부터 독립하여 다시 아파치 최고 수준의 프로젝트가 되었다.

특징 및 공통 사용

전체 텍스트 인덱싱 및 검색 기능이 필요한 모든 애플리케이션에 적합하지만, 루세네는 인터넷 검색 엔진과 로컬 단일 사이트 검색의 구현에서 그 효용성을 인정받고 있다.[10][11]

Lucene에는 편집 거리를 기반으로 퍼지 검색을 수행하는 기능이 포함되어 있다.[12]

루센은 또한 추천 시스템을 구현하는데 사용되었다.[13]예를 들어 루센의 'MoreLike'가 있다.이 클래스는 유사한 문서에 대한 권장사항을 생성할 수 있다.'MoreLike'의 벡터 기반 유사성 접근법 용어 비교이것은 공동화 및 공동화 근접도 분석과 같은 인용 기반의 문서 유사성 측정을 통해 루센의 접근방식은 매우 유사한 구조적 특성과 보다 좁은 관련성을 가진 문서를 추천하는 데 탁월했다.[14]이와는 대조적으로 인용 기반 문서 유사성 측정은 보다 광범위하게 관련된 문서를 권고하는 데 더 적합한 경향이 있었으며,[14] 이는 인용 기반 접근법이 텍스트 내 인용구를 포함하는 한 우연한 권고안을 생성하는 데 더 적합할 수 있다는 것을 의미한다.

Lucene 기반 프로젝트

Lucene 자체는 인덱싱 및 검색 라이브러리에 불과하며 탐색 및 HTML 구문 분석 기능을 포함하지 않는다.그러나 몇 가지 프로젝트는 루센의 능력을 확장한다.

참고 항목

참조

  1. ^ "Welcome to Apache Lucene". Lucene™ News section. Archived from the original on 12 February 2020. Retrieved 12 February 2020.
  2. ^ Kamphuis, Chris; de Vries, Arjen P.; Boytsov, Leonid; Lin, Jimmy (2020), Jose, Joemon M.; Yilmaz, Emine; Magalhães, João; Castells, Pablo (eds.), "Which BM25 Do You Mean? A Large-Scale Reproducibility Study of Scoring Variants", Advances in Information Retrieval, Cham: Springer International Publishing, 12036: 28–34, doi:10.1007/978-3-030-45442-5_4, ISBN 978-3-030-45441-8, PMC 7148026, retrieved 2021-06-07
  3. ^ Grand, Adrien; Muir, Robert; Ferenczi, Jim; Lin, Jimmy (2020), Jose, Joemon M.; Yilmaz, Emine; Magalhães, João; Castells, Pablo (eds.), "From MAXSCORE to Block-Max Wand: The Story of How Lucene Significantly Improved Query Evaluation Performance", Advances in Information Retrieval, Cham: Springer International Publishing, 12036: 20–27, doi:10.1007/978-3-030-45442-5_3, ISBN 978-3-030-45441-8, PMC 7148045, retrieved 2021-06-07
  4. ^ Azzopardi, Leif; Moshfeghi, Yashar; Halvey, Martin; Alkhawaldeh, Rami S.; Balog, Krisztian; Di Buccio, Emanuele; Ceccarelli, Diego; Fernández-Luna, Juan M.; Hull, Charlie; Mannix, Jake; Palchowdhury, Sauparna (2017-02-14). "Lucene4IR: Developing Information Retrieval Evaluation Resources using Lucene". ACM SIGIR Forum. 50 (2): 58–75. doi:10.1145/3053408.3053421. ISSN 0163-5840.
  5. ^ "LuceneImplementations". apache.org. Archived from the original on 6 October 2015. Retrieved 23 September 2015.
  6. ^ 키워드애널리저
  7. ^ Cutting, Doug (2019-06-07). "I wrote a couple of search engines at Xerox PARC, then V-Twin at Apple, then re-wrote Excite's search, then Lucene. So, Lucene might be considered V-Twin 3.0? Almost 25 years later, V-Twin still lives on as Mac OS X Search Kit!". @cutting. Retrieved 2019-06-19.
  8. ^ Barker, Deane (2016). Web Content Management. O'Reilly. p. 233. ISBN 978-1491908105.
  9. ^ "Apache Lucene - Welcome to Apache Lucene". apache.org. Archived from the original on 4 February 2016. Retrieved 4 February 2016.
  10. ^ McCandless, Michael; Hatcher, Erik; Gospodnetić, Otis (2010). Lucene in Action, Second Edition. Manning. p. 8. ISBN 978-1933988177.
  11. ^ "GNU/Linux Semantic Storage System" (PDF). glscube.org. Archived from the original (PDF) on 2010-06-01.
  12. ^ "Apache Lucene - Query Parser Syntax". lucene.apache.org. Archived from the original on 2017-05-02.
  13. ^ J. Beel, S. Langer, B.Gipp, 2014년 영국 런던 ACM/IEEE 디지털 라이브러리 공동 컨퍼런스(JCDL 2014)에서 열린 제3회 채굴 과학 출판 국제 워크숍(WOSP 2014) 진행 중 "도씨어 연구 논문 추천자 시스템의 아키텍처 및 데이터 집합"
  14. ^ a b M. Schwarzer, M. Schubotz, N. Meuschke, C. Breinger, V. Markl, B.Gipp, https://www.gipp.com/wp-content/papercite-data/pdf/schwarzer2016.pdf "제16회 ACM/IEEE-CS 디지털 라이브러리 공동 회의(JCDL), 뉴욕, 미국, 2016, 페이지 191-200"의 "Webedia에 대한 링크 기반 권장사항 평가"
  15. ^ "The Future of Compass & Elasticsearch". the dude abides. Archived from the original on 2015-10-15. Retrieved 2015-10-14.
  16. ^ Wayner, Peter. "11 cutting-edge databases worth exploring now". InfoWorld. Archived from the original on 21 September 2015. Retrieved 21 September 2015.
  17. ^ "Elasticsearch: RESTful, Distributed Search & Analytics - Elastic". elastic.co. Archived from the original on 8 October 2015. Retrieved 23 September 2015.
  18. ^ a b Natividad, Angela. "Socialtext Updates Search, Goes Kino". CMS Wire. Archived from the original on 2012-09-29. Retrieved 2011-05-31.
  19. ^ Marvin Humphrey. "KinoSearch - Search engine library. - metacpan.org". p3rl.org. Retrieved 23 September 2015.
  20. ^ Diment, Kieren; Trout, Matt S (2009). "Catalyst Cookbook". The Definitive Guide to Catalyst. Apress. p. 280. ISBN 978-1-4302-2365-8.
  21. ^ Wishart, D. S.; et al. (January 2009). "HMDB: a knowledgebase for the human metabolome". Nucleic Acids Res. 37 (Database issue): D603–10. doi:10.1093/nar/gkn810. PMC 2686599. PMID 18953024.
  22. ^ Lim, Emilia; Pon, Allison; Djoumbou, Yannick; Knox, Craig; Shrivastava, Savita; Guo, An Chi; Neveu, Vanessa; Wishart, David S. (January 2010). "T3DB: a comprehensively annotated database of common toxins and their targets". Nucleic Acids Res. 38 (Database issue): D781–6. doi:10.1093/nar/gkp934. PMC 2808899. PMID 19897546.

참고 문헌 목록

외부 링크