아파치 루세
Apache Lucene개발자 | 아파치 소프트웨어 재단 |
---|---|
초기 릴리즈 | 1999; | 전 (
안정적 해제 | 9.1.0 / 2022년 3월 22일;[1] 전 |
리포지토리 | |
기록 위치 | 자바 |
운영 체제 | 크로스 플랫폼 |
유형 | 검색 및 색인 |
면허증 | 아파치 라이선스 2.0 |
웹사이트 | lucene |
Apache Lucene은 무료 오픈소스 검색엔진 소프트웨어 라이브러리로, 원래 더그 커팅이 자바어로 썼다.아파치 소프트웨어 재단이 지원하고 아파치 소프트웨어 라이센스로 출시된다.루센은 비연구 검색 애플리케이션의 표준 기반으로 널리 사용되고 있다.[2][3][4]
Lucene은 Object Pascal, Perl, C#, C++, Python, Ruby, PHP를 포함한 다른 프로그래밍 언어에 포팅되어 있다.[5]
역사
Doug Cutting은 원래 1999년에 Lucene을 썼다.[6]루센은 이전에 제록스 PARC에서 2번, 애플에서 1번, 익사이츠에서 4번을 쓴 그의 다섯 번째 검색 엔진이었다.[7]그것은 처음에 SourceForge 웹사이트의 집에서 다운로드 받을 수 있었다.2001년 9월 Apache Software Foundation의 자카르타 오픈소스 Java 제품군에 가입하였고, 2005년 2월 자체 최고 수준의 아파치 프로젝트가 되었다.루세라는 이름은 더그 커팅의 아내의 중간 이름과 외할머니의 첫 번째 이름이다.[8]
루세네는 이전에는 루세네와 같은 여러 하위 프로젝트를 포함했다.NET, Mahout, Tika, Nutch.이 세 가지는 이제 독립된 최상위 프로젝트다.
2010년 3월에는 아파치솔러 검색 서버가 루세네 하위 프로젝트로 가입해 개발자 커뮤니티를 합병했다.
버전 4.0은 2012년 10월 12일에 발매되었다.[9]
2021년 3월 루세네는 로고를 바꾸었고, 아파치 솔러는 루세로부터 독립하여 다시 아파치 최고 수준의 프로젝트가 되었다.
특징 및 공통 사용
전체 텍스트 인덱싱 및 검색 기능이 필요한 모든 애플리케이션에 적합하지만, 루세네는 인터넷 검색 엔진과 로컬 단일 사이트 검색의 구현에서 그 효용성을 인정받고 있다.[10][11]
Lucene에는 편집 거리를 기반으로 퍼지 검색을 수행하는 기능이 포함되어 있다.[12]
루센은 또한 추천 시스템을 구현하는데 사용되었다.[13]예를 들어 루센의 'MoreLike'가 있다.이 클래스는 유사한 문서에 대한 권장사항을 생성할 수 있다.'MoreLike'의 벡터 기반 유사성 접근법 용어 비교이것은 공동화 및 공동화 근접도 분석과 같은 인용 기반의 문서 유사성 측정을 통해 루센의 접근방식은 매우 유사한 구조적 특성과 보다 좁은 관련성을 가진 문서를 추천하는 데 탁월했다.[14]이와는 대조적으로 인용 기반 문서 유사성 측정은 보다 광범위하게 관련된 문서를 권고하는 데 더 적합한 경향이 있었으며,[14] 이는 인용 기반 접근법이 텍스트 내 인용구를 포함하는 한 우연한 권고안을 생성하는 데 더 적합할 수 있다는 것을 의미한다.
Lucene 기반 프로젝트
Lucene 자체는 인덱싱 및 검색 라이브러리에 불과하며 탐색 및 HTML 구문 분석 기능을 포함하지 않는다.그러나 몇 가지 프로젝트는 루센의 능력을 확장한다.
- Apache Nutch – 웹 탐색 및 HTML 구문[citation needed] 분석 제공
- Apache Solr – 엔터프라이즈 검색 서버
- 나침반 – Elasticsearch의[15] 전신
- CrateDB – Lucene을[16] 기반으로 구축된 오픈 소스 분산 SQL 데이터베이스
- DocFetcher – 멀티패턴 데스크톱 검색 애플리케이션[citation needed]
- Elasticsearch – 2010년에[17] 출시된 엔터프라이즈 검색 서버
- 키노세아치 – Perl과[18] C로 작성된 검색 엔진과 느슨한 Lucene 항구.[19]소셜텍스트 위키 소프트웨어는 이 검색엔진을 사용하며,[18] 모조모조위키도 마찬가지다.[20]인체대사 데이터베이스(HMDB)[21]와 독소 및 독소 대상 데이터베이스(T3DB)에서도 사용된다.[22]
- MongoDB Atlas Search – MongoDB 및 Apache Lucene 기반의 클라우드 네이티브 엔터프라이즈 검색 애플리케이션
- OpenSearch – ElasticSearch 7의 포크를 기반으로 하는 오픈 소스 엔터프라이즈 검색 서버
- Swiftype – Lucene 기반 엔터프라이즈 검색 시작
참고 항목
참조
- ^ "Welcome to Apache Lucene". Lucene™ News section. Archived from the original on 12 February 2020. Retrieved 12 February 2020.
- ^ Kamphuis, Chris; de Vries, Arjen P.; Boytsov, Leonid; Lin, Jimmy (2020), Jose, Joemon M.; Yilmaz, Emine; Magalhães, João; Castells, Pablo (eds.), "Which BM25 Do You Mean? A Large-Scale Reproducibility Study of Scoring Variants", Advances in Information Retrieval, Cham: Springer International Publishing, 12036: 28–34, doi:10.1007/978-3-030-45442-5_4, ISBN 978-3-030-45441-8, PMC 7148026, retrieved 2021-06-07
- ^ Grand, Adrien; Muir, Robert; Ferenczi, Jim; Lin, Jimmy (2020), Jose, Joemon M.; Yilmaz, Emine; Magalhães, João; Castells, Pablo (eds.), "From MAXSCORE to Block-Max Wand: The Story of How Lucene Significantly Improved Query Evaluation Performance", Advances in Information Retrieval, Cham: Springer International Publishing, 12036: 20–27, doi:10.1007/978-3-030-45442-5_3, ISBN 978-3-030-45441-8, PMC 7148045, retrieved 2021-06-07
- ^ Azzopardi, Leif; Moshfeghi, Yashar; Halvey, Martin; Alkhawaldeh, Rami S.; Balog, Krisztian; Di Buccio, Emanuele; Ceccarelli, Diego; Fernández-Luna, Juan M.; Hull, Charlie; Mannix, Jake; Palchowdhury, Sauparna (2017-02-14). "Lucene4IR: Developing Information Retrieval Evaluation Resources using Lucene". ACM SIGIR Forum. 50 (2): 58–75. doi:10.1145/3053408.3053421. ISSN 0163-5840.
- ^ "LuceneImplementations". apache.org. Archived from the original on 6 October 2015. Retrieved 23 September 2015.
- ^ 키워드애널리저
- ^ Cutting, Doug (2019-06-07). "I wrote a couple of search engines at Xerox PARC, then V-Twin at Apple, then re-wrote Excite's search, then Lucene. So, Lucene might be considered V-Twin 3.0? Almost 25 years later, V-Twin still lives on as Mac OS X Search Kit!". @cutting. Retrieved 2019-06-19.
- ^ Barker, Deane (2016). Web Content Management. O'Reilly. p. 233. ISBN 978-1491908105.
- ^ "Apache Lucene - Welcome to Apache Lucene". apache.org. Archived from the original on 4 February 2016. Retrieved 4 February 2016.
- ^ McCandless, Michael; Hatcher, Erik; Gospodnetić, Otis (2010). Lucene in Action, Second Edition. Manning. p. 8. ISBN 978-1933988177.
- ^ "GNU/Linux Semantic Storage System" (PDF). glscube.org. Archived from the original (PDF) on 2010-06-01.
- ^ "Apache Lucene - Query Parser Syntax". lucene.apache.org. Archived from the original on 2017-05-02.
- ^ J. Beel, S. Langer, B.Gipp, 2014년 영국 런던 ACM/IEEE 디지털 라이브러리 공동 컨퍼런스(JCDL 2014)에서 열린 제3회 채굴 과학 출판 국제 워크숍(WOSP 2014) 진행 중 "도씨어 연구 논문 추천자 시스템의 아키텍처 및 데이터 집합"
- ^ a b M. Schwarzer, M. Schubotz, N. Meuschke, C. Breinger, V. Markl, B.Gipp, https://www.gipp.com/wp-content/papercite-data/pdf/schwarzer2016.pdf "제16회 ACM/IEEE-CS 디지털 라이브러리 공동 회의(JCDL), 뉴욕, 미국, 2016, 페이지 191-200"의 "Webedia에 대한 링크 기반 권장사항 평가"
- ^ "The Future of Compass & Elasticsearch". the dude abides. Archived from the original on 2015-10-15. Retrieved 2015-10-14.
- ^ Wayner, Peter. "11 cutting-edge databases worth exploring now". InfoWorld. Archived from the original on 21 September 2015. Retrieved 21 September 2015.
- ^ "Elasticsearch: RESTful, Distributed Search & Analytics - Elastic". elastic.co. Archived from the original on 8 October 2015. Retrieved 23 September 2015.
- ^ a b Natividad, Angela. "Socialtext Updates Search, Goes Kino". CMS Wire. Archived from the original on 2012-09-29. Retrieved 2011-05-31.
- ^ Marvin Humphrey. "KinoSearch - Search engine library. - metacpan.org". p3rl.org. Retrieved 23 September 2015.
- ^ Diment, Kieren; Trout, Matt S (2009). "Catalyst Cookbook". The Definitive Guide to Catalyst. Apress. p. 280. ISBN 978-1-4302-2365-8.
- ^ Wishart, D. S.; et al. (January 2009). "HMDB: a knowledgebase for the human metabolome". Nucleic Acids Res. 37 (Database issue): D603–10. doi:10.1093/nar/gkn810. PMC 2686599. PMID 18953024.
- ^ Lim, Emilia; Pon, Allison; Djoumbou, Yannick; Knox, Craig; Shrivastava, Savita; Guo, An Chi; Neveu, Vanessa; Wishart, David S. (January 2010). "T3DB: a comprehensively annotated database of common toxins and their targets". Nucleic Acids Res. 38 (Database issue): D781–6. doi:10.1093/nar/gkp934. PMC 2808899. PMID 19897546.
참고 문헌 목록
- Gospodnetic, Otis; Erik Hatcher; Michael McCandless (28 June 2009). Lucene in Action (2nd ed.). Manning Publications. ISBN 978-1-9339-8817-7.
- Gospodnetic, Otis; Erik Hatcher (1 December 2004). Lucene in Action (1st ed.). Manning Publications. ISBN 978-1-9323-9428-3.