LGTE
LGTELGTE(Lucene Geographic and Temporary)는 리스본 공과대학에서 개발한 정보 검색 도구로, 연구 목적의 정보 검색 기법에 대한 검색 엔진이나 평가 시스템으로 사용할 수 있다. LGTE에 의해 구동된 첫 번째 구현은 DIGMAP의 검색 엔진으로, 2006년과 2008년 사이에 커뮤니티 프로그램 eContentplus가 공동 출자한 프로젝트로서, 여러 개의 National Libraries를 포함한 유럽 전역의 파트너 그룹으로부터 오래된 디지털화된 지도를 통해 웹에서 이용 가능한 서비스를 제공하는 것을 목표로 하였다.
LGTE 도구는 루세 도서관 주변의 자바 프로그래밍 언어로 구축되어 전체 텍스트 검색을 할 수 있으며 지리적, 시간적 정보를 처리하기 위한 여러 확장자를 도입하였다. 또한 이 패키지에는 CLEF/TREC(Cross Language Evaluation Forum/Text Research Conference) 주제 및 문서 모음 등의 정보 검색 평가를 위한 유틸리티가 포함되어 있다.
기술적으로 LGTE는 루세 상단의 레이어로서 스니펫 생성, 쿼리 확장 등 여러 서비스를 통합할 수 있는 확장형 루세 API를 제공한다. LGTE는 새로운 확률론적 모델을 구현할 기회를 제공한다. API는 원래 암스테르담 대학의 연구원들이 ILPS(Information and Language Processing Systems) 그룹이 개발한 소프트웨어 도구인 Lucene-lm에서 만든 루세네 수준의 수정 세트에 의존한다. 당시 이 도구는 오카피 BM25 모델과 다항 언어 모델에 대해 성공적으로 테스트를 거쳤으나 랜덤성 모델과의 차이도 포함한다.
LGTE 1.1.9 이상 버전도 서로 다른 인덱스 폴더에서 인덱스 필드를 분리할 수 있는 가능성을 제공한다. 또 다른 최근의 특징은 외부 키 필드를 사용한 계층형 인덱스 구성이다. 이것은 예를 들어 전체 페이지의 일반 점수와 결합된 문장의 본문을 바탕으로 점수를 만들 기회를 준다.
특징들
- 다른 폴더를 사용하여 격리된 필드 제공
- 외부 키 필드를 통해 계층형 인덱스 제공
- Yahoo PlaceMaker를 사용하여 문서를 구문 분석하는 클래스 제공
- Lucene 위에 단순하고 효과적인 추상화 계층 제공
- 주제, 시간 및 지리적 측면을 기반으로 통합 검색 및 순위를 지원한다.
- Lucene 표준 검색 모델 및 보다 진보된 확률적 검색 접근법을 지원한다.
- Rochio Query Expansion 지원
- IR 평가 실험의 프레임워크(예: CLEF/TREC 주제 처리)를 제공한다.
- trec_eval 툴에 대한 Java 대안이 포함되어 런 쌍에 걸쳐 유의성 테스트를 수행할 수 있다.
- 브라운 코퍼스 또는 크랜필드 코퍼스를 검색하기 위한 간단한 테스트 어플리케이션을 포함한다.
참고 문헌 목록
- 호르헤 마차도, 브루노 마르틴스, 호세 보르비냐, 길베르토 페드로사 "LGTE: 시스테마 아보르테오르테오르카상 데 인포메타상 텍스트얼, 지오그라피카 e Temporal"II JORNADAS SASIG, Evora, 2009년 11월 2-4일.
- Jorge Machado, Bruno Martins, José Borbinha "Experiments with N-Gram Prefixes on a Multinomial Language Model versus Lucene’s off-the-shelf ranking scheme and Rocchio Query Expansion (TEL@CLEF Monolingual Task)", European Conference of Digital Libraries/Cross Language Evaluation Forum of Cross Language Evaluation Forum, Corfu Greece, 2009.
- 호르헤 마차도, 길베르토 페드로사, 호세 보르비냐 "LGTE: Lucene Extensions for Geo-Temporal Information Research", 유럽 정보 검색 회의/지리학 정보 인터넷 워크샵, 툴루즈, 2009
- 호르헤 마차도, 길베르토 페드로사, 호세 보르비냐 "DIGMAP 구성요소를 이용한 지리 임시 검색 서비스를 위한 사용자 인터페이스" 2009년 코르푸 그리스 유럽 도서관 회의 스프링거 LNCS 절차서.
- Jorge Machado, Gilberto Pedrosa, José Borbinha "Experiments on a Multinomial Language Model versus Lucene’s off-the-shelf ranking scheme and Rochio Query Expansion (TEL@CLEF Monolingual Task) ", European Conference of Digital Libraries/in Springer LNCS proceedings of Cross Language Evaluation Forum, Ahrus, 2008.