당근2
Carrot2Carrot2's Lingo 알고리즘을 사용하여 클러스터된 웹 검색 결과. | |
| 개발자 | 당근 검색 |
|---|---|
| 안정적 해제 | 4.4.2 / 2022년 1월 10일 |
| 리포지토리 | github |
| 기록 위치 | 자바 |
| 운영 체제 | 크로스 플랫폼 |
| 유형 | 텍스트 마이닝 및 클러스터 분석 |
| 면허증. | BSD 라이선스 |
| 웹사이트 | search |
당근²는 오픈 소스[1] 검색 결과 클러스터링 엔진이다.[2]검색 결과 또는 문서 개요와 같은 작은 문서 컬렉션을 주제 범주로 자동 클러스터링할 수 있다.당근²는 자바로 작성되며 BSD 라이선스에 따라 배포된다.null
역사
Carroat²의 초기 버전은 2001년에 Dawid Weiss가 MSc 논문의 일환으로 폴란드어로 검색 결과를 클러스터링하는 STC 클러스터링 알고리즘의 적용 가능성을 검증하기 위해 구현되었다.[3]2003년에는 검색 결과의 클러스터링을 위해 특별히 고안된 참신한 텍스트 클러스터링 알고리즘인 링고를 포함하여 많은 다른 검색 결과 클러스터링 알고리즘이 추가되었다.[4]당근²의 소스 코드는 2002년 이후 사용할 수 있었지만, 버전 1.0이 공식적으로 출시된 것은 2006년에 불과했다.같은 해 향상된 사용자 인터페이스와 확장 툴 세트로 버전 2.0이 출시되었다.2009년 버전 3.0은 Eclipse Rich Client Platform에 기반한 클러스터링 조정을 위한 클러스터링 품질, 간소화된 API, 새로운 GUI 애플리케이션을 크게 개선하였다.2020년에 버전 4.0.0은 API, 코드 정리 및 데스크톱 Workbench의 제거를 더욱 단순화시켰다.버전 4.1.0은 Workbench를 웹 기반 애플리케이션으로 다시 제공한다.null
| 해제 | 릴리스 날짜 | 주요 변경 사항 및 새로운 기능 |
|---|---|---|
| 4.4.0, 4.4.1, 4.4.2 | 2021년 12월 | 보안 수정 및 종속성 업데이트.null |
| 4.3.0 | 2021년 7월 | 사소한 API 변경 및 버그 수정.작업대 개선(DCS 검색 프런트엔드).null |
| 4.2.0, 4.2.1 | 2021년 3월 | JSON 사전 및 워크벤치 개선.버그 수정.null |
| 4.1.0 | 2021년 1월 | 웹 기반 Workbench.JSON 사전 및 새 필터링 옵션.API 연마.null |
| 4.0.0 | 2020년 7월 | 코드베이스 전반에서 API 변경 및 단순화사용되지 않는 기술과 도구의 제거.새 문서 및 코드 정리.null |
| 3.16.2 | 2019년 9월 | 타사 라이브러리 업데이트(보안 관련 문제)null |
| 3.16.1 | 2019년 1월 | JS 시각화 업데이트.Microsoft Bing API v5를 v7로 마이그레이션null |
| 3.16.0 | 2018년 5월 | Java 9+ 호환성 문제에 대한 개요.Ubuntu 디스트로를 위한 워크벤치 호환성.문서 원본 업데이트 및 비기능 문서 원본 제거.null |
| 3.15.1 | 2017년 3월 | 에 대한 버그 픽스.액세스할 수 없는 현재 작업 디렉토리에 대해 선택되지 않은 I/O 예외가 발생할 수 있는 NET 릴리스null |
| 3.15.0 | 2016년 10월 | Bing API V2에서 V5로의 전환.타사 종속성 업그레이드.내장 화장품.null |
| 3.14.0 | 2016년 9월 | Workbench 개선(높은 DPI 지원, MacOSX 개선, 버그 수정)PubMed HTTP로 전환.기타 사소한 개선 사항.null |
| 3.13.0 | 2016년 7월 | Servlet API 버그 수정, Workbench 버그 수정, Google 문서 소스 제거, 몇 개 언어의 고정 언어 코드.null |
| 3.12.0 | 2016년 2월 | Morfologik 폴란드어 사전, 인프라 변경 및 조정을 업그레이드하여 C2가 보다 엄격한 보안 관리자 정책 하에서 운영될 수 있도록 한다.null |
| 3.11.0 | 2015년 10월 | Apache Lucene 업그레이드, 버그 수정 및 3.10.x 미성년자 변경 롤업.null |
| 3.10.4 | 2015년 10월 | Morfologik 라이브러리 업그레이드.null |
| 3.10.3 | 2015년 8월 | Solr에서의 충돌을 피하기 위해 Google Guava를 다시 패키지화하십시오.null |
| 3.10.2 | 2015년 7월 | Workbench에 대한 사소한 수정 사항(Arabic Cluster Display)null |
| 3.10.1 | 2015년 5월 | MacOS 배포에서 아두나 시각화가 삭제됨.Workbench에 대한 사소한 수정 사항.null |
| 3.10.0 | 2015년 5월 | 시각화 업데이트.버그 수정.라이브러리 종속성 업데이트.null |
| 3.9.4 | 2014년 11월 | 폼 트리 업데이트.다국어 클러스터링에 대한 새 속성.시각화 수정.null |
| 3.9.3 | 2014년 7월 | 폼 트리 업데이트.인프라 수정 및 수정(jflex, sonatype 저장소 URL)null |
| 3.9.2 | 2014년 4월 | 폼 트리 HTML5에 버그 수정. |
| 3.9.1 | 2014년 4월 | 버그 수정, HTML5 시각화 업그레이드.null |
| 3.9.0 | 2014년 2월 | 플래시, 라이브러리 종속성 업데이트, 버그픽스를 대체하는 HTML5 시각화.null |
| 3.8.1 | 2013년 10월 | 버그 수정, 사소한 기능 변경.null |
| 3.8.0 | 2013년 7월 | 버그 수정, 라이브러리 종속성 업데이트.null |
| 3.7.1 | 2013년 5월 | 사소한 버그 수정(3.7.0 유지 관리 릴리스)null |
| 3.7.0 | 2013년 4월 | 코어(현행 ID)에 대한 인프라 변경, 더 나은 Solr 통합 XSLT, 더 큰 입력에 대한 Workbench 조정, 업데이트된 종속성null |
| 3.6.3 | 2013년 4월 | 사소한 버그 수정 및 개선 사항: Solr 어댑터 XSLT 사용자 지정, 더 큰 입력을 위한 Workbench 트윗, 업데이트된 종속성null |
| 3.6.2 | 2012년 11월 | 사소한 버그 수정 및 개선.null |
| 3.6.1 | 2012년 8월 | 사소한 버그 수정.null |
| 3.6.0 | 2012년 6월 | 인프라 변경, 리팩터링 및 버그 수정null |
| 3.5.3 | 2011년 12월 | GitHub로의 마이그레이션으로 인한 인프라 업데이트.워크벤치를 SWT 3.7.1로 업데이트하십시오. |
| 3.5.2 | 2011년 9월 | Document Clustering Server의 Ajax 지원, Bing 문서 소스 개선, Workbench 개선, 버그 수정.null |
| 3.5.1 | 2011년 6월 | 버그 수정, 시각화 통합 개선, Yahoo BOSS API 지원 제거.null |
| 3.5.0 | 2011년 5월 | FoamTree 시각화, k-평균 군집화, 리소스 관리 개선 |
| 3.4.3 | 2011년 3월 | 메이븐 중앙 저장소로 배포 |
| 3.4.2 | 2010년 10월 | 버그 수정. |
| 3.4.1 | 2010년 9월 | Solr 1.4.x 호환성 패키지, 버그 수정 |
| 3.4.0 | 2010년 8월 | .NET API:Carrot² 클러스터링 호출 |
| 3.3.0 | 2010년 4월 | STC 클러스터링 알고리즘의 대폭적인 확장성 향상 |
| 3.2.0 | 2010년 3월 | 아랍어 및 한국어 컨텐츠 클러스터링에 대한 실험적 지원, 배치 모드에서 클러스터링을 위한 명령줄 응용, LGPL 라이센스 종속성 제거 |
| 3.1.0 | 2009년 9월 | 중국 콘텐츠 클러스터링 실험 지원, Apache Solr용 검색 결과 클러스터링 플러그인 |
| 3.1.0 | 2009년 9월 | 중국 콘텐츠 클러스터링 실험 지원, Apache Solr용 검색 결과 클러스터링 플러그인 |
| 3.0.1 | 2009년 3월 | Mac OS X에서 사용 가능한 문서 클러스터링 워크벤치 |
| 3.0.0 | 2009년 1월 | Carrot² 클러스터링에 대한 손쉬운 실험을 위해 추가된 Document Clustering Workbench, 획기적으로 간소화된 Java API, 검색 결과 클러스터링 웹 애플리케이션 재구현, 사용 가능한 사용자 설명서[5] |
| 2.1.0 | 2007년 8월 | 클러스터링을 REST 서비스로 노출하기 위해 추가된 문서 클러스터링 서버 |
| 2.0.0 | 2006년 9월 | 검색 결과 클러스터링 웹 응용 프로그램의 새 사용자 인터페이스 |
| 1.0.0 | 2006년 1월 | 첫 번째 공식 릴리스, SourceForge에서 사용 가능한 이진 파일 |
| 0.0.0 | 2002년부터 | 배양 릴리스, SourceForge에서 사용 가능한 소스 코드 |
건축
Carroat² 4.0은 주로 언어별 리소스 관리, 알고리즘 구성 및 실행을 위한 공용 API가 있는 자바 프로그래밍 라이브러리다.HTTP/REST 구성요소(문서 클러스터링 서버)는 다른 언어와의 상호운용성을 위해 제공된다.null
클러스터링 알고리즘
Carrit²는 클러스터 레이블의 품질을 강조하는 몇 가지 문서 클러스터링 알고리즘을 제공한다.
스핀오프
당근 검색
Carroot² 프로젝트의 상업적 스핀오프인 [7]Carrot Search는 Carrot²의 추가 개발에 착수하며, Carrot² 프레임워크를 준수하는 실시간 텍스트 클러스터링 알고리즘은[8] 물론 오픈 소스와 독점 소프트웨어를 기반으로 한 텍스트 마이닝 컨설팅 서비스를 제공한다.null
당근 검색 연구소
Carrot²는 Carrot Search Labs의 산하에 발표된 다수의 독립적인 오픈 소스 프로젝트를 낳았다.[9]이 시책의 일환으로 다음과 같은 프로젝트가 발표되었거나 발표되었다.
- 랜덤화 테스트: 모든 테스트 실행을 약간 다르게(임의화) 만들기 위한 유틸리티가 내장된 JUnit 테스트 러너.또한 로드 밸런싱 및 기타 벨과 휘파람을 사용하여 병렬 JVM에서 JUnit 테스트를 실행하기 위한 ANT 태스크.
- HPPC(High Performance President Collections for Java): 최고의 성능 및 메모리 효율성을 위해 조정된 Java의 기본 요소 모음 목록, 세트, 맵 및 기타 모음입니다.
- SmartSprites: CSS 스프라이트의 완전 자동 유지 관리, 스프라이트 이미지를 추가하거나 변경할 때 CSS에 복사하여 붙여넣는 번거로움 없음
중단된 프로젝트:
- JSuffixArray:성능 및 메모리 특성이 다른 접미사 어레이 데이터 구조의 여러 Java 구현.
- JUnitBenchmarks: GC 모니터링, 시간 분산 측정 및 간단한 그래픽 시각화를 통해 JUnit4 테스트를 성능 마이크로 벤치마크로 변환하기 위한 확장형 세트.
참고 항목
참조
- ^ Carrot2 Project, Stanislaw Osinski, Dawid Weiss. "Carrot2 - Open Source Search Results Clustering Engine".
{{cite web}}: CS1 maint : 복수이름 : 작성자 목록(링크) - ^ 당근2 검색 결과 클러스터링 데모
- ^ Dawid Weiss: 폴란드어와 영어로 된 웹 검색 결과를 위한 클러스터링 인터페이스.MSc 논문.Poznan Technology University, Poznań, 2001년 다운로드 PDF
- ^ a b Staniswaw Osiński, Dawid Weiss: 클러스터링 검색 결과를 위한 개념 기반 알고리즘.IEEE Intelligent Systems, 5월/6월, 3(볼록 20), 2005년, 페이지 48–54.
- ^ "Carrot2".
- ^ 오렌 자미르, 오렌 에치오니:웹 문서 클러스터링: 제21차 연례 정보 검색 연구 및 개발에 관한 ACM SIGIR 회의의 진행 (1998), 페이지 46–54
- ^ Carrot Search s.c. "Carrot Search: document clustering and visualization software".
- ^ Carrot Search s.c. "Carrot Search: Lingo3G: Text Document Clustering Engine".
- ^ Carrot Search s.c. "Carrot Search Labs".