당근2

Carrot2
당근2
Carrot2-2021.png
Carrot2's Lingo 알고리즘을 사용하여 클러스터된 웹 검색 결과.
개발자당근 검색
안정적 해제
4.4.2 / 2022년 1월 10일(2022-01-10)
리포지토리github.com/carrot2/carrot2/
기록 위치자바
운영 체제크로스 플랫폼
유형텍스트 마이닝클러스터 분석
면허증.BSD 라이선스
웹사이트search.carrot2.org

당근²는 오픈 소스[1] 검색 결과 클러스터링 엔진이다.[2]검색 결과 또는 문서 개요와 같은 작은 문서 컬렉션을 주제 범주로 자동 클러스터링할 수 있다.당근²는 자바로 작성되며 BSD 라이선스에 따라 배포된다.null

역사

Carroat²의 초기 버전은 2001년에 Dawid Weiss가 MSc 논문의 일환으로 폴란드어로 검색 결과를 클러스터링하는 STC 클러스터링 알고리즘의 적용 가능성을 검증하기 위해 구현되었다.[3]2003년에는 검색 결과의 클러스터링을 위해 특별히 고안된 참신한 텍스트 클러스터링 알고리즘인 링고를 포함하여 많은 다른 검색 결과 클러스터링 알고리즘이 추가되었다.[4]당근²의 소스 코드는 2002년 이후 사용할 수 있었지만, 버전 1.0이 공식적으로 출시된 것은 2006년에 불과했다.같은 해 향상된 사용자 인터페이스와 확장 툴 세트로 버전 2.0이 출시되었다.2009년 버전 3.0은 Eclipse Rich Client Platform에 기반한 클러스터링 조정을 위한 클러스터링 품질, 간소화된 API, 새로운 GUI 애플리케이션을 크게 개선하였다.2020년에 버전 4.0.0은 API, 코드 정리 및 데스크톱 Workbench의 제거를 더욱 단순화시켰다.버전 4.1.0은 Workbench를 웹 기반 애플리케이션으로 다시 제공한다.null

당근² 해제
해제 릴리스 날짜 주요 변경 사항 및 새로운 기능
4.4.0, 4.4.1, 4.4.2 2021년 12월 보안 수정 및 종속성 업데이트.null
4.3.0 2021년 7월 사소한 API 변경 및 버그 수정.작업대 개선(DCS 검색 프런트엔드).null
4.2.0, 4.2.1 2021년 3월 JSON 사전 및 워크벤치 개선.버그 수정.null
4.1.0 2021년 1월 웹 기반 Workbench.JSON 사전 및 새 필터링 옵션.API 연마.null
4.0.0 2020년 7월 코드베이스 전반에서 API 변경 및 단순화사용되지 않는 기술과 도구의 제거.새 문서 및 코드 정리.null
3.16.2 2019년 9월 타사 라이브러리 업데이트(보안 관련 문제)null
3.16.1 2019년 1월 JS 시각화 업데이트.Microsoft Bing API v5를 v7로 마이그레이션null
3.16.0 2018년 5월 Java 9+ 호환성 문제에 대한 개요.Ubuntu 디스트로를 위한 워크벤치 호환성.문서 원본 업데이트 및 비기능 문서 원본 제거.null
3.15.1 2017년 3월 에 대한 버그 픽스.액세스할 수 없는 현재 작업 디렉토리에 대해 선택되지 않은 I/O 예외가 발생할 수 있는 NET 릴리스null
3.15.0 2016년 10월 Bing API V2에서 V5로의 전환.타사 종속성 업그레이드.내장 화장품.null
3.14.0 2016년 9월 Workbench 개선(높은 DPI 지원, MacOSX 개선, 버그 수정)PubMed HTTP로 전환.기타 사소한 개선 사항.null
3.13.0 2016년 7월 Servlet API 버그 수정, Workbench 버그 수정, Google 문서 소스 제거, 몇 개 언어의 고정 언어 코드.null
3.12.0 2016년 2월 Morfologik 폴란드어 사전, 인프라 변경 및 조정을 업그레이드하여 C2가 보다 엄격한 보안 관리자 정책 하에서 운영될 수 있도록 한다.null
3.11.0 2015년 10월 Apache Lucene 업그레이드, 버그 수정 및 3.10.x 미성년자 변경 롤업.null
3.10.4 2015년 10월 Morfologik 라이브러리 업그레이드.null
3.10.3 2015년 8월 Solr에서의 충돌을 피하기 위해 Google Guava를 다시 패키지화하십시오.null
3.10.2 2015년 7월 Workbench에 대한 사소한 수정 사항(Arabic Cluster Display)null
3.10.1 2015년 5월 MacOS 배포에서 아두나 시각화가 삭제됨.Workbench에 대한 사소한 수정 사항.null
3.10.0 2015년 5월 시각화 업데이트.버그 수정.라이브러리 종속성 업데이트.null
3.9.4 2014년 11월 폼 트리 업데이트.다국어 클러스터링에 대한 새 속성.시각화 수정.null
3.9.3 2014년 7월 폼 트리 업데이트.인프라 수정 및 수정(jflex, sonatype 저장소 URL)null
3.9.2 2014년 4월 폼 트리 HTML5에 버그 수정.
3.9.1 2014년 4월 버그 수정, HTML5 시각화 업그레이드.null
3.9.0 2014년 2월 플래시, 라이브러리 종속성 업데이트, 버그픽스를 대체하는 HTML5 시각화.null
3.8.1 2013년 10월 버그 수정, 사소한 기능 변경.null
3.8.0 2013년 7월 버그 수정, 라이브러리 종속성 업데이트.null
3.7.1 2013년 5월 사소한 버그 수정(3.7.0 유지 관리 릴리스)null
3.7.0 2013년 4월 코어(현행 ID)에 대한 인프라 변경, 더 나은 Solr 통합 XSLT, 더 큰 입력에 대한 Workbench 조정, 업데이트된 종속성null
3.6.3 2013년 4월 사소한 버그 수정 및 개선 사항: Solr 어댑터 XSLT 사용자 지정, 더 큰 입력을 위한 Workbench 트윗, 업데이트된 종속성null
3.6.2 2012년 11월 사소한 버그 수정 및 개선.null
3.6.1 2012년 8월 사소한 버그 수정.null
3.6.0 2012년 6월 인프라 변경, 리팩터링 및 버그 수정null
3.5.3 2011년 12월 GitHub로의 마이그레이션으로 인한 인프라 업데이트.워크벤치를 SWT 3.7.1로 업데이트하십시오.
3.5.2 2011년 9월 Document Clustering Server의 Ajax 지원, Bing 문서 소스 개선, Workbench 개선, 버그 수정.null
3.5.1 2011년 6월 버그 수정, 시각화 통합 개선, Yahoo BOSS API 지원 제거.null
3.5.0 2011년 5월 FoamTree 시각화, k-평균 군집화, 리소스 관리 개선
3.4.3 2011년 3월 메이븐 중앙 저장소로 배포
3.4.2 2010년 10월 버그 수정.
3.4.1 2010년 9월 Solr 1.4.x 호환성 패키지, 버그 수정
3.4.0 2010년 8월 .NET API:Carrot² 클러스터링 호출
3.3.0 2010년 4월 STC 클러스터링 알고리즘의 대폭적인 확장성 향상
3.2.0 2010년 3월 아랍어 및 한국어 컨텐츠 클러스터링에 대한 실험적 지원, 배치 모드에서 클러스터링을 위한 명령줄 응용, LGPL 라이센스 종속성 제거
3.1.0 2009년 9월 중국 콘텐츠 클러스터링 실험 지원, Apache Solr용 검색 결과 클러스터링 플러그인
3.1.0 2009년 9월 중국 콘텐츠 클러스터링 실험 지원, Apache Solr용 검색 결과 클러스터링 플러그인
3.0.1 2009년 3월 Mac OS X에서 사용 가능한 문서 클러스터링 워크벤치
3.0.0 2009년 1월 Carrot² 클러스터링에 대한 손쉬운 실험을 위해 추가된 Document Clustering Workbench, 획기적으로 간소화된 Java API, 검색 결과 클러스터링 웹 애플리케이션 재구현, 사용 가능한 사용자 설명서[5]
2.1.0 2007년 8월 클러스터링을 REST 서비스로 노출하기 위해 추가된 문서 클러스터링 서버
2.0.0 2006년 9월 검색 결과 클러스터링 웹 응용 프로그램의 새 사용자 인터페이스
1.0.0 2006년 1월 첫 번째 공식 릴리스, SourceForge에서 사용 가능한 이진 파일
0.0.0 2002년부터 배양 릴리스, SourceForge에서 사용 가능한 소스 코드

건축

Carroat² 4.0은 주로 언어별 리소스 관리, 알고리즘 구성 및 실행을 위한 공용 API가 있는 자바 프로그래밍 라이브러리다.HTTP/REST 구성요소(문서 클러스터링 서버)는 다른 언어와의 상호운용성을 위해 제공된다.null

클러스터링 알고리즘

Carrit²는 클러스터 레이블의 품질을 강조하는 몇 가지 문서 클러스터링 알고리즘을 제공한다.

스핀오프

당근 검색

Carroot² 프로젝트의 상업적 스핀오프인 [7]Carrot Search는 Carrot²의 추가 개발에 착수하며, Carrot² 프레임워크를 준수하는 실시간 텍스트 클러스터링 알고리즘은[8] 물론 오픈 소스와 독점 소프트웨어를 기반으로 한 텍스트 마이닝 컨설팅 서비스를 제공한다.null

당근 검색 연구소

Carrot²는 Carrot Search Labs의 산하에 발표된 다수의 독립적인 오픈 소스 프로젝트를 낳았다.[9]이 시책의 일환으로 다음과 같은 프로젝트가 발표되었거나 발표되었다.

  • 랜덤화 테스트: 모든 테스트 실행을 약간 다르게(임의화) 만들기 위한 유틸리티가 내장된 JUnit 테스트 러너.또한 로드 밸런싱 및 기타 벨과 휘파람을 사용하여 병렬 JVM에서 JUnit 테스트를 실행하기 위한 ANT 태스크.
  • HPPC(High Performance President Collections for Java): 최고의 성능 및 메모리 효율성을 위해 조정된 Java의 기본 요소 모음 목록, 세트, 맵 및 기타 모음입니다.
  • SmartSprites: CSS 스프라이트의 완전 자동 유지 관리, 스프라이트 이미지를 추가하거나 변경할 때 CSS에 복사하여 붙여넣는 번거로움 없음

중단된 프로젝트:

  • JSuffixArray:성능 및 메모리 특성이 다른 접미사 어레이 데이터 구조의 여러 Java 구현.
  • JUnitBenchmarks: GC 모니터링, 시간 분산 측정 및 간단한 그래픽 시각화를 통해 JUnit4 테스트를 성능 마이크로 벤치마크로 변환하기 위한 확장형 세트.

참고 항목

참조

  1. ^ Carrot2 Project, Stanislaw Osinski, Dawid Weiss. "Carrot2 - Open Source Search Results Clustering Engine".{{cite web}}: CS1 maint : 복수이름 : 작성자 목록(링크)
  2. ^ 당근2 검색 결과 클러스터링 데모
  3. ^ Dawid Weiss: 폴란드어와 영어로 된 웹 검색 결과를 위한 클러스터링 인터페이스.MSc 논문.Poznan Technology University, Poznań, 2001년 다운로드 PDF
  4. ^ a b Staniswaw Osiński, Dawid Weiss: 클러스터링 검색 결과를 위한 개념 기반 알고리즘.IEEE Intelligent Systems, 5월/6월, 3(볼록 20), 2005년, 페이지 48–54.
  5. ^ "Carrot2".
  6. ^ 오렌 자미르, 오렌 에치오니:웹 문서 클러스터링: 제21차 연례 정보 검색 연구 및 개발에 관한 ACM SIGIR 회의의 진행 (1998), 페이지 46–54
  7. ^ Carrot Search s.c. "Carrot Search: document clustering and visualization software".
  8. ^ Carrot Search s.c. "Carrot Search: Lingo3G: Text Document Clustering Engine".
  9. ^ Carrot Search s.c. "Carrot Search Labs".