오렌지(소프트웨어)
Orange (software)| 개발자 | 류블랴나 대학교 |
|---|---|
| 초기 릴리즈 | 1996년 10월 ; 전( 10월 10일[1] |
| 안정된 릴리스 | 3.29.2[2] / 2021년 6월 8일; 전 ( |
| 저장소 | 오렌지 저장소 |
| 기입처 | Python, Cython, C++, C |
| 운영 체제 | 크로스 플랫폼 |
| 유형 | 머신 러닝, 데이터 마이닝, 데이터 시각화, 데이터 분석 |
| 면허증. | GPLv3 이후[3][4] |
| 웹 사이트 | orangedatamining |
Orange는 오픈 소스 데이터 시각화, 머신 러닝 및 데이터 마이닝 툴킷입니다.탐색적 신속한 질적 데이터 분석 및 대화형 데이터 [5]시각화를 위한 비주얼 프로그래밍 프런트 엔드가 특징입니다.
묘사
Orange는 데이터 시각화, 머신 러닝, 데이터 마이닝 및 데이터 분석을 위한 컴포넌트 기반 비주얼 프로그래밍 소프트웨어 패키지입니다.
오렌지 컴포넌트는 위젯이라고 불리며 단순한 데이터 시각화, 서브셋 선택 및 전처리에서 학습 알고리즘 및 예측 모델링의 경험적 평가까지 다양합니다.
비주얼 프로그래밍은 미리 정의된 위젯이나 사용자가 디자인한 위젯을 링크하여 워크플로우를 생성하는 인터페이스를 통해 구현되며 고급 사용자는 Orange를 데이터 조작 및 위젯 [6]변경을 위한 Python 라이브러리로 사용할 수 있습니다.
소프트웨어
Orange는 GPL로 출시된 오픈 소스 소프트웨어 패키지입니다.C++에 포함된 코어 컴포넌트와 파이썬의 래퍼를 포함한 3.0 버전까지 GitHub에서 사용할 수 있습니다.버전 3.0 이후 Orange는 numpy, scipy, skikit-learn과 같은 과학 컴퓨팅에 일반적인 Python 오픈 소스 라이브러리를 사용하며 그래픽 사용자 인터페이스는 크로스 플랫폼 Qt 프레임워크 내에서 작동합니다.
기본 설치에는 6개의 위젯 세트(데이터, 시각화, 분류, 회귀, 평가 및 비감독)에 많은 기계 학습, 전처리 및 데이터 시각화 알고리즘이 포함되어 있습니다.추가 기능(생물 정보학, 데이터 융합 및 텍스트 마이닝)은 추가 기능으로 제공됩니다.
Orange는 macOS, Windows 및 Linux에서 지원되며 Python 패키지 인덱스 저장소(ip install Orange3)에서도 설치할 수 있습니다.
특징들
주황색은 사용자가 위젯을 배치하고 데이터 분석 워크플로우를 생성하는 캔버스 인터페이스로 구성됩니다.위젯은 데이터 읽기, 데이터 테이블 표시, 특징 선택, 예측 변수 교육, 학습 알고리즘 비교, 데이터 요소 시각화 등과 같은 기본 기능을 제공합니다.사용자는 대화식으로 시각화를 탐색하거나 선택한 하위 집합을 다른 위젯에 제공할 수 있습니다.
- 캔버스: 데이터 분석용 그래픽 프론트 엔드
- 위젯:
- 데이터: 데이터 입력, 데이터 필터링, 샘플링, 변환, 기능 조작 및 기능 선택용 위젯
- 시각화: 공통 시각화(상자 그림, 히스토그램, 산점도) 및 다변량 시각화(모자이크 표시, 체 다이어그램)를 위한 위젯입니다.
- 분류: 분류를 위한 일련의 감독 기계 학습 알고리즘
- 회귀: 회귀를 위한 감독된 기계 학습 알고리즘 세트
- 평가: 교차 검증, 샘플링 기반 절차, 신뢰성 평가 및 예측 방법의 점수 부여
- 비지도: 클러스터링(k-평균, 계층적 클러스터링) 및 데이터 투영 기술(다차원 스케일링, 주성분 분석, 대응 분석)을 위한 비지도 학습 알고리즘.
- 애드온:
- 어소시에이트: 빈번한 아이템 세트 마이닝 및 관련 규칙 학습을 위한 위젯
- 생체정보학: 유전자 세트 분석, 농축 및 경로 라이브러리 접근을 위한 위젯
- 데이터 융합: 다양한 데이터 세트를 융합하고, 매트릭스를 일괄 인수분해하여 잠재 요인을 탐색하기 위한 위젯
- 교육: k-평균 클러스터링, 다항식 회귀, 확률적 경사 하강 등과 같은 기계 학습 개념을 가르치는 위젯.
- Geo: 지리 공간 데이터 작업을 위한 위젯
- 이미지 분석: 이미지 및 ImageNet 임베디드를 사용하기 위한 위젯
- 네트워크: 그래프 및 네트워크 분석용 위젯
- 텍스트 마이닝: 자연어 처리 및 텍스트 마이닝용 위젯
- 시계열: 시계열 분석 및 모델링용 위젯
- 스펙트럼 분석: (하이퍼) 스펙트럼 데이터셋 분석 및 시각화를 위한 위젯
목적
이 프로그램은 실험 선택, 추천 시스템 및 예측 모델링을 위한 플랫폼을 제공하며 생물의학, 생물정보학, 게놈 연구 및 교육에 사용됩니다.과학에서는 새로운 기계학습 알고리즘을 테스트하고 유전학 및 생물정보학에서 새로운 기술을 구현하기 위한 플랫폼으로 사용됩니다.교육에서는 생물, 생물의학, 정보학 학생들에게 기계 학습과 데이터 마이닝 방법을 가르치는 데 사용되었다.
내선번호
다양한 프로젝트는 추가 기능으로 코어 컴포넌트를 확장하거나 오렌지 캔버스만을 사용하여 구현된 비주얼 프로그래밍 기능과 GUI를 이용하여 Orange를 기반으로 구축됩니다.
- OASYS - ORANGE SYnchrotron 스위트
- scOrange : 단일 셀 생물 통계 정보
- Quasar - 자연과학 데이터 분석
역사
- 1996년 류블랴나 대학과 요제프 스테판 연구소는 C++의 기계학습 프레임워크인 ML*의 개발을 시작했습니다.
- 1997년에 파이썬 바인딩은 ML*용으로 개발되었으며, 새로운 파이썬 모듈과 함께 Orange라는 공동 프레임워크를 형성했습니다.
- 이후 몇 년 동안 데이터 마이닝 및 머신 러닝을 위한 대부분의 주요 알고리즘은 C++(Orange의 핵심) 또는 Python 모듈에서 개발되었습니다.
- 2002년에 Pmw Python 메가위젯을 사용하여 유연한 그래픽 사용자 인터페이스를 만드는 최초의 프로토타입을 설계했습니다.
- 2003년, 그래픽 사용자 인터페이스는 PyQt Python 바인딩을 사용하여 Qt 프레임워크를 위해 재설계 및 개발되었습니다.비주얼 프로그래밍 프레임워크가 정의되어 위젯(데이터 분석 파이프라인의 그래픽 구성요소) 개발이 시작되었습니다.
- 2005년에는 생물 정보학에서 데이터 분석을 위한 확장이 이루어졌다.
- 2008년에는 Mac OS X DMG 및 Fink 기반 설치 패키지가 개발되었습니다.
- 2009년에는 100개 이상의 위젯이 생성 및 유지 관리되었습니다.
- 2009년 이후 Orange는 2.0 베타 버전으로 출시되었으며 웹 사이트에서는 매일 컴파일 주기에 따라 설치 패키지를 제공하고 있습니다.
- 2012년에는 오래된 모듈 기반 구조를 대체하는 새로운 객체 계층이 도입되었습니다.
- 2013년에는 주요 GUI 재설계.
- 2015년에는 Orange 3.0이 출시됩니다.
- 2016년 오렌지는 버전 3.3입니다.개발에서는 매월 안정적인 릴리스 사이클을 사용합니다.
레퍼런스
- ^ "orange3/CHANGELOG.md at master . biolab/orange3 . GitHub". GitHub.
- ^ "Release 3.29.2". 8 June 2021. Retrieved 21 June 2021.
- ^ "Orange - License".
- ^ "orange3/LICENSE at master . biolab/orange3 . GitHub". GitHub.
- ^ DemšarJanez; CurkTomaž; ErjavecAleš; GorupČrt; HočevarTomaž; MilutinovičMitar; MožinaMartin; PolajnarMatija; ToplakMarko; StaričAnže; ŠtajdoharMiha (2013-01-01). "Orange". The Journal of Machine Learning Research.
- ^ Janez Demšar; Tomaž Curk; Aleš Erjavec; Črt Gorup; Tomaž Hočevar; Mitar Milutinovič; Martin Možina; Matija Polajnar; Marko Toplak; Anže Starič; Miha Stajdohar; Lan Umek; Lan Žagar; Jure Žbontar; Marinka Žitnik; Blaž Zupan (2013). "Orange: data mining toolbox in Python" (PDF). JMLR. 14 (1): 2349–2353.
- ^ M. Toplak, G. Birarda, S. Read, C. Sandt, S. Rosendahl, L. Vacari, J. Demshar, F.보론딕스, 싱크로트론 방사선 뉴스 30, 40-45 (2017).https://doi.org/10.1080/08940886.2017.1338424
- ^ L. Rebuffi, M. 산체스 델 리오, Proc.SPIE 10388, 103880S (2017)https://doi.org/10.1117/12.2274263
추가 정보
- Demshar, Janez 및 Blaj Zupan, 오렌지: 알차고 재미있는 데이터 마이닝 - 역사적 관점, Informatica 37, 페이지 55-60, (2013).