캣부스트
Catboost| 원저작자 | 안드레이 구린:[1] / 얀덱스 |
|---|---|
| 개발자 | Yandex 및 CatBoost 기여자[2] |
| 초기 릴리즈 | 2017년 7월 , 전([3][4] |
| 안정된 릴리스 | 2022년 4월 7일 / 0.24.1[5], 전( |
| 기입처 | Python, R, C++, Java |
| 운영 체제 | Linux, macOS, Windows |
| 유형 | 기계 학습 |
| 면허증. | Apache 라이센스 2.0 |
| 웹 사이트 | 캣부스트 |
CatBoost는[6] Yandex가 개발한 오픈 소스 소프트웨어 라이브러리입니다.다른 기능 중에서 기존의 [7]알고리즘과 비교하여 치환 기반 대안을 사용하여 범주형 피쳐에 대해 해결하려는 그라데이션 부스트 프레임워크를 제공한다.Linux, Windows, MacOS에서 작동하며 Python,[8] [9]R에서 사용할 수 있으며 C++, Java,[10] C#, Rust, Core ML, ONNX 및 PMML에서 예측에 사용할 수 있습니다. 소스 코드는 Apache License에 따라 라이센스가 부여되고 GitHub에서 [6]사용할 수 있습니다.
InfoWorld 매거진은 [11]2017년에 Tensorflow, Pytorch, XGBoost 및 기타 8개 도서관과 함께 도서관을 "The best machine learning tool"로 선정하였습니다.
Kaggle은 CatBoost를 세계에서 가장 자주 사용되는 머신 러닝(ML) 프레임워크 중 하나로 꼽았습니다.2020년[12] 조사에서는 가장 자주 사용되는 ML 프레임워크 상위 8위,[13] 2021년 조사에서는 가장 자주 사용되는 ML 프레임워크 상위 7위에 이름을 올렸다.
2022년 4월 현재 CatBoost는[14] PyPI 저장소에서 하루 약 10만회 설치되고 있습니다.
특징들
CatBoost는 주로 다음과[15] 같은 기능으로 인해 다른 그라데이션 부스트 알고리즘과 비교하여 인기를 얻고 있습니다.
- 범주형[16] 피쳐에 대한 네이티브 처리
- GPU의[17] 고속 트레이닝
- 모델 및 피쳐 분석을 위한 시각화 및 도구
- 빠른 실행을 위한 Unclessed Tree 또는 Symmetric Tree 사용
- 과적합을[7] 극복하기 위한 순서부스트
역사
2009년 Andrey Gulin은 Yandex에서 검색 결과의 순위를 매기기 위해 사용된 독점 구배 부스트 라이브러리인 MatrixNet을 개발했습니다.2009년 이후, MatrixNet은 Yandex의 다양한 프로젝트에 사용되고 있습니다.예를 들어 추천 시스템이나 일기 예보 등입니다.
2014-2015년 Andrey Gulin은 연구팀과 함께 Tensornet이라는 새로운 프로젝트를 시작했습니다.이 프로젝트는 "범주적인 데이터를 사용하는 방법"의 문제를 해결하기 위한 것입니다.그 결과 범주형 데이터 처리에 대한 다른 접근 방식을 가진 몇 가지 독점적인 Gradient Boosting 라이브러리가 생성되었습니다.
2016년 Anna Dorogush가 이끄는 기계학습 인프라 팀은 Matrixnet과 Tensornet을 포함한 Yandex의 Gradient Boosting에 착수했습니다.그들은 카테고리 및 텍스트 데이터, GPU 교육, 모델 분석, 시각화 도구를 지원하는 CatBoost라는 다음 버전의 Gradient Boost 라이브러리를 구현하고 오픈 소싱했습니다.
CatBoost는 2017년 7월에 오픈소싱되었으며 Yandex 및 오픈소스 커뮤니티에서 활발하게 개발 중입니다.
어플
- JetBrains는 코드 완성에[18] CatBoost를 사용합니다.
- Cloudflare는 봇[19] 탐지에 CatBoost를 사용합니다.
- Careem은 CatBoost를 사용하여 놀이기구의[20] 미래 목적지를 예측합니다.
「 」를 참조해 주세요.
레퍼런스
- ^ "Andrey Gulin - People - Research at Yandex". research.yandex.com.
- ^ "Yandex open sources CatBoost, a gradient boosting machine learning library". TechCrunch. Retrieved 2020-08-30.
- ^ Yegulalp, Serdar (2017-07-18). "Yandex open sources CatBoost machine learning library". InfoWorld. Retrieved 2020-08-30.
- ^ "Release 0.24.1 · catboost/catboost". GitHub. Retrieved 2020-08-30.
- ^ a b "catboost/catboost". August 30, 2020 – via GitHub.
- ^ a b Prokhorenkova, Liudmila; Gusev, Gleb; Vorobev, Aleksandr; Dorogush, Anna Veronika; Gulin, Andrey (2019-01-20). "CatBoost: unbiased boosting with categorical features". arXiv:1706.09516 [cs.LG].
- ^ "Python Package Index PYPI: catboost". Retrieved 2020-08-20.
- ^ "Conda force package catboost-r". Retrieved 2020-08-30.
- ^ "Maven Repository: ai.catboost » catboost-prediction". mvnrepository.com. Retrieved 2020-08-30.
- ^ staff, InfoWorld (27 September 2017). "Bossie Awards 2017: The best machine learning tools". InfoWorld.
- ^ "State of Data Science and Machine Learning 2020".
- ^ "State of Data Science and Machine Learning 2021".
- ^ "PyPI Stats catboost". PyPI Stats.
- ^ Joseph, Manu (2020-02-29). "The Gradient Boosters V: CatBoost". Deep & Shallow. Retrieved 2020-08-30.
- ^ Dorogush, Anna Veronika; Ershov, Vasily; Gulin, Andrey (2018-10-24). "CatBoost: gradient boosting with categorical features support". arXiv:1810.11363 [cs.LG].
- ^ "CatBoost Enables Fast Gradient Boosting on Decision Trees Using GPUs". NVIDIA Developer Blog. 2018-12-13. Retrieved 2020-08-30.
- ^ "Code Completion, Episode 4: Model Training". JetBrains Developer Blog. 2021-08-20.
- ^ "Stop the Bots: Practical Lessons in Machine Learning". The Cloudflare Blog. 2019-02-20.
- ^ "How Careem's Destination Prediction Service speeds up your ride". Careem. 2019-02-19.