자동화된 기계학습
Automated machine learning| 시리즈의 일부(on) |
| 머신 러닝 데이터 마이닝(data mining) |
|---|
자동 머신 러닝(AutoML)은 머신 러닝을 실제 문제에 적용하는 작업을 자동화하는 프로세스입니다.AutoML은 원시 데이터 세트에서 배포 준비가 된 머신 러닝 모델을 구축하기까지 모든 단계를 포함할 수 있습니다.오토엠엘은 머신러닝 적용에 대한 도전이 커지고 있는 상황에서 인공지능 기반 솔루션으로 제안됐습니다.[1][2]AutoML의 높은 자동화 수준은 비전문가가 머신러닝 전문가가 될 필요 없이 머신러닝 모델과 기술을 활용할 수 있도록 하는 것을 목표로 합니다.머신 러닝을 엔드 투 엔드로 적용하는 프로세스를 자동화하면 보다 단순한 솔루션을 생성할 수 있고, 해당 솔루션을 보다 빠르게 생성할 수 있으며, 수작업으로 설계된[citation needed] 모델보다 성능이 뛰어난 모델이 제공됩니다.AutoML에서 사용되는 일반적인 기술로는 하이퍼 파라미터 최적화, 메타 학습 및 신경 아키텍처 검색이 있습니다.
표준 접근 방식과 비교
일반적인 머신 러닝 애플리케이션에서, 실무자들은 훈련에 사용할 입력 데이터 포인트 세트를 가지고 있습니다.원시 데이터는 모든 알고리즘을 적용할 수 있는 형태가 아닐 수 있습니다.데이터를 기계 학습에 사용할 수 있도록 하려면 전문가가 적절한 데이터 전처리, 특징 엔지니어링, 특징 추출 및 특징 선택 방법을 적용해야 할 수 있습니다.이 단계를 거친 후, 실무자는 모델의 예측 성능을 극대화하기 위해 알고리즘 선택 및 하이퍼파라미터 최적화를 수행해야 합니다.딥 러닝을 사용하는 경우 신경망의 아키텍처도 머신 러닝 전문가가 선택해야 합니다.
이러한 각 단계는 기계 학습을 사용하는 데 상당한 장애물이 될 수 있습니다.AutoML은 비전문가들을 위해 이러한 단계를 단순화하고, 비전문가들이 기계 학습 기술을 정확하고 효과적으로 사용할 수 있도록 하는 것을 목표로 합니다.
AutoML은 데이터 엔지니어링, 데이터 탐색 및 모델 해석과 같은 까다로운 작업도 포함하는 데이터 과학을 자동화하는 광범위한 접근 방식 내에서 중요한 역할을 합니다.[3]
자동화 대상
자동화된 머신 러닝은 머신 러닝 과정의 다양한 단계를 대상으로 할 수 있습니다.[2]자동화 단계는 다음과 같습니다.
- 데이터 준비 및 수집(원시 데이터 및 기타 형식에서)
- 피쳐 엔지니어링
- 모델 선택 - 사용할 기계 학습 알고리즘을 선택합니다. 여러 경쟁 소프트웨어 구현을 포함하는 경우가 많습니다.
- 앙상블 - 여러 모형을 사용하는 경우 단일 모형보다[4] 더 나은 결과를 얻을 수 있는 합의 형태
- 학습 알고리즘의 하이퍼파라미터 최적화 및 특징화
- 시간, 메모리 및 복잡성 제약 조건 하에서 파이프라인 선택
- 평가지표 및 검증절차 선정
- 문제확인
- 누수감지
- 오구성 탐지
- 획득결과 분석
- 사용자 인터페이스 및 시각화 만들기
참고 항목
참고문헌
- ^ Thornton C, Hutter F, Hoos HH, Leyton-Brown K (2013). Auto-WEKA: Combined Selection and Hyperparameter Optimization of Classification Algorithms. KDD '13 Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. pp. 847–855.
- ^ a b Hutter F, Caruana R, Bardenet R, Bilenko M, Guyon I, Kegl B, and Larochelle H. "AutoML 2014 @ ICML". AutoML 2014 Workshop @ ICML. Retrieved 2018-03-28.[영구 데드링크]
- ^ De Bie, Tijl; De Raedt, Luc; Hernández-Orallo, José; Hoos, Holger H.; Smyth, Padhraic; Williams, Christopher K. I. (March 2022). "Automating Data Science". Communications of the ACM. 65 (3): 76–87. doi:10.1145/3495256.
- ^ Erickson, Nick; Mueller, Jonas; Shirkov, Alexander; Zhang, Hang; Larroy, Pedro; Li, Mu; Smola, Alexander (2020-03-13). "AutoGluon-Tabular: Robust and Accurate AutoML for Structured Data". arXiv:2003.06505 [stat.ML].
추가열람
- "Open Source AutoML Tools: AutoGluon, TransmogrifAI, Auto-sklearn, and NNI". Bizety. 2020-06-16.
- 페레이라, 루이스 외"기계학습, 딥러닝, XGboost용 AutoML 도구 비교" 2021 국제신경망 공동회의(IJCNN)IEEE, 2021.https://repositorium.sdum.uminho.pt/bitstream/1822/74125/1/automl_ijcnn.pdf