자동화된 기계학습

Automated machine learning

자동 머신 러닝(AutoML)은 머신 러닝을 실제 문제에 적용하는 작업을 자동화하는 프로세스입니다.AutoML은 원시 데이터 세트에서 배포 준비가 된 머신 러닝 모델을 구축하기까지 모든 단계를 포함할 수 있습니다.오토엠엘은 머신러닝 적용에 대한 도전이 커지고 있는 상황에서 인공지능 기반 솔루션으로 제안됐습니다.[1][2]AutoML의 높은 자동화 수준은 비전문가가 머신러닝 전문가가 될 필요 없이 머신러닝 모델과 기술을 활용할 수 있도록 하는 것을 목표로 합니다.머신 러닝을 엔드 투 엔드로 적용하는 프로세스를 자동화하면 보다 단순한 솔루션을 생성할 수 있고, 해당 솔루션을 보다 빠르게 생성할 수 있으며, 수작업으로 설계된[citation needed] 모델보다 성능이 뛰어난 모델이 제공됩니다.AutoML에서 사용되는 일반적인 기술로는 하이퍼 파라미터 최적화, 메타 학습신경 아키텍처 검색이 있습니다.

표준 접근 방식과 비교

일반적인 머신 러닝 애플리케이션에서, 실무자들은 훈련에 사용할 입력 데이터 포인트 세트를 가지고 있습니다.원시 데이터는 모든 알고리즘을 적용할 수 있는 형태가 아닐 수 있습니다.데이터를 기계 학습에 사용할 수 있도록 하려면 전문가가 적절한 데이터 전처리, 특징 엔지니어링, 특징 추출특징 선택 방법을 적용해야 할 수 있습니다.이 단계를 거친 후, 실무자는 모델의 예측 성능을 극대화하기 위해 알고리즘 선택하이퍼파라미터 최적화를 수행해야 합니다.딥 러닝을 사용하는 경우 신경망의 아키텍처도 머신 러닝 전문가가 선택해야 합니다.

이러한 각 단계는 기계 학습을 사용하는 데 상당한 장애물이 될 수 있습니다.AutoML은 비전문가들을 위해 이러한 단계를 단순화하고, 비전문가들이 기계 학습 기술을 정확하고 효과적으로 사용할 수 있도록 하는 것을 목표로 합니다.

AutoML은 데이터 엔지니어링, 데이터 탐색 및 모델 해석과 같은 까다로운 작업도 포함하는 데이터 과학을 자동화하는 광범위한 접근 방식 내에서 중요한 역할을 합니다.[3]

자동화 대상

자동화된 머신 러닝은 머신 러닝 과정의 다양한 단계를 대상으로 할 수 있습니다.[2]자동화 단계는 다음과 같습니다.

  • 데이터 준비 및 수집(원시 데이터 및 기타 형식에서)
    • 유형 감지(예: 부울, 이산 숫자, 연속 숫자 또는 텍스트)
    • 열 의도 탐지(예: 대상/라벨, 계층화 필드, 수치 피쳐, 범주형 텍스트 피쳐 또는 자유 텍스트 피쳐)
    • 작업 탐지(예: 이진 분류, 회귀, 클러스터링 또는 순위 지정)
  • 피쳐 엔지니어링
  • 모델 선택 - 사용할 기계 학습 알고리즘을 선택합니다. 여러 경쟁 소프트웨어 구현을 포함하는 경우가 많습니다.
  • 앙상블 - 여러 모형을 사용하는 경우 단일 모형보다[4] 더 나은 결과를 얻을 수 있는 합의 형태
  • 학습 알고리즘의 하이퍼파라미터 최적화 및 특징화
  • 시간, 메모리 및 복잡성 제약 조건 하에서 파이프라인 선택
  • 평가지표 및 검증절차 선정
  • 문제확인
  • 획득결과 분석
  • 사용자 인터페이스 및 시각화 만들기

참고 항목

참고문헌

  1. ^ Thornton C, Hutter F, Hoos HH, Leyton-Brown K (2013). Auto-WEKA: Combined Selection and Hyperparameter Optimization of Classification Algorithms. KDD '13 Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. pp. 847–855.
  2. ^ a b Hutter F, Caruana R, Bardenet R, Bilenko M, Guyon I, Kegl B, and Larochelle H. "AutoML 2014 @ ICML". AutoML 2014 Workshop @ ICML. Retrieved 2018-03-28.[영구 데드링크]
  3. ^ De Bie, Tijl; De Raedt, Luc; Hernández-Orallo, José; Hoos, Holger H.; Smyth, Padhraic; Williams, Christopher K. I. (March 2022). "Automating Data Science". Communications of the ACM. 65 (3): 76–87. doi:10.1145/3495256.
  4. ^ Erickson, Nick; Mueller, Jonas; Shirkov, Alexander; Zhang, Hang; Larroy, Pedro; Li, Mu; Smola, Alexander (2020-03-13). "AutoGluon-Tabular: Robust and Accurate AutoML for Structured Data". arXiv:2003.06505 [stat.ML].

추가열람