데이터 증강

Data augmentation

데이터 분석에서 데이터 증강은 기존 데이터의 약간 수정된 복사본이나 기존 데이터에서 새로 생성된 합성 데이터를 추가하여 데이터 양을 증가시키는 기술입니다. 기능은 [1]정규화 기능을 하며 기계 학습 모델을 교육할 때 과적합을 줄이는 데 도움이 됩니다.이는 데이터 분석의 오버샘플링과 밀접한 관련이 있습니다.

기존 기계 학습을 위한 합성 오버샘플링 기술

이미지 분류를 위한 데이터 확대

새로운 합성 이미지 소개

데이터 세트가 매우 작을 경우, 회전 및 미러링 등으로 증강된 버전은 여전히 주어진 문제에 충분하지 않을 수 있습니다.또 다른 솔루션은 다양한 기술을 통해 완전히 새로운 합성 이미지를 소싱하는 것입니다. 예를 들어, 데이터 [1]증강을 위한 새로운 합성 이미지를 생성하기 위해 적대적 네트워크를 사용하는 것입니다.또한 이미지 인식 알고리즘은 가상 환경에서 렌더링된 이미지를 실제 [2]데이터로 전송할 때 향상된 성능을 보여 줍니다.

신호 처리를 위한 데이터 확대

나머지 부트스트랩 또는 블록 부트스트랩은 시계열 증대에 사용할 수 있습니다.

생체 신호

합성 데이터 확대는 기계 학습 분류, 특히 고차원적이고 부족한 경향이 있는 생물학적 데이터에 가장 중요하다.장애인과 신체 건강한 피험자에 대한 로봇 제어 및 증강 적용은 여전히 주로 피험자별 분석에 의존한다.데이터 부족은 소스를 얻기 어려운 파킨슨병 전기 근 조영 신호와 같은 신호 처리 문제에서 두드러진다. Zanini 등은 이에 대응하는 합성 근 조영 신호를 생성하기 위해 생성적 적대 네트워크(특히 DCGAN)를 사용하여 스타일 전송을 수행하는 것이 가능하다고 언급했다.파킨슨병 [3]환자에 의해 전시된 사람들에게 전달되었습니다.

접근법은 뇌파(뇌파)에서도 중요하다.Wang, 등은 EEG 기반 감정 인식을 위해 심층 컨볼루션 뉴럴 네트워크를 사용하는 아이디어를 탐구했으며, 결과는 데이터 증대를 [4]사용했을 때 감정 인식이 개선되었음을 보여준다.

GPT-2가 생성한 EEG 신호(왼쪽)와 실제 인간 뇌파(오른쪽)를 "집중", "여유" 및 "중립" 정신 상태[5] 클래스에서 비교.

또한 Open은AI의 GPT-2 모델은 EEG, EMG [5]등의 합성 생체신호를 학습 및 발생시킬 수 있으며, 본 연구에서는 데이터 확대에 의해 인식이 개선되었다는 점에 주목했다.또한 합성 영역에서 훈련한 통계 기계 학습 모델은 인간 데이터를 분류할 수 있고, 그 반대도 마찬가지라는 점에 주목했다.GPT-2 모델과 인간의 뇌에 의해 생성된 EEG의 몇 가지 예에 의해 비교된다.

일반적인 접근방식은 실제 데이터의 컴포넌트를 재배열하여 합성신호를 생성하는 것입니다.Lotte[6]"인공 재판 세대 유추에 기초한"의 곳에서 세개의 데이터 예 x1x2x3{\displaystyle x_{1},x_{2},x_{3} 메서드}과 인공 xsynthe어 나는{\displaystyle x_{합성}c}예를 제공하는 3{\displaystyle x_{3}x는 것입니다}이 x2{형성된다 제안했다.\d 입니다.2({와 보다 유사하도록 }})에 적용되어 ({됩니다. 입니다.이 접근방식은 세 개의 다른 데이터 세트에서 선형 판별 분석 분류기의 성능을 향상시키는 것으로 나타났다.

현재의 연구는 비교적 단순한 기술에서 큰 영향을 얻을 수 있다는 것을 보여준다.예를 들어, Freer는[7] 수집된 데이터에 노이즈를 도입하여 추가 데이터 포인트를 형성함으로써 상대적으로 성능이 저조했던 여러 모델의 학습 능력을 향상시켰다고 관찰했다.칭가노스 [8]등은 손 제스처 인식을 위한 크기 뒤틀림, 웨이브릿 분해 및 합성 표면 EMG 모델(생성적 접근법)의 접근방식을 연구하여 훈련 중 증강 데이터가 도입되었을 때 최대 +16%의 분류 성능 증가를 발견했다.보다 최근에는 데이터 증강 연구가 딥 러닝 분야, 특히 분류 모델 훈련 과정에서 도입되는 인공 데이터를 생성하는 생성 모델의 능력에 초점을 맞추기 시작했다.2018년, Luo 등은 조건부 [9]Wasserstein Generative Adversarial Networks (GANs)에 의해 유용한 EEG 신호 데이터가 생성될 수 있다는 것을 관찰하였습니다. GANs는 그 후 기존의 열차 시험 학습 프레임워크에서 훈련 세트에 도입되었습니다.저자들은 그러한 기법이 도입되었을 때 분류 성능이 향상되었다는 것을 발견했다.

음성 인식을 위한 데이터 확대

음성 MFCC의 합성 데이터 생성은 문자 수준 반복 신경 네트워크(RNN)[10]를 통해 생성된 합성 데이터에서 전달 학습을 통해 발화자의 인식을 개선할 수 있다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b Shorten, Connor; Khoshgoftaar, Taghi M. (2019). "A survey on Image Data Augmentation for Deep Learning". Mathematics and Computers in Simulation. springer. 6: 60. doi:10.1186/s40537-019-0197-0.
  2. ^ Bird, Jordan J; Faria, Diego R; Ekart, Aniko; Ayrosa, Pedro PS (2020-08-30). From simulation to reality: CNN transfer learning for scene classification. 2020 IEEE 10th International Conference on Intelligent Systems (IS). Varna, Bulgaria: IEEE. pp. 619–625.{{cite conference}}: CS1 유지보수: 날짜 및 연도(링크)
  3. ^ Anicet Zanini, Rafael; Luna Colombini, Esther (2020). "Parkinson's Disease EMG Data Augmentation and Simulation with DCGANs and Style Transfer". Sensors. 20 (9): 2605. doi:10.3390/s20092605. ISSN 1424-8220. PMC 7248755. PMID 32375217.
  4. ^ Wang, Fang; Zhong, Sheng-hua; Peng, Jianfeng; Jiang, Jianmin; Liu, Yan (2018). "Data Augmentation for EEG-Based Emotion Recognition with Deep Convolutional Neural Networks". Multi Media Modeling. Lecture Notes in Computer Science. Vol. 10705. pp. 82–93. doi:10.1007/978-3-319-73600-6_8. ISBN 978-3-319-73599-3. ISSN 0302-9743.
  5. ^ a b Bird, Jordan J.; Pritchard, Michael George; Fratini, Antonio; Ekart, Aniko; Faria, Diego (2021). "Synthetic Biological Signals Machine-generated by GPT-2 improve the Classification of EEG and EMG through Data Augmentation" (PDF). IEEE Robotics and Automation Letters. 6 (2): 3498–3504. doi:10.1109/LRA.2021.3056355. ISSN 2377-3766. S2CID 232373183.
  6. ^ Lotte, Fabien (2015). "Signal Processing Approaches to Minimize or Suppress Calibration Time in Oscillatory Activity-Based Brain–Computer Interfaces". Proceedings of the IEEE. 103 (6): 871–890. doi:10.1109/JPROC.2015.2404941. ISSN 0018-9219. S2CID 22472204.
  7. ^ Freer, Daniel; Yang, Guang-Zhong (2020). "Data augmentation for self-paced motor imagery classification with C-LSTM". Journal of Neural Engineering. 17 (1): 016041. Bibcode:2020JNEng..17a6041F. doi:10.1088/1741-2552/ab57c0. hdl:10044/1/75376. ISSN 1741-2552. PMID 31726440.
  8. ^ Tsinganos, Panagiotis; Cornelis, Bruno; Cornelis, Jan; Jansen, Bart; Skodras, Athanassios (2020). "Data Augmentation of Surface Electromyography for Hand Gesture Recognition". Sensors. 20 (17): 4892. doi:10.3390/s20174892. ISSN 1424-8220. PMC 7506981. PMID 32872508.
  9. ^ Luo, Yun; Lu, Bao-Liang (2018). "EEG Data Augmentation for Emotion Recognition Using a Conditional Wasserstein GAN". 2018 40th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC). Annual International Conference of the IEEE Engineering in Medicine and Biology Society. IEEE Engineering in Medicine and Biology Society. Annual International Conference. Vol. 2018. pp. 2535–2538. doi:10.1109/EMBC.2018.8512865. ISBN 978-1-5386-3646-6. PMID 30440924. S2CID 53105445.
  10. ^ Bird, Jordan J.; Faria, Diego R.; Premebida, Cristiano; Ekart, Aniko; Ayrosa, Pedro P. S. (2020). "Overcoming Data Scarcity in Speaker Identification: Dataset Augmentation with Synthetic MFCCs via Character-level RNN". 2020 IEEE International Conference on Autonomous Robot Systems and Competitions (ICARSC). pp. 146–151. doi:10.1109/ICARSC49921.2020.9096166. ISBN 978-1-7281-7078-7. S2CID 218832459.