DL 부스트
DL Boost인텔의 DL 부스트(Deep Learning Boost)[1]는 트레이닝이나 추론 등의 딥 러닝 태스크의 퍼포먼스를 향상시키기 위해 설계된 x86-64 명령어셋 아키텍처 기능의 마케팅 이름입니다.DL Boost는 다음 두 가지 기능으로 구성됩니다.
- AVX-512 VNNI, 4VNNIW, 또는 AVX-VNNI: 주로 컨볼루션뉴럴 네트워크용 고속 다중 축적.
- AVX-512 BF16: 일반적으로 보다 빠른 계산을 위해 정밀도가 낮은 bfloat16 부동소수점 숫자.제공되는 작업에는 float32 및 닷 곱으로의 변환이 포함됩니다.
DL Boost 기능은 Cascade Lake 아키텍처에 도입되었습니다.
Google Cloud Platform Compute Engine에서 TensorFlow 기반 벤치마크를 실행하면 이전 CPU 및 GPU에 비해 성능이 향상되고 비용이 절감됩니다(특히 배치 크기가 [2]작을 경우).