AMD 인스팅트
AMD Instinct![]() | 이 기사는 업데이트가 필요합니다.(2022년 1월) |
![]() | |
출고일자 | 2017년 6월 20일 ( |
---|---|
설계자 : | AMD |
마케팅 담당자 | AMD |
건축학 | |
모델들 | MI 시리즈 |
트랜지스터 |
|
제작공정 | |
역사 | |
선대 |
AMD 인스팅트는 AMD의 전문 GPU 브랜드입니다.[1][2]2016년 AMD의 파이어프로스 브랜드를 대체했습니다.주류 소비자/게이머 제품의 라데온 브랜드에 비해 인스팅트 제품군은 딥 러닝, 인공 신경망 및 고성능 컴퓨팅/GPGPU 응용 프로그램을 가속화하기 위한 것입니다.
Radeon Instinct 제품군은 Nvidia의 Ampere 및 Intel Xeon Phi, 그리고 들어오는 Intel Xe 라인의 머신 러닝 및 GPGPU 카드와 직접적으로 경쟁합니다.
2020년 11월 MI100이 출시되기 전 AMD 라데온 인스팅트 계열은 AMD 라데온 인스팅트로 알려졌지만 AMD는 라데온 브랜드를 이름에서 삭제했습니다.
(AMD CPU 및) AMD Instinct GPU를 기반으로 하는 슈퍼컴퓨터는 이제 Green500 슈퍼컴퓨터 목록에서 50% 이상의 우위를 차지하고 있으며, TOP500 목록에서 현재 세계에서 가장 빠른 2위인 Frontier를 포함하여 처음 4위를 차지했습니다.
상품들
![]() | 이 섹션을 업데이트해야 합니다.(2022년 1월) |
라데온 인스팅트의 초기 제품 3종은 2016년 12월 12일에 발표되었으며 2017년 6월 20일에 출시되었으며 각각 다른 아키텍처를 기반으로 합니다.[3][4]
MI6
MI6는 16GB의 GDDR5 메모리와 150W 미만의 TDP를 가진 패시브 냉각된 폴라리스 10 기반 카드입니다.[1][2] 5.7 TFLOPS(FP16 및 FP32)에서 MI6는 신경망 훈련보다는 주로 추론에 사용될 것으로 예상됩니다.MI6는 358 GFLOPS의 최고 이중 정밀도(FP64) 컴퓨팅 성능을 갖추고 있습니다.[5]
MI8
MI8은 피지 기반 카드로 R9 Nano와 유사하며 175W 미만의 TDP를 가질 것으로 예상됩니다.[1]MI8에는 4GB의 고대역폭 메모리가 있습니다.8.2 TFLOPS(FP16 및 FP32)에서 MI8은 추론 방향으로 표시됩니다.MI8은 FP64(피크) 이중 정밀 컴퓨팅 성능 512 GFLOPS를 갖추고 있습니다.[6]
MI25
MI25는 HBM2 메모리를 사용하는 베가 기반 카드입니다.MI25 성능은 FP32 숫자를 사용하여 12.3 TFLOPS로 예상됩니다.MI6 및 MI8과 대조적으로, MI25는 더 낮은 정밀도 숫자를 사용할 때 성능을 향상시킬 수 있으며, 따라서 FP16 숫자를 사용할 때 24.6 TFLOPS에 이를 것으로 예상됩니다.MI25는 패시브 냉각이 적용된 300W 미만의 TDP로 평가됩니다.MI25는 또한 1/16 속도로 768 GFLOPS 피크 이중 정밀도(FP64)를 제공합니다.[7]
액셀러레이터 | 건축학 | 리소그래피 | 계산 단위 | 기억 | 메모리 유형 | PCIe 지원 | 폼 팩터 | FP16 성능 | BF16 성능 | FP32 성능 | FP32 매트릭스 성능 | FP64 성능 | FP64 매트릭스 성능 | INT8 성능 | INT4 성능 | TBP 피크 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
MI6 | GCN 4 | 14nm | 36 | 16GB | GDDR5 | 3.0 | PCIe | 5.7 TFLOP | 해당 없음 | 5.7 TFLOP | 해당 없음 | 358 GFLOPS | 해당 없음 | 해당 없음 | 해당 없음 | 150W |
MI8 | GCN 3 | 28nm | 64 | 4GB | HBM | 8.2 TFLOPS | 8.2 TFLOPS | 512 GFLOPS | 175W | |||||||
MI25 | GCN 5 | 14nm | 64 | 16GB | HBM2 | 26.4 TFLOP | 12.3 TFLOP | 768 GFLOPS | 300W | |||||||
MI50 | GCN 5 | 7nm | 60 | 4.0 | 26.5 TFLOP | 13.3 티플롭스 | 6.6 TFLOP | 53 TOPS | 300W | |||||||
MI60 | GCN 5 | 64 | 32GB | 29.5 TFLOPS | 14.7 TFLOP | 7.4 TFLOP | 59 TOPS | 300W | ||||||||
MI100 | CDNA | 120 | 184.6 TFLOP | 92.3 TFLOPS | 23.1 TFLOPS | 46.1 TFLOPS | 11.5 TFLOPS | 184.6 상단 | 300W | |||||||
MI210 | CDNA 2 | 6nm | 104 | 64 GB | HBM2e | 181 티플롭스 | 22.6 TFLOP | 45.3 TFLOP | 22.6 TFLOP | 45.3 TFLOP | 181 TOPS | 300W | ||||
MI250 | CDNA 2 | 208 | 128GB | OAM | 362.1 TFLOPS | 45.3 TFLOP | 90.5 티플롭스 | 45.3 TFLOP | 90.5 티플롭스 | 362.1 상의 | 560W | |||||
MI250X | CDNA 2 | 220 | 383 티플롭스 | 47.92 TFLOPS | 95.7 TFLOP | 47.9 TFLOPS | 95.7 TFLOP | 383TOPS | 560W |
소프트웨어
ROCM
다음 소프트웨어는 2022년 현재 라데온 오픈 컴퓨팅 메타 프로젝트로 재조직되었습니다.
MxGPU
MI6, MI8, MI25 제품은 모두 AMD의 MxGPU 가상화 기술을 지원하여 여러 사용자 간에 GPU 리소스를 공유할 수 있습니다.[1][8]
미오펜
MIOpen은 딥러닝의 GPU 가속화를 가능하게 하는 AMD의 딥러닝 라이브러리입니다.[1]이 중 많은 부분이 GPUOpen의 볼츠만 이니셔티브 소프트웨어를 확장합니다.[8]이것은 Nvidia의 CUDA 라이브러리의 딥 러닝 부분과 경쟁하기 위한 것입니다.딥러닝 프레임워크를 지원합니다.Theano, Caffe, TensorFlow, MXNet, Microsoft Cognitive Toolkit, Torch, Chainer.프로그래밍은 OpenCL 및 Python에서 지원되며, AMD의 Heterogeneous Compute Interface for Portability 및 Heterogeneous Compute Computer를 통해 CUDA 컴파일을 지원합니다.
칩셋 테이블
모델 (코드명) | 출고일자 | 건축학 & 팹 | 트랜지스터 & 다이사이즈 | 코어 | 채움률[a][b][c] | 가공력[a][d] (TFLOPS) | 기억 | TBP | 버스 인테 | |||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
구성[e] | 시계[a] (MHz) | 식감 (GT/s) | 화소 (GP/s) | 반 | 싱글 | 더블 | 크기 (GB) | 버스종류 & 폭을 | 대역폭 (GB/s) | 시계 (MT/s) | ||||||
라데온 인스팅트 MI6 (북극성 10)[9][10][11][12][13][14] | 2017년6월20일 | GCN 4 글로포 14LP | 5.7x109 232mm2 | 2304:144:32 36 CU | 1120 1233 | 161.3 177.6 | 35.84 39.46 | 5.161 5.682 | 5.161 5.682 | 0.323 0.355 | 16 | GDDR5 256비트 | 224 | 7000 | 150W | PCIe 3.0 ×16 |
라데온 인스팅트 MI8 (피지)[9][10][11][15][16][17] | GCN 3 TSMC 28nm | 8.9x109 596mm2 | 4096:256:64 64 CU | 1000 | 256.0 | 64.00 | 8.192 | 8.192 | 0.512 | 4 | HBM 4096비트 | 512 | 1000 | 175W | ||
라데온 인스팅트 MI25 (베가 10)[9][10][11][18][19][20][21] | GCN 5 글로포 14LP | 12.5x109 510mm2 | 1400 1500 | 358.4 384.0 | 89.60 96.00 | 22.94 24.58 | 11.47 12.29 | 0.717 0.768 | 16 | HBM2 2048비트 | 484 | 1890 | 300W | |||
라데온 인스팅트 MI50 (베가 20)[22][23][24][25][26][27] | 2018년11월18일 | GCN 5 TSMCN7 | 13.2x109 331mm2 | 3840:240:64 60 CU | 1450 1725 | 348.0 414.0 | 92.80 110.4 | 22.27 26.50 | 11.14 13.25 | 5.568 6.624 | 16 32 | HBM2 4096비트 | 1024 | 2000 | PCIe 4.0 ×16 | |
라데온 인스팅트 MI60 (베가 20)[23][28][29][30] | 4096:256:64 64 CU | 1500 1800 | 384.0 460.8 | 96.00 115.2 | 24.58 29.49 | 12.29 14.75 | 6.144 7.373 | 32 | ||||||||
AMD 인스팅트 MI100 (Arcturus)[31][32][33] | 2020년11월16일 | CDNA TSMC N7 | 25.6x109 750mm2 | 7680:480:- 120 CU | 1000 1502 | 480.0 721.0 | — | 122.9 184.6 | 15.36 23.07 | 7.680 11.54 | 1228.8 | 2400 | ||||
AMD 인스팅트 MI210 (알데바란)[34][35][36] | 2022년3월22일 | CDNA 2 TSMC N6 | 28 x 109 ~770mm2 | 6656:416:- 104 CU (1 × GCD)[f] | 1000 1700 | 416.0 707.2 | 106.5 181.0 | 13.31 22.63 | 13.31 22.63 | 64 | HBM2e 4096비트 | 1638.4 | 3200 | |||
AMD 인스팅트 MI250 (알데바란)[37][38][39] | 2021년11월8일 | 58 x 109 1540mm2 | 13312:832:- 208 CU (2 × GCD) | 832.0 1414 | 213.0 362.1 | 26.62 45.26 | 26.62 45.26 | 2 × 64 | HBM2e 2x4096비트[g] | 2 × 1638.4 | 500W 560W(피크) | |||||
AMD 인스팅트 MI250X (알데바란)[40][38][41] | 14080:880:- 220 CU (2 × GCD) | 880.0 1496 | 225.3 383.0 | 28.16 47.87 | 28.16 47.87 |
- ^ a b c 부스트 값(사용 가능한 경우)은 기본 값 아래에 기울임꼴로 표시됩니다.
- ^ 텍스처 채우기 속도는 텍스처 매핑 단위 수에 기본(또는 부스트) 코어 클럭 속도를 곱한 값으로 계산됩니다.
- ^ 픽셀 채우기 속도는 렌더링 출력 단위 수에 기본(또는 부스트) 코어 클럭 속도를 곱한 값으로 계산됩니다.
- ^ 정밀 성능은 FMA 작동을 기준으로 기본(또는 부스트) 코어 클럭 속도로부터 계산됩니다.
- ^ Unified Shader : Texture Mapping units : Render output units 와 Compute units (CU)
- ^ GCD는 그래픽 컴퓨팅 다이를 말합니다.각각의 GCD는 다른 실리콘 조각입니다.
- ^ CDNA 2.0 Based 카드는 같은 패키지에 두 개의 다이를 사용하는 디자인을 채택합니다.400GB/s 양방향 Infinity Fabric 링크와 연결되어 있으며, 다이는 호스트 시스템에서 개별 GPU로 처리됩니다.
참고 항목
- ROCm - AMD의 개방형 컴퓨팅 소프트웨어 스택
- AMD FirePro - AMD의 라데온 인스팅트의 전신
- AMD 라데온 프로 - AMD의 워크스테이션 그래픽 및 GPGPU 솔루션
- Nvidia Quadro - Nvidia의 경쟁사 워크스테이션 그래픽 솔루션
- 엔비디아 테슬라 - 엔비디아의 경쟁사 GPGPU 솔루션
- Xeon Phi - Intel의 경쟁사인 대규모 병렬 멀티코어 프로세서 제품군
- AMD 그래픽스 프로세싱 유닛 목록
참고문헌
- ^ a b c d e Smith, Ryan (December 12, 2016). "AMD Announces Radeon Instinct: GPU Accelerators for Deep Learning, Coming in 2017". Anandtech. Retrieved December 12, 2016.
- ^ a b Shrout, Ryan (December 12, 2016). "Radeon Instinct Machine Learning GPUs include Vega, Preview Performance". PC Per. Retrieved December 12, 2016.
- ^ WhyCry (December 12, 2016). "AMD announces first VEGA accelerator:RADEON INSTINCT MI25 for deep-learning". VideoCardz. Retrieved June 6, 2022.
- ^ Mujtaba, Hassan (June 21, 2017). "AMD Radeon Instinct MI25 Accelerator With 16 GB HBM2 Specifications Detailed – Launches Today Along With Instinct MI8 and Instinct MI6". Wccftech. Retrieved June 6, 2022.
- ^ "Radeon Instinct MI6". Radeon Instinct. AMD. Retrieved June 22, 2017.[영구 데드링크]
- ^ "Radeon Instinct MI8". Radeon Instinct. AMD. Retrieved June 22, 2017.[영구 데드링크]
- ^ "Radeon Instinct MI25". Radeon Instinct. AMD. Retrieved June 22, 2017.[영구 데드링크]
- ^ a b Kampman, Jeff (December 12, 2016). "AMD opens up machine learning with Radeon Instinct". TechReport. Retrieved December 12, 2016.
- ^ a b c Smith, Ryan (December 12, 2016). "AMD Announces Radeon Instinct: GPU Accelerators for Deep Learning, Coming in 2017". AnandTech. Retrieved December 12, 2016.
- ^ a b c Shrout, Ryan (December 12, 2016). "Radeon Instinct Machine Learning GPUs include Vega, Preview Performance". PCPerspective. Retrieved December 12, 2016.
- ^ a b c Kampman, Jeff (December 12, 2016). "AMD opens up machine learning with Radeon Instinct". Tech Report. Retrieved December 12, 2016.
- ^ "Radeon Instinct MI6". AMD. Archived from the original on August 1, 2017. Retrieved May 27, 2022.
- ^ "AMD Radeon Instinct MI6 Datasheet" (PDF). usermanual.wiki. Retrieved May 27, 2022.
- ^ "AMD Radeon Instinct MI6 Specs". TechPowerUp. Retrieved May 27, 2022.
- ^ "Radeon Instinct MI8". AMD. Archived from the original on August 1, 2017. Retrieved May 27, 2022.
- ^ "AMD Radeon Instinct MI8 Datasheet" (PDF). usermanual.wiki. Retrieved May 27, 2022.
- ^ "AMD Radeon Instinct MI8 Specs". TechPowerUp. Retrieved May 27, 2022.
- ^ Smith, Ryan (January 5, 2017). "The AMD Vega Architecture Teaser: Higher IPC, Tiling, & More, coming in H1'2017". AnandTech. Retrieved January 10, 2017.
- ^ "Radeon Instinct MI25". AMD. Archived from the original on August 1, 2017. Retrieved May 27, 2022.
- ^ "AMD Radeon Instinct MI25 Datasheet" (PDF). AMD. Retrieved May 27, 2022.
- ^ "AMD Radeon Instinct MI25 Specs". TechPowerUp. Retrieved May 27, 2022.
- ^ Walton, Jarred (January 10, 2019). "Hands on with the AMD Radeon VII". PC Gamer.
- ^ a b "Next Horizon – David Wang Presentation" (PDF). AMD.
- ^ "AMD Radeon Instinct MI50 Accelerator (16GB)". AMD. Retrieved December 24, 2022.
- ^ "AMD Radeon Instinct MI50 Accelerator (32GB)". AMD. Retrieved December 24, 2022.
- ^ "AMD Radeon Instinct MI50 Datasheet" (PDF). AMD. Retrieved December 24, 2022.
- ^ "AMD Radeon Instinct MI50 Specs". TechPowerUp. Retrieved May 27, 2022.
- ^ "Radeon Instinct MI60". AMD. Archived from the original on November 22, 2018. Retrieved May 27, 2022.
- ^ "AMD Radeon Instinct MI60 Datasheet" (PDF). AMD. Retrieved December 24, 2022.
- ^ "AMD Radeon Instinct MI60 Specs". TechPowerUp. Retrieved May 27, 2022.
- ^ "AMD Instinct MI100 Accelerator". AMD. Retrieved May 27, 2022.
- ^ "AMD Instinct MI100 Accelerator Brochure" (PDF). AMD. Retrieved May 27, 2022.
- ^ "AMD Radeon Instinct MI100 Specs". TechPowerUp. Retrieved May 26, 2022.
- ^ "AMD Instinct MI210 Accelerator". AMD. Retrieved May 27, 2022.
- ^ "AMD Instinct MI210 Accelerator Brochure" (PDF). AMD. Retrieved May 27, 2022.
- ^ "AMD Radeon Instinct MI210 Specs". TechPowerUp. Retrieved May 27, 2022.
- ^ "AMD Instinct MI250 Accelerator". AMD. Retrieved May 27, 2022.
- ^ a b "AMD Instinct MI200 Series Accelerator Datasheet" (PDF). AMD. Retrieved December 24, 2022.
- ^ "AMD Radeon Instinct MI250 Specs". TechPowerUp. Retrieved May 26, 2022.
- ^ "AMD Instinct MI250X Accelerator". AMD. Retrieved May 27, 2022.
- ^ "AMD Radeon Instinct MI250X Specs". TechPowerUp. Retrieved May 26, 2022.