지포스 400계 전동차
GeForce 400 series| 출시일자 | 2010년 4월 12일; 전( |
|---|---|
| 암호명 | GF10x |
| 건축 | 페르미 |
| 모델 | 지포스 시리즈
|
| 트랜지스터 | 260M 40nm(GT218)
|
| 카드 | |
| 엔트리 레벨 | GT 420 GT 430 |
| 미드레인지 | GT 440 GTS 450 GTX 460 GTX 465 |
| 하이엔드 | GTX 470 GTX 480 |
| API 지원 | |
| 다이렉트3D | Direct3D 12.0(특징 레벨 11_0)[1] |
| 오픈CL | OpenCL 1.1 |
| 오픈GL | 오픈GL 4.6 |
| 역사 | |
| 전임자 | 지포스 200계 전동차 |
| 후계자 | 지포스 500계 전동차 |
페르미의 소개로 활약하고 있는 지포스 400 시리즈는 엔비디아가 개발한 일련의 그래픽 처리 장치다.원래 2009년 11월에 출시될 예정이었으나,[2] 연기 후 2010년 4월에 이어 2010년 3월 26일에 출시되었다.
ATI의 라데온 HD 5000 시리즈가 직접적인 경쟁사였다.
건축
엔비디아는 페르미 마이크로아키텍처(Fermi MicroArchitecture)를 G80 이후 사용된 테슬라 마이크로아키텍처(Tesla MicroArchitecture)에 이어 GPU 라인의 다음 주요 단계로 설명했다.최초의 페르미 아키텍처 제품인 GF100은 대형으로 TSMC가 40nm 공정으로 제조한 512개의 스트림 프로세서, 32개 그룹 16개 그룹, 30억개의 트랜지스터가 있다.엔비디아가 처음으로 오픈GL 4.0과 다이렉트3D 11을 지원하는 칩이다.GF100 GPU가 완전히 활성화된 제품은 판매되지 않았다.GTX 480은 스트리밍 멀티프로세서 1개가 비활성화되었다.GTX 470은 스트리밍 멀티프로세서 2개와 메모리 컨트롤러 1개가 비활성화된 상태였다.GTX 465에는 스트리밍 멀티프로세서 5개와 메모리 컨트롤러 2개가 비활성화되어 있었다.Consumer GeForce 카드는 사용 가능한 각 GDDR5 메모리 컨트롤러에 256MB가 연결된 상태로 제공되었으며, 총 1.5, 1.25 또는 1.0의 용량을 제공하였다.GB; Tesla C2050은 6개의 컨트롤러 각각에 512MB를 가지고 있었고 Tesla C2070은 컨트롤러당 1024MB를 가지고 있었다.두 테슬라 카드 모두 14개의 액티브 스트림 프로세서 그룹이 있었다.
고성능 테슬라 브랜딩에서 발견되는 칩은 ECC(옵션)가 있는 메모리와 코어당 사이클당 1회의 이중정밀 플로팅 포인트 연산을 수행할 수 있는 기능, 소비자 지포스 카드는 인공적으로 4사이클당 1회의 DP 연산으로 제한된다.이러한 특징과 함께 Visual Studio 및 C++에 대한 지원이 결합되어 Nvidia는 고성능 컴퓨팅에 사용할 뿐만 아니라 전문 및 상업 시장을 타깃으로 삼았다.
페르미는 이탈리아의 물리학자 엔리코 페르미의 이름을 따서 지어졌다.
현재 제한 사항 및 절충
The quantity of on-board SRAM per ALU actually decreased proportionally compared to the previous G200 generation, despite the increase of the L2 cache from 256kB per 240 ALUs to 768kB per 512 ALUs, since Fermi has only 32768 registers per 32 ALUs (vs. 16384 per 8 ALUs), only 48kB of shared memory per 32 ALUs (vs. 16kB per 8 ALUs), and only 16kB of32 ALU당 캐시(8 ALU당 8kB 상수 캐시 + 24 ALU당 24kB 텍스처 캐시)레지스터 수와 같은 파라미터는 참조 매뉴얼의 CUDA 계산 기능 비교 표에서 확인할 수 있다.[3]
역사
9월 30일, 2009년 엔비디아:[4]칩 16'Streaming Multiprocessors의 각 특징으로 한 백서는 건축을 설명하는을 발표했다 32'CUDA Cores의 가능한 하나의 단정 밀도 연산당 또는 한 배정 밀도 연산마다 다른 사이클이며,40-bit 가상 주소 공간을 허용하는 호스트의 메모리에 매핑에 C.엉덩이의 주소 공간, 즉 포인터 종류가 하나뿐이고 C++를 훨씬 쉽게 지원한다는 의미와 384비트 와이드 GDDR5 메모리 인터페이스.G80과 GT200과 마찬가지로 스레드는 하나의 쉐이더 코어에 각각 실행되는 32개의 스레드의 세트인 '워프'로 예약되어 있다.GT200에는 각 셰이더 클러스터와 연결된 16KB의 '공유 메모리'가 있고 캐시가 필요한 경우 텍스처 유닛을 통해 데이터를 읽어야 하는 반면, GF100에는 각 클러스터와 연결된 64KB의 메모리가 있어 공유 메모리 16KB에 공유 메모리 16KB를 더한 16KB 캐시와 공유 메모리 7KB로 사용할 수 있다.68KB L2 캐시는 16개 클러스터 모두에 의해 공유된다.
백서에서는 칩을 그래픽 프로세서가 아닌 Tera MTA 아키텍처를 연상시키는 수만 개의 스레드를 포괄하는 워크로드에 대한 범용 프로세서로 설명하고 있다.
경쟁사 AMD의 라데온 HD 5000 시리즈에 비해 GeForce 400 시리즈 Fermi GPU에서 높은 온도와 낮은 전력 소비량이 개선되었다고 많은 사용자가 보고하였다.[5]영상에는 경찰 부대가 열 프로필이 큰 주택에 대한 급습에 나서는 모습이 포착돼 증식작전을 예고하고 있다.그러나 집에 들어가자마자 고온의 근원이 페르미 GPU임을 알 수 있다.[6][7] 페르미 GPU에 달걀을 가득 싣고 튀길 수 있다는 것은 흔한 농담이 되었다.[8]
상품들
- 1 SP - Shader 프로세서 - Unified Shaders:텍스처 매핑 단위:출력 단위 렌더링
- 2 GF100 아키텍처의 GPU에 있는 각 스트리밍 멀티프로세서(SM)는 32개의 SP와 4개의 SFU를 포함한다.GF104/106/108 아키텍처의 GPU에 있는 각 스트리밍 멀티프로세서(SM)는 48개의 SP와 8개의 SFU를 포함한다.각 SP는 사이클당 2회의 정밀 퓨즈결합 곱셈(FMA) 연산을 수행할 수 있다.각 SFU는 사이클당 4회의 SF 연산을 수행할 수 있다.두 개의 부동 소수점 연산에 대해 하나의 FMA 연산이 계산된다.따라서 쉐이더 카운트[n]와 셰이더 주파수[f, GHz]를 사용하는 이론적인 단일 정밀도 피크 성능은 FLOPSsp ≈ f × n × 2 (FMA)로 추정할 수 있다.Total Processing Power: for GF100 FLOPSsp ≈ f × m ×(32 SPs × 2(FMA) + 4 × 4 SFUs) and for GF104/106/108 FLOPSsp ≈ f × m × (48 SPs × 2(FMA) + 4 × 8 SFUs) or for GF100 FLOPSsp ≈ f × n × 2.5 and for GF104/106/108 FLOPSsp ≈ f × n × 8 / 3.[9]
SP - 셰이더 프로세서(Unified Shader, CUDA Core), SFU - 특수 기능 유닛, SM - 스트리밍 멀티프로세서
- 3 GF100의 각 SM에는 모든 텍스처 주소 단위에 대해 4개의 텍스처 필터링 단위가 포함되어 있다.완전한 GF100 다이에는 64개의 텍스처 어드레스 유닛과 256개의 텍스처 필터링 유닛[10] GF104/106/108 아키텍처의 각 SM에는 모든 텍스처 어드레스 유닛에 대해 8개의 텍스처 필터링 유닛이 포함되어 있다.전체 GF104 다이에는 64개의 텍스처 어드레스 유닛과 512개의 텍스처 필터링 유닛이 포함되어 있으며, 전체 GF106 다이에는 32개의 텍스처 어드레스 유닛과 256개의 텍스처 필터링 유닛이 포함되어 있으며, 전체 GF108 다이에는 16개의 텍스처 어드레스 유닛과 128개의 텍스처 필터링 유닛이 포함되어 있다.[11]
모든 제품은 40nm 제조 공정으로 생산된다.모든 제품은 Direct X 12.0, OpenGL 4.6 및 OpenCL 1.1을 지원한다.유일한 예외는 DirectX 10.1, OpenGL 3.3 및 No OpenCL Support를 지원하는 GT218 코어만을 기반으로 하는 Geforce 405이다.모든 제품은 DB15 VGA 커넥터 하나를 전체 높이와 전체 길이 카드에 가지고 있으며, 달리 열거된 것은 제외한다.
| 모델 | 발사하다 | 암호명 | 트랜지스터(백만) | 다이 사이즈(mm2) | 버스 접점 | SM 카운트 | 코어 구성1,3 | 시계율 | 충만률 | 메모리 구성 | GFLOPS(FMA)2 | TDP(와트) | 출시 가격(USD) | ||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 코어(MHz) | 셰이더(MHz) | 메모리(MHz) | 픽셀(GP/s) | 텍스처(GT/s) | 크기(MB) | 대역폭(GB/s) | D램형 | 버스 폭(비트) | |||||||||||
| 지포스 405(OEM) | 2011년 9월 16일 | GT218 | 260 | 57 | PCIe 2.0 x16 | 1 | 16:8:4 | 589 | 1402 | 1580 | 2.4 | 4.7 | 512 1024 | 12.6 | DDR3 | 64 | 44.9 | 25 | OEM |
| 지포스 GT 420(OEM) | 2010년 9월 3일 | GF108 | 585 | 116 | PCIe 2.0 x16 | 1 | 48:8:4 | 700 | 1400 | 1800 | 2.8 | 5.6 | 2048 | 28.8 | GDDR3 | 128 | 134.4 | 50 | OEM |
| 지포스 GT 430(OEM) | 2010년 10월 11일 | GF108 | 585 | 116 | PCIe 2.0 x16 | 2 | 96:16:4 | 700 | 1400 | 1600 1800 | 2.8 | 11.2 | 2048 | 25.6 28.8 | GDDR3 | 128 | 268.8 | 60 | OEM |
| 지포스 GT 430 | 2010년 10월 11일 | GF108 | 585 | 116 | PCIe 2.0 x16 | 2 | 96:16:4 | 700 | 1400 | 1800 | 2.8 | 11.2 | 1024 | 28.8 | GDDR3 | 128 | 268.8 | 49 | $79 |
| 지포스 GT 440 | 2011년 2월 1일 | GF108 | 585 | 116 | PCIe 2.0 x16 | 2 | 96:16:4 | 810 | 1620 | 1800 3200 | 3.24 | 13.2 | 512 1024 2048 | 28.8 51.2 | GDDR3 GDDR5 | 128 | 311 | 65 | $79 |
| GeForce GT 440(OEM) | 2010년 10월 11일 | GF106 | 1170 | 238 | PCIe 2.0 x16 | 3 | 144:24:24 | 594 | 1189 | 1800 | 14.26 | 14.26 | 1536 3072 | 43.2 | GDDR3 | 192 | 342.4 | 56 | OEM |
| GeForce GTS 450(OEM) | 2010년 10월 11일 | GF106 | 1170 | 238 | PCIe 2.0 x16 | 3 | 144:24:24 | 790 | 1580 | 1804 | 18.96 | 18.96 | 1024 1536 | 86 | GDDR5 | 192 | 455 | 106 | OEM |
| 지포스 GTS 450 | 2010년 9월 13일 | GF106 | 1170 | 238 | PCIe 2.0 x16 | 4 | 192:32:16 | 783 | 1566 | 1804 | 12.53 | 25.06 | 512 1024 2048 | 57.73 | GDDR3 GDDR5 | 128 | 601.3 | 106 | $129 |
| 지포스 GTX 460 SE | 2010년 11월 15일 | GF104 | 1950 | 332 | PCIe 2.0 x16 | 6 | 288:48:32 | 650 | 1300 | 3400 | 20.8 | 31.2 | 1024 | 108.8 | GDDR5 | 256 | 748.8 | 150 | $160?-$180? |
| 지포스 GTX 460(OEM) | 2010년 10월 11일 | GF104 | 1950 | 332 | PCIe 2.0 x16 | 7 | 336:56:24 | 650 | 1300 | 3400 | 20.8 | 36.4 | 1024 | 108.8 | GDDR5 | 256 | 873.6 | 150 | OEM |
| 지포스 GTX 460 | 2010년 7월 12일 | GF104 | 1950 | 332 | PCIe 2.0 x16 | 7 | 336:56:24 | 675 | 1350 | 3600 | 16.2 | 37.8 | 768 | 86.4 | GDDR5 | 192 | 907.2 | 150 | $199 |
| 336:56:32 | 21.6 | 1024 2048 | 115.2 | 256 | 160 | $229 | |||||||||||||
| 지포스 GTX 460 v2 | 2011년 9월 24일 | GF114 | 1950 | 332 | PCIe 2.0 x16 | 7 | 336:56:24 | 778 | 1556 | 4008 | 18.67 | 43.57 | 1024 | 96.2 | GDDR5 | 192 | 1045.6 | 160 | $199 |
| 지포스 GTX 465 | 2010년 5월 31일 | GF100 | 3200 | 529 | PCIe 2.0 x16 | 11 | 352:44:32 | 607 | 1215 | 3206 | 19.42 | 26.71 | 1024 | 102.6 | GDDR5 | 256 | 855.4 | 200 | $279 |
| 지포스 GTX 470 | 2010년 3월 26일 | GF100 | 3200 | 529 | PCIe 2.0 x16 | 14 | 448:56:40 | 607 | 1215 | 3348 | 24.28 | 34 | 1280 | 133.9 | GDDR5 | 320 | 1088.6 | 215 | $349 |
| 지포스 GTX 480 | 2010년 3월 26일 | GF100 | 3200 | 529 | PCIe 2.0 x16 | 15 | 480:60:48 | 700 | 1401 | 3696 | 33.60 | 42 | 1536 | 177.4 | GDDR5 | 384 | 1345 | 250 | $499 |
2010년 11월 8일 엔비디아는 GTX 580(480의 교체)과 함께 GF110 칩을 출시했다.전력 사용량이 현저히 적은 재설계된 GF100 칩이다.이로써 엔비디아는 기존에 GF100에서는 불가능했던 16개 SM(모두 16개 코어)을 모두 가능케 했다."Nvidia GeForce GTX 580".{{cite web}}: CS1 maint: url-status (링크) GF100 아키텍처의 다양한 특징들은 더 비싼 Quadro와 Tesla 시리즈 카드에서만 이용할 수 있었다.[12]GeForce 소비자 제품의 경우, 이중 정밀 성능은 "완전한" 페르미 아키텍처의 1/4이다.소비자 카드에서도 에러 확인 및 수정 메모리(ECC)가 작동하지 않는다.[13]GF100 카드는 Compute Capability 2.0을, GF104/106/108 카드는 Compute Capacity 2.1을 제공한다.
칩셋 테이블
중단지원
엔비디아는 릴리즈 390 드라이버 이후 32비트 운영체제용 32비트 드라이버를 더 이상 출시하지 않을 것이라고 발표했다.[14]
엔비디아는 2018년 4월 페르미가 레거시 운전자 지원 상태로 전환해 2019년 1월까지 유지된다고 발표했다.[15]
참고 항목
메모들
- David Kanter (September 30, 2009). "Inside Fermi: Nvidia's HPC Push". realworldtech.com. Retrieved December 16, 2010.
참조
- ^ Killian, Zak (July 3, 2017). "Nvidia finally lets Fermi GPU owners enjoy DirectX 12". Tech Report. Retrieved July 4, 2017.
- ^ "OFFICIAL: NVIDIA says GT300 on schedule for Q4 2009, yields are fine - Bright Side Of News*". Brightsideofnews.com. September 25, 2009. Retrieved September 20, 2010.
- ^ 부록 A의 97페이지의 계산 능력 비교 표는 이전 NVIDIA GPU를 나열하고 모든 G200 시리즈를 계산 능력 1.3으로 나타낸 반면, Fermi 기반 카드는 계산 능력 2.x(14페이지, 섹션 2.5)를 가지고 있다.
- ^ http://www.nvidia.com/content/PDF/fermi_white_papers/NVIDIA_Fermi_Compute_Architecture_Whitepaper.pdf
- ^ Ghostarchive 및 Wayback Machine에 보관:
- ^ "AMD Pokes Fun of NVIDIA's Fermi GPU Heat Output in "The Misunderstanding" Video". August 9, 2010.
- ^ "NVIDIA Fermi GF100 GPUs - Too little, too late, too hot, and too expensive". ZDNet.
- ^ "Archived copy". Archived from the original on September 20, 2019. Retrieved September 20, 2019.
{{cite web}}: CS1 maint: 타이틀로 보관된 사본(링크) - ^ siliconmadness.com (2010). "Nvidia Announces Tesla 20 Series". Archived from the original on May 21, 2010.
- ^ 엔비디아의 지포스 GTX 480과 GTX 470: 6개월 늦었지만 기다릴 만한 가치가 있었을까?
- ^ NVIDIA의 GeForce GTX 460:200달러의 왕
- ^ "Statement by NVIDIA on their General CUDA GPU Computing Discussion forum".
- ^ "NVIDIA Tesla C2xxx webpage"., 설명에서 유추할 수 있는 것은, 메모리 칩이 1/8 더 필요한 표준 ECC 메모리 모듈(즉, 매 8개마다 인쇄 회로 기판에 1개의 추가 칩을 장착해야 하는 표준 ECC 메모리 모듈과 달리, Teslas에서는 기존 온보드 메모리의 1/8을 사용하여 ECC를 켜고 끌 수 있다는 것이다.
- ^ "Support Plan for 32-bit and 64-bit Operating Systems NVIDIA".
- ^ "Support Plan for Fermi series GeForce GPUs NVIDIA".
외부 링크
| 위키미디어 커먼즈에는 지포스 400 시리즈와 관련된 미디어가 있다. |