그래픽 처리 장치
Graphics processing unitGPU(Graphics Processing Unit, GPU)는 디스플레이 장치에 출력하기 위한 프레임 버퍼에서 이미지 생성을 가속화하기 위해 메모리를 신속하게 조작하고 변경할 수 있도록 고안된 전문 전자회로다. GPU는 임베디드 시스템, 휴대폰, 개인용 컴퓨터, 워크스테이션, 게임기에서 사용된다.
현대의 GPU는 컴퓨터 그래픽과 이미지 처리에 매우 효율적이다. 이들의 고도로 병렬화된 구조는 대형 데이터 블록을 병렬로 처리하는 알고리즘의 범용 중앙처리장치(CPU)보다 효율적이다. 개인용 컴퓨터에서는 GPU를 비디오 카드에 표시하거나 마더보드에 내장할 수 있다. 일부 CPU에서는 CPU 다이(Die)에 내장되어 있다.[1]
1970년대에 "GPU"라는 용어는 원래 그래픽 프로세서 단위를 의미했으며 CPU로부터 독립적으로 작동하며 그래픽 조작과 출력을 담당하는 프로그램 가능한 처리 단위를 묘사했다.[2][3] 이후 1994년 소니는 1994년 플레이스테이션 콘솔의 도시바가 설계한 소니 GPU에 대해 (현재는 그래픽 처리 유닛을 나타낸다)라는 용어를 사용했다.[4] 이 용어는 1999년 엔비디아에 의해 대중화되었는데, 그는 GeForce 256을 "세계 최초의 GPU"[5]로 마케팅했다. 「변형·조명·트라이앵글 셋업/클립핑·렌더링 엔진이 통합된 싱글 칩 프로세서」[6]로 제시되었다. 경쟁사인 ATI 테크놀로지는 2002년 라데온 9700을 출시하면서 "시각 처리 장치" 또는 VPU라는 용어를 만들었다.[7]
역사
1970년대
아케이드 시스템 보드는 1970년대부터 전문 그래픽 회로를 사용해 왔다. 초기 비디오 게임 하드웨어에서는 프레임 버퍼용 RAM이 비쌌기 때문에 비디오 칩은 모니터에서 디스플레이를 스캔하면서 데이터를 합성했다.[8]
특수 배럴 시프터 회로는 Gun Fat(1975), Sea Wolf(1976), Space Inviders(1978)와 같은 미드웨이와 타이토에서 1970년대 다양한 아케이드 게임에서 CPU가 프레임 버퍼 그래픽을 애니메이션화하도록 돕기 위해 사용되었다.[9][10][11] 1979년 남코 갤럭시아 아케이드 시스템은 RGB 컬러, 멀티 컬러 스프라이트, 타일맵 배경을 지원하는 전문 그래픽 하드웨어를 사용했다.[12] 갤럭시아 하드웨어는 아케이드 비디오 게임의 황금기에 널리 사용되었는데, 남코, 센투리, 그레믈린, 이렘, 코나미, 미드웨이, 니치부츠, 세가, 타이토와 같은 게임 회사가 사용하였다.[13][14]

국내 시장에서 1977년 아타리 2600은 텔레비전 인터페이스 어댑터라고 불리는 비디오 시프터를 사용했다.[15] 아타리 8비트 컴퓨터(1979)에는 "디스플레이 목록"을 설명하는 명령, 즉 스캔 라인이 특정 비트맵 또는 문자 모드에 매핑되는 방식, 메모리가 저장되는 위치 등을 해석한 비디오 프로세서인 ANTIC가 있었다.[16] 6502 기계 코드 서브루틴은 표시 목록 지침에 비트를 설정하여 스캔 라인에서 트리거할 수 있다.[17] 또한 ANTIC는 CPU와 무관하게 부드러운 수직 및 수평 스크롤을 지원했다.[18]
1980년대

NEC µPD7220은 PC 그래픽 디스플레이 프로세서를 단일 LSI(Large Scale Integration) 집적회로 칩으로 최초로 구현한 것으로, Number Nine Visual Technology와 같은 저비용 고성능 비디오 그래픽 카드를 설계할 수 있었다. 그것은 1980년대 중반까지 가장 잘 알려진 GPU가 되었다.[19] PC용 금속산화물반도체(NMOS) 그래픽 디스플레이 프로세서를 최초로 완전 통합해 최대 1024x1024 해상도를 지원, 신흥 PC 그래픽 시장의 기반을 다졌다. 다수의 그래픽 카드에 사용되었고, 인텔의 그래픽 처리 장치 중 첫 번째인 인텔 82720과 같은 복제에 대한 라이센스를 받았다.[20] 윌리엄스 일렉트로닉스 아케이드 게임인 로보트론 2084, 주스트, 시니스타, 버블스에는 모두 16가지 색상의 비트맵으로 동작하기 위한 맞춤형 블리터 칩이 들어 있다.[21][22]
1984년, 히타치는 PC용 최초의 주요 CMOS 그래픽 프로세서인 ARC HD63484를 출시했다. ATC는 단색 모드일 때 최대 4K 해상도를 표시할 수 있었고, 1980년대 후반에는 다수의 PC 그래픽 카드와 단말기에 사용되었다.[23] 1985년 아미가 코모도어는 맞춤형 그래픽 칩을 선보였는데, 블리터 유닛이 비트맵 조작, 라인 그리기, 영역 채우기 기능을 가속시켰다. 또한 비디오 빔과 동기화하여 그래픽 하드웨어 레지스터를 조작할 수 있거나(예: 퍼스캔라인 팔레트 스위치, 스프라이트 멀티플렉싱 및 하드웨어 윈도우 설정) 블리터를 구동할 수 있는 자체 간단한 명령 세트가 있는 코프로세서가 포함된다. 1986년 텍사스 인스트루먼트는 최초의 프로그램 가능한 그래픽 프로세서인 TMS34010을 출시했다.[24] 범용 코드를 실행할 수는 있지만 그래픽 중심의 명령어 세트를 가지고 있었다. 1990-1992년 동안 이 칩은 텍사스 인스트루먼트 그래픽스 아키텍처("TIGA") 윈도우 액셀러레이터 카드의 기본이 되었다.
1987년에 IBM 8514 그래픽 시스템은 전자 하드웨어에서 고정 기능 2D 기본 기능을 구현하는 IBM PC 호환 장치의 첫 비디오 카드 중 하나로[vague] 출시되었다. 1987년 출시된 샤프의 X68000은 65,536 컬러 팔레트와 스프라이트, 스크롤, 다중 플레이필드용 하드웨어 지원으로 커스텀 그래픽 칩셋을[25] 사용, 결국 캡콤의 CP 시스템 아케이드 보드의 개발 기계 역할을 했다.[26] 후지쯔는 이후 1989년에 출시된 FM 타운즈 컴퓨터와 16,777,216 컬러 팔레트를 지원받아 경쟁했다.[27] 1988년에는 남코 시스템 21[28], 타이토 에어 시스템 등과 함께 아케이드에 최초의 전용 폴리곤 3D 그래픽 보드가 도입되었다.[29]
IBM의 독점 VGA(Video Graphics Array) 디스플레이 표준은 1987년에 도입되었으며, 최대 해상도는 640×480 픽셀이다. 1988년 11월, NEC 홈 일렉트로닉스는 IBM의 독점 VGA 디스플레이 표준의 계승자로서 SVGA(Super VGA) 컴퓨터 디스플레이 표준을 개발하고 촉진하기 위한 비디오 전자 표준 협회(VESA)의 창설을 발표했다. 슈퍼 VGA가 지원하는 그래픽 디스플레이 해상도는 36% 증가한 최대 800×600픽셀이다.[30]
1990년대

1991년 S3 Graphics는 S3 86C911을 도입했는데, S3 Graphics는 설계자들이 약속된 성능 증가의 지표로 포르쉐 911의 이름을 따서 명명했다.[31] 86C911은 1995년까지 모든 주요 PC 그래픽 칩 제조업체들이 그들의 칩에 2D 가속 지원을 추가하면서 수많은 모방자들을 양산했다.[32][33] 이 무렵 고정 기능 윈도 가속기는 윈도 성능에서 값비싼 범용 그래픽 코프로세서를 능가했고, 이 코프로세서는 PC 시장에서 멀어졌다.
1990년대 내내 2D GUI 가속화는 계속 진화했다. 제조 능력이 향상되면서 그래픽 칩의 통합 수준도 향상되었다. Windows 3.x용 Microsoft의 WinG 그래픽 라이브러리 및 Windows 95 이상에서 2D 게임의 하드웨어 가속화를 위한 DirectDraw 인터페이스와 같은 다양한 작업을 위해 추가 API(응용 프로그래밍 인터페이스)가 도착했다.
1990년대 초중반, 아케이드, 컴퓨터, 콘솔 게임에서 실시간 3D 그래픽이 점점 보편화되면서 하드웨어 가속 3D 그래픽에 대한 대중들의 수요가 증가하였다. 매스마켓 3D 그래픽 하드웨어의 초기 예는 세가모델1, 남코시스템22, 세가모델2 등 아케이드 시스템보드와 토성, 플레이스테이션, 닌텐도64 등 5세대 비디오게임기에서 찾아볼 수 있다. 1993년 세가 모델2나 남코 매직엣지 호넷 시뮬레이터 같은 아케이드 시스템은 소비자 그래픽 카드에 등장하기 전 몇 년 동안 하드웨어 T&L(변환, 클리핑, 조명)이 가능했다.[34][35] 일부 시스템은 DSP를 사용하여 변환을 가속화했다. 세가 모델 2 아케이드 시스템에서 일했던 후지쯔는 1995년부터 가정용 컴퓨터에서 사용할 수 있는 단일 LSI 솔루션으로 T&L 통합 작업을 시작했으며,[36][37][38] 개인용 컴퓨터용 최초의 3D 지오메트리 프로세서인 후지쯔 피놀라이트는 1997년에 출시되었다.[39] 홈 비디오 게임 콘솔에 탑재된 최초의 하드웨어 T&L GPU는 1996년 출시된 닌텐도 64의 리얼리티 코프로세서였다.[40] 1997년에 미쓰비시는 워크스테이션과 윈도우 NT 데스크탑을 위해 변환과 조명이 가능한 완전한 기능을 갖춘 GPU인 3Dpro/2MP를 출시했다.[41] ATi는 1997년에 출시된 그들의 FireGL 4000 그래픽 카드에 그것을 활용했다.[42]
1994년 발매된 플레이스테이션 비디오 게임기의 32비트 소니 GPU(도시바 설계)[4]를 참조해 소니가 만든 용어다.
PC 세계에서 저비용 3D 그래픽 칩의 첫 시도에서 눈에 띄는 실패는 S3 ViRGE, ATI Rage, Matrox Mistique였다. 이들 칩은 기본적으로 3D 기능이 볼트체결된 전세대 2D 가속기였다. 많은 것들이 구현의 용이성과 최소한의 비용을 위해 이전 세대의 칩과 핀 호환이 가능했다. 처음에 성능 3D 그래픽은 파워VR과 3dfx 부두와 같은 3D 기능 가속(그리고 완전히 2D GUI 가속이 부족함) 전용의 이산 보드를 통해서만 가능했다. 하지만 제조 기술이 계속 발전하면서 비디오, 2D GUI 가속도, 3D 기능까지 모두 하나의 칩으로 통합됐다. 렌디의 베라이트 칩셋은 주목할 만한 가치가 있을 만큼 이것을 잘한 최초의 인물 중 한 명이었다. 렌전은 1997년 엔비디아의 지포스256보다 수년 앞서 후지쯔 FXG-1 피놀라이트 지오메트리 프로세서와 베리테 V2200 코어를 결합한 '스릴러 음모' 프로젝트에서 헤라클레스, 후지쓰와 함께 한 단계 더 나아갔다. 시스템 CPU에 가해지는 부하를 줄이기 위해 고안된 이 카드는 시장에 출시되지 않았다.[citation needed]
오픈GL은 90년대 초반에 전문 그래픽 API로 등장했지만, 원래는 90년대 후반에 글라이드 API가 끼어들어 PC의 지배적인 세력이 될 수 있는 성능 문제로 어려움을 겪었다.[43] 그러나 이러한 문제들은 빠르게 극복되었고 글라이드 API는 도중에 떨어졌다. 비록 OpenGL의 영향이 결국 하드웨어 지원을 널리 제공하게 되었지만, OpenGL의 소프트웨어 구현은 이 기간 동안 일반적이었다. 시간이 지남에 따라 하드웨어에서 제공되는 기능과 OpenGL에서 제공되는 기능 사이에 패리티가 나타났다. 다이렉트X는 90년대 후반 윈도 게임 개발자들 사이에서 인기를 끌었다. 마이크로소프트는 오픈GL과 달리 하드웨어에 대한 엄격한 일대일 지원을 고집했다. 많은 GPU가 자체적인 특정 기능을 제공했고, 기존 OpenGL 애플리케이션은 이미 혜택을 받을 수 있었기 때문에, 이러한 접근방식은 DirectX를 종종 한 세대 뒤처지게 하기 때문에 처음에는 독립형 그래픽 API로서 DirectX의 인기가 떨어지게 했다. (OpenGL과 Direct3D 비교 참조)
시간이 흐르면서 마이크로소프트는 하드웨어 개발자들과 더욱 긴밀히 협력하기 시작했고, 지원되는 그래픽 하드웨어의 그것과 일치하도록 DirectX의 출시를 목표로 삼기 시작했다. Direct3D 5.0은 게임 시장에서 널리 채택된 최초의 API 버전이며, 오픈GL은 강력한 팔로워를 유지한 반면, 훨씬 더 하드웨어에 특화된, 종종 독점적인 그래픽 라이브러리와 직접 경쟁했다. Direct3D 7.0은 Direct3D에 대한 하드웨어 가속 변환 및 조명(T&L) 지원을 도입한 반면 OpenGL은 초기부터 이 기능이 이미 노출되어 있었다. 3D 가속기 카드는 단순한 래스터라이저에서 벗어나 3D 렌더링 파이프라인에 또 다른 중요한 하드웨어 단계를 추가했다. Nvidia GeForce 256(일명 NV10)은 하드웨어 가속 T&L로 시장에 출시된 최초의 소비자급 카드였으며, 전문 3D 카드는 이미 이 기능을 가지고 있었다. 이미 OpenGL의 기존 특징인 하드웨어 변환과 조명은 90년대에 소비자 수준의 하드웨어에 도달했고, 훨씬 유연하고 프로그램 가능한 픽셀 셰이더와 정점 쉐이더 유닛의 선례를 남겼다.
2000~2010년
Nvidia는 프로그램 가능한 음영이 가능한 칩을 처음으로 생산했다; GeForce 3 (코드명 NV20). 이제 각 픽셀은 입력으로 추가 영상 질감을 포함할 수 있는 짧은 "프로그램"에 의해 처리될 수 있으며, 각 기하학적 꼭지점 역시 그것이 화면에 투영되기 전에 짧은 프로그램에 의해 처리될 수 있다. Xbox 콘솔에서 사용되어 하드웨어 가속 정점 처리에 사용자 정의 벡터 유닛(일반적으로 VU0/VU1)을 사용하는 플레이스테이션 2와 경쟁하였다. Xbox에 사용된 셰이더 실행 엔진의 초기 함정은 일반적인 목적이 아니었고 임의의 픽셀 코드를 실행할 수 없었다. 정점과 픽셀은 픽셀 셰이더가 훨씬 더 엄격한 제약 조건을 갖는 자체 자원을 가진 다른 장치에 의해 처리되었다. 픽셀 음영 엔진은 사실 고도로 사용자 정의가 가능한 기능 블록과 더 유사하며 실제로 프로그램을 "실행"하지 않았다. 정점 및 픽셀 음영 간의 이러한 차이 중 많은 부분은 통합 셰이더 모델에서 훨씬 나중에야 해결되었다.
2002년 10월, ATI Radeon 9700(R300이라고도 함)의 도입으로 세계 최초의 Direct3D 9.0 가속기, 픽셀 및 정점 쉐이더는 반복적이고 긴 부동 소수점 산술을 구현할 수 있었고, CPU처럼 빠르게 유연해지고 있었지만, 이미지 배열 작동의 크기는 더 빨라지고 있었다. 픽셀 쉐이딩은 종종 질감을 더하는 범프 매핑에 사용되는데, 이것은 물체를 반짝이거나, 둔탁하거나, 거칠거나, 심지어 둥글거나 돌출되게 보이도록 한다.[44]
Nvidia GeForce 8 시리즈의 도입과 함께, 그리고 나서 새로운 일반 스트림 처리 장치 GPU가 더욱 일반화된 컴퓨팅 장치가 되었다. Today, parallel GPUs have begun making computational inroads against the CPU, and a subfield of research, dubbed GPU Computing or GPGPU for General Purpose Computing on GPU, has found its way into fields as diverse as machine learning,[45] oil exploration, scientific image processing, linear algebra,[46] statistics,[47] 3D reconstruction and even stock option가격 결정 당시 GPGPU는 현재 컴퓨팅 셰이더(예: CUDA, OpenCL, DirectCompute)라고 불리는 것의 전구였으며, 알고리즘으로 전달된 데이터를 텍스처 맵으로 처리하고 적절한 픽셀 셰이더로 삼각형이나 쿼드를 그려 알고리즘을 실행함으로써 실제로 하드웨어를 어느 정도 악용했다. 이는 스캔 컨버터와 같은 장치가 실제로 필요하지 않은 곳에 관련되기 때문에(픽셀 셰이더를 호출하는 것을 제외하고도 삼각형 조작은 우려되지 않음) 분명히 오버헤드가 수반된다.
2007년 처음 도입된 엔비디아의 CUDA 플랫폼은 GPU 컴퓨팅을 위해 가장 먼저 널리 채택된 프로그래밍 모델이었다.[48] 최근에는 OpenCL이 광범위하게 지원되고 있다. OpenCL은 Khronos Group이 정의한 개방형 표준으로, 휴대성에 중점을 두고 GPU와 CPU 모두에 대한 코드 개발이 가능하다.[49] 오픈CL 솔루션은 인텔, AMD, 엔비디아, ARM이 지원하고 있으며, 에반스데이터의 최근 보고서에 따르면 오픈CL은 미국과 아시아 태평양 지역 개발자들이 가장 많이 사용하는 GPGPU 개발 플랫폼이다.[citation needed]
2010년 현재
2010년, 엔비디아는 아우디와 제휴하여 자동차의 대시보드에 전력을 공급하기 시작했으며, 테그레이 GPU를 사용하여 자동차의 내비게이션 및 엔터테인먼트 시스템에 향상된 기능을 제공했다.[50] 자동차 GPU 기술의 발전은 자율주행 기술을 추진하는 데 도움을 주었다.[51] AMD의 Radeon HD 6000 시리즈 카드는 2010년에 출시되었고 2011년에 AMD는 모바일 기기에 사용할 6000M Series 이산 GPU를 출시했다.[52] 엔비디아가 만든 그래픽 카드의 케플러 라인은 2012년 출시돼 엔비디아의 600, 700 시리즈 카드에 사용되었다. 이 새로운 GPU 마이크로아키텍처에는 비디오 카드의 클럭 속도를 조절해 전력 추첨에 따라 늘리거나 줄이는 기술인 GPU 부스트가 포함됐다.[53] 케플러 마이크로아키텍처는 28nm 공정으로 제작되었다.
PS4와 Xbox One은 2013년에 출시되었으며, AMD의 Radeon HD 7850과 7790을 기반으로 한 GPU를 사용한다.[54] 이어 엔비디아의 GPU 케플러 라인이 같은 공정으로 제조된 맥스웰 라인이 그 뒤를 이었다.엔비디아사의 28nm 칩은 당시 28nm 공정으로 제조하던 대만 반도체 제조회사 TSMC가 제조했다. 과거의 40nm 기술과 비교하면, 이 새로운 제조 공정은 전력 소모는 줄이면서 성능은 20% 향상시켰다.[55][56] 가상현실 헤드셋은 시스템 요구사항이 매우 높다. VR 헤드셋 제조업체들은 출시 당시 GTX 970과 R9 290X 이상을 추천했다.[57][58] 파스칼은 엔비디아가 2016년 출시한 차세대 소비자 그래픽 카드다. GeForce 10 시리즈 카드는 이 세대의 그래픽 카드 아래에 있다. 이전 마이크로아키텍처보다 개선된 16nm 제조 공정을 사용하여 제작되었다.[59] 엔비디아는 새로운 볼타 아키텍처인 타이탄 V 아래에 하나의 비소비자 카드를 출시했다. 파스칼의 하이엔드 카드인 타이탄 XP로부터의 변화에는 CUDA 코어 수 증가, 텐서 코어 추가, HBM2 등이 있다. 텐서 코어는 딥러닝을 위해 특별히 설계된 코어인 반면, 고대역폭 메모리는 타이탄 V의 인텐에 유용한 매우 넓은 메모리 버스를 제공하는 온디, 적층, 저시계 메모리가 있다.헌신적인 목적 엔비디아는 타이탄 V가 게임 카드가 아니라는 점을 강조하기 위해 소비자 게임 카드에 추가하는 '지포스 GTX' 접미사를 제거했다.
엔비디아는 2018년 8월 20일 GPU에 레이트레이싱 코어를 추가한 RTX 20 시리즈 GPU를 출시해 조명 효과에 대한 성능을 개선했다.[60] AMD의 Polaris 11과 Polaris 10 GPU는 14 나노미터 공정에 의해 제조된다. 그들의 출시로 AMD 비디오 카드의 와트당 성능이 크게 향상되었다.[61] AMD는 엔비디아의 하이엔드 파스칼 카드의 경쟁사로 하이엔드 시장을 위한 베가 GPU 시리즈도 출시했으며 타이탄 V와 같은 HBM2도 탑재했다.
2019년 AMD는 GCN(Graphics Core Next) 마이크로아키텍처/인스트레이션 세트의 후속 제품을 출시했다. RDNA로 불리는 1세대 RDNA를 특징으로 하는 첫 번째 제품 라인업은 이후 2019년 7월 7일에 출시된 Radeon RX 5000 시리즈 비디오 카드였다.[62] 이후 RDNA 마이크로아키텍처 후임자가 리프레시(refresh)가 될 것이라고 발표했다. RDNA 2로 불리는 이 새로운 마이크로아키텍처는 2020년 4분기에 출시될 예정이었던 것으로 알려졌다.[63]
AMD는 2020년 10월 28일 온라인 이벤트에서 하드웨어 가속 레이 추적을 지원하는 차세대 RDNA 2 그래픽 카드인 Radeon RX 6000 시리즈를 공개했다.[64][65] 라인업은 처음에 RX 6800, RX 6800 XT, RX 6900 XT로 구성된다.[66][67] RX 6800 및 6800 XT는 2020년 11월 18일에 출시되었으며, RX 6900 XT는 2020년 12월 8일에 출시되었다.[68] Navi 22를 기반으로 한 RX 6700 XT는 2021년 3월 18일에 출시되었다.[69][70][71]
플레이스테이션 5와 엑스박스 시리즈 X, 시리즈 S는 2020년에 출시되었으며, 둘 다 RDNA 2 마이크로아키텍처 기반의 GPU를 사용하며, 각각의 시스템 구현에서 독점적인 트윗과 다른 GPU 구성을 가지고 있다.[72][73][74]
GPU 기업
많은 회사들이 여러 브랜드 이름으로 GPU를 생산해 왔다. 2009년에는 인텔과 엔비디아, AMD/ATI가 각각 49.4%, 27.8%, 20.6%의 시장점유율을 기록하며 점유율 1위를 차지했다. 그러나 이 숫자들은 인텔의 통합 그래픽 솔루션을 GPU로 포함한다. 엔비디아와 AMD는 셀 수 없이 2018년 현재 거의 100% 시장을 점유하고 있다. 각각의 시장 점유율은 66%와 33%[75]이다. 또한, Matrox는[76] GPU를 생산한다. 현대 스마트폰도 퀄컴의 아드레노 GPU, 상상기술의 파워VR GPU, ARM의 말리 GPU를 주로 사용한다.
연산함수
현대의 GPU는 대부분의 트랜지스터를 3D 컴퓨터 그래픽과 관련된 계산을 하는데 사용한다. 오늘날의 GPU에는 3D 하드웨어 외에도 기본 2D 가속 및 프레임 버퍼 기능(일반적으로 VGA 호환성 모드 포함)이 포함되어 있다. AMD/ATI HD5000-HD7000과 같은 최신 카드는 2D 가속화가 부족하기 때문에 3D 하드웨어로 에뮬레이션해야 한다. GPU는 처음에는 텍스처 매핑과 렌더링 폴리곤의 기억력 집약적인 작업을 가속화하기 위해 사용되었고, 이후 정점의 회전과 다른 좌표계로의 변환과 같은 기하학적 계산을 가속화하기 위해 유닛을 추가했다. 최근 GPU의 개발에는 CPU가 지원하는 많은 동일한 작업으로 정점과 질감을 조작할 수 있는 프로그램 가능한 셰이더 지원, 앨리어싱을 줄이기 위한 오버샘플링 및 보간 기법, 그리고 매우 정밀한 색상 공간 등이 포함된다. 이러한 계산의 대부분이 매트릭스와 벡터 연산을 포함하므로, 엔지니어와 과학자들은 비그래픽 계산을 위한 GPU의 사용을 점점 더 연구해 왔다. GPU는 특히 다른 당혹스러울 정도로 평행한 문제에 적합하다.
GPU 구축의 몇 가지 요인은 실시간 렌더링을 위한 카드의 성능에 들어간다. 일반적인 요인은 반도체 소자 제작에서 커넥터 경로의 크기, 클럭 신호 주파수, 다양한 온칩 메모리 캐시의 수와 크기를 포함할 수 있다. Additionally, the number of Streaming Multiprocessors (SM) for NVidia GPUs, or Compute Units (CU) for AMD GPUs, which describe the number of core on-silicon processor units within the GPU chip that perform the core calculations, typically working in parallel with other SM/CUs on the GPU. Performance of GPUs are typically measured in floating point 2010년대와 2020년대에 GPU를 사용한 초당 운영 또는 FLOPS(Flops)는 일반적으로 테라플롭스(TFLOPS)로 측정된 성능을 제공한다. 다른 요인이 실제 표시 속도에 영향을 미칠 수 있기 때문에 이는 추정된 성능 측정값이다.[77]
딥러닝의 등장으로 GPU의 중요성이 높아졌다. 인디고 연구에서는 딥러닝 신경망을 훈련하면서도 GPU가 CPU보다 250배 이상 빠를 수 있다는 연구 결과가 나왔다. 이 분야에서는 구글이 만든 텐서프로세싱유닛(TPU)을 중심으로 ASICs와 어느 정도 경쟁이 벌어져 왔다. 그러나 ASIC는 기존 코드에 대한 변경을 요구하고 있으며 GPU는 여전히 큰 인기를 끌고 있다.
GPU 가속 비디오 디코딩 및 인코딩
1995년 이후 만들어진 대부분의 GPU는 디지털 비디오 재생에 중요한 YUV 색 공간과 하드웨어 오버레이를 지원하며, 2000년 이후 만들어진 많은 GPU도 모션 보정, iDCT와 같은 MPEG 원형을 지원한다. 비디오 디코딩 프로세스와 비디오 후 처리의 일부가 GPU 하드웨어로 오프로드되는 이 하드웨어 가속 비디오 디코딩 프로세스는 일반적으로 "GPU 가속 비디오 디코딩", "GPU 보조 비디오 디코딩", "GPU 하드웨어 가속 비디오 디코딩" 또는 "GPU 하드웨어 보조 비디오 디코딩"이라고 불린다.
보다 최신의 그래픽 카드는 카드의 고화질 비디오까지 디코딩하여 중앙 처리 장치를 오프로드한다. GPU 가속 비디오 디코딩을 위한 가장 일반적인 API는 Microsoft Windows 운영 체제용 DxVAU와 VDPAU, VAAPI, XvMC, Linux 기반 및 UNIX 유사 운영 체제용 XvBA이다. All except XvMC are capable of decoding videos encoded with MPEG-1, MPEG-2, MPEG-4 ASP (MPEG-4 Part 2), MPEG-4 AVC (H.264 / DivX 6), VC-1, WMV3/WMV9, Xvid / OpenDivX (DivX 4), and DivX 5 codecs, while XvMC is only capable of decoding MPEG-1 and MPEG-2.
전용 하드웨어 비디오 디코딩 및 인코딩 솔루션이 몇 가지 있다.
가속 가능한 비디오 디코딩 프로세스
오늘날의 현대적인 GPU 하드웨어에 의해 가속될 수 있는 비디오 디코딩 프로세스는 다음과 같다.
- 모션 보상(모션 보정)
- 역 이산 코사인 변환(iDCT)
- 역방향 텔레신 3:2 및 2:2 풀다운 보정
- 역수정 이산 코사인 변환(iMDCT)
- 인루프 디블로킹 필터
- 프레임 내 예측
- 역정량화(IQ)
- 가변 길이 디코딩(VLD), 일반적으로 슬라이스 레벨 가속이라고 함
- 공간적-임시적 디인터레이싱 및 자동 인터레이스/진행적 소스 탐지
- 비트스트림 처리(콘텍스트 적응형 가변 길이 코딩/콘텍스트 적응형 바이너리 산술 코딩) 및 완벽한 픽셀 위치 지정.
위의 작업에는 비디오 편집, 인코딩 및 트랜스코딩에도 응용 프로그램이 있다.
GPU 양식
용어.
개인용 컴퓨터에는 두 가지 주요 형태의 GPU가 있다. 각 단어에는 많은 동의어가 있다.[78]
용도별 GPU
대부분의 GPU는 특정 용도, 실시간 3D 그래픽 또는 기타 대량 계산을 위해 설계된다.
전용 그래픽 카드
가장 강력한 등급의 GPU는 일반적으로 PCI Express(PCIe) 또는 Accelerated Graphics Port(AGP)와 같은 확장 슬롯을 통해 마더보드와 인터페이스하며 마더보드가 업그레이드를 지원할 수 있다고 가정할 때 비교적 쉽게 교체하거나 업그레이드할 수 있다. 일부 그래픽 카드는 여전히 PCI(Peripheral Component Interconnect) 슬롯을 사용하지만 대역폭이 너무 제한적이어서 일반적으로 PCIe나 AGP 슬롯을 사용할 수 없을 때만 사용된다.
전용 GPU는 반드시 분리할 수 없으며, 반드시 마더보드와 표준 방식으로 인터페이스할 필요도 없다. "전용"이란 전용 그래픽카드에 전용 RAM이 있는 것을 말하며, 전용 GPU가 대부분 탈착 가능한 것을 말한다. 또한 이 RAM은 일반적으로 그래픽 카드의 예상 직렬 작업 부하에 대해 특별히 선택된다(GDDR 참조). 때로는 전용의 이산형 GPU를 가진 시스템을 "UMA" 시스템과 반대로 [79]"DIS" 시스템이라고 불렀다(다음 섹션 참조). 휴대용 컴퓨터를 위한 전용 GPU는 크기와 무게 제약으로 인해 비표준적이고 종종 독점적인 슬롯을 통해 가장 일반적으로 상호 연결된다. 그러한 포트는 상대 포트와 물리적으로 상호 교환이 가능하지 않더라도 논리적 호스트 인터페이스 측면에서 여전히 PCIe 또는 AGP로 간주될 수 있다.
NVIDIA의 SLIK와 NVLink, AMD의 CrossFire와 같은 기술은 여러 GPU가 하나의 화면에 대해 동시에 이미지를 그릴 수 있도록 하여 그래픽에 사용할 수 있는 처리 능력을 높인다. 그러나 대부분의 게임에서 여러 GPU를 충분히 활용하지 못하기 때문에 이러한 기술은 점점 더 희귀해지고 있다.[80][81][82] 로 DGX 워크 스테이션과 서버의 엔비디아 라인 업과 테슬라 GPUs의 경우 다중 GPUs 여전히 슈퍼 컴퓨터에(처럼 정상 회의), 작업대에 VFX[92][93]고 그리고 AI에서 훈련을 촉진하기 위한 simulations,[94]을 위해 비디오(한번에 여러가지 비디오 처리)[83][84][85][86]과 3Drendering,[87][88][89][90][91]을 가속화하는 데 사용된다.D인텔의 다가오는 폰테 베키오 GPUs.
통합 그래픽 처리 장치

통합 그래픽 처리 장치(IGPU), 통합 그래픽, 공유 그래픽 솔루션, 통합 그래픽 프로세서(IGP) 또는 통합 메모리 아키텍처(UMA)는 전용 그래픽 메모리가 아닌 컴퓨터 시스템 RAM의 일부를 활용한다. IGP는 (Northbridge)[95] 칩셋의 일부로 마더보드에 통합되거나 CPU(AMD APU 또는 Intel HD Graphics 등)와 동일한 다이(통합 회로)에 통합될 수 있다. 특정 마더보드에서 AMD의 IGP는 전용 사이드포트[clarification needed] 메모리를 사용할 수 있다.[96] GPU가 전용으로 사용하는 고성능 메모리의 별도 고정 블록으로, 2007년 초에는 그래픽이 통합된 컴퓨터가 전체 PC 출하량의 약 90%를 차지한다.[97][needs update] 이들은 전용 그래픽 처리보다 구현 비용이 적게 들지만 성능이 떨어지는 경향이 있다. 역사적으로 통합 프로세싱은 3D 게임을 하거나 그래픽을 많이 사용하는 프로그램을 실행하기에 부적합한 것으로 간주되었지만 Adobe Flash와 같은 덜 집중적인 프로그램을 실행할 수 있었다. 그러한 인터넷 거버넌스 포럼의 예는 SiS와 VIA circa 2004에서 제공될 것이다.[98] 그러나 AMD Accelerated Processing Unit, Intel HD Graphics 등 현대 통합 그래픽 프로세서는 2D 그래픽이나 저응력 3D 그래픽을 처리할 수 있는 수준 이상의 성능을 갖추고 있다.
GPU 연산은 메모리 집약도가 매우 높기 때문에, 통합 프로세싱은 최소 또는 전용 비디오 메모리를 가지고 있지 않기 때문에 상대적으로 느린 시스템 RAM을 위한 CPU와 경쟁하는 것을 발견할 수 있다. IGP는 시스템 RAM에서 최대 29.856 GB/s의 메모리 대역폭을 가질 수 있는 반면 그래픽 카드는 RAM과 GPU 코어 사이에 최대 264 GB/s의 대역폭을 가질 수 있다. 이 메모리 버스 대역폭은 다중 채널 메모리가 이러한 결함을 완화시킬 수 있지만 GPU의 성능을 제한할 수 있다.[99] 기존의 통합형 그래픽 칩셋은 하드웨어 변환과 조명이 부족했지만, 새로운 그래픽 칩셋은 이를 포함한다.[100][101]
하이브리드 그래픽 처리
이 새로운 종류의 GPU들은 저가 데스크탑과 노트북 시장에서 통합 그래픽과 경쟁한다. 이것의 가장 일반적인 구현은 ATI의 HyperMemory와 Nvidia의 TurboCache이다.
하이브리드 그래픽 카드는 통합 그래픽보다 다소 비싸지만 전용 그래픽 카드보다는 훨씬 저렴하다. 이들은 시스템과 메모리를 공유하며 시스템 RAM의 높은 대기 시간을 보충하기 위해 작은 전용 메모리 캐시를 가지고 있다. PCI Express 내의 기술은 이것을 가능하게 할 수 있다. 이 솔루션들은 때때로 768MB의 RAM을 가지고 있다고 광고되지만, 이것은 시스템 메모리와 공유될 수 있는 양을 가리킨다.
스트림 처리 및 범용 GPU(GPGPU)
컴퓨팅 커널을 실행하는 스트림 프로세서(또는 벡터 프로세서)의 변형된 형태로서 범용 그래픽 처리 장치(GPGPU)를 사용하는 것이 점점 일반화되고 있다. 이 개념은 현대 그래픽 액셀러레이터의 셰이더 파이프라인의 방대한 연산력을 범용 컴퓨팅 파워로 전환하는데, 이는 그래픽 연산만을 위해 유선 연결되는 것과는 대조적이다. 대규모 벡터 연산이 필요한 특정 애플리케이션에서, 이는 기존 CPU보다 훨씬 높은 성능을 여러 차례 산출할 수 있다. 두 개의 가장 큰 이산형(위의 "전용 그래픽 카드" 참조) GPU 설계자인 AMD와 Nvidia는 일련의 애플리케이션으로 이 접근방식을 추구하기 시작하고 있다. 엔비디아와 AMD는 모두 스탠포드 대학과 협력하여 폴딩@home 분산 컴퓨팅 프로젝트를 위한 GPU 기반 클라이언트를 만들어 단백질 접기 계산을 하고 있다. 어떤 상황에서는 GPU가 그러한 애플리케이션에서 전통적으로 사용하는 CPU보다 40배 더 빨리 계산한다.[102][103]
GPGPU는 레이트레이싱을 비롯한 여러 유형의 당혹스러울 정도로 병렬적인 작업에 사용할 수 있다. 그것들은 일반적으로 GPU의 넓은 벡터 폭 SIMD 아키텍처를 이용하기 위해 데이터 병렬성을 나타내는 고투과 타입 계산에 적합하다.
나아가 GPU 기반의 고성능 컴퓨터가 대규모 모델링에 중요한 역할을 하기 시작하고 있다. 세계에서 가장 강력한 슈퍼컴퓨터 10대 중 3대가 GPU 가속화를 활용한다.[104]
GPU는 OpenCL, OpenMP 등 C 프로그래밍 언어에 대한 API 확장을 지원하고 있으며, 각 GPU 벤더는 카드만으로 동작하는 자체 API, AMD APP SDK와 Nvidia의 CUDA를 각각 소개했다. 이러한 기술은 일반적인 C 프로그램의 컴퓨팅 커널이라고 불리는 특정 기능을 GPU의 스트림 프로세서에서 실행할 수 있게 한다. 이를 통해 C 프로그램은 GPU의 대형 버퍼에서 병렬로 작동하면서도 CPU를 사용할 수 있는 기능을 활용할 수 있다. CUDA는 CPU 기반 애플리케이션이 그래픽 API 사용의 제한 없이 보다 범용적인 컴퓨팅을 위해 GPU의 리소스에 직접 액세스할 수 있도록 한 최초의 API이기도 하다.[citation needed]
2005년부터 GPU가 제공하는 성능을 진화적 계산에 사용하고, 특히 유전자 프로그래밍에서 체력 평가를 가속화하는 것에 관심이 있어 왔다. 대부분의 접근방식은 호스트 PC에서 선형 또는 트리 프로그램을 컴파일하고 실행 파일을 실행할 GPU로 전송한다. 일반적으로 성능 우위는 GPU의 SIMD 아키텍처를 사용하여 많은 예시 문제에서 단일 활성 프로그램을 동시에 실행함으로써 얻는다.[105][106] 그러나 프로그램을 편집하지 않고 GPU로 전송함으로써 상당한 가속도를 얻을 수 있으며, 이는 거기서 해석될 수 있다.[107][108] 가속은 여러 프로그램을 동시에 해석하거나, 동시에 여러 예제 문제를 실행하거나, 또는 둘의 조합을 통해 얻을 수 있다. 현대의 GPU는 수십만 개의 아주 작은 프로그램들을 쉽게 동시에 해석할 수 있다.
Volta 및 Turing 아키텍처를 사용하는 Nvidia Quadro 워크스테이션 카드와 같은 일부 최신 워크스테이션 GPU는 텐서 기반의 심층 학습 애플리케이션을 위한 전용 프로세싱 코어를 특징으로 한다. 엔비디아의 현재 GPU 시리즈에서는 이러한 코어를 텐서 코어라고 부른다.[109] 이러한 GPU는 대개 4x4 매트릭스 곱셈과 나눗셈을 활용하여 FLOPS 성능이 크게 향상되어 일부 애플리케이션에서는 하드웨어 성능이 최대 128 TFLOPS까지 향상된다.[110] 이러한 텐서 코어는 튜링 아키텍처를 실행하는 소비자 카드와 AMD의 Navi 시리즈 소비자 카드에도 나타나도록 되어 있다.[111]
외부 GPU(eGPU)
외장형 GPU는 대형 외장 하드 드라이브와 유사하게 컴퓨터의 하우징 외부에 위치한 그래픽 프로세서다. 외부 그래픽 프로세서는 때때로 노트북 컴퓨터와 함께 사용된다. 노트북은 상당한 양의 RAM과 충분히 강력한 중앙 처리 장치(CPU)를 가지고 있을 수 있지만, 강력한 그래픽 프로세서가 부족한 경우가 많고, 그 대신 강력하지는 않지만 에너지 효율이 더 높은 온보드 그래픽 칩을 가지고 있다. 온보드 그래픽 칩은 비디오 게임을 하거나, 비디오 편집이나 3D 애니메이션/렌더링과 같은 그래픽 집약적인 다른 작업에 충분하지 않은 경우가 많다.
따라서 노트북의 일부 외부 버스에 GPU를 부착할 수 있는 것이 바람직하다. PCI 익스프레스는 이 목적에 사용되는 유일한 버스다. 예를 들어, 포트는 익스프레스 카드 또는 mCIe 포트(각각 PCIe ×1, 최대 5.5Gbit/s) 또는 Thunderbolt 1, 2 또는 3 포트(각각 PCIe ×4, 최대 10, 20 또는 40Gbit/s)일 수 있다. 이러한 포트는 특정 노트북 시스템에서만 사용할 수 있다.[112][113] eGPU 인클로저는 강력한 GPU가 수백 와트를 쉽게 소비할 수 있기 때문에 자체 전원 공급 장치(PSU)를 포함한다.[114]
외부 GPU에 대한 공식 벤더 지원이 최근 탄력을 받고 있다. 주목할 만한 이정표 중 하나는 맥OS 하이 시에라 10.13.4와 함께 외부 GPU를 공식적으로 지원하기로 한 애플의 결정이었다.[115] Thunderbolt 3 eGPU 인클로저를 출시하는 주요 하드웨어 벤더(HP, Aliverware, Razer)도 여럿 있다.[116][117][118] 이러한 지원은 마니아들의 eGPU 구현에 계속 기름을 부었다.[119]
판매의
2013년 전 세계적으로 4억3830만 GPU가 출하됐고 2014년 전망치는 4억1420만이었다.[120]
참고 항목
하드웨어
- AMD 그래픽 처리 장치 비교
- Nvidia 그래픽 처리 장치 비교
- Intel 그래픽 처리 장치 비교
- 인텔 GMA
- 라라비
- Nvidia PureVideo - Nvidia의 비트 스트림 기술 - DXVA로 하드웨어 GPU의 비디오 디코딩을 가속화하기 위해 그래픽 칩에 사용되었다.
- SoC
- UVD(Unified Video Decoder) – DXVA로 하드웨어(GPU) 디코딩을 지원하는 ATI의 비디오 디코딩 비트 스트림 기술
API
- 오픈GL API
- Microsoft Windows 운영 체제를 위한 DirectX 비디오 가속(DxVA) API.
- 맨틀(API)
- 벌칸(API)
- 비디오 가속 API(VA API)
- VDPAU(Video Decode and Presentation API for Unix)
- X-Video Bitstream Acceleration(XvBA), MPEG-2, H.264 및 VC-1용 DXVA와 동등한 X11
- X-Video 모션 보상 – MPEG-2 비디오 코덱 전용 X11
적용들
- GPU 군집
- Mathematica – CUDA 및 OpenCL GPU 실행을 위한 내장 지원 포함
- GPU에서의 분자 모델링
- Deeplearning4j – 오픈 소스, Java를 위한 분산 딥러닝
참조
- ^ Denny Atkin. "Computer Shopper: The Right GPU for You". Archived from the original on 2007-05-06. Retrieved 2007-05-15.
- ^ Barron, E. T.; Glorioso, R. M. (September 1973). "A micro controlled peripheral processor". MICRO 6: Conference Record of the 6th Annual Workshop on Microprogramming. Micro 6: 122–128. doi:10.1145/800203.806247. ISBN 9781450377836. S2CID 36942876.
- ^ Levine, Ken (August 1978). "Core standard graphic package for the VGI 3400". ACM SIGGRAPH Computer Graphics. 12 (3): 298–300. doi:10.1145/965139.807405.
- ^ Jump up to: a b "Is it Time to Rename the GPU? IEEE Computer Society".
- ^ "NVIDIA Launches the World's First Graphics Processing Unit: GeForce 256". Nvidia. 31 August 1999. Archived from the original on 12 April 2016. Retrieved 28 March 2016.
- ^ "Graphics Processing Unit (GPU)". Nvidia. 16 December 2009. Archived from the original on 8 April 2016. Retrieved 29 March 2016.
- ^ Pabst, Thomas (18 July 2002). "ATi Takes Over 3D Technology Leadership With Radeon 9700". Tom's Hardware. Retrieved 29 March 2016.
- ^ Hague, James (September 10, 2013). "Why Do Dedicated Game Consoles Exist?". Programming in the 21st Century. Archived from the original on May 4, 2015. Retrieved November 11, 2015.
- ^ "mame/8080bw.c at master 路 mamedev/mame 路 GitHub". GitHub. Archived from the original on 2014-11-21.
- ^ "mame/mw8080bw.c at master 路 mamedev/mame 路 GitHub". GitHub. Archived from the original on 2014-11-21.
- ^ "Arcade/SpaceInvaders – Computer Archeology". computerarcheology.com. Archived from the original on 2014-09-13.
- ^ "mame/galaxian.c at master 路 mamedev/mame 路 GitHub". GitHub. Archived from the original on 2014-11-21.
- ^ "mame/galaxian.c at master 路 mamedev/mame 路 GitHub". GitHub. Archived from the original on 2014-11-21.
- ^ "MAME - src/mame/drivers/galdrvr.c". archive.org. Archived from the original on 3 January 2014.
- ^ Springmann, Alessondra. "Atari 2600 Teardown: What?s Inside Your Old Console?". The Washington Post. Archived from the original on July 14, 2015. Retrieved July 14, 2015.
- ^ "What are the 6502, ANTIC, CTIA/GTIA, POKEY, and FREDDIE chips?". Atari8.com. Archived from the original on 2016-03-05.
- ^ Wiegers, Karl E. (April 1984). "Atari Display List Interrupts". Compute! (47): 161. Archived from the original on 2016-03-04.
- ^ Wiegers, Karl E. (December 1985). "Atari Fine Scrolling". Compute! (67): 110. Archived from the original on 2006-02-16.
- ^ F. Robert A. Hopgood; Roger J. Hubbold; David A. Duce, eds. (1986). Advances in Computer Graphics II. Springer. p. 169. ISBN 9783540169109.
Perhaps the best known one is the NEC 7220.
- ^ 유명 그래픽 칩: NEC µPD7220 그래픽 디스플레이 컨트롤러(IEEE Computer Society)
- ^ Riddle, Sean. "Blitter Information". Archived from the original on 2015-12-22.
- ^ Wolf, Mark J.P. (June 2012). Before the Crash: Early Video Game History. Wayne State University Press. p. 185. ISBN 978-0814337226.
- ^ GPU 기록: 히타치 ARC HD63484. 두 번째 그래픽 프로세서. (IEEE Computer Society)
- ^ "Famous Graphics Chips: TI TMS34010 and VRAM. The first programmable graphics processor chip IEEE Computer Society".
- ^ "Archived copy". Archived from the original on 2014-09-03. Retrieved 2014-09-12.CS1 maint: 제목으로 보관된 복사본(링크)
- ^ "museum ~ Sharp X68000". Old-computers.com. Archived from the original on 2015-02-19. Retrieved 2015-01-28.
- ^ "Hardcore Gaming 101: Retro Japanese Computers: Gaming's Final Frontier". hardcoregaming101.net. Archived from the original on 2011-01-13.
- ^ "System 16 - Namco System 21 Hardware (Namco)". system16.com. Archived from the original on 2015-05-18.
- ^ "System 16 - Taito Air System Hardware (Taito)". system16.com. Archived from the original on 2015-03-16.
- ^ Brownstein, Mark (November 14, 1988). "NEC Forms Video Standards Group". InfoWorld. 10 (46). p. 3. ISSN 0199-6649. Retrieved May 27, 2016.
- ^ "S3 Video Boards". InfoWorld. 14 (20): 62. May 18, 1992. Archived from the original on November 22, 2017. Retrieved July 13, 2015.
- ^ "What the numbers mean". PC Magazine. 12: 128. 23 February 1993. Archived from the original on 11 April 2017. Retrieved 29 March 2016.
- ^ Singer, Graham. "The History of the Modern Graphics Processor". Techspot. Archived from the original on 29 March 2016. Retrieved 29 March 2016.
- ^ "System 16 - Namco Magic Edge Hornet Simulator Hardware (Namco)". system16.com. Archived from the original on 2014-09-12.
- ^ "MAME - src/mame/video/model2.c". archive.org. Archived from the original on 4 January 2013.
- ^ "System 16 - Sega Model 2 Hardware (Sega)". system16.com. Archived from the original on 2010-12-21.
- ^ "Archived copy" (PDF). Archived (PDF) from the original on 2016-10-11. Retrieved 2016-08-08.CS1 maint: 제목으로 보관된 복사본(링크)
- ^ "Archived copy" (PDF). Archived from the original (PDF) on 2014-09-06. Retrieved 2016-08-08.CS1 maint: 제목으로 보관된 복사본(링크)
- ^ "Fujitsu Develops World's First Three Dimensional Geometry Processor". fujitsu.com. Archived from the original on 2014-09-12.
- ^ xenol. "The Nintendo 64 is one of the greatest gaming devices of all time". xenol. Archived from the original on 2015-11-18.
- ^ "Mitsubishi's 3DPro/2mp Chipset Sets New Records for Fastest 3D Graphics Accelerator for Windows NT Systems; 3DPro/2mp grabs Viewperf performance lead; other high-end benchmark tests clearly show that 3DPro's performance outdistances all Windows NT competitors".
- ^ Vlask. "VGA Legacy MKIII - Diamond Fire GL 4000 (Mitsubishi 3DPro/2mp)". Archived from the original on 2015-11-18.
- ^ 3dfx Glide API
- ^ Søren Dreijer. "Bump Mapping Using CG (3rd Edition)". Archived from the original on 2010-01-18. Retrieved 2007-05-30.
- ^ Raina, Rajat; Madhavan, Anand; Ng, Andrew Y. (2009-06-14). "Large-scale deep unsupervised learning using graphics processors". Proceedings of the 26th Annual International Conference on Machine Learning - ICML '09. Dl.acm.org. pp. 1–8. doi:10.1145/1553374.1553486. ISBN 9781605585161. S2CID 392458.
- ^ "숫자 알고리즘의 GPU 구현을 위한 선형 대수 연산자", Kruger 및 Westermann, International Conf. 2005년 컴퓨터 그래픽 및 대화형 기법에 관한 연구
- ^ "ABC-SysBio - Python에서 GPU를 지원하는 Bayesian 연산 근사치", Liepe 등, 생물정보학, (2010), 26:1797-1799 CS1 유지보수: 제목(링크)으로 보관된 복사본
- ^ Sanders, Jason; Kandrot, Edward (2010-07-19). CUDA by Example: An Introduction to General-Purpose GPU Programming, Portable Documents. Addison-Wesley Professional. ISBN 9780132180139. Archived from the original on 2017-04-12.
- ^ "OpenCL - The open standard for parallel programming of heterogeneous systems". khronos.org. Archived from the original on 2011-08-09.
- ^ Teglet, Traian. "NVIDIA Tegra Inside Every Audi 2010 Vehicle". Archived from the original on 2016-10-04. Retrieved 2016-08-03.
- ^ "School's in session — Nvidia's driverless system learns by watching". 2016-04-30. Archived from the original on 2016-05-01. Retrieved 2016-08-03.
- ^ "AMD Radeon HD 6000M series--don't call it ATI!". CNET. Archived from the original on 2016-10-11. Retrieved 2016-08-03.
- ^ "Nvidia GeForce GTX 680 2GB Review". Archived from the original on 2016-09-11. Retrieved 2016-08-03.
- ^ "Xbox One vs. PlayStation 4: Which game console is best? - ExtremeTech". www.extremetech.com. Retrieved 2019-05-13.
- ^ "Kepler TM GK110" (PDF). NVIDIA Corporation. 2012. Archived (PDF) from the original on October 11, 2016. Retrieved August 3, 2016.
- ^ "Taiwan Semiconductor Manufacturing Company Limited". www.tsmc.com. Archived from the original on 2016-08-10. Retrieved 2016-08-03.
- ^ "Building a PC for the HTC Vive". 2016-06-16. Archived from the original on 2016-07-29. Retrieved 2016-08-03.
- ^ "VIVE Ready Computers". www.vive.com. Archived from the original on 2016-02-24. Retrieved 2021-07-30.
- ^ "Nvidia's monstrous Pascal GPU is packed with cutting-edge tech and 15 billion transistors". 5 April 2016. Archived from the original on 2016-07-31. Retrieved 2016-08-03.
- ^ Sarkar, Samit (20 August 2018). "Nvidia RTX 2070, RTX 2080, RTX 2080 Ti GPUs revealed: specs, price, release date". Polygon. Retrieved 11 September 2019.
- ^ "AMD RX 480, 470 & 460 Polaris GPUs To Deliver The "Most Revolutionary Jump In Performance" Yet". 2016-01-16. Archived from the original on 2016-08-01. Retrieved 2016-08-03.
- ^ AMD 보도 자료: AMD.com. 2019년 10월 5일 회수
- ^ "AMD to Introduce New Next-Gen RDNA GPUs in 2020, Not a Typical 'Refresh' of Navi". tomshardware.com. Tom's Hardware. 2020-01-29. Retrieved 2020-02-08.
- ^ Garreffa, Anthony (September 9, 2020). "AMD to reveal next-gen Big Navi RDNA 2 graphics cards on October 28". TweakTown. Retrieved September 9, 2020.
- ^ Lyles, Taylor (September 9, 2020). "AMD's next-generation Zen 3 CPUs and Radeon RX 6000 'Big Navi' GPU will be revealed next month". The Verge. Retrieved September 10, 2020.
- ^ "AMD Teases Radeon RX 6000 Card Performance Numbers: Aiming For 3080?". anandtech.com. AnandTech. 2020-10-08. Retrieved 2020-10-25.
- ^ "AMD Announces Ryzen "Zen 3" and Radeon "RDNA2" Presentations for October: A New Journey Begins". anandtech.com. AnandTech. 2020-09-09. Retrieved 2020-10-25.
- ^ Judd, Will (October 28, 2020). "AMD unveils three Radeon 6000 graphics cards with ray tracing and RTX-beating performance". Eurogamer. Retrieved October 28, 2020.
- ^ Mujtaba, Hassan (2020-11-30). "AMD Radeon RX 6700 XT 'Navi 22 GPU' Custom Models Reportedly Boost Up To 2.95 GHz". Wccftech. Retrieved 2020-12-03.
- ^ Tyson, Mark (December 3, 2020). "AMD CEO keynote scheduled for CES 2020 on 12th January". HEXUS. Retrieved 2020-12-03.
- ^ Cutress, Ian (January 12, 2021). "AMD to Launch Mid-Range RDNA 2 Desktop Graphics in First Half 2021". AnandTech. Retrieved January 4, 2021.
- ^ Funk, Ben (December 12, 2020). "Sony PS5 Gets A Full Teardown Detailing Its RDNA 2 Guts And Glory". Hot Hardware. Retrieved January 3, 2021.
- ^ Gartenberg, Chaim (March 18, 2020). "Sony reveals full PS5 hardware specifications". The Verge. Retrieved January 3, 2021.
- ^ Smith, Ryan. "Microsoft Drops More Xbox Series X Tech Specs: Zen 2 + RDNA 2, 12 TFLOPs GPU, HDMI 2.1, & a Custom SSD". www.anandtech.com. Retrieved 2020-03-19.
- ^ February 2018, Paul Alcorn 28 (28 February 2018). "AMD Rising: CPU And GPU Market Share Growing Rapidly". Tom's Hardware.
- ^ "Matrox Graphics - Products - Graphics Cards". Matrox.com. Archived from the original on 2014-02-05. Retrieved 2014-01-21.
- ^ Hruska, Joel (February 10, 2021). "How Do Graphics Cards Work?". Extreme Tech. Retrieved July 17, 2021.
- ^ "Help Me Choose: Video Cards". Dell. Archived from the original on 2016-09-09. Retrieved 2016-09-17.
- ^ Nvidia Optimus용 Linux 장치 드라이버 설명서
- ^ https://www.fudzilla.com/news/graphics/38134-crossfire-and-sli-market-is-just-300-000-units
- ^ "Is Multi-GPU Dead?". 7 January 2018.
- ^ "Nvidia SLI and AMD CrossFire is dead – but should we mourn multi-GPU gaming? TechRadar".
- ^ "NVIDIA FFmpeg Transcoding Guide". 24 July 2019.
- ^ https://documents.blackmagicdesign.com/ConfigGuides/DaVinci_Resolve_15_Mac_Configuration_Guide.pdf
- ^ "Recommended System: Recommended Systems for DaVinci Resolve". Puget Systems.
- ^ "GPU Accelerated Rendering and Hardware Encoding".
- ^ "V-Ray Next Multi-GPU Performance Scaling".
- ^ "FAQ GPU-accelerated 3D rendering software Redshift".
- ^ "OctaneRender 2020™ Preview is here!".
- ^ "Exploring Performance with Autodesk's Arnold Renderer GPU Beta". 8 April 2019.
- ^ "GPU Rendering — Blender Manual".
- ^ "V-Ray for Nuke – Ray Traced Rendering for Compositors Chaos Group".
- ^ "System Requirements Nuke Foundry".
- ^ "What about multi-GPU support? – Folding@home".
- ^ https://www.tomshardware.com/amp/picturestory/693-intel-graphics-evolution.html
- ^ "GA-890GPA-UD3H overview". Archived from the original on 2015-04-15. Retrieved 2015-04-15.
- ^ Gary Key. "AnandTech - µATX Part 2: Intel G33 Performance Review". anandtech.com. Archived from the original on 2008-05-31.
- ^ Tim Tscheblockov. "Xbit Labs: Roundup of 7 Contemporary Integrated Graphics Chipsets for Socket 478 and Socket A Platforms". Archived from the original on 2007-05-26. Retrieved 2007-06-03.
- ^ Coelho, Rafael (18 January 2016). "Does dual-channel memory make difference on integrated video performance?". Hardware Secrets. Retrieved 4 January 2019.
- ^ Bradley Sanford. "Integrated Graphics Solutions for Graphics-Intensive Applications" (PDF). Archived (PDF) from the original on 2007-11-28. Retrieved 2007-09-02.
- ^ Bradley Sanford. "Integrated Graphics Solutions for Graphics-Intensive Applications". Archived from the original on 2012-01-07. Retrieved 2007-09-02.
- ^ Darren Murph. "Stanford University tailors Folding@home to GPUs". Archived from the original on 2007-10-12. Retrieved 2007-10-04.
- ^ Mike Houston. "Folding@Home - GPGPU". Archived from the original on 2007-10-27. Retrieved 2007-10-04.
- ^ "Top500 List - June 2012 TOP500 Supercomputer Sites". Top500.org. Archived from the original on 2014-01-13. Retrieved 2014-01-21.
- ^ John Nickolls. "Stanford Lecture: Scalable Parallel Programming with CUDA on Manycore GPUs". Archived from the original on 2016-10-11.
- ^ S Harding and W Banzhaf. "Fast genetic programming on GPUs". Archived from the original on 2008-06-09. Retrieved 2008-05-01.
- ^ W Langdon and W Banzhaf. "A SIMD interpreter for Genetic Programming on GPU Graphics Cards". Archived from the original on 2008-06-09. Retrieved 2008-05-01.
- ^ 가르시아와 E 데브루브와 M. Barlaud. GPU를 사용한 가장 가까운 이웃 검색. 2008년 6월 미국 알래스카 앵커리지의 GPU에서 컴퓨터 비전 관련 CVPR 워크샵 진행 중.
- ^ "Tensor Cores in NVIDIA Volta". Nvidia. Nvidia. Retrieved 16 August 2018.
- ^ Smith, Ryan. "NVIDIA Volta Unveiled: GV100 GPU and Tesla V100 Accelerator Announced". AnandTech. AnandTech. Retrieved 16 August 2018.
- ^ Hill, Brandon (11 August 2017). "AMD's Navi 7nm GPU Architecture to Reportedly Feature Dedicated AI Circuitry". HotHardware. HotHardware. Archived from the original on 17 August 2018. Retrieved 16 August 2018.
- ^ "eGPU candidate system list". Tech-Inferno Forums.
- ^ Neil Mohr. "How to make an external laptop graphics adaptor". TechRadar. Archived from the original on 2017-06-26.
- ^ "Best External Graphics Card 2020 (EGPU) [The Complete Guide]". 16 March 2020.
- ^ "Use an external graphics processor with your Mac". Apple Support. Retrieved 2018-12-11.
- ^ "OMEN Accelerator HP® Official Site". www8.hp.com. Retrieved 2018-12-11.
- ^ "Alienware Graphics Amplifier Dell United States". Dell. Retrieved 2018-12-11.
- ^ "Razer Core X - Thunderbolt™ 3 eGPU". Razer. Retrieved 2018-12-11.
- ^ Box, ► Suggestions (2016-11-25). "Build Guides by users". eGPU.io. Retrieved 2018-12-11.
- ^ "Graphics chips market is showing some life". TG Daily. August 20, 2014. Archived from the original on August 26, 2014. Retrieved August 22, 2014.