멀티코어 프로세서
Manycore processor많은 코어 프로세서는 고도의 병렬 처리를 위해 설계된 특수한 종류의 멀티 코어 프로세서로, 다수의 심플하고 독립된 프로세서 코어(수십 개의 코어에서 수천 개 이상)를 포함하고 있습니다.많은 코어 프로세서가 임베디드 컴퓨터와 고성능 컴퓨팅에 광범위하게 사용되고 있습니다.
멀티코어 아키텍처와의 대조
많은 코어 프로세서는 처음부터 멀티 코어 프로세서와 구별됩니다.즉, 보다 높은 수준의 명시적 병렬 처리와 높은 스루풋(또는 낮은 전력 소비)을 실현하기 위해 최적화되어 레이텐시와 낮은 싱글 스레드 성능을 희생합니다.
반면 멀티코어 프로세서의 광범위한 범주는 일반적으로 병렬 코드와 시리얼 코드를 모두 효율적으로 실행하도록 설계되어 있기 때문에 높은 싱글 스레드 퍼포먼스(예를 들어 더 많은 실리콘을 순서 없는 실행에 할애, 더 깊은 파이프라인, 더 많은 슈퍼스칼라 실행 유닛, 더 크고 더 일반적인 캐시)에 중점을 두고 공유됩니다. 메모리이러한 기술은 런타임 리소스를 단일 스레드에서 암묵적 병렬화를 파악하는 데 사용합니다.싱글 코어 프로세서에서 지속적으로(하위 호환성이 있는) 진화한 시스템에서 사용됩니다.통상, 코어(2, 4, 8 등)는 소수이며, 이종 시스템의 멀티 코어 액셀러레이터(GPU 등)에 의해서 보완되는 경우가 있습니다.
동기
캐시 일관성은 멀티코어 프로세서의 확장을 제한하는 문제입니다.많은 코어 프로세서는 메시지 전달,[1] 스크래치 패드 메모리, DMA,[2] 파티션화된 글로벌주소 공간,[3] 읽기 전용/비 일관 캐시 등의 방법으로 이를 우회할 수 있습니다.칩 및 로컬 메모리의 네트워크를 사용하는 manycore 프로세서는 소프트웨어의 태스크 공간 레이아웃을 명시적으로 최적화할 수 있는 기회를 제공합니다([4]TrueNorth용으로 개발된 툴링에서 볼 수 있습니다).
많은 코어 프로세서는 클러스터나 벡터 [5]프로세서 등의 고성능 컴퓨팅에서 유래한 테크놀로지와 (개념적으로) 더 많은 공통점을 가지고 있을 수 있습니다.
GPU는 여러 개의 셰이더 처리 장치를 가진 manycore 프로세서의 한 형태로 간주될 수 있으며, 높은 병렬 코드(높은 throughput, 그러나 단일 스레드 성능은 극히 낮음)에만 적합합니다.
적합한 프로그래밍 모델
- 메시지 전달 인터페이스
- 컴퓨팅[6] 커널을 지원하는 OpenCL 또는 기타 API
- 분할된 글로벌 주소 공간
- 배우 모델
- OpenMP[7]
- 데이터 흐름
manycore 시스템 클래스
특정 멀티코어 아키텍처
- ZettaScaler [ 1 ], 일본 PEZY Computing 2048 코어 모듈
- MIC(Many Integrated Core) 아키텍처를 갖춘 Xeon Phi 코프로세서
- 틸레라
- Adapteva Epiphany Architecture(PGAS 스크래치패드 메모리를 사용하는 멀티코어 칩)
- HyperX 아키텍처를 기반으로 한 100코어 DSP/GPP 프로세서인 일관성 있는 Logix hx3100 프로세서
- Movidius Miriard 2 (멀티코어 비전 처리 유닛(VPU))
- Kalray, 데이터 집약적인 태스크용 멀티코어 PCI-e 액셀러레이터
- Teraflops Research Chip (메시지 전달을 사용하는 멀티코어 프로세서
- TrueNorth, 칩 아키텍처에 멀티코어 네트워크를 탑재한 AI 액셀러레이터
- 친환경 어레이, 저전력 애플리케이션을 위한 메시지 전달을 사용하는 멀티코어 프로세서
- Sunway SW26010은 260코어 멀티코어 프로세서를 탑재하여 슈퍼컴퓨터 Sunway TaihuLight 상위1대
- Eyeriss는 임베디드 비전[10] 애플리케이션용 컨볼루션 뉴럴 넷을 실행하도록 설계된 다코어 프로세서입니다.
- 멀티코어 AI 액셀러레이터 Graphcore
100만 이상의 CPU 코어를 탑재한 특정 멀티코어 컴퓨터
멀티코어 프로세서로 구축된 다수의 컴퓨터에는 100만 개 이상의 개별 CPU 코어가 있습니다.예를 들어 다음과 같습니다.
- ExaScaler와 PEZY Computing이 개발한 슈퍼컴퓨터 Gyoukou (일본어: hepburnHepburn: gyoko, 여명등)는 총 2,048,000개의 프로세서와 1250개의 인텔 Xeon D 호스트 프로세서를 갖추고 있습니다.
- SpiNaker는 Human Brain Project의 일부로 구축된 대규모 병렬(1M CPU 코어) 멀티코어 프로세서(ARM 기반)입니다.
5M 이상의 CPU 코어를 탑재한 특정 컴퓨터
슈퍼컴퓨터 중에는 CPU 코어가 백만 개가 넘고 심지어 500만 개가 5백만 개가 넘는 것도 있습니다.GPU와 같은 코프로세서가 있는 경우 코어카운트에 코어가 표시되지 않으면 타깃에 도달하는 컴퓨터가 상당히 많아집니다.
- 프런티어
- 후지쯔 A64FX ARM 기반의 코어를 채용한 일본 슈퍼컴퓨터 후가쿠는 총 7630,848대.
- Sunway TaihuLight는 대규모 병렬(1,000만 CPU [citation needed]코어) 중국 슈퍼컴퓨터입니다.이 슈퍼컴퓨터는 커스텀 멀티코어 아키텍처를 채용한 세계에서 가장 빠른 슈퍼컴퓨터 중 하나입니다.2018년 11월 현재 세계에서 세 번째로 빠른 슈퍼컴퓨터인 중국 Sunway TaihuLight는 각각 256개의 코어를 포함하는 40,960개의 SW26010 manycore 프로세서에서 성능을 얻고 있습니다.
「 」를 참조해 주세요.
- 멀티코어
- 벡터 프로세서
- SIMD
- 하이 퍼포먼스
- 컴퓨터 클러스터
- 칩상의 멀티프로세서 시스템
- 비전 처리 장치
- 메모리 액세스 패턴
- 캐시 일관성
- 민망할 정도로 평행하다
- 대규모 병렬화
- 쿠다
레퍼런스
- ^ Mattson, Tim (January 2010). "The Future of Many Core Computing: A tale of two processors" (PDF).
- ^ Hendry, Gilbert; Kretschmann, Mark. "IBM Cell Processor" (PDF).
- ^ Olofsson, Andreas; Nordström, Tomas; Ul-Abdin, Zain (2014). "Kickstarting High-performance Energy-efficient Manycore Architectures with Epiphany". arXiv:1412.5538 [cs.AR].
- ^ Amir, Arnon (June 11, 2015). "IBM SyNAPSE Deep Dive Part 3". IBM Research. Archived from the original on 2021-12-21.
- ^ "cell architecture"."셀 아키텍처는 일반 마이크로프로세서에서 볼 수 있는 그 어떤 것과도 다릅니다.멀티프로세서 벡터 슈퍼컴퓨터에 가까운 설계입니다."
- ^ Rick Merritt (June 20, 2011), "OEMs show systems with Intel MIC chips", www.eetimes.com, EE Times
- ^ Barker, J; Bowden, J (2013). "Manycore Parallelism through OpenMP". OpenMP in the Era of Low Power Devices and Accelerators. IWOMP. Lecture Notes in Computer Science, vol 8122. Springer. doi:10.1007/978-3-642-40698-0_4.
- ^ Morgan, Timothy Prickett (2021-02-10). "A First Peek At China's Sunway Exascale Supercomputer". The Next Platform. Retrieved 2021-11-18.
- ^ Hemsoth, Nicole (2021-04-19). "China's Exascale Prototype Supercomputer Tests AI Workloads". The Next Platform. Retrieved 2021-11-18.
- ^ Chen, Yu-Hsin and Krishna, Tushar and Emer, Joel and Sze, Vivienne (2016). "Eyeriss: An Energy-Efficient Reconfigurable Accelerator for Deep Convolutional Neural Networks". IEEE International Solid-State Circuits Conference, ISSCC 2016, Digest of Technical Papers. pp. 262–263.
{{cite web}}
: CS1 maint: 작성자 파라미터 사용(링크)