DOME 프로젝트

DOME project

DOME은 세계에서 가장 큰 계획 전파 망원경인 SKA(Square Kmere Array)에 초점을 맞춘 민관 협력의 형태로 IBM과 ANTOM이 공동으로 출자한 네덜란드 정부 프로젝트입니다.SKA는 호주와 남아프리카공화국에 건설될 예정이다.DOME 프로젝트의 목표는 SKA와 IBM 모두에 적용되는 기술 로드맵 개발입니다.5개년 프로젝트는 2012년에 시작되었으며, 네덜란드 정부와 스위스 취리히의 IBM Research와 네덜란드의 [1][2][3][4]ARTOMY가 공동 출자하고 있습니다.프로젝트는 2017년 9월 30일에 공식적으로 종료되었다.

DOME 프로젝트는 컴퓨팅, 그린 컴퓨팅, 데이터 및 스트리밍, 나노 광학의 3가지 분야에 초점을 맞추고 있으며 7개의 연구 프로젝트로 분할되어 있습니다.

  • P1 알고리즘과 머신– 기존 컴퓨팅의 확장이 기본적으로 벽에 부딪혔기 때문에 미래의 대규모 컴퓨터 설계에는 새로운 방법론과 원칙이 필요합니다.이것은 나머지 6개의 우산 프로젝트가 될 것이다.
  • P2 액세스 패턴– 매일 페타바이트 단위의 데이터를 저장하는 경우에는 데이터 스토리지 계층화 및 스토리지 미디어에 대한 새로운 생각을 개발해야 합니다.
  • P3 Nano Photonics – 장거리 및 시스템 간의 광섬유 통신은 새로운 것이 아니지만 컴퓨터 시스템 내 및 망원경 자체의 광섬유 통신에는 많은 작업이 필요합니다.
  • P4 Microservers – 높은 컴퓨팅 밀도, 와트당 퍼포먼스 및 시스템 복잡성 경감에 대한 새로운 요구로 새로운 종류의 커스텀 설계 서버 제공
  • P5 액셀러레이터– 일반적인 컴퓨팅 퍼포먼스가 평준화됨에 따라 신호 처리 및 분석 등의 특수한 태스크에 대해 다음 수준의 퍼포먼스에 대응하기 위한 특별한 아키텍처가 조사됩니다.
  • P6 압축 샘플링 – 전파 천문학 데이터의 캡처, 처리 및 분석을 위한 맞춤형 신호 처리 및 기계 학습 알고리즘에 대한 기초 연구.압축 감지, 대수 시스템, 기계 학습 및 패턴 인식은 초점 영역입니다.
  • P7 실시간 통신– 대규모 시스템에서 다중 네트워크 조작으로 인한 지연을 줄이고 통신 대역폭의 유틸리티를 최적화하여 적절한 데이터를 적절한 처리 장치에 실시간으로 전달합니다.

P1 알고리즘 및 머신

컴퓨터의 디자인은 지난 수십 년 동안 극적으로 변화했지만, 여전히 오래된 패러다임이 지배하고 있습니다.현재의 설계는 단일 컴퓨터가 한 장소에서 작은 데이터 세트를 작업하는 것에서 비롯됩니다.SKA는 지리적으로 분리된 수많은 장소에서 수천 대의 개별 컴퓨터를 사용하여 실시간으로 수집되는 매우 큰 데이터 세트를 처리하는 완전히 다른 환경에 직면하게 됩니다.그러한 기계를 설계하기 위한 기본 원칙을 재검토해야 할 것이다.전원 [5]엔벨로프, 액셀러레이터 테크놀로지, 워크로드 분산, 메모리 크기, CPU 아키텍처, 노드 인터커뮤니케이션에 관한 파라미터를 조사하여 설계할 새로운 기준선을 도출해야 합니다.이 프로젝트의 결과물인 툴은 2018년 초에 오픈소싱되고 있습니다.

이 기초 연구는 아키텍처 방향에 관한 적절한 결정을 내리는 데 도움이 되는 나머지 6개 중점 분야의 우산 역할을 합니다.

첫 번째 단계는 LOFARMeerKAT 망원경 설계의 소급 분석과 매우 크고 분산된 컴퓨터를 설계할 때 사용할 설계 도구의 개발입니다.

P2 액세스 패턴

이 프로젝트는 DOME이 처리해야 하는 매우 많은 양의 데이터에 초점을 맞출 것입니다.SKA는 매일 페타바이트 단위의 데이터를 생성합니다.이것은 긴급성과 지리적 위치에 따라 텔레스코프 어레이 근처 또는 데이터 센터 내에서 다르게 처리해야 합니다.복잡한 계층형 솔루션은 현재 최첨단 기술을 뛰어넘는 많은 기술을 사용하여 설계해야 합니다.설계의 원동력은 비용, 접근성 및 에너지 효율이 가장 낮다는 것입니다.

이 다계층 접근방식은 여러 종류의 소프트웨어 기술을 결합하여 자기 테이프나 하드 드라이브 등의 기존 스토리지 미디어에서 상변화 메모리 등의 새로 개발된 기술에 이르기까지 하드웨어 상의 데이터를 분석, 체, 배포, 저장 및 검색합니다.서로 다른 스토리지 미디어의 적합성은 데이터 쓰기 및 읽기 시 사용 패턴에 따라 크게 달라지며,[6] 이러한 패턴은 시간이 지남에 따라 변화하므로 설계를 변경할 여지가 있어야 합니다.

P3 나노 포토닉스

데이터 전송은 DOME 중 가장 큰 규모에서 가장 작은 규모까지 설계에 영향을 미치는 주요 요소입니다.동선상의 전기 통신 비용은 안테나 수집과 데이터센터 간의 연결에서 컴퓨터 내부의 연결 장치에 이르기까지 저전력 광전자 상호 연결의 적용을 촉진합니다.IBM과 AUTOMIC은 모두 나노 광자학, 빔포밍, 광학 링크에 대한 고급 연구 프로그램을 가지고 있으며 새로운 디자인을 [7]위해 그들의 노력을 합칠 것입니다.

본 연구 프로젝트는 디지털 광인터커넥트, 아날로그 광인터커넥트, 아날로그 광신호 처리 등 4개의 연구개발 부문으로 나뉘어 있습니다.

  1. 천문 신호 처리 보드용 디지털 광학 인터커넥트 테크놀로지.
  2. 포커스 플레인 어레이 프론트 엔드에 대응하는 아날로그 광인터커넥트 테크놀로지.
  3. 포토닉 페이즈드 어레이 리시버 타일용 아날로그 광인터커넥트 테크놀로지.
  4. 포토닉 포커스 플레인 어레이를 위한 아날로그 광인터커넥트 및 신호처리 테크놀로지.

2013년 2월, IBM스위스의 Ecole Polytechnique Fédéale de Lausanne(EPFL)는 100 Gbit/s 아날로그-디지털 변환기(ADC)[8]를 선보였습니다.2014년 2월 ISSCC에서 IBM과 AUTOMIC은 400Gbit/s ADC를 [9]시연했습니다.

P4 마이크로 서버

2012년에는 IBM의 Ronald P가 팀을 이끌었습니다.Luijten은 Linux를 실행하는 범용 컴포넌트를 기반으로 계산 밀도가 높고 에너지 효율이 뛰어난 64비트 컴퓨팅 서버 설계를 추구하기 시작했습니다.시스템 칩(SoC) 설계는 대부분의 필수 컴포넌트가 하나의 칩에 가장 적합하며, 기본적으로 완전한 메인보드(RAM 및 부트 플래시 제외)가 칩에 들어가는 "마이크로 서버"의 정의가 등장했습니다.ARM, x86Power ISA 기반 솔루션을 조사하여 Freescale의 Power ISA 기반 듀얼코어 P5020/쿼드코어 P5040 프로세서를 기반으로 한 솔루션이 출시되었습니다.

설계.

그 결과, 마이크로 서버는, 표준 FB-DIMM 소켓과 같은 폼 팩터에 넣을 수 있습니다.SoC 칩, 약 20GB의 DRAM 및 일부 제어 칩(모니터링, 디버깅 및 부팅에 사용되는 CypressPSoC 3 등)은 물리 치수가 133×55mm인 완전한 컴퓨팅 노드를 구성합니다.카드의 핀은 SATA, 5기가비트2개10기가비트 이더넷 포트, 1개의 SD 카드 인터페이스, 1개의 USB 2 인터페이스 및 전원에 사용됩니다.

계산카드는 최대 70W의 헤드룸과 함께 35W의 전력 범위 내에서 동작합니다.이 아이디어는 외부 스토리지 및 통신용 네트워크 배전반과 함께 약 100장의 컴퓨팅 카드를 19인치 랙 2U 드로어에 장착하는 것입니다.냉각은 Super가 개발한 Aquasar 온수 냉각 솔루션을 통해 제공됩니다.독일의 MUC 슈퍼컴퓨터.

미래.

2013년 말에 새로운 SoC가 선택되었습니다.Freescale의 새로운 12코어 T4240은 훨씬 강력하며 T5020과 동일한 전력 범위 내에서 작동합니다.새로운 프로토타입 마이크로 서버 카드가 2014년 초에 전체 2U 드로어에서 대규모 구현을 위해 구축 및 검증되었습니다.이후 8코어 ARMv8 보드가 NXP(구 프리스케일)의 LS2088A 부품을 사용하여 개발되었습니다.2017년 말, IBM은 2018년 중반까지 이 기술을 시장에 출시할 예정인 스타트업에게 라이센스를 부여하고 있습니다.

P5 액셀러레이터

기존의 고성능 프로세서는 2000년대 후반에는 전력 요건의 증가로 클럭 속도를 높일 수 없었던 퍼포먼스 벽에 부딪혔습니다.해결책 중 하나는 가장 일반적인 태스크나 계산 부하가 높은 태스크를 액셀러레이터라고 불리는 특수한 하드웨어에 오프로드하는 하드웨어를 포함하는 것입니다.이 연구 영역에서는 이러한 영역을 식별하고 병목 현상을 극복하기 위한 알고리즘과 하드웨어를 설계하려고 합니다.패턴 검출, 해석, 데이터 룩업 및 신호 처리하는 액셀러레이터가 있을 것입니다.하드웨어는 정적 태스크용 고정 가속기와 유사한 특성을 가진 태스크 패밀리용 프로그램 가능한 가속기의 두 가지 클래스로 구성됩니다. 프로젝트에서는 범용 그래픽 [10]프로세서를 사용한 대규모 병렬 컴퓨팅도 실현됩니다.

P6 압축 샘플링

압축 샘플링 프로젝트는 델프트 공과대학과 협력하여 신호 처리에 대한 기초적인 연구입니다.전파 천문학 캡처의 맥락에서, 신호의 분석과 처리는 방대한 데이터 세트에 매우 많은 컴퓨팅을 필요로 합니다.목표는 샘플링과 압축을 동시에 수행하고 머신러닝을 사용하여 데이터 수집기에 가능한 한 가까이에서 무엇을 보관하고 무엇을 폐기해야 하는지를 검출하는 것입니다.이 프로젝트의 목표는 지속적으로 증가하는 패턴 클러스터에서 신호를 캡처하고 유지할 패턴을 보정하는 사용할 압축 샘플링 알고리즘을 개발하는 것입니다.이 연구는 또한 패턴 품질 저하, 특이치 감지, 물체 분류 및 이미지 [11][12]형성 문제도 다룰 것이다.

P7 실시간 통신

수집기에서 프로세스 시설로의 데이터 이동은 통상적으로 지연 시간이 길거나 대역폭이 낮은 접속으로 인해 정체되어 있으며 통신 네트워크의 명확한 설계가 이루어지지 않아 데이터가 증가되는 경우가 많습니다.이 연구 프로젝트에서는 지연 시간을 최소화하고 I/O 시스템을 설계하여 엑사스케일 컴퓨터 설계로 데이터를 직접 프로세싱 엔진에 쓰도록 합니다.첫 번째 단계에서는 시스템의 보틀 넥을 식별하고 Remote Direct Memory Access(RDMA; 리모트 다이렉트 메모리 액세스)에 대해 조사합니다.두 번째 단계에서는 표준 RDMA 기술을 사용하여 상호 접속 네트워킹에 대해 조사합니다.3단계에는 기능성 [13]시제품 개발이 포함됩니다.

레퍼런스

  1. ^ DOME: IBM과 ARTOMIC의 SKA 전파 망원경용 Exascale Computer
  2. ^ NLeSC, IBM 및 AUTOMIC과 DOME 계약 체결
  3. ^ 전례 없는 데이터 처리 과제를 해결하기 위해 새로운 기술을 모색하는 IBM
  4. ^ 빅뱅에서 빅데이터로: 천문학과 IBM이 협력하여 우주의 기원을 탐색합니다.
  5. ^ ARTOMY & IBM Exascale Technology 센터– 알고리즘 및 기계
  6. ^ 천문 및 IBM Exascale Technology 센터– 접근 패턴
  7. ^ 천문 및 IBM Exascale Technology 센터– Nano Photonics
  8. ^ 초고속 이더넷 연구로 인터넷 속도가 100Gb/초로 향상
  9. ^ IBM이 400Gbps 인터넷에 문호를 개방하다
  10. ^ ARTOMY & IBM Exascale 테크놀로지 센터– 액셀러레이터
  11. ^ ARTOMY & IBM Exascale Technology 센터 – 압축 샘플링
  12. ^ "Data reduction and image formation for future radio telescopes (DRIFT)". Archived from the original on 2014-07-14. Retrieved 2014-07-02.
  13. ^ 천문 및 IBM Exascale Technology 센터– RT 커뮤니케이션