슬럼 워크로드 매니저

Slurm Workload Manager
슬럼
Slurm logo.svg
안정된 릴리스
저장소
기입처C
운영 체제Linux, BSD
유형클러스터 및 슈퍼컴퓨터의 작업스케줄러
면허증.GNU 일반 공중 라이선스
웹 사이트slurm.schedmd.com

SLURM(Simple Linux Utility for Resource Management) 또는 간단히 SLURM(Simple Linux Utility for Resource Management)이라고도 불리는 SLurm Workload Manager는 Linux 및 Unix유사한 커널을 위한 무료 오픈 소스 작업 스케줄러로, 전 세계의 많은 슈퍼 컴퓨터컴퓨터 클러스터에서 사용됩니다.

다음 3가지 주요 기능을 제공합니다.

  • 사용자가 작업을 수행할 수 있도록 일정 기간 동안 리소스(컴퓨터 노드)에 대한 배타적 액세스 및/또는 비배타적 액세스 할당
  • 작업 시작, 실행 및 모니터링을 위한 프레임워크를 제공합니다.일반적으로 할당된 노드 집합에서 MPI(Message Passing Interface) 등의 병렬 작업을 수행합니다.
  • 보류 중인 작업 대기열을 관리하여 리소스 경합을 조정합니다.

Slum은 TOP500 슈퍼컴퓨터의 [1]약 60%에 해당하는 워크로드 매니저입니다.

Slum은 병렬 [2]컴퓨터에서 작업 할당의 인접성을 최적화하기 위해 Hilbert 곡선 스케줄링 또는 팻 트리 네트워크 토폴로지에 기반최적의 알고리즘을 사용합니다.

역사

Slum은 주로 Lawrence Livermore National Laboratory, ScedMD,[3] Linux NetworX, Hewlett-PackardGroupe Bull이 프리 소프트웨어 리소스 매니저로서 공동 개발을 시작했습니다.폐쇄 소스 쿼드릭 RMS에서 영감을 받아 유사한 구문을 공유합니다.그 이름은 [4]후추라마탄산음료를 가리키는 것입니다.전 세계 100명 이상의 사람들이 이 프로젝트에 참여했다.이후 많은 대형 컴퓨터 센터의 요구사항을 충족할 수 있는 정교한 배치 스케줄러로 발전했습니다.

2021년 11월 현재 세계에서 가장 강력한 컴퓨터 TOP500 목록에 따르면 Slum은 상위 10개 시스템 중 절반 이상의 워크로드 매니저입니다.

구조.

Slum의 디자인은 매우 모듈러형이며 100여 개의 플러그인이 옵션으로 준비되어 있습니다.가장 간단한 구성에서는 몇 분 안에 설치 및 구성할 수 있습니다.보다 고도의 구성을 통해 회계, 리소스 제한 관리 및 워크로드 우선 순위 부여를 위한 데이터베이스 통합이 가능합니다.

특징들

슬럼 기능은 [citation needed]다음과 같습니다.

  • 단일 장애 지점 없음, 백업 데몬, 내결함성 작업 옵션
  • 확장성이 높음(IBM Sequoia의 100,000 소켓에서 최대 100,000개의 독립 작업 예약)
  • 하이 퍼포먼스(최대 초당 1000건의 작업 제출 및 초당 600건의 작업 실행)
  • 자유 오픈 소스 소프트웨어(GNU General Public License)
  • 약 100개의 플러그인으로 구성 가능
  • 계층형 은행 계좌를 통한 공정한 공유 스케줄링
  • 프리엠프티브 및 갱 스케줄링(병렬 작업의 타임슬라이싱)
  • 계정 및 구성을 위해 데이터베이스와 통합
  • 네트워크 토폴로지 및 온노드 토폴로지(소켓, 코어 및 하이퍼스레드)에 최적화된 리소스 할당
  • 사전 예약
  • 아이돌 노드의 전원을 끌 수 있습니다.
  • 작업마다 다른 운영 체제를 부팅할 수 있습니다.
  • 범용 자원 스케줄 설정(그래픽 처리 장치 등)
  • 태스크 레벨까지 실시간 계정 기능(CPU 또는 메모리 사용량이 많은 특정 태스크 식별)
  • 사용자 또는 은행 계정별 리소스 제한
  • 작업별 전력 소비량 산정
  • IBM 병렬 환경(PE/POE) 지원
  • 작업 어레이 지원
  • 작업 프로파일링(각 태스크의 CPU 사용량, 메모리 사용량, 전력 소비량, 네트워크 및 파일 시스템 사용량의 정기적인 샘플링)
  • 정교한 멀티팩터 작업 우선순위 부여 알고리즘
  • MapReduce+ 지원
  • 과학적 데이터 이동을 가속화하는 버스트 버퍼 지원

2014년 [5]11월에 출시된 Slum 버전 14.11에 대해 다음과 같은 기능이 발표되었습니다.

  • 작업 어레이 데이터 구조 및 확장성 향상
  • 이기종 범용 자원 지원
  • CPU 가바나 설정을 위한 사용자 옵션 추가
  • 종료 값에 따른 자동 작업 재큐 정책
  • 사용자, 유형, 개수 및 소요 시간별 API 사용 보고서
  • 통신 게이트웨이 노드로 확장성 향상

지원되는 플랫폼

Slum은 주로 Linux 디스트리뷰션과 연동하도록 개발되었지만 BSD(FreeBSD, NetBSD, OpenBSD)[6]를 포함한 다른 POSIX 기반 운영 체제도 지원합니다.또한 Slum은 다음과 같은 몇 가지 고유한 컴퓨터 아키텍처를 지원합니다.

  • 20페타플롭 IBM Sequoia를 포함한 IBM BlueGene/Q 모델
  • Cray XT, XE 및 캐스케이드
  • Tianhe-2는 인텔 Ivy Bridge 칩 32,000개와 인텔 Xeon Phi 칩 48,000개로 총 310만개의 코어를 갖춘 33.9페타플롭 시스템입니다.
  • IBM 병렬 환경
  • 안톤

면허증.

슬럼은 GNU General Public License v2에서 사용할 수 있습니다.

상용 지원

2010년, Slurm의 개발자는 표준 소스를 유지하는 SchedMD를 설립해, 개발, 레벨 3의 상업 지원, 트레이닝 서비스를 제공하고 있습니다.Bull, Cray, Science + Computing에서도 상용 지원을 받을 수 있습니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ "Running a Job on HPC using Slurm HPC USC". hpcc.usc.edu. Archived from the original on 2019-03-06. Retrieved 2019-03-05.
  2. ^ Pascual, Jose Antonio; Navaridas, Javier; Miguel-Alonso, Jose (2009). Effects of Topology-Aware Allocation Policies on Scheduling Performance. Job Scheduling Strategies for Parallel Processing. Lecture Notes in Computer Science. Vol. 5798. pp. 138–144. doi:10.1007/978-3-642-04633-9_8. ISBN 978-3-642-04632-2.
  3. ^ "Slurm Commercial Support, Development, and Installation". SchedMD. Retrieved 2014-02-23.
  4. ^ "SLURM: Simple Linux Utility for Resource Management" (PDF). 23 June 2003. Retrieved 11 January 2016.
  5. ^ "Slurm - What's New". SchedMD. Retrieved 2014-08-29.
  6. ^ 슬럼 플랫폼

추가 정보

외부 링크