슬럼 워크로드 매니저
Slurm Workload Manager![]() | |
안정된 릴리스 | |
---|---|
저장소 | |
기입처 | C |
운영 체제 | Linux, BSD |
유형 | 클러스터 및 슈퍼컴퓨터의 작업스케줄러 |
면허증. | GNU 일반 공중 라이선스 |
웹 사이트 | slurm |
SLURM(Simple Linux Utility for Resource Management) 또는 간단히 SLURM(Simple Linux Utility for Resource Management)이라고도 불리는 SLurm Workload Manager는 Linux 및 Unix와 유사한 커널을 위한 무료 오픈 소스 작업 스케줄러로, 전 세계의 많은 슈퍼 컴퓨터 및 컴퓨터 클러스터에서 사용됩니다.
다음 3가지 주요 기능을 제공합니다.
- 사용자가 작업을 수행할 수 있도록 일정 기간 동안 리소스(컴퓨터 노드)에 대한 배타적 액세스 및/또는 비배타적 액세스 할당
- 작업 시작, 실행 및 모니터링을 위한 프레임워크를 제공합니다.일반적으로 할당된 노드 집합에서 MPI(Message Passing Interface) 등의 병렬 작업을 수행합니다.
- 보류 중인 작업 대기열을 관리하여 리소스 경합을 조정합니다.
Slum은 TOP500 슈퍼컴퓨터의 [1]약 60%에 해당하는 워크로드 매니저입니다.
Slum은 병렬 [2]컴퓨터에서 작업 할당의 인접성을 최적화하기 위해 Hilbert 곡선 스케줄링 또는 팻 트리 네트워크 토폴로지에 기반한 최적의 알고리즘을 사용합니다.
역사
Slum은 주로 Lawrence Livermore National Laboratory, ScedMD,[3] Linux NetworX, Hewlett-Packard 및 Groupe Bull이 프리 소프트웨어 리소스 매니저로서 공동 개발을 시작했습니다.폐쇄 소스 쿼드릭 RMS에서 영감을 받아 유사한 구문을 공유합니다.그 이름은 [4]후추라마의 탄산음료를 가리키는 것입니다.전 세계 100명 이상의 사람들이 이 프로젝트에 참여했다.이후 많은 대형 컴퓨터 센터의 요구사항을 충족할 수 있는 정교한 배치 스케줄러로 발전했습니다.
2021년 11월[update] 현재 세계에서 가장 강력한 컴퓨터 TOP500 목록에 따르면 Slum은 상위 10개 시스템 중 절반 이상의 워크로드 매니저입니다.
구조.
Slum의 디자인은 매우 모듈러형이며 100여 개의 플러그인이 옵션으로 준비되어 있습니다.가장 간단한 구성에서는 몇 분 안에 설치 및 구성할 수 있습니다.보다 고도의 구성을 통해 회계, 리소스 제한 관리 및 워크로드 우선 순위 부여를 위한 데이터베이스 통합이 가능합니다.
특징들
슬럼 기능은 [citation needed]다음과 같습니다.
- 단일 장애 지점 없음, 백업 데몬, 내결함성 작업 옵션
- 확장성이 높음(IBM Sequoia의 100,000 소켓에서 최대 100,000개의 독립 작업 예약)
- 하이 퍼포먼스(최대 초당 1000건의 작업 제출 및 초당 600건의 작업 실행)
- 자유 오픈 소스 소프트웨어(GNU General Public License)
- 약 100개의 플러그인으로 구성 가능
- 계층형 은행 계좌를 통한 공정한 공유 스케줄링
- 프리엠프티브 및 갱 스케줄링(병렬 작업의 타임슬라이싱)
- 계정 및 구성을 위해 데이터베이스와 통합
- 네트워크 토폴로지 및 온노드 토폴로지(소켓, 코어 및 하이퍼스레드)에 최적화된 리소스 할당
- 사전 예약
- 아이돌 노드의 전원을 끌 수 있습니다.
- 작업마다 다른 운영 체제를 부팅할 수 있습니다.
- 범용 자원 스케줄 설정(그래픽 처리 장치 등)
- 태스크 레벨까지 실시간 계정 기능(CPU 또는 메모리 사용량이 많은 특정 태스크 식별)
- 사용자 또는 은행 계정별 리소스 제한
- 작업별 전력 소비량 산정
- IBM 병렬 환경(PE/POE) 지원
- 작업 어레이 지원
- 작업 프로파일링(각 태스크의 CPU 사용량, 메모리 사용량, 전력 소비량, 네트워크 및 파일 시스템 사용량의 정기적인 샘플링)
- 정교한 멀티팩터 작업 우선순위 부여 알고리즘
- MapReduce+ 지원
- 과학적 데이터 이동을 가속화하는 버스트 버퍼 지원
2014년 [5]11월에 출시된 Slum 버전 14.11에 대해 다음과 같은 기능이 발표되었습니다.
- 작업 어레이 데이터 구조 및 확장성 향상
- 이기종 범용 자원 지원
- CPU 가바나 설정을 위한 사용자 옵션 추가
- 종료 값에 따른 자동 작업 재큐 정책
- 사용자, 유형, 개수 및 소요 시간별 API 사용 보고서
- 통신 게이트웨이 노드로 확장성 향상
지원되는 플랫폼
Slum은 주로 Linux 디스트리뷰션과 연동하도록 개발되었지만 BSD(FreeBSD, NetBSD, OpenBSD)[6]를 포함한 다른 POSIX 기반 운영 체제도 지원합니다.또한 Slum은 다음과 같은 몇 가지 고유한 컴퓨터 아키텍처를 지원합니다.
- 20페타플롭 IBM Sequoia를 포함한 IBM BlueGene/Q 모델
- Cray XT, XE 및 캐스케이드
- Tianhe-2는 인텔 Ivy Bridge 칩 32,000개와 인텔 Xeon Phi 칩 48,000개로 총 310만개의 코어를 갖춘 33.9페타플롭 시스템입니다.
- IBM 병렬 환경
- 안톤
면허증.
슬럼은 GNU General Public License v2에서 사용할 수 있습니다.
상용 지원
2010년, Slurm의 개발자는 표준 소스를 유지하는 SchedMD를 설립해, 개발, 레벨 3의 상업 지원, 트레이닝 서비스를 제공하고 있습니다.Bull, Cray, Science + Computing에서도 상용 지원을 받을 수 있습니다.
「 」를 참조해 주세요.
- 클러스터의 작업 스케줄러 및 배치 큐잉
- 베어울프 성단
- 마우이 클러스터 스케줄러
- 오픈 소스 클러스터 애플리케이션 리소스(OSCAR)
- 토크
- 유니바 그리드 엔진
- 플랫폼 LSF
레퍼런스
- ^ "Running a Job on HPC using Slurm HPC USC". hpcc.usc.edu. Archived from the original on 2019-03-06. Retrieved 2019-03-05.
- ^ Pascual, Jose Antonio; Navaridas, Javier; Miguel-Alonso, Jose (2009). Effects of Topology-Aware Allocation Policies on Scheduling Performance. Job Scheduling Strategies for Parallel Processing. Lecture Notes in Computer Science. Vol. 5798. pp. 138–144. doi:10.1007/978-3-642-04633-9_8. ISBN 978-3-642-04632-2.
- ^ "Slurm Commercial Support, Development, and Installation". SchedMD. Retrieved 2014-02-23.
- ^ "SLURM: Simple Linux Utility for Resource Management" (PDF). 23 June 2003. Retrieved 11 January 2016.
- ^ "Slurm - What's New". SchedMD. Retrieved 2014-08-29.
- ^ 슬럼 플랫폼
추가 정보
- Balle, Susanne M.; Palermo, Daniel J. (2008). Enhancing an Open Source Resource Manager with Multi-core/Multi-threaded Support. Job Scheduling Strategies for Parallel Processing. Lecture Notes in Computer Science. Vol. 4942. p. 37. doi:10.1007/978-3-540-78699-3_3. ISBN 978-3-540-78698-6.
- Jette, M.; Grondona, M. (June 2003). "SLURM: Simple Linux Utility for Resource Management" (PDF). Proceedings of ClusterWorld Conference and Expo. San Jose, California.
- Layton, Jeffrey B. (5 February 2009). "Caos NSA and Perceus: All-in-one Cluster Software Stack". Linux Magazine.
- Yoo, Andy B.; Jette, Morris A.; Grondona, Mark (2003). SLURM: Simple Linux Utility for Resource Management. Job Scheduling Strategies for Parallel Processing. Lecture Notes in Computer Science. Vol. 2862. p. 44. CiteSeerX 10.1.1.10.6834. doi:10.1007/10968987_3. ISBN 978-3-540-20405-3.