HTCondor
HTCondor개발자 | 위스콘신 대학교 매디슨 |
---|---|
안정적 해제 | 9.0.11 LTS / 2022년 3월 15일; 전 |
릴리스 미리 보기 | 9.7.0 / 2022년 3월 15일; 전 |
운영 체제 | Microsoft Windows, Mac OS X, Linux, FreeBSD |
유형 | 높은 처리량 컴퓨팅 |
면허증 | 아파치 라이선스 2.0 |
웹사이트 | htcondor |
HTCondor는 컴퓨팅 집약적인 작업의 거친 분산 병렬화를 위한 오픈 소스 고처리 컴퓨팅 소프트웨어 프레임워크다.[1]컴퓨터 전용 클러스터에서 워크로드를 관리하거나 유휴 데스크톱 컴퓨터(일명 사이클 청소)에 대한 작업을 수행하는 데 사용할 수 있다.HTCondor는 Linux, Unix, Mac OS X, FreeBSD 및 Microsoft Windows 운영 체제에서 실행된다.HTCondor는 전용 리소스(랙 마운트 클러스터)와 비 전용 데스크톱 머신(사이클 청소) 모두를 하나의 컴퓨팅 환경에 통합할 수 있다.
HTCondor는 위스콘신-매디슨 대학의 HTCondor 팀이 개발하여 자유롭게 사용할 수 있다.HTCondor는 오픈소스 철학을 따르며 Apache License 2.0에 따라 라이센스를 받는다.[2]
HTCondor는 사용하지 않는 컴퓨팅 시간을 사용하는 반면, HTCondor와 함께 사용하기 위해 컴퓨터를 켜두는 것은 에너지 소비와 관련 비용을 증가시킬 것이다.버전 7.1.1부터 HTCondor는 이전에 타사 소프트웨어를 통해서만 사용할 수 있었던 기능인 사용자 지정 정책에 따라 시스템을 최대 절전 및 절전 모드 해제할 수 있다.
역사
HTCondor의 개발은 1988년에 시작되었다.
HTCondor는 이전에는 Condor로 알려져 있었다. 상표권 소송을 해결하기 위해 2012년 10월에 이름이 바뀌었다.[3]
HTCondor는 Human Genome의 초안 조립을 위한 작업을 분배하는 데 사용되는 스케줄러 소프트웨어였다.
사용 예
NASA Advanced Supercomputing 설비(NAS) HTCondor 풀은 소프트웨어 개발, 시각화, 이메일, 문서 준비 및 기타 작업에 구입하여 사용하는 약 350개의 SGI 및 Sun 워크스테이션으로 구성되어 있다.각 워크스테이션은 사용자 I/O 및 CPU 로드를 감시하는 데몬을 실행한다.워크스테이션이 2시간 동안 유휴 상태일 때 배치 대기열의 작업이 워크스테이션에 할당되고 데몬이 키 스트로크, 마우스 동작 또는 높은 비 HTCondor CPU 사용량을 감지할 때까지 실행된다.이 때 작업은 워크스테이션에서 제거되고 배치 대기열에 다시 배치된다.
특징들
HTCondor는 순차 작업과 병렬 작업을 모두 실행할 수 있다.순차적 작업은 대부분의 "batch ready" 프로그램을 실행할 수 있는 기능을 제공하는 "vanilla"와 대상 애플리케이션이 원격 작업 I/O 및 작업 체크포인트를 제공하는 HTCondor I/O 라이브러리와 다시 연결되는 "표준 우주"를 포함하여 여러 "범용"에서 실행할 수 있다.HTCondor는 또한 "제출 호스트"에서 작업을 실행할 수 있는 "로컬 우주"를 제공한다.
병렬 작업의 세계에서 HTCondor는 표준 메시지 전달 인터페이스와 병렬 가상 머신(Goux, et al.2000) 매우 병렬적인 작업을 위한 자체 마스터 작업자 "MW" 라이브러리 외에도,
HTCondor-G는 HTCondor 작업이 직접 통제되지 않는 리소스를 사용하도록 허용한다.프리WS 및 WS Globus, Nordugrid ARC, UNICORE 및 Amazon Elastic Compute Cloud와 같은 그리드 및 클라우드 리소스와 대화하는 데 주로 사용된다.그러나 Torque/PBS 및 LSF와 같은 다른 배치 시스템과 대화할 때도 사용할 수 있다.Sun Grid Engine에 대한 지원은 EGE 프로젝트의 일환으로 현재 개발 중에 있다.[citation needed]
HTCondor는 DRMA job API를 지원한다.이를 통해 DRMAA 준수 클라이언트는 HTCondor 작업을 제출하고 모니터링할 수 있다.SAGA C++ Reference Implementation은 HTCondor 플러그인(어댑터)을 제공하여 SAGA의 Python 및 C++ API를 통해 HTCondor의 작업 제출 및 모니터링을 가능하게 한다.
다른 HTCondor 기능에는 직무 의존성을 기술하는 메커니즘을 제공하는 "DAGMAN"이 있다.
참고 항목
참조
- ^ Thain, Douglas; Tannenbaum, Todd; Livny, Miron (2005). "Distributed Computing in Practice: the Condor Experience" (PDF). Concurrency and Computation: Practice and Experience. 17 (2–4): 323–356. CiteSeerX 10.1.1.6.3035. doi:10.1002/cpe.938.
- ^ "HTCondor - License Information". research.cs.wisc.edu.
- ^ Tannenbaum, Todd. ""Condor" name changing to "HTCondor"". Retrieved 11 March 2013.