자동 계층형 스토리지
Automated tiered storage![]() |
자동화된 계층형 스토리지(자동화된 스토리지 계층화)는 스토리지 장치 및 미디어의 서로 다른 계층(유형)에 걸쳐 데이터를 자동으로 진행 또는 강등하는 것이다. 데이터 이동은 소프트웨어 또는 임베디드 펌웨어의 도움으로 자동화된 방식으로 이루어지며 성능 및 용량 요구사항에 따라 관련 매체에 할당된다. 보다 고급 구현에는 계층 간에 데이터를 이동할 수 있는지 여부와 시기를 지시하는 규칙과 정책을 정의할 수 있는 기능이 포함되며, 많은 경우 데이터를 계층에 영구적으로 또는 특정 기간 동안 고정할 수 있는 기능을 제공한다. 구현은 다양하지만, 범용 스토리지 미디어의 대부분의 형태를 지원하는 범용 프로세서에서 실행되는 순수한 소프트웨어 기반 구현과 SAN 디스크 어레이와 같은 폐쇄형 내장 스토리지 시스템의 일부로 펌웨어에 의해 제어되는 내장형 자동 계층형 스토리지라는 두 가지 광범위한 범주로 분류된다. 소프트웨어 정의 스토리지 아키텍처는 일반적으로 주요 기능의 일부로 계층형 스토리지의 구성요소를 포함한다.
가장 일반적인 정의에서 자동 계층화된 스토리지는 계층적 스토리지 관리의 한 형태다. 그러나, 솔리드 스테이트 Disk와 스토리지 클래스 메모리의 확산에 의해 구동되는 새로운 형태의 실시간 성능 최적화된 데이터 마이그레이션을 수용하기 위해 자동 계층형 스토리지라는 용어가 등장했다. 또한, 기존의 HSM 시스템이 파일에 대해 동작하고 스토리지 계층 간에 데이터를 이동시키는 경우, 패션과 같이 자동화된 스토리지 계층 시스템은 배치 및 실시간 모드 모두에서 하위 파일 레벨에서 작동할 수 있다. 후자의 경우, 데이터가 스토리지 시스템에 진입하는 즉시 이동하거나 데이터에 접근한 후 몇 초 이내에 활동 수준에 따라 재배치하는 반면, 전통적인 계층화는 시간별, 일일 또는 심지어 주별 일정에 따라 작동하는 경향이 있다. HSM, ILM 및 자동 계층형 스토리지 간의 상대적 차이점에 대한 자세한 배경은 SNIA 웹 사이트에서 확인할 수 있다.[1] 다른 접근방법의 일반적인 비교는 이 '자동 계층형 스토리지에 대한 비교 기사[2]에서도 확인할 수 있다.
OS 및 소프트웨어 기반 자동 계층형 스토리지
대부분의 서버 지향 소프트웨어 자동 계층화 스토리지 벤더는 계층화를 일반 스토리지 가상화 스택 제품의 구성 요소로 제공하며, 예를 들어 계층화 스토리지 공간을 마이크로소프트에 제공하는 것이 그 예다.[2] 그러나 자동 계층화는 이제 Linux, Microsoft Windows와 같은 산업 표준 운영 체제의 공통적인 부분이 되고 있으며, 소비자 PC의 경우 Fusion Drive를 탑재한 Apple OSX가 있다.[3] 이 솔루션은 단일 SSD와 하드 디스크 드라이브를 단일 자동 계층형 스토리지 드라이브로 결합하여 가장 자주 액세스하는 데이터를 가상 디스크의 SSD 부분에 저장할 수 있도록 했다. Windows 운영 체제용 FuzeDrive 제품으로 실시간 계층화를 지원하는 Enmotus는 더 많은 OS 불가지론 버전을 도입하여 NVDIMM 및 NVRAM 장치와 같은 스토리지 클래스 메모리 제품까지 지원했다.[4]
SAN 기반 계층형 스토리지
하드웨어 스토리지 어레이의 자동화된 계층형 스토리지의 예는 Compellent Technologies의 Data Progression이라고 불리는 기능이다. Data Progress는 서로 다른 드라이브 유형과 RAID 10, RAID 5와 같은 RAID 그룹 간에 데이터 블록을 투명하게 이동할 수 있는 기능을 가지고 있다. 블록은 서로 다른 RAID 그룹과 드라이브 유형에 걸쳐도 동일한 가상 볼륨의 일부분이다. 컴펠렌트는 모든 블록에 대한 메타데이터를 보관하기 때문에 이러한 작업을 수행할 수 있으며, 이를 통해 각 블록과 해당 연결을 추적할 수 있다."[5] SAN 기반 계층화의 또 다른 강력한 예는 SAN Disk 어레이 내의 스토리지 계층 간에 데이터를 이동하는 DotHill의 자동 계층화 스토리지(Relative Tiered Storage)이다.[6]
자동화된 계층형 스토리지와 비교 SSD 캐싱
계층화 솔루션과 캐슁은 겉으로 보기에는 동일하지만, 근본적인 차이점은 스토리지를 더 빨리 사용할 수 있는 방법과 자주 액세스하는 데이터를 감지하고 가속화하는 데 사용되는 알고리즘에 있다.
SSD 캐슁은 SRAM-DRAM 캐시가 자주 액세스하는 데이터 블록(예: 4K 캐시 페이지 크기)의 복사본을 만들고 복사본을 SSD에 저장한 후 느린 백엔드 스토리지에 원본 데이터 원본 대신 이 복사본을 사용하는 것과 유사하게 작동한다. 스토리지 읽기가 발생할 때마다 캐싱 소프트웨어는 캐시에 이 데이터의 복사본이 이미 있는지 확인하고 사용 가능한 경우 해당 복사본을 사용한다. 그렇지 않으면 속도가 느린 하드 드라이브 스토리지에서 데이터를 읽는다.
반면에 계층화는 매우 다르게 작동한다. SSD의 특정 사례를 사용하여 데이터가 자주 사용되는 것으로 식별되면 식별된 데이터 블록이 백그라운드에서 SSD로 이동되며 SSD가 한 번 복사 영역이 아닌 기본 스토리지 계층으로 활용되고 있기 때문에 복사되지 않는다. 이후 데이터에 액세스하면 SSD의 기본 성능 또는 그 근처에서 IO가 발생한다.[7]
참고 항목
참조
- Russ Taddiken – 수석 스토리지 설계자(2006) 스토리지 계층 간의 데이터 이동 자동화. UW 레코드 관리 웹 사이트에서 검색: https://web.archive.org/web/20060628054613/http://www.compellent.com/
- ^ http://www.snia.org/sites/default/education/tutorials/2012/spring/storman/LarryFreeman_What_Old_Is_New_Again.pdf
- ^ https://redmondmag.com/articles/2013/08/30/windows-storage-tiering.aspx?m=1
- ^ "Apple iMac Performance 웹사이트" 2012년 10월 24일.
- ^ http://cdn2.hubspot.net/hub/486631/file-2586107985-pdf/PDFs/20111129_S2-102_Mills.pdf?t=1447892865729
- ^ 토니 아사로, 컴퓨터월드. "Compellent-Intelligent Tiered Storage." 2009년 1월 19일 웨이백 머신에 2010-05-24 보관.
- ^ "Hybrid Data Storage Solution with SSD and HDD Tiers". Archived from the original on 2015-09-06. Retrieved 2016-01-18.
- ^ [1] "플래시 기반 스토리지 시스템의 계층화 및 캐슁"