오류 복구 제어
Error recovery control컴퓨팅에서 오류 복구 제어(ERC)(Western Digital: 시간 제한 오류 복구(TLER), Samsung/Hitachi: 명령 완료 시간 제한(CCTVL)은 시스템 관리자가 드라이브의 펌웨어가 읽기 또는 쓰기 오류로부터 복구하는 데 걸리는 시간을 구성할 수 있는 하드 디스크 기능입니다.복구 시간을 제한함으로써 하드웨어 또는 소프트웨어 RAID 환경에서 오류 처리를 개선할 수 있습니다.경우에 따라서는, 에러 처리를 하드 드라이브 또는 RAID 실장 중 어느 쪽이 실시할지를 놓고 경합하는 일이 있습니다.그 때문에, 드라이브가 사용 불능으로 마크 되어 퍼포먼스가 큰폭으로 저하하는 것을 피할 수 있었습니다.
개요
최신 하드 드라이브는 섹터를 내부적으로 재매핑하거나 다른 형태의 자가 테스트 및 복구를 수행하여 일부 읽기/쓰기 오류로부터 복구할 수 있는 기능을 갖추고 있습니다.이 프로세스에 몇 초 또는 (사용량이 많은 경우) 몇 분 정도 걸릴 수 있으며, 이 시간 동안 드라이브가 응답하지 않습니다.하드웨어 RAID 컨트롤러와 소프트웨어 RAID 실장은 몇 초 이내에 응답하지 않는 드라이브를 인식하여 신뢰할 수 없는 것으로 표시하도록 설계되어 있어 사용이 중지되고 패리티 데이터에서 어레이가 재구축되어야 함을 나타냅니다.이 과정은 시간이 오래 걸리고 성능이 저하되며, 이로 인한 추가 작업 부하로 인해 더 많은 드라이브가 고장 나면 심각한 결과를 초래할 수 있습니다.
드라이브 자체는 본래 신뢰성이 높지만 일부 불량 섹터가 있는 경우, TLER 및 이와 유사한 기능을 통해 검출된 오류를 수정하는 데 걸리는 시간을 제한한 후 어레이 컨트롤러에 실패한 작업을 통지함으로써 디스크가 불필요하게 "실패"로 마크되는 것을 방지합니다.그러면 어레이 컨트롤러는 드라이브 전체를 장애로 표시하지 않고 한정된 양의 데이터 복구를 처리할 수 있습니다.
데스크톱 컴퓨터 및 TLER
실제로 TLER 및 이와 유사한 기능은 온드라이브 오류 처리 성능을 제한하므로 하드웨어 RAID 컨트롤러 및 소프트웨어 RAID 구현에서 문제가 발생할 경우 오류를 처리할 수 있습니다.
일반적으로 Raptor, Caviar RE2 및 RE2-GP(RAID Edition)와 같은 Western Digital 엔터프라이즈 드라이브에는 TLER Read "Enabled"(7초)와 TLER Write "Enabled"(7초)가 포함되어 있으며, Caviar SE, SE16, GP 등의 데스크톱 드라이브에는 TLER Read and Disabled(7초)가 포함되어 있습니다.
스탠드아론 vsRAID에 관한 고려 사항
디스크 읽기 또는 쓰기 오류로 인한 복구 시간이 RAID 구현의 타임아웃 임계값을 초과하지 않도록 하려면 RAID 어레이에서 TLER를 "활성화"하는 것이 가장 좋습니다.드라이브의 타임 아웃이 발생했을 경우는, 수동으로 하드 디스크를 어레이에 재추가할 필요가 있습니다.하드 디스크를 재구축해 재동기화할 필요가 있습니다.TLER 를 유효하게 하면, 타임 아웃 전에 에러 수정을 중단하고, 데이터 세그먼트에 대해서만 장해를 보고하는 것으로, 이 문제를 회피하려고 합니다.그 결과, RAID 어레이의 신뢰성이 향상됩니다.
스탠드아론 구성에서는 TLER를 디세블로 해야 합니다.드라이브는 중복되지 않으므로 세그먼트를 장애로 보고하면 수동 작업만 증가합니다.디스크를 드롭하기 위한 하드웨어 RAID 컨트롤러나 소프트웨어 RAID를 실장하지 않으면 일반(TLER 없음) 복구 기능이 가장 안정적입니다.
소프트웨어 RAID 구성에서는 TLER가 도움이 되는지 여부는 운영체제에 따라 달라집니다.예를 들어 FreeB에서는SD ATA/CAM 스택은 타임아웃을 제어하며 타임아웃 발생 시 점진적으로 증가하도록 설정되어 있습니다.따라서 TLER가 없는 데스크톱 디스크가 섹터 읽기에 대한 응답을 지연하기 시작하면 FreeB가 실행됩니다.SD는, 디스크를 어레이로부터 너무 빨리 드롭 하는 것을 막기 위해서, 타임 아웃이 길어지는 것을 반복해 읽기를 재시도합니다.
모델 | TLER 디폴트(읽기/쓰기) | 스탠드아론의 권장 사항 | RAID 권장 사항 |
---|---|---|---|
캐비어, SE, SE16, GP, 랩터 | 디세이블 (0s / 0s ) | 체납 | 유효(가능한 경우) |
캐비어 RE2, RE2-GP, 빨간색 | 유효(7초/7초) | 무효 | 체납 |
TLER와 고도의 ZFS 파일 시스템과의 상호작용
ZFS 파일 시스템은 불량으로 보고되거나 읽는 데 시간이 너무 오래 걸리는 섹터(예: TLER 드라이브)에 데이터를 즉시 쓰기 위해 작성되었습니다. 이렇게 하면 대부분의 [citation needed]드라이브에서 취약한 섹터에 즉시 섹터를 다시 매핑해야 합니다.
Western Digital Time Limit 오류 복구 유틸리티
그WDTLER.EXE 유틸리티에서는 하드디스크의 펌웨어 설정에서 TLER 파라미터를 활성화 또는 비활성화할 수 있습니다.이를 통해 사용자는 스탠드아론 드라이브 또는 RAID 드라이브로서 특정 용도에 가장 적합한 설정을 결정할 수 있습니다.이 유틸리티는 DOS용으로 작성되어 있으며 이 유틸리티를 사용하려면 DOS 부터블 디스크가 필요합니다.
이 유틸리티는 컴퓨터에 접속되어 있는 모든 호환성이 있는 Western Digital 하드 디스크(HDD)에서 동작하며 이를 변경합니다.변경은 모든 HDD에 영향을 미친다는 점에 주의해 주십시오.컴퓨터의 특정 HDD만을 변경하는 경우는, 이 유틸리티를 사용하기 전에 다른 HDD의 접속을 해제하고, 그 후에 재접속할 필요가 있습니다.
이 유틸리티에는 TLESCAN이라는3개의 배치파일이 부속되어 있습니다.모든 하드 드라이브의 TLER 설정의 현재 상태를 취득하는 BAT, TLER-ON.TLER를 활성화하기 위한 BAT 및 TLER-OFF.TLER를 디세블로 하는 BAT.부속 TLER-ON.BAT는 Read & Write TLER 시간을 7초로 설정합니다.커스텀 타임 아웃치를 사용하려면 , WDTLER 를 사용할 수 있습니다.EXE 유틸리티와 함께-r# -w#
[ Time Limit ]의 값을 초수로 지정합니다.
Western Digital은 WDTler를 사용한다고 주장한다.새로운 드라이브의 EXE 유틸리티는 펌웨어를 손상시켜 디스크를 사용할 수 없게 할 수 있습니다.이 유틸리티는 Western Digital에서 더 이상 사용할 수 없으며 새 드라이브에서는 TLER 설정을 변경할 수 없습니다.RE 디스크는 RAID 어레이에만 적합하며 Caviar는 비 RAID에만 적합합니다.유틸리티는[when?], 낡은 드라이브에서도 동작.
smartctl 유틸리티
smartctl 유틸리티(smartmontools 패키지의 일부)는[1] ATA-8[2] 표준을 완전히 구현한 하드 디스크 드라이브에서 SCT Error Recovery Control(scter) 파라미터를 설정하여 TLER 동작을 제어할 수 있습니다.
일부 제조업체는 데스크톱 드라이브를 ERC 파라미터([3][4]예: 고가의 RAID/[citation needed]엔터프라이즈 모델 판매)를 지원하지 않도록 변경했기 때문에 smartctl 유틸리티를 사용하여 TLER 동작을 제어하는 것이 일부 하드 디스크 드라이브에서는 작동하지 않을 수 있습니다.
RAID 컨트롤러
하드웨어 RAID 컨트롤러의 접속 해제 타임아웃 값은 벤더마다 다를 수 있습니다.따라서 컨트롤러가 드라이브를 타임아웃하기 전에 TLER를 트리거해야 합니다.예를 들어 3ware 9650 입니다.SE는 20초를 [5]타임아웃으로 사용하지만 IBM x 시리즈에서 사용되는 LSI Logic의 경우 10초입니다.[6]
인텔 서버 메인보드와 최신 데스크톱 메인보드에 내장된 인텔 매트릭스 RAID / 인텔 래피드 스토리지 테크놀로지는 진정한 하드웨어 RAID 컨트롤러가 아닌 의사 하드웨어 컨트롤러입니다.
소프트웨어 RAID
Linux mdadm은 드라이브를 유지하고 복구를 완료할 수 있습니다.단, SCSI 디스크 레이어(/sys/block/sd?/device/timeout)의 기본 명령어 타임아웃은 [7]30초입니다.그 후, 드라이브의 리셋을 시도하고, 실패했을 경우는,[8] 드라이브를 오프라인으로 합니다.
레퍼런스
- ^ "Author's description of the original patch to smartctl that implemented that feature". Archived from the original on 2013-09-10. Retrieved 2013-02-15.
- ^ AT 첨부 파일 8 – ATA/ATAPI 명령어 세트 (ATA8-ACS)
- ^ "Re: md RAID with enterprise-class SATA or SAS drives". spinics.net.
- ^ "Seagate FAQ: What is Error Recovery Control?". seagate.com.
- ^ "User Guide for 9650SE 9690SA from 9.5.2 Complete Codeset". lsi.com. Archived from the original on 3 February 2012. Retrieved 10 June 2015.
- ^ BIOS Raid Config Utility > Advanced Device Properties에서 사용 가능
- ^ "linux/sd.h at master · torvalds/linux · GitHub". GitHub.
- ^ "Linux SCSI Subsystem: SCSI EH". kernel.org.
외부 링크
- Linux Raid wiki:타임아웃 불일치
- Western Digital FAQ(웨스턴 디지털 FAQ) 1397: Desktop Edition과 RAID(엔터프라이즈) Edition 드라이브의 차이점
- Western Digital, 2013년 1월, TLER(Time-limited Error Recovery) 정보 시트
- 삼성 CCTL