캐스케이드 실패
Cascading failure캐스케이드 장애는 상호 연결된 부품 시스템에서 발생한 장애로, 일부 부품의 고장이 다른 부품의 장애로 이어지며, 양의 피드백에 따라 점차적으로 증가합니다.이 문제는 단일 부품에 장애가 발생하여 시스템의 다른 부품에 [1][2]장애가 발생할 가능성이 높아집니다.이러한 장애는 전력 전송, 컴퓨터 네트워킹, 금융, 교통 시스템, 유기체, 인체 및 생태계를 포함한 많은 유형의 시스템에서 발생할 수 있습니다.
캐스케이드 장애는 시스템의 일부에 장애가 발생했을 때 발생할 수 있습니다.이 경우 다른 부품은 고장난 부품을 보상해야 합니다.이로 인해 이들 노드가 과부하 상태가 되어 장애가 발생하고 추가 노드가 잇따라 장애가 발생합니다.
송전 중
캐스케이드 장애는 하나의 요소가 완전히 또는 부분적으로 장애를 일으켜 부하가 시스템 내의 인근 요소로 이동했을 때 전력망에서 흔히 발생합니다.그런 다음 근처에 있는 요소들이 용량 이상으로 밀려나기 때문에 과부하가 되어 부하가 다른 요소들로 옮겨집니다.캐스케이드 장애는 고전압 시스템에서 볼 수 있는 일반적인 영향입니다.완전 부하가 걸린 시스템 또는 약간 과부하가 걸린 시스템에서 Single Point of Failure(SPF; 단일점 장애)로 인해 시스템의 모든 노드에서 갑자기 스파이크가 발생합니다.이 서지 전류는 이미 과부하된 노드를 장애로 유도하여 더 많은 과부하를 유발하여 매우 짧은 시간 내에 전체 시스템을 정지시킬 수 있습니다.
이 고장 프로세스는 연못의 잔물결처럼 시스템 요소를 통과하여 시스템 내의 거의 모든 요소가 손상되거나 시스템이 부하의 원천에서 기능적으로 분리될 때까지 계속됩니다.예를 들어, 특정 상황에서는 단일 변압기 고장 후 대규모 전력 그리드가 붕괴될 수 있습니다.
시스템의 동작을 실시간으로 감시하고 부품의 적절한 절단을 실시하면 캐스케이드를 정지하는 데 도움이 됩니다.또 하나의 일반적인 기술은 가능한 고장을 컴퓨터 시뮬레이션하여 시스템의 안전 여유도를 계산하고 계산된 시나리오 중 어느 것도 캐스케이드 장애를 일으키지 않을 것으로 예상되는 안전한 작동 수준을 확립하고 캐스케이드 [3]장애를 일으킬 가능성이 가장 높은 네트워크 부분을 식별하는 것입니다.
전기 그리드 고장을 방지하기 위한 주요 문제 중 하나는 제어 신호의 속도가 전파 전력 과부하 속도보다 빠르지 않다는 것입니다. 즉, 제어 신호와 전력 모두 동일한 속도로 이동하기 때문에 전방에 경고를 보내 정전을 격리할 수 없습니다.없습니다.
예
캐스케이드 장애로 인해 다음과 같은 정전이 발생했습니다.
- 1965년 미국 북동부 정전
- 1999년 브라질 남부 정전 사건
- 2003년 미국 북동부 정전 사건
- 2003년 이탈리아 정전
- 2003년 런던 정전 사건
- 2006년 유럽 블랙아웃
- 2012년 북인도 정전 사건
- 2016년 사우스오스트레일리아 블랙아웃
- 2019년 남미 남동부 블랙아웃
컴퓨터 네트워크 내
캐스케이드 장애는 하드웨어 또는 소프트웨어의 장애 또는 접속 해제로 인해 네트워크 트래픽이 네트워크의 대규모 섹션으로 심각하게 손상되거나 네트워크 간 트래픽이 중지되는 컴퓨터 네트워크(인터넷 등)에서도 발생할 수 있습니다.이 맥락에서 캐스케이드 장애는 캐스케이드 장애라는 용어로 알려져 있습니다.캐스케이드 장애는 대규모 사용자 및 시스템 그룹에 영향을 미칠 수 있습니다.
캐스케이드 장애의 원인은 보통 중요한 단일 라우터 또는 노드의 과부하로 인해 노드가 잠시라도 다운됩니다.유지보수 또는 업그레이드를 위해 노드를 정지하는 경우에도 발생할 수 있습니다.어느 경우든 트래픽은 다른 (대체) 경로로 라우팅됩니다.그 결과 이 대체 패스는 과부하가 되어 다운되는 등의 원인이 됩니다.또, 통상적인 동작의 노드에 의존하는 시스템에도 영향을 줍니다.
증상
캐스케이드 장애의 증상으로는 단일 시스템뿐만 아니라 네트워크 또는 인터넷 섹션 전체에 대한 패킷 손실 및 네트워크 지연이 있습니다.높은 지연과 패킷 손실은 congestion의 붕괴에 의해 동작하지 않는 노드에 의해 발생합니다.이러한 노드는 네트워크에 존재하지만 이들 노드를 통과하는 유용한 통신은 많지 않습니다.그 결과 루트는 실제로 통신을 제공하지 않고 여전히 유효한 것으로 간주할 수 있습니다.
캐스케이드 장애로 인해 충분한 루트가 다운되면 네트워크 또는 인터넷 전체 섹션에 도달할 수 없게 될 수 있습니다.이는 바람직하지 않지만 접속이 타임아웃되어 다른 노드가 절단된 섹션으로의 접속 확립을 포기하여 관련된 노드의 부하를 줄이기 때문에 이 장애로부터의 회복 속도를 높일 수 있습니다.
캐스케이드 장애 시 발생하는 일반적인 장애는 보행 장애입니다.이 경우 섹션이 다운되어 다음 섹션이 실패하게 되고 그 후 첫 번째 섹션이 다시 올라갑니다.이 리플에 의해 안정성이 회복되기 전에 같은 섹션 또는 연결 노드를 여러 개 통과할 수 있습니다.
역사
캐스케이드 장애는 트래픽의 대폭적인 증가와 시스템과 네트워크 간의 높은 상호 접속성을 수반하는 비교적 최근의 발전입니다.이 용어는 1990년대 후반 네덜란드의 IT 전문가에 의해 처음 사용되었으며, 이러한 대규모 [citation needed]장애에 대한 비교적 일반적인 용어가 되었습니다.
예
네트워크 장애는 일반적으로 단일 네트워크 노드에 장애가 발생했을 때 시작됩니다.처음에 보통 노드를 통과하는 트래픽은 정지됩니다.시스템 및 사용자에게 호스트에 연결할 수 없다는 오류가 표시됩니다.보통 ISP의 다중 시스템은 매우 신속하게 응답하며 다른 백본을 통해 다른 경로를 선택합니다.이 대체 루트를 경유하는 라우팅 패스는 홉이 많아지고 그 후 갑자기 제공되는 트래픽의 양을 처리하지 않는 시스템이 많아지기 때문에 더 길어집니다.
이로 인해 대체 경로를 따라 하나 이상의 시스템이 다운되어 유사한 문제가 발생할 수 있습니다.
이 경우 관련 시스템도 영향을 받습니다.예를 들어 DNS 확인이 실패할 수 있으며 일반적으로 시스템이 상호 연결되면 중단된 실제 시스템과 직접 관련이 없는 연결이 끊어질 수 있습니다.이로 인해 전혀 관련이 없는 것처럼 보이는 노드에서 문제가 발생하여 스스로 또 다른 장애가 발생할 수 있습니다.
2012년 12월, Gmail 서비스의 일부(40%)가 18분간 전 세계에서 발생했습니다.이 서비스 손실은 장애가 있는 로직을 포함한 로드밸런싱 소프트웨어의 일상적인 업데이트에 의해 발생하였습니다.이 경우 에러는 보다 적절한 '일부'[4]가 아닌 부적절한 '모두'를 사용한 로직에 의해 발생하였습니다.캐스케이드 오류는 한 번에 모든 노드를 부분적으로 업데이트하지 않고 네트워크 내의 단일 노드를 완전히 업데이트함으로써 수정되었습니다.
계단식 구조 장애
개별 구조 구성요소가 있는 특정 하중 지지 구조물은 "지퍼 효과"에 노출될 수 있으며, 여기서 단일 구조 부재의 기능 상실은 인접 부재의 하중을 증가시킨다.하얏트 리젠시 보행로 붕괴의 경우 수직 서스펜션 로드 하나가 고장나면서(즉, 지퍼와 같은) 현수식 보행로가 붕괴되어 인접한 로드들이 과부하되었다.이러한 고장을 일으킬 수 있는 교량은 파괴 임계라고 불리며, 다수의 교량 붕괴는 단일 부품의 고장으로 인해 발생하였다.적절하게 설계된 구조물은 이러한 유형의 기계적 캐스케이드 [5]고장을 방지하기 위해 적절한 안전 계수 및/또는 대체 부하 경로를 사용한다.
기타 예
생물학
생화학 캐스케이드는 작은 반응이 시스템 전체에 영향을 미칠 수 있는 생물학에 존재합니다.한 가지 부정적인 예는 허혈성 캐스케이드인데, 작은 허혈성 공격은 초기 손상보다 훨씬 더 많은 세포를 죽이는 독소를 방출하고, 결과적으로 더 많은 독소를 방출한다.현재의 연구는 뇌졸중 환자의 이러한 캐스케이드를 차단하여 손상을 최소화하는 방법을 찾는 것이다.
멸종 연구에서, 때때로 한 종의 멸종은 다른 많은 멸종들을 야기할 것이다.이러한 종은 키스톤 종으로 알려져 있다.
일렉트로닉스
또 다른 예로는 Cockcroft-Walton 발전기가 있는데, 이 발전기에서는 하나의 다이오드가 고장나면 순식간에 모든 다이오드가 고장날 수 있습니다.
그러나 과학 실험에서 이러한 영향의 또 다른 예는 2001년 단일 검출기의 고장으로 인한 충격파가 연쇄 반응에서 다른 검출기의 내파를 촉발한 것으로 보이는 슈퍼 카미오칸데 실험에 사용된 수천 개의 깨지기 쉬운 유리 광전자 증배관의 내파이다.
자금
금융에서는, 금융기관의 연쇄적인 부실의 리스크를 시스템 리스크라고 부릅니다.즉, 한 금융기관의 부실은 다른 금융기관(상대방)의 부실을 초래해, 시스템 전체에 걸쳐 연쇄적으로 발생할 가능성이 있습니다.시스템 리스크를 수반하는 것으로 생각되는 기관은, 위협을 수반하는 것처럼 보이는 이유에 따라, 「너무 커서 실패하지 않는다」(TBTF) 또는 「너무 상호 접속되어 실패하지 않는다」(TICTF)로 간주됩니다.
단, 시스템 리스크는 개별 기관 자체의 원인이 아니라 상호 접속에 기인한다는 점에 유의하십시오.계단식 실패의 영향을 연구하고 예측하는 프레임워크가 연구 [6][7][8]문헌에서 개발되었다.
2010년 플래시 [8]크래시를 예로 들 수 있는 금융의 캐스케이드 실패는 주식시장에서 발생합니다.
상호의존적 캐스케이드 장애
상수도, 교통, 연료 및 발전소 등의 다양한 인프라가 함께 결합되어 기능하기 위해 서로 의존하고 있다. 그림 1 참조. 이 결합으로 인해 상호의존 네트워크는 무작위 장애, 특히 표적 공격에 매우 민감하며, 1n의 노드 중 일부에 장애가 발생할 수 있다.etwork는 여러 상호의존 [9][10]네트워크에서 반복적인 장애 캐스케이드를 트리거할 수 있습니다.정전사태는 상호의존 네트워크 간의 연속적인 장애로 인해 자주 발생하며, 이 문제는 최근 몇 년간 발생한 대규모 정전사태에 의해 극적으로 나타나고 있습니다.블랙아웃은 네트워크 간의 의존성이 수행하는 중요한 역할을 보여주는 매력적인 사례입니다.예를 들어, 2003년 이탈리아 정전 사태는 철도 네트워크, 의료 시스템, 금융 서비스의 광범위한 장애를 초래했으며, 통신 네트워크에 심각한 영향을 미쳤습니다.통신 시스템의 부분적인 장애는 전기 그리드 관리 시스템을 더욱 손상시켜 전력 그리드에 [11]대한 긍정적인 피드백을 생성했다.이 예에서는 상호의존성이 상호작용하는 네트워크 시스템의 손상을 크게 확대할 수 있음을 강조하고 있습니다.
과부하 캐스케이드 장애
과부하 전파에 의한 캐스케이드 장애의 모델은 Motter-Lai [12]모델입니다.
「 」를 참조해 주세요.
레퍼런스
- ^ "Cascading Failure - an overview ScienceDirect Topics". www.sciencedirect.com.
- ^ Ulrich, Mike. "Chapter 22 - Addressing Cascading Failures". Google - Site Reliability Engineering.
- ^ Zhai, Chao (2017). "Modeling and Identification of Worst-Case Cascading Failures in Power Systems". arXiv:1703.05232 [cs.SY].
- ^ "Why Gmail went down: Google misconfigured load balancing servers (Updated)". 11 December 2012.
- ^ Petroski, Henry (1992). To Engineer Is Human: The Role of Failure in Structural Design. Vintage. ISBN 978-0-679-73416-1.
- ^ Acemoglu, Daron; Ozdaglar, Asuman; Tahbaz-Salehi, Alireza (2015). "Systemic Risk and Stability in Financial Networks". American Economic Review. American Economic Association. 105 (2): 564–608. doi:10.1257/aer.20130456. hdl:1721.1/100979. ISSN 0002-8282. S2CID 7447939.
- ^ Gai, Prasanna; Kapadia, Sujit (2010-08-08). "Contagion in financial networks". Proceedings of the Royal Society A: Mathematical, Physical and Engineering Sciences. 466 (2120): 2401–2423. Bibcode:2010RSPSA.466.2401G. doi:10.1098/rspa.2009.0410. ISSN 1364-5021. S2CID 9945658.
- ^ a b Elliott, Matthew; Golub, Benjamin; Jackson, Matthew O. (2014-10-01). "Financial Networks and Contagion". American Economic Review. 104 (10): 3115–3153. doi:10.1257/aer.104.10.3115. ISSN 0002-8282.
- ^ "Report of the Commission to Assess the Threat to the United States from Electromagnetic Pulse (EMP) Attack" (PDF).
- ^ Rinaldi, S.M.; Peerenboom, J.P.; Kelly, T.K. (2001). "Identifying, understanding, and analyzing critical infrastructure interdependencies". IEEE Control Systems Magazine. 21 (6): 11–25. doi:10.1109/37.969131.
- ^ V. Rosato, Issacharoff, L., Tiriticco, F., Meloni, S., Porcellinis, S.D., & Setola, R. (2008). "Modelling interdependent infrastructures using interacting dynamical models". International Journal of Critical Infrastructures. 4: 63–79. doi:10.1504/IJCIS.2008.016092.
- ^ Motter, A. E.; Lai, Y. C. (2002). "Cascade-based attacks on complex networks". Phys. Rev. E. 66 (6 Pt 2): 065102. arXiv:cond-mat/0301086. Bibcode:2002PhRvE..66f5102M. doi:10.1103/PhysRevE.66.065102. PMID 12513335. S2CID 17189308.
추가 정보
- Toshiyuki Miyazaki (1 March 2005). "Comparison of defense strategies for cascade breakdown on SF networks with degree correlations" (PDF). Archived from the original (PDF) on 2009-02-20.
- Russ Cooper (1 June 2005). "(In)Secure Shell?". RedmondMag.com. Archived from the original on 2007-09-28. Retrieved 2007-09-08.
- US Department of Homeland Security (5 February 2007). "Cascade Net (simulation program)". Center for Homeland Defense and Security. Archived from the original on 2008-12-28. Retrieved 2007-09-08.
외부 링크
- 우주 날씨: 정전 - 대규모 전력망 장애
- 계단식 실패 데모 애플릿(모나시 대학 가상 랩)
- A. E. Motter와 Y.-C.Lai, 복잡한 네트워크에 대한 캐스케이드 기반 공격, Physical Review E(Rapid Communications) 66, 065102(2002).
- P. 크루시티, V. 라토라, M.Marchiori, 복잡한 네트워크에서의 캐스케이드 장애 모델, Physical Review E(Rapid Communications) 69, 045104(2004)
- 캐스케이드 그리드 장애에 대한 보호 전략 - 숏컷 어프로치
- I. 돕슨, B. A. 카레라스, D.E. Newman, 사전 인쇄 확률론적 계단식 실패의 하중 의존 모델, 공학과 정보과학에서의 확률, vol. 19, no. 1, 2005년 1월, 페이지 15-32.
- 노바: 1998년 9월 2일 111편 추락.뉴욕발 제네바행 스위스항공 111편은 229명이 탑승한 채 노바스코샤 앞바다 대서양에 추락했다.원래 테러 행위라고 믿었죠3,900만달러의 조사, 15억달러의 보험 합의, 그리고 4년여 만에 수사관들은 연쇄 실패라는 수수께끼를 풀었다.스위스 에어 111의 유산은 무엇인가요?"우리는 디자인, 견제와 균형, 보호, 안전의 내부 구조를 들여다 볼 수 있는 창을 가지고 있습니다." - 데이비드 에반스 항공 안전 주간 편집장
- 물리 웹 스토리:사고 발생지 중성미자 연구실
- 대규모 조직 네트워크의 구조와 역동성(Dan Braha, New England Complex Systems Institute)
- 단일 네트워크에서 네트워크로의 전환