분산 데이터 저장소

Distributed data store

분산형 데이터 스토어는 정보가 여러 노드에 저장되는 컴퓨터 네트워크이며,[1] 종종 복제된 방식으로 저장됩니다.일반적으로 사용자가 여러 노드에 정보를 저장하는 분산 데이터베이스 또는 사용자가 여러 피어 네트워크 [2]노드에 정보를 저장하는 컴퓨터 네트워크를 가리키는 데 사용됩니다.

분산 데이터베이스

분산 데이터베이스는 일반적으로 다수의 노드에서 데이터에 빠르게 액세스할 수 있는 비관계형 데이터베이스입니다.일부 분산 데이터베이스는 풍부한 쿼리 기능을 노출하는 반면 다른 데이터베이스는 키-값 저장소 시멘틱으로 제한됩니다.제한된 분산 데이터베이스의 로는 분산 파일 시스템이나 피어피어 [3]네트워크보다 훨씬 많은 GoogleBigtable, Amazon[4] Dynamo 및 Microsoft Azure Storage [5]등이 있습니다.

임의 쿼리 능력은 가용성만큼 중요하지 않기 때문에 분산 데이터 저장소 설계자는 일관성을 희생하면서 후자를 증가시켰습니다.그러나 고속 읽기/쓰기 액세스는 CAP 정리에 따라 파티션화된 네트워크상에서 일관성과 가용성을 모두 보장할 수 없기 때문에 일관성이 저하됩니다.

피어 네트워크 노드 데이터스토어

피어 네트워크 데이터 스토어에서 사용자는 보통 상호 작용하여 다른 사용자가 자신의 컴퓨터를 스토리지 노드로 사용할 수 있도록 허용할 수 있습니다.네트워크 설계에 따라서는, 다른 유저가 정보에 액세스 할 수 없는 경우도 있습니다.

대부분의 피어 피어 네트워크에는 분산형 데이터 저장소가 없습니다.이는 사용자의 데이터가 네트워크상에 있는 경우에만 사용할 수 있다는 점입니다.단, BitTorrent와 같은 시스템에서는 이 구별이 다소 모호합니다.원래 노드는 오프라인으로 전환되지만 콘텐츠는 계속 제공됩니다.다만, 이것은, 프리넷, Winny, Share, 및 Perfect Dark등의 노드가 네트워크상의 파일의 일부를 보존하고 있는 네트워크와는 대조적으로, 재배포자가 요구하는 개개의 파일에 한정됩니다.

분산 데이터 저장소에서는 일반적으로 오류 탐지 및 수정 기술을 사용합니다.일부 분산 데이터스토어(예: Parchive over NNTP)는 파일의 일부가 손상되거나 사용할 수 없는 경우 오류 수정 기술을 사용하여 원래 파일을 복구합니다.다른 사용자는 다른 미러에서 해당 파일을 다시 다운로드하려고 합니다.

분산된 비관계형 데이터베이스

제품. 면허증. 하이 어베이러빌리티 메모들
아파치 어큐뮬로 AL2
에어로스파이크 AGPL
아파치 카산드라 AL2 네. 이전에 페이스북에서 사용되었던
아파치 이그니트 AL2
빅테이블 독자 사양 Google에서 사용
카우치 베이스 AL2 Linked In, PayPaleBay에서 사용
CrateDB AL2 네.
아파치 드루이드 AL2 Netflix 및 Yahoo에서 사용
다이너모 독자 사양 아마존에서 사용
헤이즐캐스트 AL2, 독자 사양
HBase AL2 네. 이전에 페이스북에서 사용되었던
하이퍼테이블 GPL 2 바이두
MongoDB SSPL
리악 AL2 네.
레디스 BSD 라이선스 네.
실라 AGPL
볼드모트 AL2 Linked In에서 사용

피어 네트워크 노드 데이터스토어

「 」를 참조해 주세요.

레퍼런스

  1. ^ Yaniv Pessach, Distributed Storage (Distributed Storage: Concepts, Algorithms, and Implementations ed.), OL 25423189M
  2. ^ "Distributed Data Storage - an overview ScienceDirect Topics".
  3. ^ "Bigtable: Google's Distributed Data Store". Paper Trail. Archived from the original on 2017-07-16. Retrieved 2011-04-05. Although GFS provides Google with reliable, scalable distributed file storage, it does not provide any facility for structuring the data contained in the files beyond a hierarchical directory structure and meaningful file names. It’s well known that more expressive solutions are required for large data sets. Google’s terabytes upon terabytes of data that they retrieve from web crawlers, amongst many other sources, need organising, so that client applications can quickly perform lookups and updates at a finer granularity than the file level. [...] The very first thing you need to know about Bigtable is that it isn’t a relational database. This should come as no surprise: one persistent theme through all of these large scale distributed data store papers is that RDBMSs are hard to do with good performance. There is no hard, fixed schema in a Bigtable, no referential integrity between tables (so no foreign keys) and therefore little support for optimised joins.
  4. ^ Sarah Pidcock (2011-01-31). "Dynamo: Amazon's Highly Available Key-value Store" (PDF). WATERLOO – CHERITON SCHOOL OF COMPUTER SCIENCE. p. 2/22. Retrieved 2011-04-05. Dynamo: a highly available and scalable distributed data store
  5. ^ "Windows Azure Storage". 2011-09-16. Archived from the original on 9 November 2011. Retrieved 6 November 2011.