싱글 스토어

SingleStore
싱글 스토어
장르.RDBMS
설립.2011년 1월(2011-01)[1]
설립자
  • 에릭 프렌키엘
  • 니키타 샴구노프
  • 애덤 프루트
본사
서비스 지역
전 세계
종업원수
350[2]
웹 사이트www.singlestore.com

SingleStore(이전의 MemSQL)는 데이터 집약적[3]애플리케이션용으로 설계된 클라우드 네이티브 데이터베이스입니다.ANSI SQL 지원을 특징으로 하는 분산형 관계형 SQL 데이터베이스 관리[4] 시스템(RDBMS)으로 데이터 수집, 트랜잭션 처리 및 쿼리 [5][3]처리 속도가 빠른 것으로 알려져 있습니다.

SingleStore는 주로 관계형 데이터를 저장하지만 JSON 데이터, 그래프 데이터 및 시계열 데이터도 저장할 수 있습니다.일반적으로 HTAP 워크로드라고 불리는 혼합 워크로드와 기존의 OLTPOLAP 사용 사례를 지원합니다.쿼리의 경우 SQL(Structured Query Language)을 기계 코드로 컴파일합니다.SingleStore 데이터베이스 엔진은 사내 설치, 퍼블릭프라이빗 클라우드 공급자, Kubernetes 운영자를 통한 컨테이너 또는 SingleStore Managed [6][7]Service로 알려진 클라우드에서 호스팅된 서비스 등 다양한 Linux 환경에서 실행할 수 있습니다.

역사

1999-2010 (제1기)

클라우드 데이터는 사내 SQL 데이터베이스[8]범용 SQL 데이터베이스로 구성되었습니다.

2010-2017(2기)

시장에서는 속도와 확장성을 달성하기 위해 일반적으로 사용되는 SQL에서 후퇴하는 대신 특수 목적의 NoSQL 데이터베이스와 저렴한 객체 스토리지를 [8]채택하는 것을 선호했습니다.

2017년 - 현재 (제3시대)

몇 가지 동향으로 인해 데이터베이스 시장은 혼란에 빠졌습니다. 즉, 인터넷 속도가 빨라지고 스트리밍, 게임, IoT 등을 위한 최신 애플리케이션 채택이 증가했으며, 멀티 모델 데이터를 위한 통합 스트리밍 데이터, 트랜잭션 및 분석 처리의 필요성이 대두되었습니다.세 번째 시대는 2017년에 실시간 하이브리드 멀티 클라우드, 멀티 모델 및 관계형 데이터베이스로 시작되었습니다.이러한 클라우드 데이터의 진화로 SingleStore는 실시간 데이터 집약적인 애플리케이션을 [8][6]위한 마찰 없는 유니파이드 분산 SQL 데이터베이스를 개발하게 되었습니다.

2013년 4월 23일, SingleStore는 MemSQL로 [9]일반에 제공되는 데이터베이스의 첫 번째 버전을 출시했습니다.초기 버전은 행 지향 테이블만 지원했으며 모든 데이터가 메인 메모리 에 들어갈 수 있도록 고도로 최적화되었습니다.이 설계는 무어의 법칙과 유사한 추세로 시간이 지남에 따라 RAM 비용이 기하급수적으로 감소할 것이라는 생각에 기초하고 있습니다.이를 통해 대부분의 데이터베이스 시스템이 데이터를 메모리에 독점적으로 저장할 수 있게 됩니다.

출시 직후 MemSQL은 메모리 내 [8]행스토어와 함께 동작하는 온디스크 열 기반 스토리지 포맷에 대한 일반적인 지원을 추가했습니다.시간이 지남에 따라 메모리 비용 감소는 둔화되었고, 디스크 기반 OLAP 워크로드에 대한 수요가 증가하면서 순수 인메모리 데이터베이스 시스템 시장은 대부분 실현되지 못했습니다.따라서 시간이 지남에 따라 MemSQL의 컬럼스토어는 고객에게 중요한 초점이 되고 중요한 기능이 되었습니다.

2020년 10월 27일, MemSQL은 독점적인 메모리 워크로드에서 벗어나 초점을 전환하기 위해 SingleStore로 브랜드를 변경했습니다.새로운 이름은 트랜잭션 및 분석 사용 [10]사례를 모두 지원할 수 있는 범용 스토리지 형식을 실현하는 목표를 강조합니다.

현재 제품 릴리스인 v.7.5에서 SingleStore는 스토리지와 컴퓨팅의 분리와 기록 시스템을 단일 플랫폼으로 통합한 최초이자 유일한 데이터베이스가 되었습니다.캘리포니아주 샌프란시스코에 본사를 둔 Single Store는 2021년 6월 노스캐롤라이나주 롤리에 사무실을 개설했습니다.사무실 개설의 일환으로 SingleStore는 솔루션을 배양하고 프로토타입으로 만드는 혁신 센터인 Launch Pad를 출시했습니다.다른 사무실에는 캘리포니아의 서니베일, 워싱턴의 시애틀, 포르투갈의 [11]리스본이 있다.

자금 조달

2013년 1월 Single Store는 500만 달러를 모금했다고 발표했다.그 이후로 이 회사는 318달러를 조달했다.Khosla Ventures, Accel, Google Ventures, Dell Capital,[12] HPE 등 다양한 투자자의 100만 명.

자금 조달 라운드
시리즈 날짜. 금액(백만 달러) 주요 투자자
A 2013 5 DVCA, IA Ventures
B 2014 서른다섯[6] 가속
C 2016 36개[6] 카페인 캐피털, REV
D 2018 30개[4] Google Ventures, Glynn Capital
E 2020년 12월 팔십[13] Insight 파트너
F 2021년 9월 팔십[5] Insight 파트너

아키텍처

행 및 열 테이블 형식

SingleStore는 행 지향 테이블("rowstore") 또는 지향 테이블("columnstore")에 데이터를 저장할 수 있습니다.사용되는 형식은 사용자가 테이블을 작성할 때 결정합니다.

Rowstore 테이블은 이름에서 알 수 있듯이 정보를 RDB에서 사용되는 기존 데이터 형식인 행 형식으로 저장합니다.MS 시스템로우스토어는 싱글톤 또는 소규모 삽입, 업데이트 또는 삭제 쿼리에 최적화되어 있으며 OLTP(트랜잭션) 사용 사례와 가장 밀접하게 관련되어 있습니다.행스토어 테이블의 데이터는 메모리에 완전히 저장되므로 스냅샷 및 트랜잭션 로그가 디스크에 유지되고 랜덤 읽기를 빠르게 수행할 수 있습니다.

컬럼스토어는 일반적으로 OLAP(분석) 및 데이터 웨어하우징 사용 사례와 관련된 복잡한 SELECT 쿼리에 최적화되어 있습니다.예를 들어, 데이터 분석을 위한 대규모 임상 데이터 세트는 컬럼 형식으로 가장 잘 저장된다. 쿼리는 일반적으로 다수의 유사한 데이터 항목에 대해 집계를 계산하는 임시 쿼리이기 때문이다.컬럼스토어 테이블의 데이터는 Disk에 저장되므로 일반적으로 5~10배까지 빠른 시퀀셜 읽기 및 압축을 지원합니다.

색인화

SingleStore 로우스토어에서는 기존의 B-tree 인덱스가 아닌 [1]메모리에서 빠르고 잠금 없는 처리를 위해 최적화된 스키리스트를 사용합니다.열 저장소는 Disk 압축을 극대화하고 빠른 순서 검색을 수행하기 위해 정렬된 세그먼트에 인덱싱된 데이터를 저장합니다.SingleStore는 특정 쿼리 속도를 높이기 위해 해시 인덱스를 보조 인덱스로 사용할 수도 있습니다.

분산 아키텍처

SingleStore 데이터베이스는 여러 범용 머신에 분산되어 있습니다.데이터는 리프 노드의 파티션에 저장되며 사용자는 애그리게이터 [1]노드에 연결됩니다.SingleStore 애그리게이터 및 리프 노드에는 단일 소프트웨어가 설치됩니다. 관리자는 셋업 중에 클러스터에서 각 머신의 역할을 지정합니다.애그리게이터 노드는 SQL 쿼리를 수신하여 리프 노드 간에 쿼리를 분할하고 결과를 클라이언트에 다시 집계하는 역할을 합니다.리프 노드는 SingleStore 데이터를 저장하고 애그리게이터로부터의 쿼리를 처리합니다.애그리게이터와 리프 노드 간의 모든 통신은 SQL을 사용하여 네트워크를 통해 이루어집니다.SingleStore는 해시 파티셔닝을 사용하여 리프 [14]노드 수에 걸쳐 데이터를 균일하게 분산합니다.

실시간 스트리밍 데이터 수집

SingleStore 파이프라인은 분산 데이터 소스와 [6]병렬로 스트리밍 데이터 수집을 제공하는 내장 통합 기술입니다.메시지 브로커에서 정확히 한 번 의미론적인 데이터를 수집했을 때 실시간 중복 제거 기능을 제공하며 ETL 미들웨어의 필요성을 줄이거나 제거하여 아키텍처를 단순화합니다.변환 및 ML 통합은 바이너리를 내장하여 SingleStore 파이프라인 변환을 통해 수행할 수 있습니다.SingleStore 파이프라인은 Apache Kafka, Apache Spark, Amazon S3 버킷, Microsoft Azure Blob Storage Google Cloud Storage, HDFS 또는 디스크의 파일과 같은 데이터 소스에 연결되며 JSON, Parquet, Avro 및 CSV와 같은 형식을 지원합니다.잠금 기능이 없는 건너뛰기 목록 때문에 쿼리는 데이터가 도착하는 즉시 데이터를 검색할 수 있지만 데이터가 [2][15]수집되는 동안 계속되지 않도록 차단되지 않습니다.

엔드리스 스토리지

바닥 없는 스토리지는 SingleStore를 [16]위한 스토리지와 컴퓨팅을 분리합니다.데이터 파일은 S3 또는 이와 유사한 BLOB 스토리지 및 NFS에 비동기적으로 유지됩니다."블롭"은 컬럼스토어를 지원하는 압축 부호화된 데이터 구조입니다.SingleStore 클러스터에서는 최신 데이터에 대한 고가용성이 유지되지만 장기간의 스토리지는 BLOB 스토리지로 이동합니다.쿼리되지 않은 블럽은 SingleStore 노드의 로컬 디스크에서 자동으로 삭제되므로 클러스터는 사용 가능한 디스크보다 더 많은 데이터를 보유할 수 있으므로 클러스터의 스토리지가 "바닥이 없는" 상태가 됩니다.새 복제본은 모든 BLOB 파일을 다운로드하여 파티션을 만들고 이동할 필요가 없습니다.Bottomless는 기존의 재해 복구 및 백업 클라우드 운영 절차의 필요성을 없애주는 "연속 백업" 역할을 합니다.또한 과거 분석을 [6]위해 더 큰 페타바이트 크기의 데이터셋도 지원합니다.

내구성

메모리 내 행 저장소의 내구성에는 체크포인트와 마찬가지로 미리 쓰기 로그 및 스냅샷이 구현됩니다.기본 설정에서는 트랜잭션이 메모리에서 확인되는 즉시 데이터베이스는 디스크가 허용하는 [17]한 빠르게 트랜잭션을 디스크에 비동기적으로 씁니다.

온디스크 컬럼스토어는 실제로 스키플리스트를 사용하여 색인화된 메모리 내 행스토어와 같은 구조로 되어 있습니다.이 구조는 SingleStore 행스토어와 동일한 내구성을 보장합니다.이와는 별도로 컬럼스토어는 데이터가 디스크에 저장되기 때문에 내구성이 뛰어납니다.

레플리케이션

SingleStore 클러스터는 HA(High Availability) 모드로 구성할 수 있습니다.여기서 모든 데이터 파티션은 2개의 개별 리프 노드에 마스터 버전과 슬레이브 버전을 사용하여 자동으로 생성됩니다.HA 모드에서는 애그리게이터가 마스터 파티션으로 트랜잭션을 전송하고 마스터 파티션은 슬레이브 파티션으로 로그를 전송합니다.마스터에서 예기치 않은 장애가 발생했을 경우 슬레이브 파티션이 마스터 파티션으로 대체되며 [6]다운타임이 없는 완전 온라인 작업이 이루어집니다.

배포 형식

2020년 싱글스토어 샌프란시스코 지사

SingleStore는 무료로 다운로드하여 Linux 상에서 실행할 수 있습니다.최대 4개의 리프 노드(각각 32기가 RAM)의 시스템용입니다.대규모 도입 및 공식 SingleStore 지원을 위해서는 Enterprise 라이선스가 필요합니다.SingleStore 클러스터는 SingleStore Kubernetes Operator를 사용하여 컨테이너에서 관리할 수 있습니다.또한 SingleStore는 SingleStore Managed Service라는 이름의 관리 서비스로 제공되며, Google Cloud 및 Amazon Web Services의 다양한 지역에서 사용할 수 있으며 Microsoft Azure 구현은 가까운 장래에 예정되어 있습니다.기본 엔진과 잠재적인 시스템 성능은 모든 배포 [2]형식에서 동일합니다.

SingleStore에는 SingleStore Tools라는 설치, 관리 및 모니터링 도구 세트가 함께 제공됩니다.SingleStore를 설치할 때 도구를 사용하여 여러 머신에 분산된 SingleStore 데이터베이스를 설정할 수 있습니다.SingleStore는 또한 SingleStore Studio라는 브라우저 기반 쿼리 및 관리 UI를 제공하여 쿼리 처리 및 데이터베이스 모니터링을 제공하고 실행 [2]중인 클러스터에 대한 상태 및 정보 세부 정보를 표시합니다.

인식

2021년 12월, SingleStore는 Gartner가 발행한 클라우드 데이터베이스 관리 시스템용 매직 쿼드런트에서 처음으로 [15]인정받았습니다.또한 SingleStore는 [6]Deloitte의 Technology Fast 500 North America, San Francisco Business Times Fast 100, Dresner Industry Excellence 및 Inc 5000 어워드에도 포함되어 있습니다.이 회사는 Cloud Native Computing Foundation 및 Bytecode [7]Alliance의 일부입니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b c Tuesday (2012-08-14). "MemSQL Architecture - The Fast (MVCC, InMem, LockFree, CodeGen) and Familiar (SQL)". High Scalability. Retrieved 2019-08-13.
  2. ^ a b c d "Why Is Better Data Management Silicon Valley's New Obsession?". Inno & Tech Today. Retrieved 26 April 2022.
  3. ^ a b "Enterprise Technology: Revenge of the Nerdiest Nerds". Business Week. Retrieved 26 April 2022.
  4. ^ a b "IBM invests in SingleStore to get faster AI and analytics on distributed data". Retrieved 2017-09-29.
  5. ^ a b Lunden, Ingrid. "Real-time database platform SingleStore raises $80M more, now at a $940M valuation". TechCrunch. Retrieved 8 September 2021.
  6. ^ a b c d e f g h "BOTTOMLESS STORAGE AND PIPELINE: THE QUEST FOR A NEW DATABASE PARADIGM". Dataconomy. Retrieved 26 April 2022.
  7. ^ a b "Database Firm SingleStore Scores $80M in Series F Funding". Datanami. Retrieved 26 April 2022.
  8. ^ a b c d "SingleStore raises $80M for distributed SQL database". TechTarget. Retrieved 26 April 2022.
  9. ^ Hainzinger, Brittany (2020). "MemSQL Is Now SingleStore" (published 2020-11-02). Retrieved 2022-04-23.
  10. ^ "MemSQL rebrands as SingleStore". Software Development Times. Retrieved 26 April 2022.
  11. ^ "SingleStore Could Double Employee Count in Raleigh". News Observer. Retrieved 26 April 2022.
  12. ^ "Database Startup SingleStore Raises $75M". VentureBeat. Retrieved 26 April 2022.
  13. ^ "SingleStore, formerly MemSQL, raises $80M to integrate and leverage companies' disparate data silos". TechCrunch. Retrieved 27 April 2022.
  14. ^ "Introduction to MemSQL DBMS 2 : DataBase Management System Services". DBMS. Retrieved 26 April 2022.
  15. ^ a b "What's Changed: 2021 Gartner Magic Quadrant for Cloud Database Management Systems". Solutions Review. Retrieved 26 April 2022.
  16. ^ "Why We Need Management And Scalability To Benefit From The Power Of Data". Forbes. Retrieved 26 April 2022.
  17. ^ "A blazingly fast database in a data-driven world". IBM. Retrieved 2018-01-19.

외부 링크