치수 모델링

치수 모델링(DM)은 Ralph Kimball이 개발한 비즈니스 차원 라이프 사이클 방법론의 일부로서, 데이터 웨어하우스 ^[1]^{: 1258–1260}^[2]설계에 사용하기 위한 방법, 기법 및 개념을 포함합니다.이 접근방식은 비즈니스 내에서 주요 비즈니스 프로세스를 식별하고 이를 모델링하여 상향식 ^[1]^{: 1258–1260}접근방식으로 구현하는데 중점을 두고 있습니다.Inmon의 대안적 접근법은 엔티티-관계 모델링(^[1]^{: 1258–1260}ER) 등의 도구를 사용하여 모든 기업 데이터의 모델을 하향식으로 설계하는 것을 지지합니다.

묘사

치수 모델링은 항상 사실(측도)과 차원(콘텍스트)의 개념을 사용합니다.팩트는 일반적으로 집계할 수 있는(항상 그렇지는 않지만) 숫자 값이며, 차원은 팩트를 정의하는 계층 및 설명자 그룹입니다.예를 들어 매출액은 팩트입니다.타임스탬프, 제품, 레지스터 번호, 스토어 번호 등은 치수의 요소입니다.치수 모델은 매장 판매, 재고, 청구 등 비즈니스 프로세스 영역별로 구축됩니다.서로 다른 비즈니스 프로세스 영역은 일부 차원을 공유하지만 모든 차원을 공유하지는 않기 때문에 설계, 운영 및 일관성의 효율은 일치된 치수, 즉 대상 영역 ^{[citation needed]}전체에서 공유 차원의 복사본을 사용하여 달성됩니다.

치수 모델링에 관계형 데이터베이스가 반드시 필요한 것은 아닙니다.다차원 데이터베이스나 플랫 파일 등 모든 물리적 형태에 대해 논리 수준에서 동일한 모델링 방식을 사용할 수 있습니다.이해성과 ^{[citation needed]}퍼포먼스에 중점을 두고 있습니다.

설계 방법

모델 설계

치수 모델은 별 모양 스키마 또는 눈송이 스키마 위에 구축되며, 차원은 팩트 ^[3]^[4]테이블을 둘러싸고 있습니다.스키마를 작성하려면 다음 설계 모델이 사용됩니다.

비즈니스 프로세스 선택
곡식을 신고하다
치수를 특정
사실을 특정하다

비즈니스 프로세스 선택

치수 모델링 프로세스는 치수 모델의 사용성과 데이터 웨어하우스의 사용을 보장하는 4단계 설계 방법을 기반으로 합니다.설계의 기본은 데이터 웨어하우스가 커버해야 하는 실제 비즈니스 프로세스를 기반으로 합니다.따라서 모델의 첫 번째 단계는 모델이 구축된 비즈니스 프로세스를 설명하는 것입니다.예를 들어 소매점의 판매 상황일 수 있습니다.비즈니스 프로세스를 설명하려면 이를 일반 텍스트로 수행하거나 BPMN(Business Process Modeling Numption) 또는 Unified Modeling Language(UML)와 같은 기타 설계 가이드를 사용할 수 있습니다.

곡식을 신고하다

비즈니스 프로세스를 설명한 후 설계의 다음 단계는 모델의 결점을 선언하는 것입니다.모델의 입자는 치수 모델이 무엇에 초점을 맞춰야 하는지에 대한 정확한 설명입니다.예를 들어, "소매점에서 고객 전표에 기재된 개별 품목"이 있을 수 있습니다.곡물의 의미를 명확히 하기 위해서는 중심 과정을 골라 한 문장으로 설명해야 합니다.게다가 그 곡식(문장)은 당신이 당신의 차원과 사실표를 만드는 것입니다.모델이 제공할 수 있는 정보에 대한 새로운 정보를 얻기 위해 이 단계로 돌아가서 곡선을 변경해야 할 수도 있습니다.

치수를 특정

설계 프로세스의 세 번째 단계는 모델의 치수를 정의하는 것입니다.치수는 4단계 프로세스의 두 번째 단계부터 그레인 내에서 정의해야 합니다.치수는 팩트 테이블의 기초이며 팩트 테이블의 데이터가 수집되는 곳입니다.일반적으로 치수는 날짜, 매장, 재고 등의 명사입니다.이러한 치수는 모든 데이터가 저장되는 곳입니다.예를 들어 날짜 차원에는 연도, 월 및 요일과 같은 데이터가 포함될 수 있습니다.

사실의 특정

치수를 정의한 후 프로세스의 다음 단계는 팩트 테이블의 키를 만드는 것입니다.이 단계에서는 각 팩트테이블 행을 채울 수치 팩트를 식별합니다.이 단계는 데이터 웨어하우스에 저장된 데이터에 액세스할 수 있는 시스템 비즈니스 사용자와 밀접한 관련이 있습니다.따라서 대부분의 팩트 테이블 행은 수치, 수량 또는 단위당 비용 등의 가산 수치입니다.

치수 정규화

치수 정규화 또는 눈송이에 의해 정규화된 평탄한 치수로 알려진 중복 속성이 제거됩니다.치수는 하위 치수로 엄격하게 결합됩니다.

눈꽃은 데이터 ^[4]웨어하우스의 많은 철학과는 다른 데이터 구조에 영향을 미칩니다.여러 개의 설명(차원) 표로 둘러싸인 단일 데이터(팩트) 표

개발자는 다음과 같은 몇 가지 ^[5]이유로 치수를 정규화하지 않는 경우가 많습니다.

정규화는 데이터 구조를 더욱 복잡하게 만듭니다.
테이블 간 조인 수가 많기 때문에 성능이 저하될 수 있습니다.
공간 절약은 최소
비트맵 인덱스를 사용할 수 없습니다.
성능을 쿼리합니다.3NF 데이터베이스는 분석이 필요할 수 있는 많은 차원 값을 집계하거나 검색할 때 성능 문제를 겪습니다.운용 보고서만 작성하는 경우 운용 사용자가 매우 세밀한 데이터를 요구하고 있기 때문에 3NF로 그럭저럭 대처할 수 있습니다.

정규화가 ^[4]유용한 이유에 대한 몇 가지 주장이 있습니다.계층 구조의 일부가 둘 이상의 차원에 공통인 경우 이점이 될 수 있습니다.예를 들어, 지리적 치수는 고객과 공급업체 치수가 모두 사용하기 때문에 재사용할 수 있습니다.