메타데이터 저장소

Metadata repository

메타데이터 저장소는 메타데이터를 저장하기 위해 작성된 데이터베이스입니다.메타데이터는 실제 데이터를 포함하는 구조에 대한 정보입니다.메타데이터는 흔히 "데이터에 관한 데이터"라고 하지만 이는 오해를 불러일으킵니다.데이터 프로파일은 실제 "데이터에 관한 데이터"의 예입니다.메타데이터는 이 정의에 하나의 추상화 레이어를 추가합니다. 즉, 데이터가 포함된 구조에 대한 데이터입니다.메타데이터는 모든 형식으로 저장된 모든 데이터의 구조를 설명할 수 있습니다.

적절하게 설계된 메타데이터 저장소에는 일반적으로 다양한 데이터 구조의 단순한 정의를 훨씬 뛰어넘는 데이터가 포함됩니다.일반적인 저장소에는 각 데이터 구조에 대한 수십~수백 개의 개별 정보가 저장됩니다.

두 개의 데이터 항목(디지털 항목과 물리적 항목)의 메타데이터를 비교하면 메타데이터가 무엇인지 명확히 알 수 있습니다.

첫째, 디지털:데이터베이스에 저장된 데이터의 경우 "Patient(환자)"라는 테이블이 있을 수 있으며, 각 테이블에는 각 환자의 서로 다른 속성을 설명하는 데이터가 들어 있습니다.이러한 열 중 하나에 "Patient_Last_Name"이라는 이름을 붙일 수 있습니다.데이터베이스에서 환자의 실제 성을 포함하는 열에 대한 메타데이터는 무엇입니까?데이터가 들어 있는 컬럼 이름(Patient_Last_Name)과 컬럼이 들어 있는 테이블 이름(Patient)의 두 가지 항목을 이미 사용했습니다.기타 메타데이터에는 입력할 수 있는 성의 최대 길이, 성이 필요한지 여부(Patient_Last_Name이 없는 환자를 가질 수 있는지 여부), 데이터베이스에서 소문자로 입력한 성을 대문자로 변환하는지 여부 등이 포함될 수 있습니다.보안 성질의 메타데이터에는 이러한 이름을 볼 수 있는 사용자를 제한하는 제한이 표시될 수 있습니다.

둘째, 물리:벽돌과 모르타르 라이브러리에 저장된 데이터의 경우 볼륨이 많고 책을 포함한 다양한 미디어가 있을 수 있습니다.서적에 관한 메타데이터에는 ISBN, Binding_이 포함됩니다.유형, 페이지 수, 작성자 등바인딩 내_유형, 메타데이터에는 가능한 바인딩, 재료 등이 포함됩니다.

비즈니스 데이터의 이러한 상황별 정보에는 의미와 내용, 지배하는 정책, 기술적 속성, 변환하는 사양 및 [1]: 171 조작하는 프로그램이 포함됩니다.

정의.

메타데이터 저장소는 메타데이터를 물리적으로 저장하고 카탈로그를 만드는 역할을 합니다.메타데이터 저장소의 데이터는 일반 데이터, 통합 데이터, 현재 데이터 및 기록 데이터여야 합니다.범용:메타데이터 모델은 메타데이터를 애플리케이션 고유의 정의된 방식으로 저장하는 대신 범용 용어로 저장해야 합니다. 따라서 데이터베이스 표준이 제품 간에 변경되어도 메타데이터 저장소의 물리적 메타 모델을 변경할 필요가 없습니다.메타데이터 저장소를 통합하면 모든 비즈니스 영역의 메타데이터가 통합됩니다. 즉, 조직의 모든 도메인과 대상 영역을 포괄합니다.메타데이터 저장소에는 액세스 가능한 현재 [2]기록 메타데이터가 있어야 합니다.메타데이터 저장소를 데이터 [1]: 239 사전이라고 했습니다.

비즈니스 인텔리전스의 메타데이터 사용에 대한 요구가 변화함에 따라 메타데이터 저장소의 범위도 확대되었습니다.이전의 데이터 사전은 기술과 비즈니스를 상호 작용하는 가장 가까운 장소입니다.데이터 사전은 초기 단계에서 메타데이터 저장소의 세계이지만 비즈니스 측면에서 비즈니스 용어집과 다양한 상태 플래그에 대한 태그가 등장하면서 테크놀로지 메타데이터를 소비함으로써 데이터 사전은 비즈니스와 기술을 가져오는 귀중한 보고서의 원천이 되었습니다.데이터 관리 결정을 쉽게 내릴 수 있을 뿐만 아니라 변경 비용을 평가할 수 있도록 지원했습니다.

메타데이터 저장소는 전사적인 데이터 거버넌스, 데이터 품질 및 마스터 데이터 관리(마스터 데이터 및 참조 데이터 포함)를 조사하여 이 풍부한 정보를 조직 전체의 통합 메타데이터와 통합하여 데이터 구조에 대한 의사결정 지원 시스템을 제공합니다.단, 데이터 구조에는 사용되는 구조만 반영됩니다.다양한 시스템

저장소 vs.

Repository에는 레지스트리와 비교하여 추가 기능이 있습니다.메타데이터 저장소는 메타데이터 레지스트리 등의 메타데이터를 저장할 뿐만 아니라 관련 메타데이터 유형과의 관계도 추가합니다.메타데이터가 도입 시점부터 성과물까지의 흐름에서 관련될 경우 해당 데이터 포인트의 계보로 간주됩니다.관련된 다른 메타데이터 유형 간에 관련되는 메타데이터를 링크라고 합니다.메타데이터 저장소는 조직 전체의 모든 메타데이터 포인트와의 관계를 제공하고 변경을 처리하기 위한 아키텍처와의 정합성을 유지함으로써 데이터 흐름과 그 정의 및 영향을 이해하기 위한 기본 자료를 제공합니다.또한 중요한 기능은 이 대조 문장은 논의의 여지가 있지만 버전 관리를 유지하는 것입니다.이러한 정의는 아직 진화하고 있기 때문에 정의의 정확성을 개선할 필요가 있습니다.

레지스트리의 목적은 메타데이터 요소를 정의하고 조직 전체에서 유지관리하는 것입니다.또한 데이터 모델 및 기타 데이터 관리 팀은 레지스트리를 참조하여 변경 사항을 확인합니다.메타데이터 저장소는 조직의 다양한 메타데이터 시스템에서 메타데이터를 소싱하여 업스트림에 있는 것을 반영합니다.레지스트리가 메타데이터 변경의 업스트림으로 사용되는 동안 저장소는 업스트림으로 작동하지 않습니다.

사용 이유

메타데이터 저장소를 통해 조직 데이터 컨테이너의 모든 구조를 하나의 통합 위치로 이동할 수 있습니다.이것에 의해, 계산된 비즈니스 의사결정을 실시하기 위한 풍부한 정보가 표시됩니다.이 도구는 하나의 범용 데이터 모델을 사용하여 모든 모델을 통합함으로써 조직의 모든 애플리케이션과 프로그램을 하나의 형식으로 통합합니다.또한 비즈니스 정의와 비즈니스 프로세스를 적용하여 비즈니스와 테크놀로지를 보다 밀접하게 함으로써 조직이 확실한 목표를 가지고 신뢰할 수 있는 로드맵을 작성할 수 있도록 지원합니다.원스톱 정보를 통해 기업은 변경 사항을 보다 효과적으로 제어할 수 있으며 툴의 영향 분석을 수행할 수 있습니다.일반적으로 기업은 조직의 데이터 관리에서 변경을 가하거나 새로운 데이터 구조를 추가하거나 구조를 제거하기 위해 검출과 영향에 대한 조사에 따라 많은 시간과 비용을 소비합니다.구조화 및 유지보수가 잘 된 저장소를 사용하면 아이디어화에서 제공까지 제품을 이동하는 데 걸리는 시간이 최소화됩니다(다른 변수가 일정하다는 점을 고려).요약하면:

  1. 조직 전체의 메타데이터 통합.
  2. 다양한 메타데이터 유형 간의 관계 구축
  3. 다양한 이종 시스템 간의 관계를 구축합니다.
  4. 정의의 비즈니스 골든 카피를 정의합니다.
  5. 구조 수준에서의 변경 버전 제어.
  6. 참조 데이터와의 교호작용
  7. 보기를 마스터 데이터에 연결합니다.
  8. 다양한 인증된 메타데이터 소스 시스템과의 자동 동기화
  9. 비즈니스 의사결정에 대한 관리 강화.
  10. 모델을 겹쳐서 구조를 검증하다
  11. 데이터 구조 수준에서 불일치, 격차, 계통, 측정 기준을 발견합니다.

각 데이터베이스 관리 시스템(DBMS) 및 데이터베이스 도구에는 메타데이터 구성 요소에 대한 고유한 언어가 있습니다.데이터베이스 응용 프로그램에는 저장된 데이터에 액세스하는 데 필요한 모든 기능을 제공하는 자체 리포지토리 또는 레지스트리가 이미 있습니다.벤더는 다른 기업이 자사 제품에서 경쟁사 제품으로 데이터를 쉽게 이행하는 것을 원치 않기 때문에 메타데이터를 처리하는 방식이 독점적입니다.CASE 툴, DBMS 딕셔너리, ETL 툴, 데이터 클렌징 툴, OLAP 툴 및 데이터 마이닝 툴은 모두 메타데이터를 다른 방식으로 처리하고 저장합니다.이러한 모든 도구의 메타데이터 구성요소를 [3]저장하도록 설계할 수 있는 것은 메타데이터 저장소뿐입니다.

설계.

메타데이터 저장소는 소유권, 기술 특성, 규칙 및 정책, 물리적 특성 등 4가지 분류로 메타데이터를 저장해야 합니다.소유권: 데이터 소유자 및 애플리케이션 소유자를 표시합니다.설명적 특성, 이름, 유형 및 길이, 비즈니스 데이터 또는 비즈니스 프로세스를 설명하는 정의를 정의합니다.규칙 및 정책은 보안, 데이터 무결성, 데이터 일정 및 관계를 정의합니다.물리적 특성은 원본 또는 소스 및 물리적 [1]: 176 위치를 정의합니다.데이터베이스를 생성하기 위한 논리적 데이터 모델을 구축하는 것과 마찬가지로, 논리적 메타 모델은 비즈니스 [1]: 185 데이터에 대한 메타데이터 요구 사항을 식별하는 데 도움이 될 수 있습니다.메타데이터 저장소는 중앙 집중화, 분산화 또는 분산됩니다.중앙 집중식 설계는 비즈니스 전반에 걸쳐 모든 애플리케이션의 메타데이터를 저장하는 메타데이터 저장소에 하나의 데이터베이스가 있다는 것을 의미합니다.중앙 집중식 메타데이터 저장소는 중앙 집중식 데이터베이스와 동일한 장점과 단점을 가지고 있습니다.모든 데이터가 하나의 데이터베이스에 있기 때문에 관리가 용이하지만 병목 현상이 발생할 수 있다는 단점이 있습니다.

분산형 메타데이터 저장소는 메타데이터를 위치 및 부서별로 구분하여 여러 데이터베이스에 저장합니다.따라서 중앙 집중식 메타데이터 저장소보다 저장소 관리가 더 많이 필요하지만 메타데이터를 개별 부서로 세분화할 수 있다는 장점이 있습니다.

분산 메타데이터 저장소는 분산된 방법을 사용하지만 분산된 메타데이터 저장소와 달리 메타데이터는 원래 응용 프로그램에 남아 있습니다.XML 게이트웨이가 생성되어[1]: 246 서로 다른 애플리케이션 내의 메타데이터에 액세스하기 위한 디렉토리로 기능합니다.분산 메타데이터 저장소의 장점과 단점은 분산 데이터베이스의 장점과 단점을 반영합니다.

정보 모델 설계에는 데이터의 통합 뷰를 작성하기 위해 중복되는 메타데이터 유형의 다양한 레이어를 포함해야 합니다.비즈니스 용어집에 링크하는 하향식 모델에서는 다양한 메타데이터 유형을 관련 메타데이터 요소와 연결해야 합니다.

메타데이터 레이어:

  1. 비즈니스 용어집: 비즈니스 용어와의 재귀적 관계를 포함합니다.
  2. 비즈니스 태그:해당 용어에 대한 다양한 관련성을 포함합니다.
  3. Data Dictionary: 데이터 또는 엔터프라이즈 아키텍처에서 제공하는 메타데이터 요소 및 그 기술적 정의를 정의하기 위한 데이터 모델 도구의 정보가 포함되어 있습니다.
  4. 개념 데이터 모델:
  5. 논리 데이터 모델
  6. 물리 데이터 모델
  7. 데이터베이스
  8. 검증 규칙 및 데이터 품질 규칙
  9. ETL, 비즈니스 규칙 및 속성 및 엔티티와의 관계
  10. 리포트
  11. 소스 대 대상 매핑 아티팩트(관계)
  12. 보고 요건(관계)
  13. 비즈니스 프로세스와 테크놀로지와의 관계
  14. 사람들의 계층구조와 그들의 관계
  15. 소유자 관계

엔티티-관계/개체 지향

메타데이터 리포지토리는 엔티티 관계 모델 또는 객체 지향 설계로 설계될 수 있습니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b c d e Moss, L. T.; Atre, S. (2003). Business Intelligence Roadmap: The Complete Project Lifecycle for Decision-Support Applications. Addison-Wesley Professional. ISBN 0-201-78420-3.
  2. ^ Marco, D.; Jennings, M. (2004). Universal Metadata Models. Wiley. pp. 36–43. ISBN 0-471-08177-9.
  3. ^ Marco, D. (2000). Building and Managing the Metadata Repository: A Full Lifecycle Guide. Wiley. ISBN 978-0471355236.