연합 데이터베이스 시스템
Federated database system연합 데이터베이스 시스템은 다중 자율 데이터베이스 시스템을 하나의 연합 데이터베이스로 투명하게 매핑하는 메타 데이터베이스 관리 시스템(DBMS)의 일종이다. 구성 데이터베이스는 컴퓨터 네트워크를 통해 상호 연결되며 지리적으로 분산될 수 있다. 구성 데이터베이스 시스템은 자율적이기 때문에 연합 데이터베이스 시스템은 여러 개의 상이한 데이터베이스를 병합하는 (때로는 벅찬) 작업에 대한 대조 가능한 대안이다. 연합 데이터베이스 또는 가상 데이터베이스는 연합 데이터베이스 시스템에 있는 모든 구성 데이터베이스의 합성물이다. 데이터 연합의 결과로 구성되는 상이한 데이터베이스에는 실제 데이터 통합이 없다.
데이터 추상화를 통해 연합 데이터베이스 시스템은 균일한 사용자 인터페이스를 제공할 수 있어, 구성 데이터베이스가 이기종이라 하더라도 사용자와 클라이언트가 단일 질의로 다중 비연속 데이터베이스의 데이터를 저장하고 검색할 수 있다. 이를 위해 연합 데이터베이스 시스템은 관련 구성 요소 DBMS에 제출하기 위해 쿼리를 하위 쿼리로 분해할 수 있어야 하며, 그 후에 시스템은 하위 쿼리의 결과 세트를 합성해야 한다. 다양한 데이터베이스 관리 시스템은 서로 다른 쿼리 언어를 사용하기 때문에 연합 데이터베이스 시스템은 하위 쿼리에 래퍼를 적용하여 적절한 쿼리 언어로 변환할 수 있다.
정의
McLeod와 Heimbigner는[1] 1980년대 중반 연합 데이터베이스 시스템을 최초로 정의한 사람들 중 한 명이었다.
FDBS는 "중앙 권한을 최소화하는 동시에 데이터베이스 시스템 간의 부분적인 공유와 조정을 지원하는 구조와 상호 연결[s] 데이터베이스를 정의"하는 것이다.[1] 이 설명은 연합 데이터베이스의 McLeod/Himbigner[1] 정의를 정확하게 반영하지 못할 수 있다. 오히려 이 설명은 McLeod/Himbigner가 복합 데이터베이스라고 부르는 것과 일치한다. McLeod/Himbigner의 연합 데이터베이스는 수출 스키마 발행과 접속 운영을 통해 연방의 다른 구성원이 자신의 데이터를 이용할 수 있게 하는 자율적 요소의 모음이며, 연방 구성원이 이용할 수 있는 정보를 포괄하는 통일된 중앙 스키마는 없다.
다른 조사들 중에서,[2] 실무자들은 연합 데이터베이스를 자율적이고 이질적인 협력 요소 시스템의 집합으로 정의한다.
FDBS의 세 가지 중요한 구성요소는 자율성, 이질성 및 분배다.[2] 또한 고려된 또 다른 차원은 네트워킹 환경 컴퓨터 네트워크(예: LAN을 통한 많은 DBS 또는 참여 DBS의 WAN 업데이트 관련 기능(예: 업데이트 없음, 비원자성 전환, 원자성 업데이트)이다.
FDBS 아키텍처
DBMS는 중앙집중식 또는 분산형 중 하나로 분류될 수 있다. 중앙 집중식 시스템은 단일 데이터베이스를 관리하는 반면 분산형 시스템은 여러 데이터베이스를 관리한다. DBMS의 구성요소 DBS는 중앙집중화되거나 분산될 수 있다. 다중 DBS(MDBS)는 구성 요소 DBS의 자율성에 따라 연합체 및 비연합체로 분류할 수 있다. 비연합 데이터베이스 시스템은 자율적이지 않은 구성요소 DBMS의 통합이다. 연합 데이터베이스 시스템은 독립적이지만 연방에 참여하는 구성 요소 DBS로 구성되며, 구성 요소 DBS는 데이터의 부분적 및 통제된 공유를 허용한다.
연합 아키텍처들은 구성요소 데이터베이스 시스템과의 통합 수준과 연합이 제공하는 서비스의 범위에 따라 다르다. FDBS는 느슨하거나 긴밀하게 결합된 시스템으로 분류할 수 있다.
- 느슨하게 결합되는 구성 요소 데이터베이스는 자체 연합 스키마를 구축하도록 요구한다. 사용자는 일반적으로 멀티다타베이스 언어를 사용하여 다른 구성요소 데이터베이스 시스템에 액세스하지만, 이것은 사용자가 연합 스키마에 대한 직접적인 지식을 가질 것을 강요하는 위치 투명성의 수준을 제거한다. 사용자는 다른 구성요소 데이터베이스에서 필요한 데이터를 가져와 자신의 데이터와 통합하여 연합 스키마를 형성한다.
- 긴밀하게 결합된 시스템은 독립적 프로세스를 사용하여 통합된 연합 스키마를 구축하고 공표하는 구성요소 시스템으로 구성된다.
FDBS가 특정 유형인 다중 DBS는 다음 3차원을 따라 특성화할 수 있다. 분배, 이질성 및 자율성. 다른 특성화는 네트워킹의 차원에 기초할 수 있다. 예를 들어 단일 데이터베이스 또는 LAN 또는 WAN의 다중 데이터베이스.
분배
FDBS에서 데이터의 분포는 FDBS가 구축되기 전에 다중 DBS가 존재하기 때문이다. 데이터는 단일 컴퓨터 또는 여러 컴퓨터에 저장될 수 있는 여러 데이터베이스 간에 분산될 수 있다. 이 컴퓨터들은 지리적으로 다른 장소에 위치할 수 있지만 네트워크에 의해 상호 연결될 수 있다. 데이터 배포의 이점은 가용성 및 신뢰성 향상과 액세스 시간 개선에 도움이 된다.
이질성
데이터베이스의 이질성은 구조의 차이, 데이터의 의미론, 지원되는 제약조건 또는 질의 언어와 같은 요인에 의해 발생한다. 구조상의 차이는 두 데이터 모델이 전문화 및 상속을 지원하는 객체 지향형(OO) 모델과 그렇지 않은 관계형 모델과 같이 서로 다른 원시적 요소를 제공할 때 발생한다. 제약조건으로 인한 차이는 두 모델이 두 개의 서로 다른 제약조건을 지원할 때 발생한다. 예를 들어 CODASYL 스키마의 설정 유형은 관계 스키마에서 참조 무결성 제약으로 부분적으로 모델링될 수 있다. CODASYL은 참조 무결성만으로 캡처되지 않는 삽입 및 보존을 지원한다. 하나의 DBMS에 의해 지원되는 쿼리 언어는 다른 컴포넌트 DBMS들 간의 이질성에 기여할 수 있다. 예를 들어, 동일한 데이터 모델이나 다른 버전의 쿼리 언어의 차이는 이질성에 기여할 수 있다.
의미론적 이질성은 데이터의 의미, 해석 또는 의도된 사용에 대한 불일치가 있을 때 발생한다. 스키마와 데이터 수준에서 가능한 이질성의 분류에는 다음이 포함된다.
- 이름 지정은 동일한 개념을 나타내기 위해 다른 이름을 사용하는 데이터베이스와 충돌한다.
- 도메인 충돌 또는 데이터 표현 충돌. 예를 들어, 동일한 개념을 나타내기 위해 다른 값을 사용하는 데이터베이스.
- 예를 들어, 동일한 데이터에 대해 서로 다른 기본 도메인의 동일한 데이터 값을 사용하는 데이터베이스가 충돌한다.
- 메타데이터 충돌(예: 스키마 수준 및 인스턴스 수준)에서 동일한 개념이 표현된다.
- 데이터 충돌(예: 누락된 속성)
- 스키마 충돌(예: 테이블 대 테이블 충돌), 이름 충돌, 테이블 대 테이블 충돌
연합 스키마를 만들 때 구성요소 DB 스키마를 통합하기 전에 이러한 이질성을 해결해야 한다.
스키마 일치, 스키마 매핑
호환되지 않는 데이터 유형 또는 쿼리 구문을 처리하는 것만이 FDBS의 구체적인 구현에 장애물이 아니다. 계획된 하향식 시스템이 아닌 시스템에서 일반적인 문제는 의미론적으로 동등하지만 서로 다른 스키마(=데이터 모델)와 다른 이름의 부분(테이블, 속성)에 있다. n개 속성 간의 쌍방향 은n ( - ) {\) 이상의 매핑 규칙(주어진 동등성 매핑)을 발생시킬 수 있으며, 이는 실제 목적을 위해 너무 빠르게 커진다. 일반적인 방법은 모든 구성원 스키마의 관련 부분을 구성하고 데이터베이스 보기 형식으로 매핑을 제공하는 글로벌 스키마를 제공하는 것이다. 두 가지 주요 접근방식은 매핑 방향에 따라 달라진다.
- Global as View(GaV): 글로벌 스키마는 기본 스키마에 따라 정의됨
- Local as View(LaV): 로컬 스키마는 글로벌 스키마 관점에서 정의된다.
둘 다 스키마 매칭 문제라 불리는 데이터 통합의 예다.
자율성
MDBS와 FDBS의 차이에 대한 기본은 자율성의 개념이다. 구성요소 DB에 대한 자율성의 측면과 구성요소 DBS가 FDBS에 참여할 때 이들 측면을 어떻게 다룰 수 있는지를 이해하는 것이 중요하다. 다음과 같은 네 가지 종류의 자치단체가 있다.
- 설계 자율성(Design Autonomy)은 데이터, 질의 언어 또는 개념화, 시스템 구현의 기능성과 관계없이 설계를 선택할 수 있는 능력을 말한다.
FDBS에서 이질적인 것은 주로 설계 자율성 때문이다.
- 통신 자율성은 다른 DBMS와 통신하기 위한 DBMS의 일반적인 운영을 말한다.
- 실행 자율성은 구성요소 DBMS가 로컬 및 외부 운용에 의해 요청된 운영을 제어할 수 있도록 한다.
- 협회 자율성은 구성 요소 DBS에게 FDBS가 어떤 단일 DBS와도 독립적으로 작동할 수 있다는 것을 의미하는 연합체와의 연결을 해제할 힘을 준다.
ANSI/X3/SPARC Study Group은 데이터베이스의 개념 스키마, 내부 스키마 및 외부 스키마인 3가지 수준의 데이터 설명 아키텍처를 개략적으로 설명했다. 그러나 3단계 아키텍처는 FDBS의 아키텍처를 기술하기에 불충분하다. 따라서 그것은 FDBS의 3차원 즉 분배, 자율성 및 이질성을 지원하도록 확장되었다. 5단계 스키마 아키텍처는 아래에 설명되어 있다.
동시성 제어
이질성과 자율성 요구사항은 FDBS의 동시성 제어와 관련된 특별한 문제를 제기하며, 이는 동시성 트랜잭션을 정확하게 실행하는 데 중요하다(Global Concurrency Control 참조). 이러한 요건 하에서 주요 정확성 기준인 글로벌 연속성을 달성하는 것은 매우 어렵고 미해결된 것으로 특징지어진다.[2] 1991년에 도입된 약속 순서는 이 문제에 대한 일반적인 해결책을 제공했다(솔루션의 아키텍처 측면에 대해서는 글로벌 연속성; 약속 순서도 참조).
FDBS용 5단계 스키마 아키텍처
5단계 스키마 아키텍처는 다음을 포함한다.
- Local Schema는 기본적으로 기본 데이터 모델로 표현된 구성요소 데이터베이스의 개념 모델이다.[3]
- 컴포넌트 스키마는 소유자 조직이 FDBS의 다른 사용자와 기꺼이 공유하고자 하는 로컬 스키마의 서브셋이며, 공통 데이터 모델로 변환된다.[3]
- Export Schema는 특정 연합에서 사용할 수 있는 구성요소 스키마의 하위 집합을 나타낸다.[3] 그것은 특정 연방 사용자에 의한 그것의 사용에 관한 접근 제어 정보를 포함할 수 있다. 내보내기 스키마는 데이터 제어 흐름 관리에 도움이 된다.
- 연합 스키마는 여러 내보내기 스키마의 통합이다. 수출 스키마를 통합할 때 생성되는 데이터 배포에 대한 정보를 포함한다.[3]
- 외부 스키마는 연합 스키마에서 추출되며, 특정 연합의 사용자/애플리케이션에 대해 정의된다.[3]
데이터 통합에서 예술의 상태를 정확하게 나타내지만, 위의 5단계 스키마 아키텍처는 IT가 외관과 느낌을 강요하는 큰 단점으로 인해 어려움을 겪고 있다. 현대의 데이터 사용자들은 데이터가 어떻게 표시되는지에 대한 통제를 요구한다. 그들의 요구는 데이터 통합에 대한 그러한 상향식 접근법과 다소 상충된다.
참고 항목
- 엔터프라이즈 정보 통합(EII)
- 데이터 가상화
- 마스터 데이터 관리(MDM)
- 스키마 매칭
- 보편적 관계 가정
- 링크된 데이터
- SPARQL
참조
- ^ a b c "McLeod and Heimbigner (1985). "A Federated Architecture for information management". ACM Transactions on Information Systems, Volume 3, Issue 3. pp. 253–278.
- ^ a b c "Sheth and Larson (1990). "Federated Database Systems for Managing Distributed, Heterogeneous, and Autonomous Databases". ACM Computing Surveys, Vol. 22, No.3. pp. 183–236.
- ^ a b c d e Masood, Nayyer; Eaglestone, Barry (December 2003). "Component and Federation Concept Models in a Federated Database System" (PDF). Malaysian Journal of Computer Science. 16 (2): 47–57. Archived from the original (PDF) on 2016-03-07. Retrieved 2016-03-03.
외부 링크
- DB2 및 연합 데이터베이스
- 소위 "푸시다운" 조인을 수행할 위치 및 기타 성능 특성에 대한 문제
- Oracle, Informix, DB2 및 Excel 연합 예제
- 프리타스, 안드레, 에드워드 커리, 주앙 가브리엘 올리베이라, 션 오라인. 2012. "Linked Data Web에서 이기종 데이터셋 쿼리: 과제, 접근 방식 및 동향" IEEE 인터넷 컴퓨팅 16(1): 24–33.
- IBM Gaian 데이터베이스: 동적 분산 연합 데이터베이스
- 이러한 시스템을 구현하고 사용하는 연합 시스템 및 방법 및 메커니즘