Page semi-protected

의미적 통합

Semantic integration

의미적 통합은 달력과 작업관리 목록, 전자우편 보관소, 존재 정보(물리적, 심리적, 사회적), 모든 종류의 문서, 연락처(소셜 그래프 포함), 검색 결과, 광고 및 마케팅 관련성 등 다양한 출처의 정보를 상호 연관시키는 과정이다. 이와 관련하여 의미론은 이질적인 데이터 출처 사이의 중개자 역할을 함으로써 의 조직과 정보에 대한 행동에 초점을 맞추는데, 이는 구조뿐만 아니라 맥락이나 가치에 의해서도 충돌할 수 있다.

응용 프로그램 및 방법

엔터프라이즈 애플리케이션 통합(EAI)에서 의미 통합은 메타데이터 퍼블리싱을 사용하여 컴퓨터 시스템 간의 통신을 촉진하거나 자동화시킬 수 있다. 메타데이터 퍼블리싱은 잠재적으로 온톨로지를 자동으로 연결하는 기능을 제공한다. (반자동화된) 온톨로지 매핑에 대한 한 가지 접근방식은 의미적 거리 또는 그것의 역, 의미적 유사성 및 적절한 규칙을 정의해야 한다. 다른 접근법으로는 온톨로지의 구조를 이용하는데 의존하는 방법론뿐만 아니라 소위 어휘적 방법론도 있다. 유사성/평등성을 명시적으로 언급하기 위해, 대부분의 온톨로지 언어에는 특별한 속성이나 관계가 존재한다. 예를 들어, OWL은 "올빼미:equivalentClass", "올빼미:equivalentProperty" 및 "올빼미:sameAs"가 있다.

결국 시스템 설계는 출판된 의미 기반 인터페이스가 새롭고 의미 있는 기능을[citation needed] 가능하게 하기 위해 결합되는 복합형 아키텍처의 출현을 볼 수 있다. 이것들은 주로 런타임에[citation needed] 궁극적으로 렌더링되고 실행될 수 있는 설계시간 선언적 규격에 의해 설명될 수 있다.

의미론적 통합은 또한 인터페이스 설계와 매핑의 설계 시간 활동을 용이하게 하는데 사용될 수 있다. 이 모델에서 의미론은 설계에만 명시적으로 적용되며 런타임 시스템은 구문 수준에서[citation needed] 작동한다. 이러한 "조기 의미 구속력" 접근방식은 의미 중심 설계의[citation needed] 이점을 유지하면서 전체적인 시스템 성능을 개선할 수 있다.

의미적 통합 상황

산업 활용 사례에서 의미 매핑은 온톨로지 클래스나 데이터 유형 속성의 범위 내에서만 수행된 것으로 관찰되었다. 이와 같이 확인된 의미적 통합은 (1) 제약 없이 온톨로지 클래스 인스턴스를 다른 온톨로지 클래스로 통합하고, (2) 속성 값의 범위 제약에 의해 선택된 인스턴스를 다른 온톨로지 클래스로 통합하며, (3) 온톨로지 클래스 인스턴스를 다른 온톨로지 클래스로 통합하는 것이다. 인스턴스(instance) 속성의 값 변환과 함께. 각각의 매핑은 각각 (1) 등가 또는 소소수 매핑 관계, (2) 속성 값(데이터 범위)을 제약하는 조건부 매핑 관계, (3) 속성 값을 변환하는 변환 매핑 관계(단위 변환)이다. 식별된 각 매핑 관계는 (1) 직접 매핑 유형, (2) 데이터 범위 매핑 유형 또는 (3) 단위 변환 매핑 유형 중 하나로 정의할 수 있다.

KG 대 RDB 접근법

보충 데이터 소스를 통합하는 경우,

  • KG(Knowledge graph)는 개념, 사물 간의 관계, 사물의 범주를 기술함으로써 정보에 관련된 의미를 공식적으로 나타낸다. 데이터에 포함된 이러한 내재된 의미론들은 데이터에 대한 추론, 이기종 데이터 소스 처리와 같은 상당한 이점을 제공한다. 이 규칙은 그래프 쿼리를 사용하여 KG에 더 효율적으로 적용될 수 있다. 예를 들어, 그래프 쿼리는 관계형 데이터베이스의 테이블 전체 검색을 반복하는 대신 연결된 관계를 통해 데이터를 추론한다. KG는 기존 정보와 새로운 실체 간의 새로운 관계만 추가하면 새로운 이기종 데이터의 통합을 촉진한다. 이러한 촉진은 Wikidata.org과 같은 기존의 인기 있는 연계 오픈 데이터 소스와의 통합을 위해 강조된다.
  • SQL 쿼리는 특정 데이터베이스 내의 데이터 유형에 의해 긴밀하게 결합되고 엄격히 제한되며 테이블에 결합하여 테이블에서 데이터를 추출할 수 있으며, 결과는 일반적으로 테이블이며, 쿼리는 데이터 유형별로 일치하는 모든 열에 의해 테이블에 결합할 수 있다. SPARQL 쿼리는 재사용성을 촉진하고 데이터 유형으로부터 자유로운 관계를 통해 데이터를 추출할 수 있도록 웹 상에서 느슨하게 결합되고 웹 상에서 Linked Open Data에 대한 표준 쿼리 언어 및 프로토콜이며, 보다 정교한 연산(로직: transiti)으로 추가 지식 그래프를 생성할 수 있다.ve/대칭성/inverOf/기능성). 추론 기반 질의(논리에 의한 새로운 사실의 생성 없이 기존의 주장된 사실에 대한 질의)는 추론 기반 질의(기존에 대한 질의+논리에 근거하여 생성된/발견된 사실에 대한 질의)에 비해 빠를 수 있다.
  • 기존 데이터베이스에 있는 이기종 데이터 소스의 정보 통합은 복잡하기 때문에 구조 변경 및/또는 새로운 데이터 추가와 같은 데이터베이스 테이블의 재설계가 필요하다. 의미 쿼리의 경우 SPARQL 쿼리는 도메인에 대한 인간의 이해와 일치하는 방식으로 실체 간의 관계를 반영하기 때문에 질의의 의미적 의도를 쿼리 자체에서 확인할 수 있다. SPARQL과 달리, 데이터베이스의 특정 구조를 반영하고 테이블의 관련 기본 키와 외부 키를 일치시키는 것에서 파생된 SQL 쿼리는 엔티티 간의 관계를 누락함으로써 쿼리의 의미론을 상실한다. 아래는 "TB의 척추"를 치료하는 약물에 대한 SPARQL과 SQL 질의를 비교한 예다.

SELECT ?메디케이션
Where {
?예의 진단:진단.
?진단 예:이름 "척추의 TB".
의료 예:치료할 수 있는 진단.
}

선택 약물.med아이디
진단, 약물, 약물_진단으로부터
Where DiagnosticID=DRUG_DENSION.진단아이디
그리고 마약.메이드ID=DRUG_DENSION.med.아이디
AND DIAGNOSIS.name="척추 TB"

태평양 바이오컴퍼팅 심포지엄은 그동안 바이오메디컬 영역에서 온톨로지 매핑 과제를 대중화하는 장이 되어 왔으며, 그 진행 과정에서도 해당 주제에 대한 논문들을 다수 찾아볼 수 있다.

참고 항목

참조

외부 링크