시멘틱 상호 운용성

Semantic interoperability

시멘틱 상호운용성은 컴퓨터 시스템이 모호하지 않고 공유된 의미를 가진 데이터를 교환할 수 있는 능력입니다.시멘틱 상호 운용성은 정보 [1]시스템 간에 기계 계산 가능한 논리, 회의, 지식 발견 및 데이터 페더레이션을 가능하게 하기 위한 요건입니다.

따라서 의미적 상호운용성은 데이터의 패키징(구문)뿐만 아니라 데이터와의 의미의 동시 전달(의미학)과도 관련이 있다.이는 데이터에 대한 데이터(메타데이터)를 추가하여 각 데이터 요소를 제어되고 공유된 어휘에 연결함으로써 이루어집니다.데이터의 의미는 데이터 자체와 함께 모든 정보 시스템과 독립적인 하나의 "정보 패키지"로 전송됩니다.이 공유 어휘와 기계 해석, 추론 및 논리의 기초와 능력을 제공하는 온톨로지와의 관련 링크입니다.

구문적 상호 운용성(아래 참조)은 시멘틱 상호 운용성의 전제 조건입니다.통사적 상호운용성은 데이터의 패키징 및 전송 메커니즘을 말합니다.의료 분야에서 HL7은 30년 이상 사용되고 있으며(인터넷 및 웹 기술보다 이전), 파이프 문자( )를 데이터 구분자로 사용합니다.문서 마크업의 현재 인터넷 표준은 XML로, 데이터 딜리미터로 "< >"를 사용합니다.데이터 구분 기호는 데이터를 구조화하는 것 외에는 데이터에 의미를 부여하지 않습니다.구분 기호의 내용을 번역하는 데이터 사전이 없으면 데이터는 의미가 없습니다.이러한 데이터 패키징 메커니즘에 관련짓기 위한 데이터 사전 및 정보 모델을 작성하려는 시도는 많이 있지만 실제 구현은 이루어지지 않았습니다.이로 인해 데이터의 지속적인 "바벨화"와 의미 있는 데이터 교환이 불가능해질 뿐입니다.

1999년 [2]Tim Berners-Lee에 의해 시멘틱개념이 도입된 이후 W3C(World Wide Web Consortium) 표준에 대한 관심과 응용이 증가하여 웹 규모의 시멘틱 데이터 교환, 페더레이션 및 회의 기능을 제공하고 있습니다.

통사적 상호 운용성의 함수로서의 의미론

XML이나 SQL 표준 등의 구문 상호 운용성은 시멘틱의 전제 조건입니다.정보 처리 방법이 구조에서 해석될 수 있도록 데이터를 구조화하기 위한 공통 데이터 형식과 공통 프로토콜을 포함합니다.또한 구문 오류를 검출할 수 있으므로 수신 시스템에서 왜곡되거나 불완전한 것으로 보이는 메시지의 재발송을 요구할 수 있습니다.구문이 왜곡되거나 데이터를 나타낼 수 없는 경우에는 의미 통신이 불가능합니다.단, 어떤 구문에서 표현되는 정보는 다른 구문으로 정확하게 변환될 수 있습니다.구문을 정확하게 번역할 수 있는 경우 다른 구문을 사용하는 시스템도 정확하게 상호 운용할 수 있습니다.경우에 따라 사용되는 형식어법이 다른 표현력(정보를 표현하는 능력)을 가질 때 다른 구문을 사용하는 시스템 간에 정보를 정확하게 번역하는 능력이 한 방향으로 제한될 수 있습니다.

모든 애플리케이션에서 사용되는 모든 용어의 표현을 포함하는 단일 온톨로지는 일반적으로 새로운 용어가 빠르게 생성되거나 오래된 용어에 새로운 의미를 부여하기 때문에 불가능한 것으로 간주됩니다.그러나 사용자가 컴퓨터에서 표현하고 싶어하는 모든 개념을 예상할 수는 없지만, 사용자가 특정 애플리케이션 또는 온톨로지 집합에 대해 필요로 하는 보다 구체적인 개념을 만들기 위해 조합할 수 있는 유한한 "원시적" 개념 표현을 찾을 수 있는 가능성이 있습니다.이러한 모든 원시 요소를 포함하는 기반 온톨로지(상위 온톨로지라고도 함)를 갖는 것은 일반적인 의미적 상호 운용성을 위한 건전한 기반을 제공할 수 있으며 사용자는 온톨로지 요소의 기본 인벤토리를 사용하여 필요한 새로운 용어를 정의할 수 있으며, 여전히 다른 모든 compu에서 새롭게 정의된 용어를 적절하게 해석할 수 있습니다.기본 온톨로지를 해석할 수 있는 ter 시스템.이러한 원시 개념 표현의 수가 실제로 유한한지, 아니면 무한히 확대될지는 현재 검토 중인 문제이다.만약 그것이 유한하다면, 정확하고 일반적인 시맨틱 상호 운용성을 지원하는 데 적합한 안정적인 기반 온톨로지는 일부 초기 기반 온톨로지가 다양한 사용자에 의해 테스트되고 사용된 후에 진화할 수 있다.현재 광범위한 커뮤니티에서 채택된 기반 온톨로지가 없기 때문에 이러한 안정적인 기반 온톨로지는 아직 미래에도 존재한다.

단어와 의미

의미론에 대한 논의에서 반복되는 한 가지 지속적인 오해는 "단어와 의미의 혼란"이다.단어의 의미는 때때로 빠르게 변한다.그러나 온톨로지에 사용되는 것과 같은 형식 언어는 변하지 않는 형태로 개념의 의미(의미)를 부호화할 수 있습니다.특정 단어(예를 들어 데이터베이스의 용어)의 의미를 결정하기 위해서는 온톨로지 내의 각 고정 개념 표현에 해당 개념을 참조할 수 있는 단어 또는 용어를 라벨로 붙일 필요가 있습니다.여러 단어가 언어에서 같은 (고정된) 개념을 참조할 때 이것은 동의어라고 하며, 한 단어가 둘 이상의 개념을 참조하기 위해 사용되는 경우, 그것은 모호성이라고 불립니다.

애매함과 동의어는 언어의 컴퓨터 이해를 매우 어렵게 만드는 요소들 중 하나이다.개념(사용되는 단어의 의미)을 참조하기 위한 단어의 사용은 사람이 읽을 수 있는 많은 용어의 문맥과 사용 목적에 매우 민감합니다.의미적 상호 운용성을 지원하기 위해 온톨로지를 사용하는 것은 의미와 관계가 안정적이고 사용자가 동의할 수 있는 고정된 개념 세트를 제공하는 것이다.어떤 문맥(각 데이터베이스는 다른 문맥)을 온톨로지 작성 태스크와 분리하여 데이터베이스 설계자, 데이터 입력용 폼 설계자 또는 언어 이해용 프로그램 개발자가 수행해야 하는 작업입니다.일부 상호 운용 가능한 컨텍스트에서 사용되는 단어의 의미가 변경되면 상호 운용성을 유지하기 위해 해당 단어의 의미를 지정하는 온톨로지 요소로 포인터를 변경해야 합니다.

지식 표현 요건 및 언어

지식 표현 언어는 잘 이해된 분야에서 의미의 뉘앙스를 기술하기에 충분히 표현될 수 있다.이러한[specify] 복잡성에는 적어도 5가지 레벨이 있습니다.

일반적인 반구조화 데이터의 경우 [3]XML과 같은 범용 언어를 사용할 수 있습니다.

많은 작업에는 1차 술어 논리의 완전한 기능을 갖춘 언어가 필요할 수 있습니다.

인간의 언어는 표현력이 매우 높지만, 현재 인간의 언어 기술 수준을 고려할 때 원하는 정확한 해석을 하기에는 너무 애매한 것으로 여겨진다.

사전 동의 필요 없음

시멘틱 상호운용성은, 송신 시스템에 의해서 사용되는 알고리즘이 미지의 경우라도, 전송되는 정보가, 그 통신 형태에 있어서, 수신 시스템이 그것을 올바르게 해석하기 위해서 필요한 모든 의미를 가지는지를 고려함으로써, 다른 형태의 상호운용성과 구별될 수 있다.다음의 번호의 송신을 검토해 주세요.

만약 그 숫자가 한 회사가 다른 회사에 진 돈의 합계라면, 그것은 그것을 보내는 사람과 받는 사람 모두에게 어떤 행동이나 행동이 부족함을 의미한다.

특정 요구에 응답하여 송신하고, 예상된 시각과 형식으로 수신하는 경우, 올바르게 해석될 수 있습니다.이 올바른 해석은 숫자 자체에만 의존하는 것이 아니라, 수백만 가지 유형의 정량적 측정의 거의 모든 종류를 나타낼 수 있으며, 전달 상황에 따라 엄격히 달라진다.즉, 해석은 다른 시스템의 알고리즘이 정확히 동일한 의미로 번호를 사용하는 것을 기대하는 두 시스템에 따라 달라지며, 이는 최소 번호의 실제 전송 이전에 발생한 전체 전송 엔벨로프에 따라 더욱 달라진다.

반대로, 송신 시스템이 그 정보가 다른 시스템에 의해서 어떻게 이용될지를 모르는 경우, (많은 가능한 의미 중) 어떤 특정한 의미를 가지는 정보가 통신에 어떻게 나타나는지에 대한 공유 합의를 얻을 필요가 있다.특정 태스크에 대해 하나의 해결책은 지불 요구와 같은 폼을 표준화하는 것입니다.그 요구는, 예를 들면, 돈을 빌린 대리인, 돈을 빌린 대리인, 빚을 진 대리인, 상품, 서비스 및 기타와 같이, 그것을 평가하는 데 필요한 모든 정보를 표준화된 방식으로 부호화해야 합니다.해당 조치의 참가자, 조치 시점, 채무액 및 계산 통화, 지급 허용 시간, 요구된 지급 형식 및 기타 정보.두 개 이상의 시스템이 그러한 요청에서 정보를 해석하는 방법에 대해 합의했을 때, 그들은 그 특정 유형의 트랜잭션에 대한 의미적 상호 운용성을 달성할 수 있다.일반적으로 시멘틱 상호 운용성을 위해서는 상업적인 거래 이상의 의미를 기술하는 표준화된 방법을 제공할 필요가 있으며, 표현에 합의해야 하는 개념의 수는 최소 수천 개이다.

온톨로지 조사

제한된 시나리오에서 의미적 상호운용성을 달성하는 방법은 현재 연구와 논의의 문제이다.일반 시맨틱 상호 운용성의 문제에 대해서는, 복수의 도메인에서 보다 전문화된 온톨로지를 위한 개념의 정의를 제공할 수 있을 만큼 충분히 포괄적인 기초 온톨로지('상위 온톨로지')의 형태가 필요하다.지난 10년 동안 10개 이상의 기반 온톨로지가 개발되었지만, 아직까지 광범위한 사용자 기반에 채택된 것은 없습니다.

시멘틱 상호 운용성을 지원하기 위한 하나의 포괄적인 온톨로지의 필요성은 로컬 도메인 온톨로지 또는 로컬 데이터베이스에서 사용되는 용어의 의미를 논리적으로 기술하기 위해 조합할 수 있는 기본("primitive") 개념 세트로서 공통 기반 온톨로지를 설계함으로써 피할 수 있습니다.이 전술은 다음 원칙에 기초하고 있습니다.

다음 경우:

(1) 기초온톨로지에서의 원시온톨로지 요소의 의미와 용도를 합의하고, (2) 도메인온톨로지에서의 온톨로지 요소를 기초온톨로지 요소의 논리적 조합으로 구성한다.

그 후, 다음과 같이 입력합니다.

도메인 온톨로지 요소의 의도된 의미는 기본 온톨로지 요소의 의미를 받아들이고 도메인 온톨로지 요소의 논리적 사양을 모두 갖는 시스템에 의해 FOL(일차 논리) 추론기를 사용하여 자동으로 계산될 수 있습니다. 

그 때문에,

다른 시스템과의 정확한 상호 운용을 원하는 시스템은 통신할 데이터만 전송하면 됩니다.또, 로컬로 작성되어 아직 공통의 기초 온톨로지에는 없는, 그 데이터에 사용되는 용어의 논리적인 기술도 필요합니다. 

이 방법에서는 의미에 대한 사전 합의가 공통 Foundation Ontology(FO)의 온톨로지 요소에만 한정됩니다.몇 가지 고려사항을 바탕으로 하면 필요한 요소(유형 및 관계)는 10,000개 미만일 수 있습니다.다만, 보다 상세한 내용과 상세한 내용을 포함한 온톨로지 요소가 많아지면, FO내의 특정의 도메인 개념을 찾아내거나 추가할 수 있는 정확한 장소를 찾아낼 수 있습니다.

실제로, 원시 개념의 표현에 초점을 맞춘 FO와 함께, FO 요소를 사용하여 지정된 요소를 가진 FO에 대한 도메인 확장 온톨로지 세트도 사용될 수 있습니다.이러한 기존 확장은 의도된 의미를 가진 기존 요소를 제공함으로써 도메인 온톨로지 작성 비용을 절감하고 이미 테스트된 요소를 사용함으로써 오류 발생 가능성을 줄일 수 있습니다.도메인 확장 온톨로지는 논리적으로 서로 모순될 수 있으며, 어떤 통신에서도 다른 도메인 확장이 사용되는지 판단해야 합니다.

이러한 단일 기반 온톨로지의 사용 자체가 독자적으로 개발된 온톨로지 간의 정교한 매핑 기법에 의해 회피될 수 있는지 여부도 조사 중이다.

중요성

의미적 상호운용성의 실질적인 중요성은 의미적 상호운용성의 결여로 인한 비용(효율성 손실)을 추정하는 여러 연구에 의해 측정되었다.의료 정보 전달의 효율성 상실에 초점을 맞춘 [4]한 연구에서는 이 분야에서 효과적인 상호 운용성 표준을 구현함으로써 연간 778억 달러를 절감할 수 있을 것으로 추정했습니다.건설[5] 산업과 자동차 제조 [6]공급망에 관한 다른 연구에서는 이러한 산업에서의 의미적 상호 운용성의 결여로 인해 연간 100억 달러 이상의 비용이 발생할 것으로 추산하고 있다.전체적으로 이러한 수치는 미국에서만 널리 사용되는 의미적 상호 운용성 표준이 없기 때문에 연간 1,000억 달러 이상의 손실이 발생하고 있음을 나타내기 위해 추정할 수 있다.

의미적 상호 운용성 표준을 적용하여 비용을 크게 절감할 수 있는 각 정책 분야에 대한 연구는 아직 없습니다.그러나 의미적 상호 운용성을 통해 이익을 얻을 수 있는 정책 필드를 확인하려면 일반적으로 '상호 운용성'을 참조하십시오.이러한 정책 분야에는 전자정부, 보건, 보안 등이 있습니다.EU는 또한 2007년 6월에 시멘틱 상호 운용성 센터를 설립하였다.

사물인터넷을 위한 시멘틱 상호운용성

디지털 전환은 조직이 비즈니스 및 운영 환경의 변화에 보다 효율적이고 유연하며 민첩하게 대응할 수 있도록 하는 데 큰 이점이 있습니다.여기에는 조직 전체에 걸쳐 이기종 데이터와 서비스를 통합해야 합니다.시멘틱 상호 운용성은 의미와 문맥에 대한 공유 이해의 필요성에 대처합니다.

이를 지원하기 위해 ISO/IEC JTC1, ETSI, oneM2M 및 W3C가 참여하는 교차 조직 전문가 그룹이 AIOTI와 협력하여 IoT에서의 의미 기술 채택을 가속화하고 있습니다.이 그룹은 최근 시맨틱 IoT 솔루션 - 개발자 관점'과 '온톨로지에 기반한 시맨틱 상호운용성 표준 지향'이라는 이름의 시맨틱 상호운용성에 관한 두 개의 공동 백서를 발표했습니다.이것은, 「사물의 웹을 위한 시맨틱 상호 운용성」에 관한 이전의 백서의 성공에 이은 것입니다.


출처:

"Semantic IoT 솔루션– 개발자 관점"

"온톨로지 기반의 시맨틱 상호운용성 표준을 지향합니다."

이것은, 「사물의 웹을 위한 시맨틱 상호 운용성」에 관한 이전의 백서의 성공에 이은 것입니다.

https://www.w3.org/blog/2019/10/aioti-iso-iec-jtc1-etsi-onem2m-and-w3c-collaborate-on-two-joint-white-papers-on-semantic-interoperability-targeting-developers-and-standardization-engineers/

「 」를 참조해 주세요.

레퍼런스

  1. ^ NCOIC, "SCOPE", 네트워크 중심 운영 산업 컨소시엄, 2008
  2. ^ Berners-Lee, Tim; Fischetti, Mark (1999). Weaving the Web. HarperSanFrancisco. chapter 12. ISBN 978-0-06-251587-2.
  3. ^ Web에서의 시멘틱 상호 운용성 시멘틱 상호 운용성을 위한 툴로서의 XML, Jeff Heflin 및 James Hendler
  4. ^ Jan Walker, Eric Pan, Douglas Johnston, Julia Adler-Milstein, David W. Bates 및 Blackford Middleton, 의료정보 교환상호운용성 보건업무의 가치, 2005년 1월 19일
  5. ^ Microsoft Word - 08657 최종 Rpt_8-2-04.doc
  6. ^ "Archived copy" (PDF). Archived from the original (PDF) on 2012-06-16. Retrieved 2017-07-13.{{cite web}}: CS1 maint: 제목으로 아카이브된 복사(링크)

외부 링크