온톨로지 학습

Ontology learning

온톨로지 학습(온톨로지 추출, 온톨로지 생성 또는 온톨로지 획득)은 온톨로지의 자동 또는 반자동 생성으로 자연어 텍스트의 말뭉치에서 대응하는 도메인의 용어 및 이들 용어가 나타내는 개념 의 관계를 추출하여 온톨로지 언어로 인코딩합니다.쉽게 검색할 수 있습니다.온톨로지를 수동으로 구축하는 것은 노동 집약적이고 시간이 많이 걸리기 때문에 프로세스를 자동화할 수 있는 큰 동기가 있습니다.

일반적으로 이 프로세스는 part-of-speech taging 및 prase chunking 등의 언어 프로세서를 사용하여 일반 텍스트에서 용어 및 개념 또는 명사 구문을 추출하는 것으로 시작합니다.그런[1] 다음 종종 패턴 기반[4] 또는 정의[5] 기반 하이퍼님 추출 기술에 기반하여 관계 서명을 추출하기 위해 통계적 또는[2][3] 심볼릭 기법이 사용됩니다.

절차.

온톨로지 학습(OL)은 자연어 [6][7]텍스트에서 전체 온톨로지를 자동으로 추출하는 데 사용됩니다.프로세스는 보통 다음 8개의 과제로 나누어져 있으며, 모든 온톨로지 학습 시스템에 반드시 적용되는 것은 아닙니다.

도메인 용어 추출

도메인 용어 추출 단계에서 도메인 고유의 용어를 추출하고, 다음 단계(개념 발견)에서 개념을 도출한다.관련 용어는 예를 들어 TF/IDF 값을 계산하거나 C-값/NC-값 방법을 적용하여 결정할 수 있다.결과 용어 목록은 도메인 전문가가 필터링해야 합니다.다음 단계에서는 정보 추출에서의 상호 참조 해결과 마찬가지로 OL 시스템은 동의어를 결정한다.이는 그것들이 같은 의미를 공유하기 때문에 동일 개념에 대응하기 때문이다.따라서 가장 일반적인 방법은 클러스터링과 통계적 유사성 측정의 적용이다.

개념의 발견

개념 발견 단계에서 용어는 의미 베어링 단위로 그룹화되며, 이는 세계의 추상화에 대응하며, 따라서 개념에 대응한다.그룹화된 용어는 도메인 용어 추출 단계에서 식별된 이러한 도메인 고유 용어와 동의어입니다.

개념 계층 구조 도출

개념 계층 도출 스텝에서 OL 시스템은 추출된 개념을 분류학적 구조로 배열하려고 한다.이는 대부분 비지도 계층 클러스터링 방법을 통해 달성됩니다.이러한 방법의 결과는 종종 노이즈가 발생하기 때문에 사용자 평가와 같은 감독 단계가 추가된다.하위 또는 초대 관계를 나타내야 하는 여러 패턴의 사용에는 개념 위계질서의 도출을 위한 추가 방법이 존재한다."X, that is a Y" 또는 "X is a Y"와 같은 패턴은 X가 Y의 하위 클래스임을 나타냅니다.그러한 패턴은 효율적으로 분석될 수 있지만, 그러한 패턴은 종종 너무 드물게 발생하여 충분한 하위 또는 초과 관계를 추출할 수 없다.대신 부트스트래핑 방식이 개발되어 이러한 패턴을 자동으로 학습하므로 커버리지가 확대됩니다.

비택시 관계의 학습

비택시적 관계 단계를 학습할 때, 하위 또는 초상을 표현하지 않는 관계가 추출된다.이러한 관계는 예를 들어, 작업자 또는 위치입니다.이 하위 작업을 해결하기 위한 두 가지 일반적인 방법이 있습니다.첫 번째는 익명의 어소시에이션의 추출에 근거하고, 두 번째 단계에서 적절히 명명됩니다.두 번째 접근법은 주변 단어로 표현되는 실체 간의 관계를 나타내는 동사를 추출한다.정확성을 보장하기 위해 두 접근법의 결과를 존재학자가 평가해야 한다.

규칙 검출

규칙 [8]검출 에 추출된 개념에 대해 공리(개념의 형식 설명)가 생성됩니다.예를 들어 자연어 정의의 구문 구조와 결과 종속성 트리에 대한 변환 규칙의 적용을 분석함으로써 이를 달성할 수 있다.이 과정의 결과는 공리의 목록이며, 그 후에 개념 설명으로 이해됩니다.이 출력은 온톨로지스트에 의해 평가됩니다.

온톨로지 집단

이 단계에서 온톨로지는 개념과 속성의 인스턴스로 증강됩니다.개념 인스턴스와의 증강을 위해 사전 구문 패턴의 매칭에 기초한 메서드가 사용됩니다.속성 인스턴스는 관계 튜플을 수집하는 부트스트래핑 메서드를 통해 추가됩니다.

개념 계층 확장

이 단계에서 OL 시스템은 기존 온톨로지의 분류학적 구조를 추가 개념으로 확장하려고 한다.이는 훈련된 분류기를 사용한 감독 방식 또는 유사성 측정의 적용을 통해 감독되지 않은 방식으로 수행될 수 있다.

프레임 및 이벤트 검출

프레임/이벤트 검출 중에 OL 시스템은 텍스트에서 복잡한 관계를 추출하려고 합니다.예를 들어 누가 어디서 어떤 장소에서 언제 출발했는지 등입니다.접근방식은 커널 메서드를 사용한SVM 적용부터 시멘틱라벨링([10]SRL)[9]까지 상세 시멘틱 해석 기술에 이르기까지 다양합니다.

도구들

Dog4Dag(Dresden Ontology Generator for Directed Acyclic Graphs)는 Protégé 4.1 및 OBOEdit 2.1용 온톨로지 생성 플러그인입니다.항 생성, 형제 생성, 정의 생성 및 관계 유도를 허용합니다.Protégé 4.1 및 OBO-Edit 2.1에 통합된 DOG4DAG는 모든 일반적인 온톨로지 형식(OWL 및 OBO 등)에 대해 온톨로지 확장을 가능하게 합니다.주로 EBI 및 Bio Portal Lookup Service [11]확장에 한정됩니다.

「 」를 참조해 주세요.

참고 문헌

레퍼런스

  1. ^ A. Maedche와 S.시맨틱 웹을 위한 온톨로지 학습.시맨틱 웹 Worskhop 2001에서.
  2. ^ 로베르토 나발리와 파올라 벨라디.문서 웨어하우스전용사이트에서 도메인 온톨로지 학습, 컴퓨터 언어학, 30(2), MIT Press, 2004, 페이지 151-179.
  3. ^ P.Velardi, S.Faralli, R.항해사ToLearn 새로고침: 분류법 유도를 위한 그래프 기반 알고리즘.컴퓨터 언어학, 39(3), MIT Press, 2013, 페이지 665-707.
  4. ^ 마르티 A.허스트큰 텍스트 말뭉치에서 하이포니어를 자동으로 가져옵니다.제14회 컴퓨터 언어학 국제회의의 진행에서 539-545쪽, 프랑스 낭트, 1992년 7월.
  5. ^ R. Navigli, P. Velardi정의하이퍼나임 추출을 위한 워드 클래스 격자를 학습합니다.제48회 컴퓨터 언어학 협회 연차총회(ACL 2010), 스웨덴, 웁살라, 2010년 7월 11-16일, 페이지 1318-1327.
  6. ^ 시미아노, 필리핀, 볼커, 요한나, 스터더, 루디(2006)."온 디맨드형 온톨로지?" - 온톨로지 학습을 위한 최신 기술, 응용 프로그램, 과제 및 트렌드 텍스트", 정보, Wissenschaft und Praxis, 57, 페이지 315 - 320, http://people.aifb.kit.edu/pci/Publications/iwp06.pdf (영어: 18.06.2012)
  7. ^ Wong, W., Liu., W. & Bennamoon, M.(2012), "텍스트에서 배우는 온톨로지 학습: A Look back and to the future."ACM Computing Surveies, Volume 44, 제4호, 20:1~20:36 페이지.
  8. ^ Johanna Völker, Pascal Hitzler, Cimiano, 필리핀(2007)."Lexical Resources로부터의 OWL DL Axioms 획득", 시맨틱 웹에서 제4회 유럽 회의 진행, 페이지 670 - 685, http://smartweb.dfki.de/Vortraege/lexo_2007.pdf (제18.06.2012)
  9. ^ 코폴라 B., 간게미 A., 글리조 A.;Picca D.; Presutti V. (2009년)"시맨틱 웹을 통한 프레임 검출", 유럽시맨틱 회의 진행(ESWC2009), Springer, 2009.
  10. ^ Presutti V., Draicchio F., Gangemi A. (2009년)"담화 표현 이론과 언어학적 틀에 기초한 지식 추출", 지식 엔지니어링지식 관리 회의(ECAW2012), LNCS, Springer, 2012.
  11. ^ 토마스 베흐터, 괴츠 파비안, 마이클 슈로더: DOG4DAG: OBO-Edit 및 Protégé에서의 반자동 온톨로지 생성.SWAT4LS London, 2011.doi:10.1145/2166896.2166926 http://www.biotec.tu-dresden.de/research/schroeder/dog4dag/