언어 링크 오픈 데이터

Linguistic Linked Open Data

자연어 처리, 언어학 및 인접 분야에서 LLOD(Languistic Linked Open Data)Linked Data 원칙에 따라 언어 자원의 작성, 공유 및 (재사용)에 관한 방법 및 학제간 커뮤니티를 기술합니다.Languistic Linked Open Data Cloud는 Open Knowledge Foundation의 OWLG(Open Languageistics Working Group)가 구상하고 유지 보수하고 있지만, 그 이후 여러 W3C 커뮤니티 그룹, 연구 프로젝트 및 인프라스트럭처의 주요 활동 지점이 되었습니다.

정의와 개발

LLOD 클라우드(2016-05-24)

Languistical Linked Open Data는 [1]다음 원칙을 사용하여 언어학 및 자연어 처리를 위한 데이터 공개를 설명합니다.

  • 데이터는 Creative Commons 라이선스와 같은 라이선스를 사용하여 공개 라이선스를 받아야 합니다.
  • 데이터 집합의 요소는 URI를 통해 고유하게 식별되어야 합니다.
  • 사용자가 웹 브라우저를 사용하여 더 많은 정보에 액세스할 수 있도록 URI가 해결되어야 합니다.
  • LLOD 리소스를 해결하려면 RDF(Resource Description Framework) 의 웹 표준을 사용하여 결과를 반환해야 합니다.
  • 사용자가 새로운 자원을 발견하고 의미론을 제공할 수 있도록 다른 자원에 대한 링크를 포함해야 합니다.

LLOD의 주요 이점은 다음과 같습니다.[2]

  • 표현:링크된 그래프는 언어 데이터에 대한 보다 유연한 표현 형식입니다.
  • 상호 운용성:일반적인 RDF 모델은 쉽게 통합할 수 있습니다.
  • 페더레이션:복수의 소스로부터의 데이터를 3회 조합할 수 있습니다.
  • 생태계:RDF 및 링크된 데이터용 툴은 오픈 소스 라이선스로 널리 이용 가능합니다.
  • 표현력:기존의 어휘들은 언어적 자원을 표현하는데 도움이 된다.
  • 의미론:공통 링크는 무엇을 의미하는지 나타냅니다.
  • 동적:웹 데이터를 지속적으로 개선할 수 있습니다.

LLOD 클라우드 다이어그램의 홈페이지는 linguistic-lod[3].org에 있습니다.

LLOD 어휘

LLOD 커뮤니티는 메타데이터를 수집하고 LLOD 클라우드 다이어그램을 생성하는 것 외에도 어휘, 메타데이터 및 베스트 프랙티스 권장사항에 관한 커뮤니티 표준 개발을 추진하고 있습니다.

Cimiano et al. (2020)[4]의 최신 개요에 따르면, 여기에는 다음이 포함됩니다.

  • 어휘 자원을 모델링하기 위해
    • ToLlex-Lemon, 어휘 자원 커뮤니티 표준 (기계 판독 가능한 사전, 다국어 용어, 온톨로지 어휘화)[5]
  • 언어 주석 모델링용(말뭉치 또는 NLP)
    • 웹 리소스 주석을 위한 W3C 표준인 웹 주석(텍스트 또는 기타)[6]
    • NLP Interchange Format(NIF), 텍스트 문법 주석[7] 커뮤니티 표준
    • CoNLL-RDF: 기존 TSV("CoNLL") 형식의[8] 말뭉치를 RDF 표현하기 위한 NIF 기반 어휘
    • POWLA: NIF, CoNLL-RDF 또는 웹 주석을[9] 보완하기 위해 사용할 수 있는 범용 언어 데이터 구조 용어
  • 언어 데이터 카테고리의 경우
  • 언어 식별을 위해
  • 메타데이터용
    • 더블린 코어: 웹 리소스를 설명하는 데 사용할 수 있는 커뮤니티 용어 표준
    • Data Catalog Vocularies(DCAT), 웹에[13] 게시된 데이터 카탈로그의 W3C 표준
    • METASARE-OWL, 언어 리소스[14] 메타데이터용 어휘

2020년 중반 현재, 이러한 커뮤니티 표준의 대부분은 적극적으로 임하고 있습니다.특히 문제가 되는 것은 언어 주석에 대해 호환되지 않는 여러 표준이 존재한다는 것입니다. 2020년 초, W3C 커뮤니티 그룹 언어 기술 링크드 데이터(Linked Data for Language Technology)는 [15]웹에서 언어 주석에 대한 이러한 (및 기타) 어휘의 통합을 위해 작업하기 시작했습니다.

지역 사회

LLOD 클라우드 다이어그램은 개방형 언어 리소스 전문가로 구성된 Open Knowledge Foundation(2014년 이후)의 OWLG(Open Languageology Working Group)에 의해 개발되어 관리되고 있습니다.

OWLG는 커뮤니티 이벤트를 조직하고 LLOD 개발을 조정하며 LLOD 기여자와 사용자 간의 학제 간 커뮤니케이션을 촉진합니다.

몇몇 W3C 비즈니스 및 커뮤니티 그룹은 LLOD의 특수한 측면에 초점을 맞추고 있습니다.

  • W3C Ontology-Lexica Community Group(Ontlex)은 LLOD 클라우드에서 기계 판독 가능한 사전의 사양을 개발하고 유지합니다.
  • 다국어 링크 오픈 데이터 커뮤니티 그룹의 W3C 베스트 프랙티스에서는 다국어 링크 오픈 데이터를 [16]작성하기 위한 베스트 프랙티스에 대한 정보를 수집합니다.
  • W3C Linked Data for Language Technology Community Group은 Linked [17]Data를 사용하는 언어 테크놀로지 어플리케이션의 사용자 사례와 요건을 정리합니다.

LLOD 개발은 일련의 국제 워크숍, 데이터톤 및 관련 출판물에 의해 추진되고 문서화됩니다.그 중에서도 다음과 같은 것이 있습니다.

  • Linked Data in Languistics(LDL) 연례 과학 워크숍, 2012년 시작
  • 다국어 MLODE(Linked Open Data for Enterprise), 격년 커뮤니티 미팅(2012년 및 2014년)
  • 2015년부터 SD-LLOD(언어 연계 오픈 데이터) 여름 데이터톤, 격년 데이터톤

LLOD의 응용 프로그램

Languical Linked Open Data는 다음과 같은 과학적 연구 문제를 해결하기 위해 적용됩니다.

  • 경험적 언어학, 컴퓨터 언어학 및 자연어 처리의 모든 영역에서 언어 주석과 언어 표기는 분석의 중심 요소를 나타냅니다.그러나 이 분야의 진보는 상호운용성 과제, 특히 다른 자원과 도구에 사용되는 어휘와 주석 체계에서의 차이로 인해 방해받고 있다.Linked Data를 사용하여 언어 리소스 및 온톨로지/용어 저장소를 연결하면 공유 어휘를 재사용하고 공통 기반으로 해석할 수 있습니다.
  • 말뭉치 언어학 및 계산 언어학에서 중복 마크업은 기존의 XML 형식에서 악명 높은 문제입니다.따라서 그래프 기반 데이터 모델은 1990년대 [18]후반부터 제안되어 왔다.이러한 파일은 일반적으로 여러 개의 상호 연결된 XML 파일(스탠드오프 XML)[19][20]로 표시되며, 이러한 파일은 시판 XML 기술에서 제대로 지원되지 않습니다.Linked Data와 같은 복잡한 주석을 모델링하는 것은 의미적으로는 교착 [21]XML과 동등한 형식주의를 나타내지만 특수 목적 기술이 필요하지 않고 기존 RDF 생태계에 의존합니다.
  • 글로벌 WordNet Association의 Interlangual Index에서 수행된 WordNet과 같은 어휘 자원의 링크와 BabelNet에서 수행된 WordNet과 Wikipedia와 같은 이종 자원의 상호 연결을 포함한 다국어 문제.
  • 언어 자원 정보의 표준화를 위한 포럼 제공

Languical Linked Open Data는 다음과 같은 개발과 밀접하게 관련되어 있습니다.

선정연구과제

LLOD의 사용 및 개발은 다음과 같은 여러 대규모 연구 프로젝트의 대상이 되어 왔다.

  • LOD2. 연동된 데이터를 활용한 지식 창조 (11개 EU 국가 + 한국, 2010–[22]2014)
  • MONNET. 네트워크 지식을 위한 다국어 온톨로지 (2010-2013년)[23]
  • LIDER. Linked Data는 유럽 전역의 기업을 위한 크로스 미디어 및 다국어 콘텐츠 분석을 가능하게 합니다(EU 5개국, 2013-2015).[24]
  • QTLeap. 심층 언어 엔지니어링 접근법에 의한 품질 번역 (2013~2016년 [25]6개 EU 국가)
  • LiODI. Linked Open Dictionary (BMBF eHumanities Early Career Research Group,[26] 2015-2020)
  • FREME. 디지털 콘텐츠의 다국어 및 의미 강화를 위한 E-Services의 개방형 프레임워크 (2015-2017년)[27]
  • POSTDATA시 표준화 및 링크드 오픈 데이터(ERC Starting Grant, UNED, 스페인, 2016-2021)[28]
  • 링크 라틴어(ERC Consolidator Grant, Universita Cattolica del Sacro Cuore, 이탈리아, 2018-2023)[29]
  • 프리 어 로드 (유럽연합 [30]5개국, 2019-2021년)
  • NexusLinguarum.유럽 웹 중심 언어 데이터 과학 네트워크(COST Action, 35개 COST 국가, 인접 국가 2개, 국제 파트너 국가 1개, 2019-2023년)

선택한 자원

2018년 10월 현재, LLOD 다이어그램에서 가장 자주 연결된 10개의 리소스는 다음과 같습니다(링크된 데이터 세트 수 순서대로).

  • 언어 주석의 온톨로지(OLiA, 74개의 데이터 세트와 연동)는 언어 주석 및 문법 메타데이터에 대한 참조 용어를 제공합니다.
  • WordNet(51개 데이터셋과 연결), 영어용 사전 데이터베이스 및 다른 언어의 유사한 데이터베이스 개발을 위한 피벗(Princeton 버전은 36개 데이터셋과 연결, W3C 버전은 8개 데이터셋과 연결, VU 버전은 7개 데이터셋과 연결)
  • DBpedia(데이터셋 50개와 연동) Wikipedia를 기반으로 한 일반적인 세계 지식의 다국어 지식 기반
  • lexinfo.net(36개의 데이터셋과 링크)은 어휘 자원에 대한 참조 용어를 제공한다.
  • BabelNet(33개의 데이터 세트와 연계) 다국어 어휘화 시맨틱 네트워크, 특히 WordNet과 Wikipedia의 기타 다양한 자원 집약을 기반으로 한다.
  • lexvo.org (26개의 데이터셋과 링크)는 언어 식별자 및 기타 언어 관련 데이터를 제공합니다.가장 중요한 것은 lexvo가 언어 식별자와 이러한 언어에 대한 정보를 위해 ISO 639-3 3글자 코드의 RDF 표현을 제공한다는 것입니다.
  • ISO 12620 Data Category Registry(ISOcat; RDF 에디션, 10개의 데이터셋과 링크됨)는 다양한 언어 관련 용어를 위한 반구조화된 저장소를 제공합니다.ISOcat은 언어 아카이브(The Language Archive)에 의해 Max Planck Institute for Psycholinguistics에서 각각 DOBES 프로젝트를 주최하고 있지만 현재 CLARIN으로 전환 중이다.
  • 다양한 어휘 자원에서 집계된 영어 어휘 네트워크인 UBY(RDF 버전 레몬-Uby, 9개의 데이터 세트와 연결됨)
  • Glottolog(7개의 데이터셋과 링크)는 특히 lexvo.org에서 다루지 않는 저자원 언어에 대해 세분화된 언어 식별자를 제공합니다.
  • Wiktionary-DBpedia 링크(wiktionary.dbpedia.org, 7개의 데이터셋과 링크), DBpedia 개념을 위한 Wiktionary 기반 어휘화.

양상

용어의 다양한 측면, 적용 가능성 및 특정 유형의 [32]자원에 관한 많은 반복적인 논의가 있다.

언어 데이터: 범위와 분류

LLOD 클라우드 다이어그램에는 언어 연구에 사용되고 작성된 리소스 외에도 원래 언어 과학이나 언어 기술(예: DBpedia)에 대한 관심에서 비롯된 개발이 아닌 온톨로지, 용어 및 일반 지식 기반도 포함됩니다.LLOD 다이어그램에 포함하기 위한 기준으로 OWLG는 "언어적 관련성"을 요구합니다. "[A] 데이터 집합이 언어 연구 또는 자연 언어 [33]처리 목적으로 사용할 수 있는 언어 데이터를 제공하거나 설명하는 경우 언어적 관련성이 있습니다."여기에는 엄밀한 의미의 언어자원(「조건 1」)이 포함됩니다.「언어학 관련 저널이나 회의의 과학 출판물에 의해서 실증되고 있는 것처럼, 언어 과학이나 언어 테크놀로지에 적용하기 위해서 작성된 주석 첨부 또는 그 외의 구조화된 자원」도 포함됩니다.또, 「주석에 사용할 수 있는 자원입니다.언어 리소스 리치화, 검색 또는 분류...자원(언어적 관련성은 확인되어야 함)과 자원 충족 조건 (1)"("조건 2")[34] 사이의 연계가 존재하는지 여부를 확인할 수 있다.

관련 문제는 언어적으로 관련된 데이터 세트(또는 일반적인 언어 리소스)의 분류입니다.OWLG는 LLOD 클라우드 [35]다이어그램에 대해 다음과 같은 분류를 개발했습니다.

  • corpa: 언어적으로 분석된 언어 데이터 수집
  • 어휘: 어휘 개념 데이터
  • 메타데이터
    • 언어 자원 메타데이터(언어 자원, 디지털 언어 자원 및 인쇄 서적 포함)
    • 언어 데이터 카테고리(언어 용어집 등)언어 카테고리, 언어 식별자)
    • 유형 데이터베이스(개별 언어, 특히 해당 언어의 언어적 특징에 대한 정보)
  • 기타(아직 [1]분류되지 않은 자원의 플레이스 홀더)

이 분류에서 용어 베이스는 문법적인 정보를 제공하지 않는다는 점에서 약간 다를 수 있지만, 의미 지식을 공식화하기 때문에 명명된 개체 인식이나 아나포라 해결과 같은 자연 언어 처리 작업에 내재적인 관련성을 갖는다.


데이터 열기:유용성

LLOD는 Linked Open Data와 관련하여 정의되므로 LLOD 리소스(데이터)는 Open [36]Definition에 따라 라이선스에 적합해야 합니다.그러나 LLOD 클라우드 다이어그램(및 LOD 다이어그램)을 생성하는 경우에는 아직 이 사항이 시행되지 않은 것 같습니다. 따라서 기술 기준은 웹을 통한 가용성 및 메타데이터 항목입니다.OWLG에서는 비상업적(학술적) 자원을 현재(2015년) 인정하되 LLOD 클라우드의 성장과 함께 보다 엄격한 요건을 적용하는 일반적인 합의 하에 포함시킬 수 있을지에 대해 여러 차례 논의되어 왔다.2018년 1월 현재, 언제 [37]이사가 이루어질지는 아직 합의되지 않았다.2020년 1월 현재 86개의 LLOD 리소스에 대해 기계 판독 가능한 라이센스 메타데이터를 사용할 수 있으며, 이 중 82개의 채택된 오픈 라이센스,[38] 4개의 채택된 비상업 라이센스입니다.

보다 넓은 의미에서 LLOD 기술(인프라, 도구, 용어)이라는 용어는 예를 들어 여러 상업적 비즈니스 [39]케이스를 특징으로 하는 EU 프로젝트 Pret-a-LOD의 이름으로 실제로 오픈 리소스가 관련되어 있는지 여부와는 독립적으로 기술을 지칭하는 데 사용될 수 있다.이는 오픈 데이터를 소비하는(제공하는 것이 아니라) 애플리케이션에 대해 정당화될 수 있지만, 링크드 데이터 기술과 다른 LLOD 표기법(특히 LLOD의 맥락에서 개발된 RDF 용어 사용)을 적용하여 LLOD 자원(오픈 리소스)의 원활한 통합을 촉진할 수도 있습니다.

약어 "LLOD"는 LLOD 테크놀로지(Linked Data 및 LLOD 어휘 사용, 처리 중인 데이터의 법적 상태와는 무관)와 LLOD 자원(오픈 데이터) 중 하나를 나타낼 때 사용할 수 있습니다.명확화를 위해 "LLOD 자원" 및 "LLOD 기술"이라는 용어를 사용할 수 있습니다.오픈되지 않은 자원에 대한 응용 또는 응용성을 강조하기 위해 "LLD"(Languistic Linked Data)도 [40]사용되었습니다.가능한 절충안은 이 테크놀로지의 약어인 "LL(O)D"입니다.오픈되지 않은 리소스를 포함하는 "Licensed Languistic Linked Data" 클라우드는 현재([38]2020년 6월) 존재하지 않습니다.

링크된 데이터: 형식

Linked Data를 정의하려면 RDF 또는 관련 표준을 적용해야 합니다.여기에는 W3C 권장 SPARQL, Turtle, JSON-LD, RDF-XML, RDFa 등이 포함됩니다.그러나 언어 기술 및 언어 과학에서는 현재 다른 형식이 더 널리 사용되고 있으며, 이러한 데이터를 LLOD 클라우드 다이어그램에 포함시키는 것이 때때로 [32]요청되었습니다.이러한 언어에는 W3C 표준 래핑 메커니즘이 있습니다(XML, CSV, 관계형 데이터베이스 ).Knowledge extraction # 를 참조해 주세요.구조화된 소스에서 RDF로의 추출) 및 이러한 데이터는 소스 데이터와 함께 대응하는 매핑을 제공하는 조건으로 통합될 수 있다.

선정 문헌

LLOD에 관한 최신 기술에 대한 자세한 설명은 다음과 같습니다.

  • 필리핀, 치미아노, 기독교, 맥크레이, 존 P., 그라시아, 호르헤(2020).언어 링크 데이터: 표현, 세대 및 응용 프로그램.스프링거 인터내셔널 퍼블리싱

Languistical Linked Open Data 클라우드의 개념은 원래 다음과 같이 도입되었습니다.

  • Chiarcos, Christian, Hellmann, Sebastian 및 Nordhoff, Sebastian(2011).Languistical Linked Open Data 클라우드:오픈 언어학 워킹 그룹.TAL(Traitement Automatique des Langues), 52(3), 245-275.

이 주제에 관한 첫 번째 책은

  • Christian Chiarcos, Sebastian Nordhoff 및 Sebastian Hellmann (eds., 2012).언어학 링크 데이터언어 데이터 및 언어 메타데이터를 표현하고 연결합니다.스프링거, 하이델베르크

Cimiano et al. (2020)[41]에 따르면, 그 이후 다른 주요 출판물은 다음을 포함한다.

  • 크리스찬 키아르코스, 스티븐 모란, 파블로 N. 멘데스, 세바스찬 노르드호프, 리처드 리타우어.언어 자원의 Linked Open Data 클라우드 구축:동기부여와 발전.Iryna Gurevych와 Jungi Kim(에드)에서는 The People's Web Meets NLP.협업으로 구성된 언어 리소스.스프링거, 하이델베르크, 2013년
  • 크리스찬 치아르코스, 존 맥크레이, 필립 치미아노, 크리스찬 펠바움.언어학을 위한 오픈 데이터: Lexical Linked Data.Alessandro Oltramari, Pik Vossen, Lu Qin 및 Eduard Hovy(에드)에서 온톨로지 및 어휘 자원의 새로운 경향 연구.스프링거, 하이델베르크, 2013년
  • 호르헤 그라시아, 엘레나 몬티엘 폰소다, 필리프 치미아노, 아순시온 고메즈 페레스, 폴 부이텔라르, 존 맥크레.다국어 데이터 웹에 관한 과제.웹 의미론 저널, vol. 11, 페이지 63-71.엘세비어 B.V., 2012.

2015년부터 2019년까지의 개발은 수집된 볼륨으로 다음과 같이 요약된다.

  • 안토니오 파레야로라, 바바라, 블룸, 마리아, 치아르코스, 크리스찬(ed., 2020).언어 과학에서의 데이터 집약적인 공동 연구를 위한 언어학 링크 오픈 데이터 자원 개발.MIT 프레스

레퍼런스

  1. ^ a b Open Linguistics Working Group. "Linguistic LOD". linguistic-lod.org. LIDER project. Retrieved 2016-05-24.
  2. ^ Chiarcos, Christian; McCrae, John; Cimiano, Philipp; Fellbaum, Christiane (2013). Towards open data for linguistics: Lexical Linked Data (PDF). Heidelberg: In: Alessandro Oltramari, Piek Vossen, Lu Qin, and Eduard Hovy (eds.), New Trends of Research in Ontologies and Lexical Resources. Springer. Retrieved 2016-05-24.
  3. ^ "Linguistic Linked Open Data. Information about the current status of the growing cloud of linguistic linked open data". Retrieved 10 December 2019.
  4. ^ Cimiano, Philipp; Chiarcos, Christian; McCrae, John P.; Gracia, Jorge (2020). Linguistic Linked Data: Representation, Generation and Applications. Springer International Publishing. ISBN 978-3-030-30224-5.
  5. ^ "Lexicon Model for Ontologies: Community Report, 10 May 2016". www.w3.org. Retrieved 2020-06-05.
  6. ^ "Deliverables of W3C's Web Annotation Working Group". w3c.github.io. Retrieved 2020-06-05.
  7. ^ Hellmann, Sebastian; Lehmann, Jens; Auer, Sören; Brümmer, Martin (2013). Alani, Harith; Kagal, Lalana; Fokoue, Achille; Groth, Paul; Biemann, Chris; Parreira, Josiane Xavier; Aroyo, Lora; Noy, Natasha; Welty, Chris (eds.). "Integrating NLP Using Linked Data". The Semantic Web – ISWC 2013. Lecture Notes in Computer Science. Berlin, Heidelberg: Springer. 7908: 98–113. doi:10.1007/978-3-642-41338-4_7. ISBN 978-3-642-41338-4.
  8. ^ Chiarcos, Christian; Fäth, Christian (2017). Gracia, Jorge; Bond, Francis; McCrae, John P.; Buitelaar, Paul; Chiarcos, Christian; Hellmann, Sebastian (eds.). "CoNLL-RDF: Linked Corpora Done in an NLP-Friendly Way". Language, Data, and Knowledge. Lecture Notes in Computer Science. Cham: Springer International Publishing. 10318: 74–88. doi:10.1007/978-3-319-59888-8_6. ISBN 978-3-319-59888-8.
  9. ^ Chiarcos, Christian (2012). Simperl, Elena; Cimiano, Philipp; Polleres, Axel; Corcho, Oscar; Presutti, Valentina (eds.). "POWLA: Modeling Linguistic Corpora in OWL/DL". The Semantic Web: Research and Applications. Lecture Notes in Computer Science. Berlin, Heidelberg: Springer. 7295: 225–239. doi:10.1007/978-3-642-30284-8_22. ISBN 978-3-642-30284-8.
  10. ^ Chiarcos, Christian; Sukhareva, Maria (2015-01-01). "OLiA – Ontologies of Linguistic Annotation". Semantic Web. 6 (4): 379–386. doi:10.3233/SW-140167. ISSN 1570-0844.
  11. ^ Cimiano, P.; Buitelaar, P.; McCrae, J.; Sintek, M. (2011-03-01). "LexInfo: A declarative model for the lexicon-ontology interface". Journal of Web Semantics. 9 (1): 29–51. doi:10.1016/j.websem.2010.11.001. ISSN 1570-8268.
  12. ^ de Melo, Gerard (2015-01-01). "Lexvo.org: Language-related information for the Linguistic Linked Data cloud". Semantic Web. 6 (4): 393–400. doi:10.3233/SW-150171. ISSN 1570-0844.
  13. ^ "Data Catalog Vocabulary (DCAT) - Version 2". www.w3.org. Retrieved 2020-06-05.
  14. ^ McCrae, John P.; Labropoulou, Penny; Gracia, Jorge; Villegas, Marta; Rodríguez-Doncel, Víctor; Cimiano, Philipp (2015). Gandon, Fabien; Guéret, Christophe; Villata, Serena; Breslin, John; Faron-Zucker, Catherine; Zimmermann, Antoine (eds.). "One Ontology to Bind Them All: The META-SHARE OWL Ontology for the Interoperability of Linguistic Datasets on the Web". The Semantic Web: ESWC 2015 Satellite Events. Lecture Notes in Computer Science. Cham: Springer International Publishing. 9341: 271–282. doi:10.1007/978-3-319-25639-9_42. ISBN 978-3-319-25639-9.
  15. ^ ld4lt/linguistic-annotation, ld4lt, 2020-05-19, retrieved 2020-06-05
  16. ^ "Best Practices for Multilingual Linked Open Data Community Group". Retrieved 9 December 2019.
  17. ^ "Linked Data for Language Technology Community Group". Retrieved 9 December 2019.
  18. ^ Bird, Steven; Liberman, Mark. "Towards a formal framework for linguistic annotations" (PDF). In: Proceedings of the International Conference on Spoken Language Processing, Sydney, 1998. Retrieved 2016-05-25.[영구 데드링크]
  19. ^ ISO 24612:2012. "Language resource management -- Linguistic annotation framework (LAF)". ISO. Retrieved 2016-05-25.
  20. ^ Eckart, Richard (2008). Choosing an XML database for linguistically annotated corpora. SDV. Sprache und Datenverarbeitung 32.1/2008: International Journal for Language Data Processing, Workshop Datenbanktechnologien für hypermediale linguistische Anwendungen (KONVENS 2008), Universitätsverlag Rhein-Ruhr, Berlin, Sep 2008. pp. 7–22.
  21. ^ Chiarcos, Christian. "Interoperability of Corpora and Annotations (draft version)" (PDF). In: Christian Chiarcos, Sebastian Nordhoff, and Sebastian Hellmann (eds.) Linked Data in Linguistics. Representing and Connecting Language Data and Language Metadata, 2012. Retrieved 2016-05-25.
  22. ^ "lod2.okfn.org (archived version)". Archived from the original on 7 March 2014. Retrieved 9 December 2019.
  23. ^ "Multilingual Ontologies for Networked Knowledge (Monnet)". European Commission, CORDIS EU research results. Retrieved 10 December 2019.
  24. ^ "LIDER: Linked Data as an enabler of cross-media and multilingual content analytics for enterprises across Europe". European Commission, CORDIS EU research results. Retrieved 10 December 2019.
  25. ^ "Quality Translation by Deep Language Engineering Approaches". European Commission, CORDIS EU research results. Retrieved 10 December 2019.
  26. ^ "Linked Open Dictionaries (LiODi)". Retrieved 10 December 2019.
  27. ^ "Open Framework of E-Services for Multilingual and Semantic Enrichment of Digital Content". Retrieved 10 December 2019.
  28. ^ "POSTDATA – Poetry Standardization and Linked Open Data". Retrieved 10 December 2019.
  29. ^ "Linking Latin. Building a Knowledge Base of Linguistic Resources for Latin". Retrieved 10 December 2019.
  30. ^ "Pret-a-LLOD project home page". Retrieved 10 December 2019. "Pret-a-LLOD". European Commission, CORDIS EU research results. Retrieved 10 December 2019.
  31. ^ "CA18209 - European network for Web-centred linguistic data science". cost. European Cooperation in Science and Technology. Retrieved 10 December 2019.
  32. ^ a b 이러한 논의에 대한 자세한 내용은 https://github.com/open-linguistics/linguistics.okfn.org/tree/master/backup에서 백업으로만 제공되는 Open Languageistics 메일링 리스트 아카이브를 참조하십시오.
  33. ^ Cimiano, Philipp; Chiarcos, Christian; McCrae, John P.; Gracia, Jorge (2020). Linguistic Linked Data: Representation, Generation and Applications. Springer International Publishing. p. 33. ISBN 978-3-030-30224-5.
  34. ^ Cimiano, Philipp; Chiarcos, Christian; McCrae, John P.; Gracia, Jorge (2020). Linguistic Linked Data: Representation, Generation and Applications. Springer International Publishing. pp. 33–34. ISBN 978-3-030-30224-5.
  35. ^ Cimiano, Philipp; Chiarcos, Christian; McCrae, John P.; Gracia, Jorge (2020). Linguistic Linked Data: Representation, Generation and Applications. Springer International Publishing. pp. 36f. ISBN 978-3-030-30224-5.
  36. ^ Chiarcos, Christian and Pareja-Lora, Antonio(2020), 개방형 데이터-열린 데이터-열린 데이터-언어적 개방형 데이터(LLOD): 일반 소개인: 파레자로라, 안토니오, 러스트, 바바라, 블룸, 마리아, 치아르코스, 크리스찬(ed.언어 과학에서의 데이터 집약적인 공동 연구를 위한 언어학 링크 오픈 데이터 자원 개발.MIT 프레스, 페이지 1-18.
  37. ^ "linguistics.okfn.org/003004.html at master · open-linguistics/linguistics.okfn.org · GitHub". GitHub. Retrieved 2020-06-05.
  38. ^ a b Cimiano, Philipp; Chiarcos, Christian; McCrae, John P.; Gracia, Jorge (2020). Linguistic Linked Data: Representation, Generation and Applications. Springer International Publishing. p. 37. ISBN 978-3-030-30224-5.
  39. ^ "Prêt-à-LLOD – Prêt-à-LLOD project website". Retrieved 2020-06-05.
  40. ^ 치미아노, 키아르코스, 그라시아, 맥크레(2020)의 책 제목을 참조하라.그러나 LLOD(2020년 6월: 7개 Google Scholar matches)와 비교하면 약어 LLD(2020년 6월: 309개 Google Scholar matches)는 거의 사용되지 않는 것으로 보인다.
  41. ^ Cimiano, Philipp; Chiarcos, Christian; McCrae, John P.; Gracia, Jorge (2020). Linguistic Linked Data: Representation, Generation and Applications. Springer International Publishing. pp. vi. ISBN 978-3-030-30224-5.