DBpedia
DBpedia개발자 | |
---|---|
초기 릴리즈 | 2007년 1월 10일 | 전
안정적 해제 | DBpedia 2016-10 / 2017년 7월 4일 |
리포지토리 | |
기록 위치 | |
운영 체제 | Virtuoso Universal Server |
유형 | |
면허증 | GNU 일반 공중 사용권 |
웹사이트 | dbpedia |
DBpedia("데이터베이스"를 위한 "DB"로부터)는 위키백과 프로젝트에서 만들어진 정보에서 구조화된 콘텐츠를 추출하는 것을 목표로 하는 프로젝트다.이 구조화된 정보는 월드 와이드 웹에서 이용할 수 있다.[1]DBpedia는 사용자가 다른 관련 데이터 집합에 대한 링크를 포함하여 위키백과 자원의 관계와 속성을 의미론적으로 질의할 수 있도록 한다.[2]
2008년에 Tim Berners-Lee는 DBpedia를 분산형 Linked Data 노력의 가장 유명한 부분 중 하나로 묘사했다.[3]
배경
이 프로젝트는 베를린 자유대학, 라이프치히대학[4] 사람들이 오픈링크 소프트웨어와 협력하여 시작했으며, 현재는 만하임대학, 라이프치히대학 사람들이 관리하고 있다.[5][6]첫 공개 데이터 집합은 2007년에 발표되었다.[4]이 데이터는 무료 라이센스(CC-BY-SA)로 제공되어 다른 사용자가 데이터 집합을 재사용할 수 있도록 허용된다. 단, 개방형 데이터 라이센스를 사용하여 수성 데이터베이스 권리를 포기하지는 않는다.
위키백과 기사는 대부분 자유 텍스트로 구성되지만, 또한 "인포박스" 표(많은 위키백과 기사의 기본 보기의 상단 오른쪽 또는 모바일 버전 시작 부분에 나타나는 풀아웃 패널), 분류 정보, 이미지, 지리 좌표 및 외부로의 링크와 같은 기사에 포함된 구조화된 정보를 포함한다.l 웹 페이지.이 구조화된 정보는 추출되어 질 수 있는 균일한 데이터 집합에 넣는다.
데이터 집합
2016-04년 공개된 DBpedia 데이터 세트는 60만 개 실체를 기술하고 있으며, 이 중 520만 개가 150만 명, 810만 명, 음악 앨범 135k, 106k 영화, 20k 비디오 게임, 275k 조직, 301k 종, 5k 질병 등 일관된 온톨로지 형태로 분류된다.[7]DBpedia는 추출된 정보를 나타내기 위해 자원기술 프레임워크(RDF)를 사용하며 95억 RDF 3중으로 구성되어 있으며, 이 중 13억은 위키백과 영문판, 50억은 다른 언어판으로부터 추출되었다.[7]
이 데이터 세트에서 여러 페이지에 걸쳐 분산된 정보를 추출할 수 있다.예를 들어, 책의 저자는 작품에 관한 페이지, 또는 저자에 관한 페이지로부터 모아질 수 있다.[further explanation needed]
위키백과에서 정보를 추출할 때 어려운 점 중 하나는 동일한 개념을 infobox와 다른 템플릿에서 다른 매개변수를 사용하여 표현할 수 있다는 것이다. birthplace=
그리고 placeofbirth=
이것 때문에, 사람들이 어디에서 태어났는지에 대한 질의가 더 완전한 결과를 얻기 위해 이 두 가지 속성을 모두 검색해야 할 것이다.그 결과, DBpedia Mapping Language는 동의어의 수를 줄이면서 이러한 속성을 온톨로지(Ontology)에 매핑하는 데 도움을 주기 위해 개발되었다.위키백과에서 사용되고 있는 인포박스와 속성이 매우 다양하기 때문에, 이러한 매핑을 개발하고 개선하는 과정이 공공기여에 개방되었다.[8]
버전 2014는 2014년 9월에 출시되었다.[9]이전 버전 이후 주요한 변화는 추상적인 텍스트가 추출되는 방식이었다.특히, 위키피디아의 지역 거울을 운영하고 그것에서 렌더링된 추상체를 검색하는 것은 추출된 텍스트를 상당히 더 깨끗하게 만들었다.또한 위키미디어 커먼즈에서 추출한 새로운 데이터 세트가 소개되었다.
2021년 6월 현재, 1조 개 이상의 실체를 포함하고 있다.[10]
예
DBpedia는 위키백과 페이지에서 사실 정보를 추출하여, 사용자들이 그 정보가 여러 위키백과 기사에 걸쳐 퍼져있는 질문에 대한 답을 찾을 수 있게 한다.SPARQL이라고 불리는 RDF에 대해 SQL과 같은 쿼리 언어를 사용하여 데이터에 액세스한다.
예를 들어 일본 쇼조망가 시리즈인 도쿄뮤에 관심이 있었고, 일러스트 작가 미아 이쿠미가 쓴 다른 작품들의 장르를 찾고 싶다고 상상해 보라.
DBpedia는 위키피디아의 도쿄 뮤, 미아 이쿠미 등의 출품작과 슈퍼돌 리카찬, 코이 큐피드 등의 작품에 관한 정보를 결합한다.DBpedia는 정보를 하나의 데이터베이스로 정규화하므로, 어떤 항목이 각 정보 조각을 운반하는지 정확하게 알 필요 없이 다음과 같은 질의를 할 수 있으며, 관련 장르를 열거할 것이다.
접두사 dbprop: <http://dbpedia.org/ontology/> 접두사 db: <http://dbpedia.org/resource/> 선택 ?누구, ?WORK, ?genre 어디에 { db:도쿄_Mew_Mew dbprop:저자 ?누구 . ?WORK dbprop:저자 ?누구 . 선택적 { ?WORK dbprop:장르. ?genre } . }
사용 사례
DBpedia는 인간 지식의 다른 영역을 포괄하는 광범위한 실체를 가지고 있다.이것은 외부 데이터셋이 그것의 개념에 연결될 수 있는 데이터셋을 연결하기 위한 천연 허브가 된다.[11]DBpedia 데이터 집합은 RDF 수준에서 웹 상의 다양한 다른 오픈 데이터 데이터 데이터 집합과 연동된다.이를 통해 애플리케이션은 이러한 데이터셋의 데이터로 DBpedia 데이터를 풍부하게 할 수 있다.2013년[update] 9월 현재, DBpedia와 외부 데이터셋 사이의 상호연계는 다음을 포함하여 4,500만 개 이상이다.Freebase, OpenCyc, UMBEL, GeoNames, MusicBrainz, CIA World Fact Book, DBLP, Project Gutenberg, DBtune Jamenden도, Eurostat, UniProt, Bio2RDF, US 센서스 데이터.[12][13]Thomson Reuters 이니셔티브 OpenCalais, The New York Times의 Linked Open Data 프로젝트, Zemanta API[14], DBpedia Spotlight 등도 DBpedia에 대한 링크를 포함하고 있다.[15][16][17]BBC는 DBpedia를 사용하여 내용을 정리한다.[18][19]파비키는 의미태깅을 위해 DBpedia를 사용한다.[20]삼성은 '지식공유 플랫폼'에도 DBpedia를 포함시켰다.
이렇게 구조화된 교차 영역 지식의 풍부한 원천은 인공지능 시스템에는 비옥한 땅이다.DBpedia는 IBM Watson's Defendy! 우승 시스템의[21] 지식 출처 중 하나로 사용되었다.
아마존은 아마존 웹 서비스 응용프로그램에 통합될 수 있는 DBpedia Public Data Set를 제공한다.[22]
DBpedia의 창작자에 대한 데이터는 예술작품의 판매 관찰을 풍부하게 하는 데 사용될 수 있다.[23]
크라우드소싱 소프트웨어 회사인 우샤히디는 DBpedia를 활용하여 시민이 작성한 보고서에 의미 주석을 수행하는 소프트웨어의 프로토타입을 만들었다.프로토타입은 주석을 수행하기 위해 DBpedia를 사용하는 쉐필드 대학교에서 개발한 "YODIE"(Yet et other open Data Information Extraction system) 서비스를[24] 통합했다.우샤히디의 목표는 들어오는 보고를 관리할 수 있는 속도와 시설을 개선하는 것이었다.[25]
DBpedia 스포트라이트
DBpedia Spotlight는 DBpedia 자원의 언급에 텍스트로 주석을 달기 위한 도구다.이를 통해 DBpedia를 통해 비정형 정보 소스를 Linked Open Data 클라우드에 연결할 수 있다.DBpedia Spotlight는 엔티티 탐지 및 이름 결정(즉, 해체를 포함)을 포함한 명명된 엔티티 추출을 수행한다.또한 명명된 실체 인식 및 기타 정보 추출 작업에 사용할 수 있다.DBpedia Spotlight는 많은 사용 사례에 맞게 사용자 정의할 수 있는 것을 목표로 한다.이 프로젝트는 소수의 개체 유형에 초점을 맞추는 대신, 350만 개 모든 개체와 DBPEDIA의 320개 이상의 계층의 개념에 대한 주석을 지원하기 위해 노력한다.이 프로젝트는 2010년 6월 베를린 자유대학의 웹 기반 시스템 그룹에서 시작되었다.
DBpedia Spotlight는 Apache License를 통해 라이센스를 받은 Java/Scala API와 테스트를 위한 웹 서비스로 공개적으로 이용 가능하다.DBpedia Spotlight 배포판에는 개발자가 자신의 페이지에 한 줄을 추가하여 웹 상의 어느 페이지나 주석을 달 수 있는 jQuery 플러그인이 포함되어 있다.[26]클라이언트는 Java나 PHP로도 이용 가능하다.[27]이 도구는 데모 페이지와[28] 웹 서비스를 통해 다양한 언어를 처리한다.국제화는 위키백과판이 있는 모든 언어에 대해 지원된다.[29]
Archivo 온톨로지 데이터베이스
2020년부터 DBpedia 프로젝트는 OWL 온톨로지 언어로 작성된 웹 액세스 가능 온톨로지 데이터베이스를 정기적으로 업데이트한다.[30]Archivo는 또한 접근성, 품질 및 관련 사용 적합성 기준에 기초하여 스크래핑되는 온톨로지에 대한 4성 등급 체계를 제공한다.예를 들어, 그래프 기반 데이터에 대한 SHACL 준수는 적절할 때 평가된다.온톨로지는 또한 그 특성에 대한 메타데이터를 포함하고 그 사용 조건을 설명하는 공개 라이선스를 지정해야 한다.[31][32]2021년[update] 6월 현재 Archivo 데이터베이스는 1368개의 항목을 포함하고 있다.
역사
DBpedia는 Sören Auer, Christian Bizer, Georgi Kobilarov, Jens Lehmann, Richard Cyganiak, Zachary Ives에 의해 2007년에 시작되었다.[4]
참고 항목
참조
- ^ Bizer, Christian; Lehmann, Jens; Kobilarov, Georgi; Auer, Soren; Becker, Christian; Cyganiak, Richard; Hellmann, Sebastian (September 2009). "DBpedia - A crystallization point for the Web of Data" (PDF). Web Semantics: Science, Services and Agents on the World Wide Web. 7 (3): 154–165. CiteSeerX 10.1.1.150.4898. doi:10.1016/j.websem.2009.07.002. ISSN 1570-8268. Archived from the original (PDF) on 10 August 2017. Retrieved 11 December 2015.
- ^ "Komplett verlinkt — Linked Data" (in German). 3sat. 19 June 2009. Archived from the original on 6 January 2013. Retrieved 10 November 2009.
- ^ "Sir Tim Berners-Lee Talks with Talis about the Semantic Web". Talis. 7 February 2008. Archived from the original on 10 May 2013.
- ^ a b c DBpedia: [1], [2] 또는 [3]에서 사용할 수 있는 개방형 데이터 웹용 핵
- ^ "Credits". DBpedia. Archived from the original on 21 September 2014. Retrieved 9 September 2014.
- ^ "Home".
- ^ a b "YEAH! We did it again ;) – New 2016-04 DBpedia release". DBpedia. 19 October 2016. Retrieved 9 January 2019.
- ^ "DBpedia Mappings". mappings.dbpedia.org. Retrieved 3 April 2010.
- ^ "Changelog". DBpedia. September 2014. Retrieved 9 September 2014.
- ^ Holze, Julia (23 July 2021). "Announcement: DBpedia Snapshot 2021-06 Release". DBpedia Association. Retrieved 28 July 2021.
- ^ E. 커리, A.프리타스, 그리고 S.O'Riain, "기업을 위한 커뮤니티 주도 데이터 큐레이션의 역할" 2012년 1월 23일 기업 데이터 연결의 웨이백 머신에서 보관우드, 에드.보스턴, 2010년 스프링거 US, 25-47페이지
- ^ "Statistics on links between Data sets", SWEO Community Project: Linking Open Data on the Semantic Web, W3C, retrieved 24 November 2009
- ^ "Statistics on Data sets", SWEO Community Project: Linking Open Data on the Semantic Web, W3C, retrieved 24 November 2009
- ^ "Zemanta API". dev.zemanta.com. Retrieved 26 July 2021.
- ^ Sandhaus, Evan; Larson, Rob (29 October 2009). "First 5,000 Tags Released to the Linked Data Cloud". The New York Times Blogs. Retrieved 10 November 2009.
- ^ "Life in the Linked Data Cloud". opencalais.com. Archived from the original on 24 November 2009. Retrieved 10 November 2009.
Wikipedia has a Linked Data twin called DBpedia. DBpedia has the same structured information as Wikipedia – but translated into a machine-readable format.
- ^ "Zemanta talks Linked Data with SDK and commercial API". ZDNet. Archived from the original on 28 February 2010. Retrieved 10 November 2009.
Zemanta fully supports the Linking Open Data initiative. It is the first API that returns disambiguated entities linked to dbPedia, Freebase, MusicBrainz, and Semantic Crunchbase.
- ^ "European Semantic Web Conference 2009 - Georgi Kobilarov, Tom Scott, Yves Raimond, Silver Oliver, Chris Sizemore, Michael Smethurst, Christian Bizer and Robert Lee. Media meets Semantic Web - How the BBC uses DBpedia and Linked Data to make Connections". eswc2009.org. Archived from the original on 8 June 2009. Retrieved 10 November 2009.
- ^ "BBC Learning - Open Lab - Reference". BBC. Archived from the original on 25 August 2009. Retrieved 10 November 2009.
Dbpedia is a database version of Wikipedia. It is used in a lot of projects for a wide range of different reasons. At the BBC we are using it for tagging content.
- ^ "Semantic Tagging with Faviki". readwriteweb.com. Archived from the original on 29 January 2010.
- ^ 데이비드 페루치, 에릭 브라운, 제니퍼 추 캐럴, 제임스 팬, 데이비드 곤데크, 아 디트야 A.칼리안푸르, 아담 랄리, J. 윌리엄 머독, 에릭 나이버그, 존 프래거, 니코 슐래퍼, 크리스 웰티 「빌딩 왓슨: DeepQA 프로젝트 개요."2010년 AI 매거진 가을에서인공지능 선진화 협회(AAAI)
- ^ "Amazon Web Services Developer Community : DBpedia". developer.amazonwebservices.com. Archived from the original on 13 February 2010. Retrieved 10 November 2009.
- ^ Filipiak, Dominik; Filipowska, Agata (2 December 2015). DBpedia in the Art Market. Business Information Systems Workshops. BIS 2015. Lecture Notes in Business Information Processing. Vol. 228. pp. 321–331. doi:10.1007/978-3-319-26762-3_28. ISBN 978-3-319-26761-6.
- ^ "GATE.ac.uk - applications/yodie.html". gate.ac.uk. Retrieved 11 May 2020.
- ^ "ushahidi/platform-comrades". GitHub. 30 June 2019. Retrieved 9 March 2020.
- ^ Mendes, Pablo. "DBpedia Spotlight jQuery Plugin". jQuery Plugins. Retrieved 15 September 2011.
- ^ DiCiuccio, Rob (25 September 2016). "PHP Client for DBpedia Spotlight". GitHub.
- ^ "Demo of DBpedia Spotlight". Retrieved 8 September 2013.
- ^ "Internationalization of DBpedia Spotlight". GitHub. Retrieved 8 September 2013.
- ^ "DBpedia Archivo". Retrieved 8 July 2021.
- ^ 프레이, 요하네스;Streitmatter, 데니스, 괴츠, 파비안, 헬만, 세바스찬, 아른트, Natanael(10월 27일 2020년)."DBpedia Archivo:존재론에 대한web-scale 인터페이스가 소비자 중심의 방면에서 아카이빙".Sure-Vetter, 뉴욕, 약탈, 하랄트;Cudré-Mauroux, 필립, Maleshkova, 마리아, 펠레그리니, Tassilo;아코스타, 마리벨(eds.)에서.의미론적 시스템:AI과 지식 그래프의 힘이다.사장 스위스:Springer.doi:10.1007/978-3-030-59833-4_2.아이 에스비엔 978-3-030-59832-7.S2CID 219939266.PDF또는 ePUB로 다운로드.
- ^ Frey, Johannes; Streitmatter, Denis; Götz, Fabian; Hellmann, Sebastian; Arndt, Natanael (10 September 2020). DBpedia Archivo: a web-scale interface for ontology archiving under consumer-oriented aspects. Leipzig, Germany: Institut für Angewandte Informatik (InfAI). Retrieved 8 July 2021. 유튜브 동영상 00:10:38.
외부 링크
위키미디어 커먼즈에는 DBpedia와 관련된 미디어가 있다. |