위키데이터

Wikidata
위키데이터
Logo of Wikidata, a bar code with red, green, and blue stripes
스크린샷
Wikidata main page screenshot.png
2021년 4월 Wikidata 메인 페이지
사이트 유형
이용가능기간:다국어
주인위키미디어 재단
에디터위키미디어 커뮤니티
URLwww.wikidata.org Edit this at Wikidata
상업의아니요.
등록.선택적.
개시.2012년 10월 29일, 9년 전(2012-10-29)[1]

WikidataWikimedia [2]Foundation이 주최하는 다국어 지식 그래프입니다.Wikipedia와 [3][4]같은 위키미디어 프로젝트 및 다른 모든 사용자가 CC0 퍼블릭 도메인 라이센스에 따라 사용할 수 있는 오픈 데이터의 공통 소스입니다.Wikidata는 소프트웨어 MediaWiki를 기반으로 하는 Wiki입니다.또한 Wikibase라고 불리는 지식 그래프 MediaWiki 확장자 세트도 갖추고 있습니다.

개념.

이 그림은 Wikidata에서 사용되는 가장 중요한 용어를 보여줍니다.

Wikidata는 모든 종류의 주제, 개념 또는 개체를 나타내는 항목에 초점을 맞춘 문서 지향 데이터베이스입니다.각 항목에는 고유하고 영구적인 식별자(대문자 Q가 앞에 붙는 정의 정수)가 할당되어 있으며, 이를 "QID"라고 합니다.이것에 의해, 항목이 커버하는 토픽을 특정하기 위해서 필요한 기본적인 정보를 언어를 사용하지 않고 번역할 수 있습니다.

품목의 예로는 1988년 하계 올림픽 (Q8470), 사랑 (Q316), 조니 캐시 (Q42775), 엘비스 프레슬리 (Q303), 고릴라 (Q36611) 등이 있다.

항목 레이블은 고유할 필요가 없습니다.예를 들어, "엘비스 프레슬리"라는 이름의 두 가지 아이템이 있다: 미국의 가수이자 배우대표하는 엘비스 프레슬리와 셀프 타이틀 앨범을 대표하는 엘비스 프레슬리이다.단, 라벨과 그 설명의 조합은 고유해야 합니다.따라서 모호함을 피하기 위해 항목의 고유 식별자(QID)가 이 조합에 연결됩니다.

주요 부품

Wikidata screenshot


단계 1 Wikidata 페이지의 4가지 주요 컴포넌트 레이아웃(라벨, 설명, 에일리어스 및 언어 간 링크)

기본적으로 항목은 다음과 같이 구성됩니다.

  • 의무적으로 라벨 및 설명과 관련된 식별자(QID).
  • 옵션으로 여러 개의 에일리어스와 몇 개의 문(및 그 속성과 값)을 사용할 수 있습니다.

진술들

Wikidata screenshot
화성에 관한 Wikidata 항목(Q111)의 세 가지 문장.값에는 다른 항목 및 Wikimedia Commons에 대한 링크가 포함됩니다.

문장은 항목에 대해 알려진 정보가 Wikidata에 기록되는 방법입니다.형식적으로는 키-값 쌍으로 구성되며, 키-값 쌍은 속성(: "저작자" 또는 "출판일")과 하나 이상의 엔티티 값(예: "Arthur Conan Doyle" 또는 "1902")을 일치시킨다.예를 들어, 비공식 영어 문구 "milk is white"는 특성 색상(P462)과 우유 항목(Q8495) 아래의 값 흰색(Q23444)을 조합하는 문장으로 인코딩될 것이다.

문은 속성을 둘 이상의 값에 매핑할 수 있습니다.예를 들어 마리 퀴리의 "직업" 속성은 그녀가 두 [5]직업에 모두 종사했다는 사실을 반영하기 위해 "물리학자"와 "화학자"의 가치와 연결될 수 있다.

값은 다른 Wikidata 항목, 문자열, 숫자 또는 미디어 파일 등 다양한 유형을 사용할 수 있습니다.속성은 이러한 값을 쌍으로 구성할 수 있는 유형을 지정합니다.예를 들어, 부동산 공식 웹사이트(P856)는 "URL"[6] 유형의 값과만 쌍을 이룰 수 있습니다.

선택적으로 수식자를 사용하여 추가 정보를 제공하여 문장의 의미를 구체화할 수 있습니다.예를 들어 "인구" 문장은 "2011년 기준"과 같은 한정자를 사용하여 수정할 수 있습니다.문의 값은 문의 [7]내용을 백업하는 소스를 가리키는 참조로 주석을 달 수도 있습니다.문장과 마찬가지로 모든 한정자와 참조는 속성-값 쌍입니다.

특성.

하나의 속성-값 쌍으로 구성된 단순 문장의 예제

각 속성에는 대문자 P가 앞에 붙은 숫자 식별자와 Wikidata 페이지가 있으며 옵션 라벨, 설명, 에일리어스 및 문장이 있습니다.이와 같이 (P1647)서브프로퍼티와 같은 다른 속성을 기술하는 유일한 목적을 가진 속성이 있습니다.

속성은 또한 의도된 용도에 대한 더 복잡한 규칙(제약)을 정의할 수도 있습니다.예를 들어, 자본(P36) 자산에는 "단일 가치 제약"이 포함되어 있으며, 이는 (일반적으로) 영토에 자본이 하나만 있는 현실을 반영합니다.제약조건은 위반할 수 없는 [8]규칙이 아니라 경고 및 힌트를 테스트하는 것으로 취급됩니다.

새 속성을 생성하기 전에 논의 [9][10]과정을 거쳐야 합니다.

가장 많이 사용되는 자산은 2022년 [11]2월 현재 2억 8천만 페이지 이상의 항목 페이지에 사용되고 있는 인용 작품(P2860)이다.

렉셈스

언어학에서 어휘소어휘적 의미의 단위이다.마찬가지로, Wikidata의 어휘소는 사전 데이터를 저장하기에 더 적합한 구조를 가진 항목이다.어휘소가 참조하는 언어를 저장하는 것 외에 형태와 [12]감각을 위한 섹션이 있습니다.

엔티티 스키마

2019년 1월 MediaWiki는 별도의 [13][14]네임스페이스에 Shape Expressions를 저장할 수 있는 새로운 확장을 개발하기 시작했습니다.

이 확장은 이후 Wikidata에[15] 설치되었으며 기여자는 Shape Expressions를 사용하여 항목 및 어휘소의 리소스 기술 프레임워크 데이터를 검증하고 설명할 수 있습니다.Wikidata의 모든 항목 또는 어휘소는 Entity Schema에 대해 검증할 수 있으며, 이는 품질 보증을 위한 중요한 도구가 됩니다.

발전

이 프로젝트의 창설은 앨런 인공지능 연구소, 고든과 베티 무어 재단, 구글, Inc. 기부금으로 [16][17]총 130만 유로의 자금을 조달했습니다.이 프로젝트의 개발은 주로 Lydia Pintscher가 관리하는 Wikimedia Deutschland가 주도하고 있으며, 원래는 다음과 같은 3단계로 [18]분할되었습니다.

  1. 언어간 링크 일원화– 다른 언어로 된 동일한 토픽에 관한 Wikipedia 기사 간의 링크
  2. 모든 Wikipedia에 정보 상자 데이터를 중앙 위치에 제공합니다.
  3. Wikidata 데이터를 기반으로 목록 문서를 만들고 업데이트하며 Meta-Wiki 및 자체 Wikidata(인터위키링크)를 포함한 다른 Wikimedia 자매 프로젝트에 링크합니다.

초기 롤아웃

Wikipedia screenshot


Wikipedia 문서의 언어 간 링크 목록은 편집 상자(왼쪽)와 Wikidata 이전 문서 페이지(오른쪽)에 나타납니다.이러한 목록의 각 링크는 다른 기사에 대한 언어 간 링크 목록이 필요한 기사에 대한 것입니다. 이것은 Wikidata에 의해 중앙 집중화된 정보입니다.
Wikidata screenshot
오늘날 "링크 편집" 링크는 독자를 Wikidata로 이동하여 언어 간 링크와 인터위키 링크를 편집합니다.

Wikidata는 2012년 10월 29일에 시작되었으며 2006년 이후 [3][19][20]Wikimedia Foundation의 첫 번째 새로운 프로젝트입니다.이 시기에는 언어 링크의 중앙 집중화만 가능했습니다.이를 통해 Wikipedia의 모든 언어판(인터위키피디아 링크)에서 해당 주제에 대한 문서에 대한 링크, 이름 또는 제목, 별칭, 레이블 대체 용어, 설명, 설명과 같은 항목을 만들고 기본 정보로 채울 수 있었습니다.

역사적으로 위키피디아 기사는 언어 간 링크 목록을 포함하며, 위키피디아의 다른 판에 있는 동일한 주제에 대한 글에 대한 링크입니다.처음에 Wikidata는 언어 간 [21]링크의 자체 저장소였습니다.Wikipedia 언어판은 여전히 Wikidata에 접속할 수 없었기 때문에 주로 기사 페이지 끝에 [citation needed]있는 언어 간 링크 목록을 계속 유지할 필요가 있었다.

2013년 1월 14일 헝가리어 위키피디아는 위키데이터를 [22]통한 언어 간 링크 제공을 가능하게 한 최초의 웹사이트가 되었다.이 기능은 1월 30일 히브리어이탈리아어 위키피디아, 2월 13일 영어 위키피디아, [23][24][25][26]3월 6일 기타 모든 위키피디아로 확장되었습니다.영어 [27]위키피디아에서 언어 링크를 삭제하는 것을 제한하는 제안에 대한 합의가 이루어지지 않은 후, 영어 위키피디아에서 언어 링크를 삭제할 수 있는 권한이 자동 편집자에게 주어졌다.2013년 9월 23일, 언어 간 링크는 위키미디어 [28]커먼스에 공개되었습니다.

스테이트먼트 및 데이터 액세스

2013년 2월 4일, Wikidata 엔트리에 성명서가 도입되었습니다.속성에서 가능한 값은 처음에는 두 가지 데이터 유형(Wikimedia Commons의 항목 및 이미지)으로 제한되었으며, 나중에 더 많은 데이터 유형(좌표 및 날짜 등)이 뒤따를 것입니다.첫 번째 새로운 유형인 문자열은 3월 [29]6일에 배치되었습니다.

위키피디아의 다양한 언어판이 위키데이터의 데이터에 액세스할 수 있는 기능은 2013년 [30][31]3월 27일부터 4월 25일 사이에 점진적으로 도입되었습니다.2015년 9월 16일, Wikidata는 위키백과의 특정 문서에서 직접 연결되지 않은 위키데이터 항목에 대한 문장으로의 임의 액세스 또는 액세스를 허용하기 시작했습니다.예를 들어 이전에는 [32]불가능했던 베를린 기사에서 독일에 관한 데이터를 읽을 수 있게 되었다.2016년 4월 27일 Wikimedia [33]Commons에서 임의 액세스가 활성화되었습니다.

2020년 조사에 따르면 Wikidata의 데이터 대부분은 인터넷 봇에 의해 다른 데이터베이스에서 일괄적으로 Import된 엔트리로 구성되어 있어 데이터 [34]사일로의 "벽 허물기"에 도움이 됩니다.

서비스 및 기타 개선 사항 문의

2015년 9월 7일, Wikimedia Foundation은 사용자가 Wikidata에 [36]포함된 데이터에 대한 쿼리를 실행할 수 있는 Wikidata Query Service의 [35]출시를 발표했습니다.서비스에서는 SPARQL을 쿼리 언어로 사용합니다.2018년 11월 현재 다양한 [37]방법으로 데이터를 조회할 수 있는 도구는 최소 26개입니다.트리플스토어 [38][39]그래프 데이터베이스로 Blazegraph를 사용합니다.

한편, Wiktionary 측면 창에는 새로운 항목과 새 [citation needed]페이지 링크를 만드는 데 도움이 되는 "Wikidata 항목"이 포함되어 있습니다[when?].예를 들어 항목이 영어 Wiktionary에만 있고 다른 언어의 Wiktionary가 아닌 다른 Wikimedia 프로젝트에 연결해야 할 때 유용합니다.

다음으로 섬(Q23442)과 항공 사고(Q744913)관한 주요 주제(P921)를 가진 (P31) 텔레비전 시리즈(Q5398426) 인스턴스를 검색하는 SPARQL의 예를 나타냅니다.그러나 적절한 범주가 존재하고 허용될 경우 유사한 결과를 Wikipedia에서 범주 교차로를 사용하여 직접 찾을 수 있습니다.

선택한다. 아이템 ?아이템라벨 어디에 {   아이템 wdt:P31 wd:Q5398426.   아이템 wdt:P921 wd:문제 23442.   아이템 wdt:P921 wd:Q744913.   서비스 키보드:라벨. {bd:서비스 파라미터 키보드:언어 [AUTO_LANGUAGUA],en.} } 

다음으로 (P31) TV 시리즈(Q5398426) 인스턴스를 찾는 SPARQL의 예를 나타냅니다.여기서 캐스트 멤버(P161)에는 Daniel Dae Kim(Q299700) Jorge Garcia(Q264914)포함됩니다.텔레비전 시리즈 상태는 텔레비전 시리즈 에피소드(Q2191270)/2부작 에피소드(Q21664088)를 표시할 수 없도록 하며 필름(Q11424)인 결과를 표시하지 않습니다.

선택한다. 아이템 ?아이템라벨 어디에 {   아이템 wdt:P31 wd:Q5398426.   아이템 wdt:P161 wd:Q299700.   아이템 wdt:P161 wd:Q264914.   서비스 키보드:라벨. {bd:서비스 파라미터 키보드:언어 [AUTO_LANGUAGUA],en.} } 

로고의 바에는 모스 [40]부호로 인코딩된 "WIKI"라는 단어가 포함되어 있습니다.그것은 Arun Ganesh에 의해 만들어졌고 지역사회의 [41]결정을 통해 선택되었습니다.

접수처

2014년 11월, Wikidata는 "완벽한 확장성과 내장된 개방성"[42]으로 Open Data Institute로부터 Open Data Publisher Award를 수상했습니다.

2014년 12월, 구글은 위키데이터를 [43]위해 프리베이스를 폐쇄할 것이라고 발표했다.

2018년 11월 현재 Wikidata 정보는 전체 영어 위키피디아 문서의 58.4%에서 주로 외부 식별자 또는 조정 위치에 사용되고 있습니다.종합하면 Wikidata의 데이터는 Wikipedia의 모든 페이지의 64%, Wikivoyage의 모든 문서의 93%, Wikipedia 인용문의 34%, Wiki sources의 32%, Wikimedia Commons의 27%에 표시됩니다.다른 Wikimedia Foundation 프로젝트에서의 사용은 [44]추천할 만한 것입니다.

2020년 12월 현재, Wikidata의 데이터는 적어도 20개의 다른 외부 도구로[45] 시각화되었으며, Wikidata에 [46]대한 300개 이상의 논문이 발표되었습니다.

Wikidata의 구조화된 데이터 세트는 Apple의 Siri와 Amazon [47]Alexa와 같은 가상 어시스턴트에 의해 사용되고 있습니다.

적용들

  • Mwnci 확장자는 Wikidata에서 LibreOffice Calc 스프레드시트[48] 데이터를 가져올 수 있습니다.
  • (2019년[49] 10월) QID 이모티콘과 관련하여 QID 항목 사용에 대한 논의가 있다.
  • Wiki Explorer – Android 어플리케이션으로 주변 사물 검색 및 Wikidata[50] 마이크로 편집 가능
  • KDE 여행 일정 – Wikidata의[51] 데이터를 사용하는 개인 정보 보호 오픈 소스 여행 길잡이
  • 구글[52]당초 인공지능을 이용해 관련 문구를 만들어 위키피디아 정보를 해석해 위키데이터로 옮기는 프레임 시맨틱 파서 프로젝트를 시작했다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ "The Wikidata revolution is here: enabling structured data on Wikipedia". 25 April 2013. Retrieved 12 June 2022. Since Wikidata.org went live on 30 October 2012,
  2. ^ Chalabi, Mona (26 April 2013). "Welcome to Wikidata! Now what?". Retrieved 2 October 2021.
  3. ^ a b Wikidata (2012년 10월 29일 Wayback Machine에서 아카이브 완료)
  4. ^ "Data Revolution for Wikipedia". Wikimedia Deutschland. 30 March 2012. Archived from the original on 23 October 2012. Retrieved 11 September 2012.
  5. ^ "Help:Statements – Wikidata". www.wikidata.org.
  6. ^ "Help:Data type – Wikidata". www.wikidata.org.
  7. ^ "Help:Sources – Wikidata". www.wikidata.org.
  8. ^ "Help:Property constraints portal – Wikidata". www.wikidata.org.
  9. ^ Cochrane, Euan (30 September 2016). "Wikidata as a digital preservation knowledgebase". openpreservation.org.
  10. ^ Samuel, John (15 August 2018). "Experimental IR Meets Multilinguality, Multimodality, and Interaction". Experimental IR Meets Multilinguality, Multimodality, and Interaction. CLEF 2018. Lecture Notes in Computer Science. Vol. 11018. p. 129. doi:10.1007/978-3-319-98932-7_12. ISBN 978-3-319-98931-0.
  11. ^ "Wikidata:Database reports/List of properties/Top100". Retrieved 2 February 2022.
  12. ^ "Wikidata:Lexicographical data/Documentation – Wikidata". www.wikidata.org.
  13. ^ "Extension:EntitySchema - MediaWiki". mediawiki.org. Retrieved 10 September 2021.
  14. ^ "Initial empty repository". Gerrit. 15 January 2019. Retrieved 12 June 2022.
  15. ^ "Version - Wikidata". Wikidata.org. Retrieved 10 September 2021.
  16. ^ Dickinson, Boonsri (30 March 2012). "Paul Allen Invests In A Massive Project To Make Wikipedia Better". Business Insider. Retrieved 11 September 2012.
  17. ^ Perez, Sarah (30 March 2012). "Wikipedia's Next Big Thing: Wikidata, A Machine-Readable, User-Editable Database Funded By Google, Paul Allen And Others". TechCrunch. Archived from the original on 5 October 2012. Retrieved 11 September 2012.
  18. ^ "Wikidata – Meta". meta.wikimedia.org.
  19. ^ Pintscher, Lydia (30 October 2012). "wikidata.org is live (with some caveats)". wikidata-l (Mailing list). Retrieved 3 November 2012.
  20. ^ Roth, Matthew (30 March 2012). "The Wikipedia data revolution". Wikimedia Foundation. Archived from the original on 11 September 2012. Retrieved 11 September 2012.
  21. ^ Leitch, Thomas (1 November 2014). Wikipedia U: Knowledge, Authority, and Liberal Education in the Digital Age. Johns Hopkins University Press. p. 120. ISBN 978-1-4214-1550-5.
  22. ^ Pintscher, Lydia (14 January 2013). "First steps of Wikidata in the Hungarian Wikipedia". Wikimedia Deutschland. Retrieved 17 December 2015.
  23. ^ Pintscher, Lydia (30 January 2013). "Wikidata coming to the next two Wikipedias". Wikimedia Deutschland. Retrieved 31 January 2013.
  24. ^ Pintscher, Lydia (13 February 2013). "Wikidata live on the English Wikipedia". Wikimedia Deutschland. Retrieved 15 February 2013.
  25. ^ Pintscher, Lydia (6 March 2013). "Wikidata now live on all Wikipedias". Wikimedia Deutschland. Retrieved 8 March 2013.
  26. ^ "Wikidata ist für alle Wikipedien da" (in German). Golem.de. Retrieved 29 January 2014.
  27. ^ "Wikipedia talk:Wikidata interwiki RFC". 29 March 2013. Retrieved 30 March 2013.
  28. ^ Pintscher, Lydia (23 September 2013). "Wikidata is Here!". Commons:Village pump.
  29. ^ Pintscher, Lydia. "Wikidata/Status updates/2013 03 01". Wikimedia Meta-Wiki. Wikimedia Foundation. Retrieved 3 March 2013.
  30. ^ Pintscher, Lydia (27 March 2013). "You can have all the data!". Wikimedia Deutschland. Retrieved 28 March 2013.
  31. ^ "Wikidata goes live worldwide". The H. 25 April 2013. Archived from the original on 1 January 2014.
  32. ^ Lydia, Pintscher (16 September 2015). "Wikidata: Access to data from arbitrary items is here". Wikipedia:Village pump (technical). Retrieved 30 August 2016.
  33. ^ Lydia, Pintscher (27 April 2016). "Wikidata support: arbitrary access is here". Commons:Village pump. Retrieved 30 August 2016.
  34. ^ Waagmeester, Andra; Stupp, Gregory; Burgstaller-Muehlbacher, Sebastian; et al. (17 March 2020). "Wikidata as a knowledge graph for the life sciences". eLife. 9. doi:10.7554/ELIFE.52614. ISSN 2050-084X. PMC 7077981. PMID 32180547. Wikidata Q87830400.
  35. ^ https://query.wikidata.org/[베어 URL]
  36. ^ "[Wikidata] Announcing the release of the Wikidata Query Service - Wikidata - lists.wikimedia.org".
  37. ^ "Wikidata:Tools/Query data – Wikidata". www.wikidata.org.
  38. ^ "[Wikidata-tech] Wikidata Query Backend Update (take two!)". lists.wikimedia.org. Retrieved 29 August 2018. (이 메시지에는 Wikimedia에서 수행한 그래프 데이터베이스 비교에 대한 링크도 포함되어 있습니다.)
  39. ^ "Blazegraph fork?". GitHub. 12 April 2018.
  40. ^ 공통:파일 토크:Wikidata-logo-en.svg#하이브리드2016년 10월 6일 취득.
  41. ^ "Und der Gewinner ist..." 13 July 2012.
  42. ^ "First ODI Open Data Awards presented by Sirs Tim Berners-Lee and Nigel Shadbolt". Archived from the original on 24 March 2016.
  43. ^ "Freebase". Google Plus. 16 December 2014. Archived from the original on 20 March 2019.
  44. ^ "Percentage of articles making use of data from Wikidata". Archived from the original on 15 November 2018. Retrieved 15 November 2018.
  45. ^ "Wikidata:Tools/Visualize data – Wikidata". www.wikidata.org.
  46. ^ "Scholia". Scholia.
  47. ^ Simonite, Tom (18 February 2019). "Inside the Alexa-Friendly World of Wikidata". Wired. ISSN 1059-1028. Retrieved 25 December 2020.
  48. ^ "Rob Barry / Mwnci – Deep Spreadsheets". GitLab.
  49. ^ "Public Review Issues".
  50. ^ "Wiki Explorer in the Google Play Store".
  51. ^ Krause, Volker (12 January 2020), KDE Itinerary – A privacy by design travel assistant, retrieved 10 November 2020
  52. ^ SLING - A natural language frame semantics parser, Google, 14 November 2021, retrieved 14 November 2021

추가 정보

외부 링크