위키데이터

Wikidata
위키데이터
Logo of Wikidata, a bar code with red, green, and blue stripes
스크린샷
2021년 4월 위키데이터 메인페이지
사이트유형
에서 사용 가능다국어
주인위키미디어 재단
편집기위키미디어 커뮤니티
URLwww.wikidata.org Edit this at Wikidata
상업의아니요.
등록.선택적.
런칭2012년 10월 29일; 11년(2012-10-29)[1]

위키데이터위키미디어 재단에서 주최하는 공동 편집된 다국어 지식 그래프입니다.[2] 위키백과[3][4]같은 위키미디어 프로젝트가 CC0 공용 도메인 라이선스 하에서 사용할 수 있는 오픈 데이터의 공통 소스입니다. 위키데이터(Wikidata)는 미디어위키(MediaWiki)에 의해 구동되는 위키로, 반구조화된 데이터인 위키베이스(Wikibase)에 대한 확장을 포함합니다.

개념.

이 다이어그램은 위키데이터에서 사용되는 가장 중요한 용어를 보여줍니다.

위키데이터는 문서 중심의 데이터베이스로, 항목에 초점을 맞추고 있으며, 모든 종류의 주제, 개념 또는 대상을 나타냅니다. 각 항목에는 고유하고 지속적인 식별자, "QID"로 알려진 대문자 Q가 접두사로 붙은 양의 정수가 할당됩니다. Q는 위키데이터 공동 개발자 데니 브란데치와 결혼한 우즈베키스탄 위키미디어인 카마르니소 브란데치(성 이스밀로바)의 첫 번째 이름입니다.[5] 이를 통해 항목이 다루는 주제를 식별하는 데 필요한 기본 정보를 언어를 선호하지 않고 번역할 수 있습니다.

상품의 예로는 1988년 하계 올림픽 (Q8470), 사랑 (Q316), 조니 캐시 (Q42775), 엘비스 프레슬리 (Q303), 고릴라 (Q36611) 등이 있습니다.

항목 레이블은 고유할 필요가 없습니다. 예를 들어, "엘비스 프레슬리"라는 이름의 두 가지 아이템이 있습니다: 미국 가수이자 배우대표하는 엘비스 프레슬리 (Q303)와 그의 자작 앨범대표하는 엘비스 프레슬리 (Q610926). 그러나 라벨과 설명의 조합은 고유해야 합니다. 따라서 모호성을 방지하기 위해 항목의 고유 식별자(QID)가 이 조합에 연결됩니다.

주요부분

Wikidata screenshot


1단계 위키데이터 페이지의 4가지 주요 구성요소(라벨, 설명, 별칭 및 언어 간 링크)의 레이아웃

기본적으로 항목은 다음과 같이 구성됩니다.

  • 레이블 및 설명과 관련된 식별자(QID)입니다.
  • 선택적으로 여러 개의 별칭과 몇 개의 문(및 해당 속성 및 값)이 있습니다.

진술들

Wikidata screenshot
화성에 관한 위키데이터의 항목(Q111)에서 나온 세 가지 설명. 값에는 다른 항목 및 Wikimedia Commons에 대한 링크가 포함됩니다.

문장은 항목에 대해 알려진 모든 정보가 위키데이터에 기록되는 방법입니다. 공식적으로 키-값 쌍으로 구성되며, 키-값 쌍은 하나 이상의 엔티티 값(예: "저자" 또는 "출판 날짜")과 일치합니다(예: "아서 코난 도일 경" 또는 "1902"). 예를 들어, "우유는 흰색"이라는 비공식 영어 문구는 우유(Q8495) 항목 아래속성 색상(P462)과 흰색(Q23444)을 쌍으로 구성하는 문구로 인코딩됩니다.

문은 속성을 하나 이상의 값으로 매핑할 수 있습니다. 예를 들어, 마리 퀴리의 "직업" 속성은 그녀가 두 직업에 모두 종사했다는 사실을 반영하기 위해 "물리학자" 및 "화학자" 값과 연결될 수 있습니다.[6]

값은 다른 위키데이터 항목, 문자열, 숫자 또는 미디어 파일을 포함한 많은 유형을 취할 수 있습니다. 속성은 어떤 유형의 값과 쌍을 이룰 수 있는지 지정합니다. 예를 들어, 부동산 공식 웹 사이트(P856)는 "URL" 유형의 값과만 쌍을 이룰 수 있습니다.[7]

선택적으로 수식어를 사용하여 추가 정보를 제공하여 문장의 의미를 구체화할 수 있습니다. 예를 들어, "군" 문은 "포인트 시점(P585): 2011"(자체 키-값 쌍)과 같은 한정자로 수정될 수 있습니다. 문의 값은 또한 문의 내용을 백업하는 소스를 가리키는 참조와 함께 주석을 달 수 있습니다.[8] 문과 마찬가지로 모든 한정자 및 참조는 속성-값 쌍입니다.

특성.

속성-값 쌍 하나로 구성된 단순 문 예제

각 속성에는 대문자 P로 접두사가 붙은 숫자 식별자와 선택적인 레이블, 설명, 별칭 및 문이 있는 Wikidata 페이지가 있습니다. 이와 같이 (P1647) 하위 속성과 같이 다른 속성을 설명하기 위한 유일한 목적을 가진 속성이 있습니다.

속성은 또한 의도된 사용에 대한 보다 복잡한 규칙인 제약 조건을 정의할 수 있습니다. 예를 들어, 자본(P36) 재산에는 "단일 가치 제약"이 포함되며, 이는 (일반적으로) 영토가 하나의 자본 도시만 있는 현실을 반영합니다. 제약 조건은 위반할 수 없는 규칙이 아닌 테스트 경고 및 힌트로 취급됩니다.[9]

새 부동산을 만들기 전에 논의 과정을 거쳐야 합니다.[10][11]

가장 많이 사용되는 속성은 인용 저작물(P2860)로, 2023년 11월 기준으로 290,000,000개 이상의 항목 페이지에서 사용됩니다.[12]

렉세메스

언어학에서 어휘소어휘적 의미의 단위입니다. 마찬가지로 위키데이터의 어휘소사전 데이터를 저장하기에 더 적합한 구조를 가진 항목입니다. 어휘소가 참조하는 언어를 저장하는 것 외에도 형태를 위한 섹션과 감각을 위한 섹션이 있습니다.[13]

엔티티 스키마

2019년 1월, 미디어위키의 새로운 확장 기능을 개발하여 Shape expressions를 별도의 네임스페이스에 저장할 수 있게 했습니다.[14][15]

이 확장은 이후 Wikidata에[16] 설치되었으며 기여자는 Shape Expressions를 사용하여 항목 및 어휘소의 리소스 설명 프레임워크 데이터를 확인하고 설명할 수 있습니다. Wikidata의 어떤 항목이나 어휘명도 엔티티 스키마에 대해 검증할 수 있으므로 품질 보증을 위한 중요한 도구가 됩니다.

발전

프로젝트의 설립은 앨런 인공지능 연구소, 고든베티 무어 재단, 구글의 기부금으로 총 130만 유로를 지원했습니다.[17][18] 이 프로젝트의 개발은 주로 Lydia Pintscher의 관리 하에 Wikimedia Deutschland에 의해 주도되었으며, 원래는 세 단계로 나뉘었습니다.[19]

  1. 언어 간 링크 중앙 집중화 – 같은 주제에 대한 위키백과 기사 간의 다른 언어의 링크.
  2. 모든 Wikipedia를 위한 인포박스 데이터를 위한 중앙 장소를 제공합니다.
  3. 위키데이터의 데이터를 기반으로 목록 기사를 만들고 업데이트하며 메타위키 및 자체 위키데이터(인터위키링크)를 포함한 다른 위키미디어 자매 프로젝트에 링크합니다.

초기 롤아웃

Wikipedia screenshot


위키데이터 이전에 편집 상자(왼쪽)와 기사 페이지(오른쪽)에 표시된 위키백과 기사의 언어 간 링크 목록입니다. 이러한 목록의 각 링크는 다른 기사에 대한 자체 언어 간 링크 목록이 필요한 기사에 대한 것입니다. 이는 위키데이터에 의해 중앙에 집중된 정보입니다.
Wikidata screenshot
오늘날 "링크 편집" 링크는 독자들을 위키데이터로 데려가 언어 간 및 위키 간 링크를 편집합니다.

위키데이터는 2012년 10월 29일에 시작되었으며 2006년 이후 위키미디어 재단의 첫 번째 신규 프로젝트였습니다.[3][20][21] 이때는 언어 링크의 중앙 집중화만 가능했습니다. 이를 통해 기본 정보인 라벨(이름 또는 제목, 별칭)을 만들고 채울 수 있었습니다. 라벨의 대체 용어, 설명 및 위키백과의 모든 다양한 언어판(인터위키피디아 링크)에 있는 주제에 대한 기사 링크.

역사적으로 위키백과 기사에는 언어 간 링크 목록(다른 위키백과 판에 있는 동일한 주제의 기사에 대한 링크가 존재하는 경우)이 포함됩니다. 위키데이터는 원래 언어 간 링크의 자체 저장소였습니다.[22] 위키백과 언어판은 여전히 위키데이터에 접근할 수 없었기 때문에 언어 간 링크 목록을 계속 유지해야 했습니다.[citation needed]

2013년 1월 14일 헝가리어 위키백과는 위키데이터를 통한 언어 간 링크 제공을 가능하게 한 최초의 위키백과가 되었습니다.[23] 이 기능은 1월 30일에 히브리어와 이탈리아어 위키백과로, 2월 13일에 영어 위키백과로, 3월 6일에 다른 모든 위키백과로 확장되었습니다.[24][25][26][27] 영어 위키백과에서 언어 링크를 삭제하는 것을 제한하는 제안에 대한 합의가 이루어지지 않은 후,[28] 에 의해 자동으로 삭제되었습니다. 2013년 9월 23일 위키미디어 커먼즈에서 언어 간 링크가 생중계되었습니다.[29]

문 및 데이터 액세스

2013년 2월 4일, 위키데이터 항목에 성명이 도입되었습니다. 속성에 대한 가능한 값은 처음에는 두 가지 데이터 유형(Wikimedia Commons의 항목 및 이미지)으로 제한되었으며 나중에 더 많은 데이터 유형(: 좌표 및 날짜)이 뒤따릅니다. 최초의 새로운 유형인 문자열은 3월 6일에 배포되었습니다.[30]

위키백과의 다양한 언어판들이 위키데이터의 데이터에 접근할 수 있는 기능은 2013년 3월 27일에서 4월 25일 사이에 점진적으로 시작되었습니다.[31][32] 2015년 9월 16일, 위키데이터는 위키백과의 특정 기사에서 직접 연결되지 않은 위키데이터 항목에 대한 진술에 대한 접근, 이른바 임의 접근을 허용하기 시작했습니다. 예를 들어 베를린 기사에서 독일에 대한 자료를 읽을 수 있게 되었는데, 이전에는 실현 가능하지 않았습니다.[33] 2016년 4월 27일 위키미디어 커먼즈에서 임의 접근이 활성화되었습니다.[34]

2020년 연구에 따르면, 위키데이터의 데이터의 상당 부분은 인터넷 봇에 의해 다른 데이터베이스에서 대량으로 가져온 항목으로 구성되어 있으며, 이는 데이터 사일로의 "벽을 허물어뜨리는" 데 도움이 됩니다.[35]

서비스 및 기타 개선사항 조회

2015년 9월 7일, 위키미디어 재단은 위키데이터에 포함된 데이터에 대한 쿼리를 실행할 수 [36]있는 위키데이터 쿼리 서비스를 발표했습니다.[37] 서비스는 SPARQL을 쿼리 언어로 사용합니다. 2018년 11월 현재 데이터를 다른 방식으로 조회할 수 있는 도구는 최소 26개입니다.[38] Blazegraph트리플스토어 및 그래프 데이터베이스로 사용합니다.[39][40]

2021년 위키미디어 Deutschland는 "SPARQL을 사용하는 방법을 모르는 사람들이 쿼리를 작성할 수 있도록 하는 양식 기반 쿼리 빌더"를 공개했습니다.[41]

로고의 막대에는 모스 코드로 인코딩된 "WIKI"라는 단어가 포함되어 있습니다.[42] 아룬 가네쉬가 만들고 커뮤니티 결정을 통해 선정했습니다.[43]

접수처

2014년 11월, 위키데이터는 오픈 데이터 연구소로부터 오픈 데이터 퍼블리셔 상을 수상했습니다.[44]

2014년 12월, 구글은 위키데이터에 유리하게 프리베이스를 폐쇄할 것이라고 발표했습니다.[45]

2018년 11월 기준으로 위키데이터 정보는 전체 영어 위키백과 기사의 58.4%에서 사용되었으며, 대부분 외부 식별자나 좌표 위치에 사용되었습니다. 종합하면, 위키데이터의 데이터는 전체 위키미디어 페이지의 64%, 전체 위키보이아게 기사의 93%, 전체 위키 인용문의 34%, 전체 위키 소스의 32%, 위키미디어 커먼즈의 27%에 나타납니다. 다른 Wikimedia Foundation 프로젝트에서의 사용은 하나의 사례입니다.[46]

2020년 12월 현재 위키데이터의 데이터는 최소 20개의 다른 외부 도구에[47] 의해 시각화되었으며 위키데이터에 관한 300개 이상의 논문이 발표되었습니다.[48]

위키데이터의 구조화된 데이터셋은 애플의 SiriAmazon Alexa와 같은 가상 비서들에 의해 사용되어 왔습니다.[49]

적용들

  • Mwnci 확장은 Wikidata에서 LibreOffice Calc 스프레드시트[50] 데이터를 가져올 수 있습니다.
  • QID emoji라고 불리는[51] 것과 관련하여 QID 항목을 사용하는 것에 대한 (2019년 10월) 논의가 있습니다.
  • KDE 여행 일정 – Wikidata의[52] 데이터를 사용하는 개인 정보 보호를 고려한 오픈 소스 여행 도우미
  • 구글원래 인공지능을 이용해 관련 진술을 내놓음으로써 위키피디아의 정보를 파싱하고 위키데이터로 옮기는 것을 목표로 하는 프레임 시맨틱 파서 프로젝트를 시작했습니다.[53]
  • MathQA – 수학적 질문 응답 시스템[54]

2019년에는 위키데이터의 연구 활용에 대한 체계적 문헌고찰이 이루어졌습니다.[55]

참고 항목

참고문헌

  1. ^ "The Wikidata revolution is here: enabling structured data on Wikipedia". 25 April 2013. Retrieved 12 June 2022. Since Wikidata.org went live on 30 October 2012,
  2. ^ Chalabi, Mona (26 April 2013). "Welcome to Wikidata! Now what?". Archived from the original on 2 October 2021. Retrieved 2 October 2021.
  3. ^ a b Wikidata (Wayback Machine에서 2012년 10월 29일 아카이브)
  4. ^ "Data Revolution for Wikipedia". Wikimedia Deutschland. 30 March 2012. Archived from the original on 23 October 2012. Retrieved 11 September 2012.
  5. ^ Vrandečić, Denny; Pintscher, Lydia; Krötzsch, Markus (30 April 2023). "Wikidata: The Making of". Companion Proceedings of the ACM Web Conference 2023. pp. 615–624. doi:10.1145/3543873.3585579. ISBN 9781450394192. S2CID 258377705.
  6. ^ "Help:Statements – Wikidata". www.wikidata.org. Archived from the original on 25 March 2019. Retrieved 20 February 2019.
  7. ^ "Help:Data type – Wikidata". www.wikidata.org. Archived from the original on 23 March 2019. Retrieved 20 February 2019.
  8. ^ "Help:Sources – Wikidata". www.wikidata.org. Archived from the original on 17 April 2019. Retrieved 20 February 2019.
  9. ^ "Help:Property constraints portal". Wikidata. Archived from the original on 1 June 2019. Retrieved 20 February 2019.
  10. ^ Cochrane, Euan (30 September 2016). "Wikidata as a digital preservation knowledgebase". openpreservation.org. Archived from the original on 5 January 2022. Retrieved 5 January 2022.
  11. ^ Samuel, John (15 August 2018). "Experimental IR Meets Multilinguality, Multimodality, and Interaction". Experimental IR Meets Multilinguality, Multimodality, and Interaction. CLEF 2018. Lecture Notes in Computer Science. Vol. 11018. p. 129. doi:10.1007/978-3-319-98932-7_12. ISBN 978-3-319-98931-0.
  12. ^ "Wikidata:Database reports/List of properties/Top100". Archived from the original on 24 February 2023. Retrieved 18 November 2023.
  13. ^ "Wikidata:Lexicographical data/Documentation – Wikidata". www.wikidata.org. Archived from the original on 13 November 2018. Retrieved 13 November 2018.
  14. ^ "Extension:EntitySchema - MediaWiki". mediawiki.org. Archived from the original on 25 June 2021. Retrieved 10 September 2021.
  15. ^ "Initial empty repository". Gerrit. 15 January 2019. Archived from the original on 19 March 2022. Retrieved 12 June 2022.
  16. ^ "Version - Wikidata". Wikidata.org. Archived from the original on 19 October 2021. Retrieved 10 September 2021.
  17. ^ Dickinson, Boonsri (30 March 2012). "Paul Allen Invests In A Massive Project To Make Wikipedia Better". Business Insider. Archived from the original on 23 December 2017. Retrieved 11 September 2012.
  18. ^ Perez, Sarah (30 March 2012). "Wikipedia's Next Big Thing: Wikidata, A Machine-Readable, User-Editable Database Funded By Google, Paul Allen And Others". TechCrunch. Archived from the original on 5 October 2012. Retrieved 11 September 2012.
  19. ^ "Wikidata – Meta". meta.wikimedia.org. Archived from the original on 7 April 2012. Retrieved 8 November 2015.
  20. ^ Pintscher, Lydia (30 October 2012). "wikidata.org is live (with some caveats)". wikidata-l (Mailing list). Retrieved 3 November 2012.
  21. ^ Roth, Matthew (30 March 2012). "The Wikipedia data revolution". Wikimedia Foundation. Archived from the original on 11 September 2012. Retrieved 11 September 2012.
  22. ^ Leitch, Thomas (1 November 2014). Wikipedia U: Knowledge, Authority, and Liberal Education in the Digital Age. Johns Hopkins University Press. p. 120. ISBN 978-1-4214-1550-5.
  23. ^ Pintscher, Lydia (14 January 2013). "First steps of Wikidata in the Hungarian Wikipedia". Wikimedia Deutschland. Archived from the original on 14 December 2015. Retrieved 17 December 2015.
  24. ^ Pintscher, Lydia (30 January 2013). "Wikidata coming to the next two Wikipedias". Wikimedia Deutschland. Archived from the original on 4 October 2018. Retrieved 31 January 2013.
  25. ^ Pintscher, Lydia (13 February 2013). "Wikidata live on the English Wikipedia". Wikimedia Deutschland. Archived from the original on 19 February 2013. Retrieved 15 February 2013.
  26. ^ Pintscher, Lydia (6 March 2013). "Wikidata now live on all Wikipedias". Wikimedia Deutschland. Archived from the original on 14 April 2013. Retrieved 8 March 2013.
  27. ^ "Wikidata ist für alle Wikipedien da" (in German). Golem.de. Archived from the original on 6 November 2018. Retrieved 29 January 2014.
  28. ^ "Wikipedia talk:Wikidata interwiki RFC". 29 March 2013. Archived from the original on 18 October 2021. Retrieved 30 March 2013.
  29. ^ Pintscher, Lydia (23 September 2013). "Wikidata is Here!". Commons:Village pump. Archived from the original on 6 December 2021. Retrieved 30 August 2016.
  30. ^ Pintscher, Lydia. "Wikidata/Status updates/2013 03 01". Wikimedia Meta-Wiki. Wikimedia Foundation. Archived from the original on 12 April 2013. Retrieved 3 March 2013.
  31. ^ Pintscher, Lydia (27 March 2013). "You can have all the data!". Wikimedia Deutschland. Archived from the original on 29 March 2013. Retrieved 28 March 2013.
  32. ^ "Wikidata goes live worldwide". The H. 25 April 2013. Archived from the original on 1 January 2014.
  33. ^ Pintscher, Lydia (16 September 2015). "Wikidata: Access to data from arbitrary items is here". Wikipedia:Village pump (technical). Archived from the original on 27 September 2016. Retrieved 30 August 2016.
  34. ^ Pintscher, Lydia (27 April 2016). "Wikidata support: arbitrary access is here". Commons:Village pump. Archived from the original on 5 February 2017. Retrieved 30 August 2016.
  35. ^ Waagmeester, Andra; Stupp, Gregory; Burgstaller-Muehlbacher, Sebastian; et al. (17 March 2020). "Wikidata as a knowledge graph for the life sciences". eLife. 9. doi:10.7554/ELIFE.52614. ISSN 2050-084X. PMC 7077981. PMID 32180547. Wikidata Q87830400.{{cite journal}}: CS1 메인트: 플래그 없는 무료 DOI(링크)
  36. ^ "Home". query.wikidata.org. Archived from the original on 7 November 2016. Retrieved 30 January 2019.
  37. ^ "[Wikidata] Announcing the release of the Wikidata Query Service - Wikidata - lists.wikimedia.org". Archived from the original on 10 November 2015. Retrieved 13 November 2018.
  38. ^ "Wikidata:Tools/Query data – Wikidata". www.wikidata.org. Archived from the original on 31 May 2020. Retrieved 13 November 2018.
  39. ^ "[Wikidata-tech] Wikidata Query Backend Update (take two!)". lists.wikimedia.org. Archived from the original on 6 January 2021. Retrieved 29 August 2018. (이 메시지에는 위키미디어에서 수행한 그래프 데이터베이스 비교에 대한 링크도 포함되어 있습니다.)
  40. ^ GitHub에서 86
  41. ^ "Wikidata Query Builder". query.wikidata.org.
  42. ^ 공용:파일 대화:Wikidata-logo-en.svg#Hybrid. 회수 2016-10-06
  43. ^ "Und der Gewinner ist..." 13 July 2012. Archived from the original on 21 January 2021. Retrieved 16 June 2020.
  44. ^ "First ODI Open Data Awards presented by Sirs Tim Berners-Lee and Nigel Shadbolt". Archived from the original on 24 March 2016.
  45. ^ "Freebase". Google Plus. 16 December 2014. Archived from the original on 20 March 2019.
  46. ^ "Percentage of articles making use of data from Wikidata". Archived from the original on 15 November 2018. Retrieved 15 November 2018.
  47. ^ "Wikidata:Tools/Visualize data – Wikidata". www.wikidata.org. Archived from the original on 15 November 2018. Retrieved 15 November 2018.
  48. ^ "Scholia". Scholia. Archived from the original on 30 September 2021. Retrieved 2 August 2021.
  49. ^ Simonite, Tom (18 February 2019). "Inside the Alexa-Friendly World of Wikidata". Wired. ISSN 1059-1028. Retrieved 25 December 2020.
  50. ^ "Rob Barry / Mwnci – Deep Spreadsheets". GitLab. Archived from the original on 21 September 2019. Retrieved 21 September 2019.
  51. ^ "Public Review Issues". Archived from the original on 20 November 2019. Retrieved 30 October 2019.
  52. ^ Krause, Volker (12 January 2020), KDE Itinerary – A privacy by design travel assistant, archived from the original on 26 June 2020, retrieved 10 November 2020
  53. ^ 깃허브매달리기
  54. ^ Scharpf, P. Schubotz, M. Gipp, B. 비감독 공식 라벨링을 통한 질문 답변을 위한 수학 문서 마이닝은 2022년 2월 10일 웨이백 머신 ACM/IEEE 디지털 라이브러리 합동 회의에서 아카이브되었습니다.
  55. ^ Mora-Cantallops, Marçal; Sánchez-Alonso, Salvador; García-Barriocanal, Elena (2 September 2019). "A systematic literature review on Wikidata". Data Technologies and Applications. 53 (3): 250–268. doi:10.1108/DTA-12-2018-0110. S2CID 202036639.

더보기

외부 링크