위키데이터
Wikidata사이트유형 | |
---|---|
에서 사용 가능 | 다국어 |
주인 | 위키미디어 재단 |
편집기 | 위키미디어 커뮤니티 |
URL | www |
상업의 | 아니요. |
등록. | 선택적. |
런칭 | 2012년 10월 29일;[1] | 전
위키데이터는 위키미디어 재단에서 주최하는 공동 편집된 다국어 지식 그래프입니다.[2] 위키백과와 [3][4]같은 위키미디어 프로젝트가 CC0 공용 도메인 라이선스 하에서 사용할 수 있는 오픈 데이터의 공통 소스입니다. 위키데이터(Wikidata)는 미디어위키(MediaWiki)에 의해 구동되는 위키로, 반구조화된 데이터인 위키베이스(Wikibase)에 대한 확장을 포함합니다.
개념.
위키데이터는 문서 중심의 데이터베이스로, 항목에 초점을 맞추고 있으며, 모든 종류의 주제, 개념 또는 대상을 나타냅니다. 각 항목에는 고유하고 지속적인 식별자, "QID"로 알려진 대문자 Q가 접두사로 붙은 양의 정수가 할당됩니다. Q는 위키데이터 공동 개발자 데니 브란데치와 결혼한 우즈베키스탄 위키미디어인 카마르니소 브란데치(성 이스밀로바)의 첫 번째 이름입니다.[5] 이를 통해 항목이 다루는 주제를 식별하는 데 필요한 기본 정보를 언어를 선호하지 않고 번역할 수 있습니다.
상품의 예로는 1988년 하계 올림픽 (Q8470), 사랑 (Q316), 조니 캐시 (Q42775), 엘비스 프레슬리 (Q303), 고릴라 (Q36611) 등이 있습니다.
항목 레이블은 고유할 필요가 없습니다. 예를 들어, "엘비스 프레슬리"라는 이름의 두 가지 아이템이 있습니다: 미국 가수이자 배우를 대표하는 엘비스 프레슬리 (Q303)와 그의 자작 앨범을 대표하는 엘비스 프레슬리 (Q610926). 그러나 라벨과 설명의 조합은 고유해야 합니다. 따라서 모호성을 방지하기 위해 항목의 고유 식별자(QID)가 이 조합에 연결됩니다.
주요부분
기본적으로 항목은 다음과 같이 구성됩니다.
- 레이블 및 설명과 관련된 식별자(QID)입니다.
- 선택적으로 여러 개의 별칭과 몇 개의 문(및 해당 속성 및 값)이 있습니다.
진술들
문장은 항목에 대해 알려진 모든 정보가 위키데이터에 기록되는 방법입니다. 공식적으로 키-값 쌍으로 구성되며, 키-값 쌍은 하나 이상의 엔티티 값(예: "저자" 또는 "출판 날짜")과 일치합니다(예: "아서 코난 도일 경" 또는 "1902"). 예를 들어, "우유는 흰색"이라는 비공식 영어 문구는 우유(Q8495) 항목 아래의 속성 색상(P462)과 흰색(Q23444)을 쌍으로 구성하는 문구로 인코딩됩니다.
문은 속성을 하나 이상의 값으로 매핑할 수 있습니다. 예를 들어, 마리 퀴리의 "직업" 속성은 그녀가 두 직업에 모두 종사했다는 사실을 반영하기 위해 "물리학자" 및 "화학자" 값과 연결될 수 있습니다.[6]
값은 다른 위키데이터 항목, 문자열, 숫자 또는 미디어 파일을 포함한 많은 유형을 취할 수 있습니다. 속성은 어떤 유형의 값과 쌍을 이룰 수 있는지 지정합니다. 예를 들어, 부동산 공식 웹 사이트(P856)는 "URL" 유형의 값과만 쌍을 이룰 수 있습니다.[7]
선택적으로 수식어를 사용하여 추가 정보를 제공하여 문장의 의미를 구체화할 수 있습니다. 예를 들어, "군" 문은 "포인트 시점(P585): 2011"(자체 키-값 쌍)과 같은 한정자로 수정될 수 있습니다. 문의 값은 또한 문의 내용을 백업하는 소스를 가리키는 참조와 함께 주석을 달 수 있습니다.[8] 문과 마찬가지로 모든 한정자 및 참조는 속성-값 쌍입니다.
특성.
각 속성에는 대문자 P로 접두사가 붙은 숫자 식별자와 선택적인 레이블, 설명, 별칭 및 문이 있는 Wikidata 페이지가 있습니다. 이와 같이 (P1647)의 하위 속성과 같이 다른 속성을 설명하기 위한 유일한 목적을 가진 속성이 있습니다.
속성은 또한 의도된 사용에 대한 보다 복잡한 규칙인 제약 조건을 정의할 수 있습니다. 예를 들어, 자본(P36) 재산에는 "단일 가치 제약"이 포함되며, 이는 (일반적으로) 영토가 하나의 자본 도시만 있는 현실을 반영합니다. 제약 조건은 위반할 수 없는 규칙이 아닌 테스트 경고 및 힌트로 취급됩니다.[9]
새 부동산을 만들기 전에 논의 과정을 거쳐야 합니다.[10][11]
가장 많이 사용되는 속성은 인용 저작물(P2860)로, 2023년 11월 기준으로 290,000,000개 이상의 항목 페이지에서 사용됩니다.[update][12]
렉세메스
언어학에서 어휘소는 어휘적 의미의 단위입니다. 마찬가지로 위키데이터의 어휘소는 사전 데이터를 저장하기에 더 적합한 구조를 가진 항목입니다. 어휘소가 참조하는 언어를 저장하는 것 외에도 형태를 위한 섹션과 감각을 위한 섹션이 있습니다.[13]
엔티티 스키마
2019년 1월, 미디어위키의 새로운 확장 기능을 개발하여 Shape expressions를 별도의 네임스페이스에 저장할 수 있게 했습니다.[14][15]
이 확장은 이후 Wikidata에[16] 설치되었으며 기여자는 Shape Expressions를 사용하여 항목 및 어휘소의 리소스 설명 프레임워크 데이터를 확인하고 설명할 수 있습니다. Wikidata의 어떤 항목이나 어휘명도 엔티티 스키마에 대해 검증할 수 있으므로 품질 보증을 위한 중요한 도구가 됩니다.
발전
이 프로젝트의 설립은 앨런 인공지능 연구소, 고든 앤 베티 무어 재단, 구글의 기부금으로 총 130만 유로를 지원했습니다.[17][18] 이 프로젝트의 개발은 주로 Lydia Pintscher의 관리 하에 Wikimedia Deutschland에 의해 주도되었으며, 원래는 세 단계로 나뉘었습니다.[19]
- 언어 간 링크 중앙 집중화 – 같은 주제에 대한 위키백과 기사 간의 다른 언어의 링크.
- 모든 Wikipedia를 위한 인포박스 데이터를 위한 중앙 장소를 제공합니다.
- 위키데이터의 데이터를 기반으로 목록 기사를 만들고 업데이트하며 메타위키 및 자체 위키데이터(인터위키링크)를 포함한 다른 위키미디어 자매 프로젝트에 링크합니다.
초기 롤아웃
위키데이터는 2012년 10월 29일에 시작되었으며 2006년 이후 위키미디어 재단의 첫 번째 신규 프로젝트였습니다.[3][20][21] 이때는 언어 링크의 중앙 집중화만 가능했습니다. 이를 통해 기본 정보인 라벨(이름 또는 제목, 별칭)을 만들고 채울 수 있었습니다. 라벨의 대체 용어, 설명 및 위키백과의 모든 다양한 언어판(인터위키피디아 링크)에 있는 주제에 대한 기사 링크.
역사적으로 위키백과 기사에는 언어 간 링크 목록(다른 위키백과 판에 있는 동일한 주제의 기사에 대한 링크가 존재하는 경우)이 포함됩니다. 위키데이터는 원래 언어 간 링크의 자체 저장소였습니다.[22] 위키백과 언어판은 여전히 위키데이터에 접근할 수 없었기 때문에 언어 간 링크 목록을 계속 유지해야 했습니다.[citation needed]
2013년 1월 14일 헝가리어 위키백과는 위키데이터를 통한 언어 간 링크 제공을 가능하게 한 최초의 위키백과가 되었습니다.[23] 이 기능은 1월 30일에 히브리어와 이탈리아어 위키백과로, 2월 13일에 영어 위키백과로, 3월 6일에 다른 모든 위키백과로 확장되었습니다.[24][25][26][27] 영어 위키백과에서 언어 링크를 삭제하는 것을 제한하는 제안에 대한 합의가 이루어지지 않은 후,[28] 봇에 의해 자동으로 삭제되었습니다. 2013년 9월 23일 위키미디어 커먼즈에서 언어 간 링크가 생중계되었습니다.[29]
문 및 데이터 액세스
2013년 2월 4일, 위키데이터 항목에 성명이 도입되었습니다. 속성에 대한 가능한 값은 처음에는 두 가지 데이터 유형(Wikimedia Commons의 항목 및 이미지)으로 제한되었으며 나중에 더 많은 데이터 유형(예: 좌표 및 날짜)이 뒤따릅니다. 최초의 새로운 유형인 문자열은 3월 6일에 배포되었습니다.[30]
위키백과의 다양한 언어판들이 위키데이터의 데이터에 접근할 수 있는 기능은 2013년 3월 27일에서 4월 25일 사이에 점진적으로 시작되었습니다.[31][32] 2015년 9월 16일, 위키데이터는 위키백과의 특정 기사에서 직접 연결되지 않은 위키데이터 항목에 대한 진술에 대한 접근, 이른바 임의 접근을 허용하기 시작했습니다. 예를 들어 베를린 기사에서 독일에 대한 자료를 읽을 수 있게 되었는데, 이전에는 실현 가능하지 않았습니다.[33] 2016년 4월 27일 위키미디어 커먼즈에서 임의 접근이 활성화되었습니다.[34]
2020년 연구에 따르면, 위키데이터의 데이터의 상당 부분은 인터넷 봇에 의해 다른 데이터베이스에서 대량으로 가져온 항목으로 구성되어 있으며, 이는 데이터 사일로의 "벽을 허물어뜨리는" 데 도움이 됩니다.[35]
서비스 및 기타 개선사항 조회
2015년 9월 7일, 위키미디어 재단은 위키데이터에 포함된 데이터에 대한 쿼리를 실행할 수 [36]있는 위키데이터 쿼리 서비스를 발표했습니다.[37] 서비스는 SPARQL을 쿼리 언어로 사용합니다. 2018년 11월 현재 데이터를 다른 방식으로 조회할 수 있는 도구는 최소 26개입니다.[38] Blazegraph를 트리플스토어 및 그래프 데이터베이스로 사용합니다.[39][40]
2021년 위키미디어 Deutschland는 "SPARQL을 사용하는 방법을 모르는 사람들이 쿼리를 작성할 수 있도록 하는 양식 기반 쿼리 빌더"를 공개했습니다.[41]
로고
로고의 막대에는 모스 코드로 인코딩된 "WIKI"라는 단어가 포함되어 있습니다.[42] 아룬 가네쉬가 만들고 커뮤니티 결정을 통해 선정했습니다.[43]
접수처
2014년 11월, 위키데이터는 오픈 데이터 연구소로부터 오픈 데이터 퍼블리셔 상을 수상했습니다.[44]
2014년 12월, 구글은 위키데이터에 유리하게 프리베이스를 폐쇄할 것이라고 발표했습니다.[45]
2018년[update] 11월 기준으로 위키데이터 정보는 전체 영어 위키백과 기사의 58.4%에서 사용되었으며, 대부분 외부 식별자나 좌표 위치에 사용되었습니다. 종합하면, 위키데이터의 데이터는 전체 위키미디어 페이지의 64%, 전체 위키보이아게 기사의 93%, 전체 위키 인용문의 34%, 전체 위키 소스의 32%, 위키미디어 커먼즈의 27%에 나타납니다. 다른 Wikimedia Foundation 프로젝트에서의 사용은 하나의 사례입니다.[46]
2020년[update] 12월 현재 위키데이터의 데이터는 최소 20개의 다른 외부 도구에[47] 의해 시각화되었으며 위키데이터에 관한 300개 이상의 논문이 발표되었습니다.[48]
위키데이터의 구조화된 데이터셋은 애플의 Siri와 Amazon Alexa와 같은 가상 비서들에 의해 사용되어 왔습니다.[49]
적용들
- Mwnci 확장은 Wikidata에서 LibreOffice Calc 스프레드시트로[50] 데이터를 가져올 수 있습니다.
- QID emoji라고 불리는[51] 것과 관련하여 QID 항목을 사용하는 것에 대한 (2019년 10월) 논의가 있습니다.
- KDE 여행 일정 – Wikidata의[52] 데이터를 사용하는 개인 정보 보호를 고려한 오픈 소스 여행 도우미
- 구글은 원래 인공지능을 이용해 관련 진술을 내놓음으로써 위키피디아의 정보를 파싱하고 위키데이터로 옮기는 것을 목표로 하는 프레임 시맨틱 파서 프로젝트를 시작했습니다.[53]
- MathQA – 수학적 질문 응답 시스템[54]
2019년에는 위키데이터의 연구 활용에 대한 체계적 문헌고찰이 이루어졌습니다.[55]
참고 항목
참고문헌
- ^ "The Wikidata revolution is here: enabling structured data on Wikipedia". 25 April 2013. Retrieved 12 June 2022.
Since Wikidata.org went live on 30 October 2012,
- ^ Chalabi, Mona (26 April 2013). "Welcome to Wikidata! Now what?". Archived from the original on 2 October 2021. Retrieved 2 October 2021.
- ^ a b Wikidata (Wayback Machine에서 2012년 10월 29일 아카이브)
- ^ "Data Revolution for Wikipedia". Wikimedia Deutschland. 30 March 2012. Archived from the original on 23 October 2012. Retrieved 11 September 2012.
- ^ Vrandečić, Denny; Pintscher, Lydia; Krötzsch, Markus (30 April 2023). "Wikidata: The Making of". Companion Proceedings of the ACM Web Conference 2023. pp. 615–624. doi:10.1145/3543873.3585579. ISBN 9781450394192. S2CID 258377705.
- ^ "Help:Statements – Wikidata". www.wikidata.org. Archived from the original on 25 March 2019. Retrieved 20 February 2019.
- ^ "Help:Data type – Wikidata". www.wikidata.org. Archived from the original on 23 March 2019. Retrieved 20 February 2019.
- ^ "Help:Sources – Wikidata". www.wikidata.org. Archived from the original on 17 April 2019. Retrieved 20 February 2019.
- ^ "Help:Property constraints portal". Wikidata. Archived from the original on 1 June 2019. Retrieved 20 February 2019.
- ^ Cochrane, Euan (30 September 2016). "Wikidata as a digital preservation knowledgebase". openpreservation.org. Archived from the original on 5 January 2022. Retrieved 5 January 2022.
- ^ Samuel, John (15 August 2018). "Experimental IR Meets Multilinguality, Multimodality, and Interaction". Experimental IR Meets Multilinguality, Multimodality, and Interaction. CLEF 2018. Lecture Notes in Computer Science. Vol. 11018. p. 129. doi:10.1007/978-3-319-98932-7_12. ISBN 978-3-319-98931-0.
- ^ "Wikidata:Database reports/List of properties/Top100". Archived from the original on 24 February 2023. Retrieved 18 November 2023.
- ^ "Wikidata:Lexicographical data/Documentation – Wikidata". www.wikidata.org. Archived from the original on 13 November 2018. Retrieved 13 November 2018.
- ^ "Extension:EntitySchema - MediaWiki". mediawiki.org. Archived from the original on 25 June 2021. Retrieved 10 September 2021.
- ^ "Initial empty repository". Gerrit. 15 January 2019. Archived from the original on 19 March 2022. Retrieved 12 June 2022.
- ^ "Version - Wikidata". Wikidata.org. Archived from the original on 19 October 2021. Retrieved 10 September 2021.
- ^ Dickinson, Boonsri (30 March 2012). "Paul Allen Invests In A Massive Project To Make Wikipedia Better". Business Insider. Archived from the original on 23 December 2017. Retrieved 11 September 2012.
- ^ Perez, Sarah (30 March 2012). "Wikipedia's Next Big Thing: Wikidata, A Machine-Readable, User-Editable Database Funded By Google, Paul Allen And Others". TechCrunch. Archived from the original on 5 October 2012. Retrieved 11 September 2012.
- ^ "Wikidata – Meta". meta.wikimedia.org. Archived from the original on 7 April 2012. Retrieved 8 November 2015.
- ^ Pintscher, Lydia (30 October 2012). "wikidata.org is live (with some caveats)". wikidata-l (Mailing list). Retrieved 3 November 2012.
- ^ Roth, Matthew (30 March 2012). "The Wikipedia data revolution". Wikimedia Foundation. Archived from the original on 11 September 2012. Retrieved 11 September 2012.
- ^ Leitch, Thomas (1 November 2014). Wikipedia U: Knowledge, Authority, and Liberal Education in the Digital Age. Johns Hopkins University Press. p. 120. ISBN 978-1-4214-1550-5.
- ^ Pintscher, Lydia (14 January 2013). "First steps of Wikidata in the Hungarian Wikipedia". Wikimedia Deutschland. Archived from the original on 14 December 2015. Retrieved 17 December 2015.
- ^ Pintscher, Lydia (30 January 2013). "Wikidata coming to the next two Wikipedias". Wikimedia Deutschland. Archived from the original on 4 October 2018. Retrieved 31 January 2013.
- ^ Pintscher, Lydia (13 February 2013). "Wikidata live on the English Wikipedia". Wikimedia Deutschland. Archived from the original on 19 February 2013. Retrieved 15 February 2013.
- ^ Pintscher, Lydia (6 March 2013). "Wikidata now live on all Wikipedias". Wikimedia Deutschland. Archived from the original on 14 April 2013. Retrieved 8 March 2013.
- ^ "Wikidata ist für alle Wikipedien da" (in German). Golem.de. Archived from the original on 6 November 2018. Retrieved 29 January 2014.
- ^ "Wikipedia talk:Wikidata interwiki RFC". 29 March 2013. Archived from the original on 18 October 2021. Retrieved 30 March 2013.
- ^ Pintscher, Lydia (23 September 2013). "Wikidata is Here!". Commons:Village pump. Archived from the original on 6 December 2021. Retrieved 30 August 2016.
- ^ Pintscher, Lydia. "Wikidata/Status updates/2013 03 01". Wikimedia Meta-Wiki. Wikimedia Foundation. Archived from the original on 12 April 2013. Retrieved 3 March 2013.
- ^ Pintscher, Lydia (27 March 2013). "You can have all the data!". Wikimedia Deutschland. Archived from the original on 29 March 2013. Retrieved 28 March 2013.
- ^ "Wikidata goes live worldwide". The H. 25 April 2013. Archived from the original on 1 January 2014.
- ^ Pintscher, Lydia (16 September 2015). "Wikidata: Access to data from arbitrary items is here". Wikipedia:Village pump (technical). Archived from the original on 27 September 2016. Retrieved 30 August 2016.
- ^ Pintscher, Lydia (27 April 2016). "Wikidata support: arbitrary access is here". Commons:Village pump. Archived from the original on 5 February 2017. Retrieved 30 August 2016.
- ^ Waagmeester, Andra; Stupp, Gregory; Burgstaller-Muehlbacher, Sebastian; et al. (17 March 2020). "Wikidata as a knowledge graph for the life sciences". eLife. 9. doi:10.7554/ELIFE.52614. ISSN 2050-084X. PMC 7077981. PMID 32180547. Wikidata Q87830400.
{{cite journal}}
: CS1 메인트: 플래그 없는 무료 DOI(링크) - ^ "Home". query.wikidata.org. Archived from the original on 7 November 2016. Retrieved 30 January 2019.
- ^ "[Wikidata] Announcing the release of the Wikidata Query Service - Wikidata - lists.wikimedia.org". Archived from the original on 10 November 2015. Retrieved 13 November 2018.
- ^ "Wikidata:Tools/Query data – Wikidata". www.wikidata.org. Archived from the original on 31 May 2020. Retrieved 13 November 2018.
- ^ "[Wikidata-tech] Wikidata Query Backend Update (take two!)". lists.wikimedia.org. Archived from the original on 6 January 2021. Retrieved 29 August 2018. (이 메시지에는 위키미디어에서 수행한 그래프 데이터베이스 비교에 대한 링크도 포함되어 있습니다.)
- ^ GitHub에서 86
- ^ "Wikidata Query Builder". query.wikidata.org.
- ^ 공용:파일 대화:Wikidata-logo-en.svg#Hybrid. 회수 2016-10-06
- ^ "Und der Gewinner ist..." 13 July 2012. Archived from the original on 21 January 2021. Retrieved 16 June 2020.
- ^ "First ODI Open Data Awards presented by Sirs Tim Berners-Lee and Nigel Shadbolt". Archived from the original on 24 March 2016.
- ^ "Freebase". Google Plus. 16 December 2014. Archived from the original on 20 March 2019.
- ^ "Percentage of articles making use of data from Wikidata". Archived from the original on 15 November 2018. Retrieved 15 November 2018.
- ^ "Wikidata:Tools/Visualize data – Wikidata". www.wikidata.org. Archived from the original on 15 November 2018. Retrieved 15 November 2018.
- ^ "Scholia". Scholia. Archived from the original on 30 September 2021. Retrieved 2 August 2021.
- ^ Simonite, Tom (18 February 2019). "Inside the Alexa-Friendly World of Wikidata". Wired. ISSN 1059-1028. Retrieved 25 December 2020.
- ^ "Rob Barry / Mwnci – Deep Spreadsheets". GitLab. Archived from the original on 21 September 2019. Retrieved 21 September 2019.
- ^ "Public Review Issues". Archived from the original on 20 November 2019. Retrieved 30 October 2019.
- ^ Krause, Volker (12 January 2020), KDE Itinerary – A privacy by design travel assistant, archived from the original on 26 June 2020, retrieved 10 November 2020
- ^ 깃허브에 매달리기
- ^ Scharpf, P. Schubotz, M. Gipp, B. 비감독 공식 라벨링을 통한 질문 답변을 위한 수학 문서 마이닝은 2022년 2월 10일 웨이백 머신 ACM/IEEE 디지털 라이브러리 합동 회의에서 아카이브되었습니다.
- ^ Mora-Cantallops, Marçal; Sánchez-Alonso, Salvador; García-Barriocanal, Elena (2 September 2019). "A systematic literature review on Wikidata". Data Technologies and Applications. 53 (3): 250–268. doi:10.1108/DTA-12-2018-0110. S2CID 202036639.
더보기
- Mark Graham (6 April 2012), "The Problem With Wikidata", The Atlantic, US
- Claudia Muller-Birn, Benjamin Karran, Janette Lehmann, Markus Luczak-Rösch: 동료 제작 시스템 또는 공동 온톨로지 개발 노력: 위키데이터란? In, OpenSym 2015 – Open Collaboration에 관한 컨퍼런스, 미국 샌프란시스코, 2015년 8월 19일부터 21일까지 (사전 인쇄).
외부 링크
- 공식 홈페이지
- 비디오: WikidataCon on media.ccc.de