위키백과:위키백과 연구

Wikipedia:

위키백과 연구(이전에는 위키백과 주라고 알려져 있음)에서는 위키백과 프로젝트의 다양한 측면을 정량적으로 측정하는 몇 가지 방법뿐 아니라 그 분야에서 수행된 연구를 다룬다.위키피디아가 가질 수 있는 다른 목표들과 그 목표들의 성취도를 측정하는 다른 방법들이 있기 때문에 이 주제는 어렵다.

이론

원시수

성공을 측정하는 어려운 방법은 위키피디아의 기사 수를 세는 것이다.이 정보는 통계 페이지에서 확인할 수 있다.기사 숫자만 세는 문제점은, '기사'란 무엇인가.우리의 "미술품"의 많은 부분이 극히 짧은 단조로운 것일 수도 있고, 아니면 단지 약탈되지 않은 반달리즘으로 구성되어 있을 수도 있다.{{merge}}}}{{ stub}}}}}의 뭉툭한 기사들이 더 적고, 더 나은 기사로 이어지며, 내용물을 잃지 않는다.위키피디아의 크기를 보다 정확하게 측정하는 것은 기사의 문자나 단어 수다.위키피디아는 2006년 10월 현재 평균 길이가 3,300자인 140만 개의 기사를 보유하고 있다.

그러한 측정은 내용의 품질을 나타내지 않는다.위키피디아의 좋은 기사, 유용성, 정확성 또는 균형 잡힌 기사 수를 추정하는 것은 훨씬 더 어렵다.이를 위해, 우리는 "기분 좋은", "좋은", "A-" 또는 "B-클래스" 기사로 평가된 기사만을 고려할 수 있다.2007년 2월 현재, 위키피디아에 관한 550개의 기사 중 1개는 "기능적"이거나 "좋은" 기사들이다.

통계 페이지에 대해 생각해 볼 수 있는 한 가지 방법은 그것을 참고 작품이라기 보다는 하나의 프로젝트로서 위키피디아의 성공에 대한 척도로 보는 것이다.(지역사회건물이 2차 목표가 아닌 부작용인 상태에서) 참조작업 제작 프로젝트인 만큼, 사업성공 평가는 참조작업 평가와 직결된다.

웹과의 관련성

위키피디아의 성공을 고려하는 또 다른 방법은 위키피디아의 정보가 월드 와이드 웹과 얼마나 관련이 있는지 물어보는 것이다.위키백과 사이트는 하루에 몇 번의 조회수를 받는가?구글에서 얼마나 많은 독자들이 왔는가?Google PageLank가 높은 페이지는?

위키피디아의 인기 척도는 웹 트래픽 순위를 보여주는 알렉사(Alexa) 기재되어 있다.

가치 있지만 자동화하기 어려운 한 가지 척도는 위키백과를 고려하는 것이다.구글 조회수 상위 10개.이미 위키피디아에 나와 있는 주제 중 구글에서 높은 페이지 순위를 차지할 만큼 충분한 참고자료가 얼마나 되는가?

그러나 또 다른 측정은 다른 사이트들이 위키백과의 내용을 사용하는 수 또는 정도를 포함할 수 있다.많은 다른 사이트들이 위키피디아 내용의 정확성을 신뢰한다는 사실은 위키피디아 성공의 강력한 지표다.

커버리지

고려해야 할 또 다른 축은 위키피디아 커버리지다.커버리지는 위키피디아에서 우리가 필요로 하는 정보가 이미 얼마나 많은지 보여주는 척도다.위키피디아가 얼마나 잘 알아야 할 지식의 범위를 "커버링"하고 있는가?

커버리지에 대해 생각해 볼 수 있는 한 가지 방법은 위키백과 가치가 있는 모든 정보가 시스템에 있는 미래의 어떤 "끝점"인 편집 제로(Edit Zero)를 상상하는 것이다.이때 위키피디아인들의 작업은 기존 주제에 대한 글쓰기에서 새로운 사람, 행사, 국가, 시상식, 종, 앨범, 책, 행성 등이 등장하면서 새로운 주제에 대한 기사를 추가하는 것으로 바뀌게 된다.위키피디아의 현재 커버리지의 척도는 그 상상 속의 백과사전 중 얼마나 많은 기사가 어떤 유용한 형태로 이미 존재하는지 측정하는 것일 것이다.

이것은 대부분의 면에서 헤아릴 수 없는 측정기준이다.편집제로의 위키피디아에 얼마나 많은 기사가 실릴지 알 수 없기 때문에 이미 몇 퍼센트의 기사가 실릴지는 알 수 없다.우리가 할 수 있는 최선의 방법은 "실제" 적용 범위 측정 기준과 임시 측정 기준의 근사치 입니다.

제안된 일부 근사치:

  • 1911년 브리태니커 백과사전 중 해당 위키백과 기사가 있는 사람은 몇 명인가?(완전히 조잡하지만, 1911년에 돌아온다면 적어도 EB만큼의 지식을 갖고 싶지 않을까?가까이?)
  • 위키백과 검색의 몇 퍼센트가 비어 있는가?(이것은 위키백과 독자들이 시스템에 있어야 한다고 생각하는 것 중 몇 퍼센트가 이미 존재하는지 측정할 것이다.)
  • 위키피디아 내부 링크 중 몇 퍼센트가 어디에도 없는가?엔드포인트에 고정되지 않은 기사가 몇 개 있는가?(이것은 위키백과 작가들이 시스템에 있어야 한다고 생각하는 것 중 몇 퍼센트가 이미 존재하는지 측정할 것이다.)

Edit Zero 모델은 위키백과 가치가 있는 기사들의 수가 미래의 어느 시점에 모일 것으로 예상하는 단순화라는 점에 유의한다.

수행된 연구 및 기타 자료 목록

위키백과(기본적으로)와 다른 위키미디어 프로젝트들은 그들의 기능을 책임지는 현상을 연구하는 것과 관련된 연구를 점점 더 많이 만들어내고 있다.그 연구 중 일부는 전문 학술지에 발표되거나 컨퍼런스에 발표되었다: 위키백과:위키백과의 학술 연구.

그러나 많은 다른 질문들이 그러한 저널에 발표되지 않고, 그 결과 위키백과의 위키백과 네임스페이스우리의 메타위키에 있는 일부 페이지 그리고 다른 프로젝트들에 관한 것 같은 짧은 연구 논문, 에세이 그리고 다른 자료들로 점점 더 채워지고 있다. 메타:연구는 그러한 연구가 조정되어야 하는 곳이지만, 사실 대부분의 도구와 논문들은 영어 위키백과에서 찾아볼 수 있다.아래는 그러한 자원에 대한 안내서다.

범주:위키백과 통계

주 1: 가장 흥미롭고 덜 최신의 프로젝트는 대담하다.

참고 2: 그래프, 차트 등을 범주에 추가해야 한다.위키백과 차트

키워드:

  • 편집자: 편집자 정보
  • 사용자: 사용자 정보
  • 기사: 기사 정보
  • 기술: 프로젝트의 기술적 측면(소프트웨어, 코드...)
항목 설명 및 주석 최종 업데이트 날짜: 시계열: 분석 테이블/목록 있음 차트 있음 키워드
관리자 통계:사용자:9월 없음/9월 관리 프로젝트 많은 관리 관련 통계와 많은 하위 페이지. 2007년 2월 처음부터, 가능한 한 많이 편집자
공지사항 1) 영어 위키백과에 관한 중요한 이정표, 통계 및 알렉사 순위 뉴스 (특별한: 참조)통계) 2) 영어 위키백과에 영향을 미치는 위키미디어 재단과 관련된 모든 뉴스. 월간 2001년 1월 이후 보도자료 유형 아니요.
삭제 통계에 대한 문서 AfD에 대한 대략적인 통계는 하위 페이지를 참조하십시오.특히 유용함:위키백과:AFD 100일:2005년 6월 1일부터 2005년 9월 8일까지 100일간의 AFD 로그를 구문 분석하기 위해 드래곤스 비행에 의해 설계된 컴퓨터 스크립트가 서명된 논평에서 굵은 키워드(예: 삭제, 보관, 병합, 리디렉션, 킬, 정리 등)를 검색하는 데 사용되었다. 이것은 투표와 기사 삭제 행동에서 중요한 패턴을 확인할 수 있는 대규모 통계 표본을 생성할 수 있게 했다. 2006년 1월 2월 7일 일부 아니요. 기사들
인구당 물품 해당 언어의 총 사용자 수 백만 명당 언어로 존재하는 위키백과 기사 수 2006년 9월 기록 이외에는 2005년 11월부터의 일련의 업데이트를 볼 수 없음 아니요. 아니요. 기사들
인식 통계 위키백과에 대한 대중의 인식의 성장을 측정하기 위한 시도.주로 위키피디아의 알렉사 등급, 즉 '위키피디아 인기가 얼마나 높은가'와 관련이 있다. 다양하지만, 대부분의 표는 2007년 1월 7일 현재 최신이다; 차트는 2006년 1월이라고 표시된다. 2002년 10월 이후부터 다양하다. 사용자
브라우저 영어 위키백과에 액세스하는 데 사용되는 브라우저 2004년 9월 역사는 2004년 4월의 오래된 데이터를 보여준다. 아니요. 아니요. 기술, 사용자
주요 기사 통계 추천 기사에 대한 몇 가지 기본 통계. 월간 2004년 1월 기사들
좋은 기사 통계 좋은 기사에 대한 몇 가지 기본적인 통계. 2007년 2월 2005년 11월 기사들
구글이 좋아하는 것 구글은 일반적으로 웹에 대한 검색 패턴과 트렌드에 대해 구글 Zeitgeist라고 불리는 웹 페이지를 가지고 있다.이것은 위키피디아에서 사람들이 무엇을 찾고 있는지 우리에게 알려줄 수 있다.그들이 찾을 수 있는 콘텐츠가 있나?그렇지 않다면, 특히 최근 상위 10개 검색의 경우, 이러한 목록의 작성에 높은 우선순위를 두는 것이 좋을 것이다.이상적으로는 Google Zeitgeist 통계는 Google과 위키백과의 링크 통계와 일치해야 한다.위키백과를 참조하십시오.구글 검색위키백과단어1위를 차지하는 기사:시대정신(2004년 데이터) 2003년 3월 7일 2001년 11월 아니요. 사용자, 기술
편집 횟수별 위키백과 목록 이름은 자명하다. 2008년 5월 2004년 6월 16일 조금요. 아니요. 편집자
최근 편집 횟수별 위키백과 목록 이름은 자명하다. 2008년 5월 2004년 5월 아니요. 아니요. 편집자
마일스톤 통계 언어(주어진 위키백과에서 기사 수로 정의되는 날짜 마일스톤)에 도달한 언어에 도달한 순서대로 2007년 2월 없음. 그러나 역사는 2004년 11월부터 업데이트를 표시함 아니요. 아니요. 기사들
모델링 위키백과의 성장 이 페이지는 위키백과의 기사 수 데이터를 분석하고, 관찰된 기사 수 크기와 성장 데이터에 과거 및 미래 성장의 단순한 숫자 모델을 맞추려고 시도한다. 2006년 11월 역사를 파헤치고 싶다면 2003년 6월 아니요. 기사들
대부분의 참조 기사 이것들은 2006년 1월 25일 데이터베이스 덤프에서 발견된 가장 많이 참조된 기사들이다. 2006년 1월 25일 페이지 역사에서 2003년 8월 14일 아니요. 기사들
가장 자주 편집되는 페이지 당연하다. 2008년 5월 2004년 1월 아니요. 아니요. 기사들
2001년 10월 가장 인기 있는 페이지 명확하고 업데이트되지 않음.인기 페이지를 참조하십시오. 2001년 10월 아니요. 아니요. 기사들
가장 많이 편집된 대화 페이지 2003년 11월 11일 현재 가장 많은 개정 내용을 담은 토크 페이지는 다음과 같다. 2003년 11월 11일 2003년 2월 아니요. 아니요. 기사들
언어별 위키피디아의 성장.이 범주의 많은 페이지, 특히 흥미롭다.위키백과:다국어 월별 통계(패노라마)위키백과:다국어 통계. 2007년 2월 2001년 7월 가끔 아니요. 기사들
연도별 사람 출생 및 사망 범주를 사용하여 특정 해에 출생/사망자에 대한 기사 수를 계산한다.위키백과를 참조하십시오.연도별/보고서별 사람. 2005년 7월 2004년 9월 아니요. 아니요. 문서, 기술
수영장 사람들이 위키피디아의 다양한 미래 이정표에 대해 추측하는 풀이 만들어졌는데, 이정표는 'When will Wikipedia will go number of its'로 정의된다.일부 예측 분석에 유용할 수 있다. 다양한 다양한 해당 없음 아니요.
인기 페이지 최근 달의 보기 수에 따라 정렬된 페이지 목록 2008년 5월 2004년 4월 아니요. 아니요. 기사들
위키백과:위키백과 작성자의 생산성 위키백과의 언어별 편집자 활동 2006년 중반 아니요. 아니요. 편집자
위키백과 연구 이 페이지는 위키피디아로 우리의 성공을 정량적으로 측정하는 몇 가지 방법을 논의한다.기본적으로 위키백과 통계에 대한 에세이 입니다. 2003 아니요. 아니요. 아니요. 전부
검색 엔진 통계 위키피디아가 검색엔진(구글)에 나타나는 빈도와 중요성에 대한 데이터를 기록한다. 2005년 11월 아니요. 문서, 기술
크기 비교 이 기사는 위키피디아의 크기를 다른 백과사전 및 정보 모음과 비교한다. 2007년 2월 2002년 9월 기사의 역사에서 아니요. 기사, 사용자
위키백과의 크기 이전 통계 페이지.대부분 역사적이다. 일부는 최신이고 일부는 그렇지 않다. 기록을 확인하다. 기사, 사용자
위키백과:통계 주요 공식 통계 페이지. 대부분 최신 버전. 2001년 12월, 하지만 그곳에서는 아무 쓸모도 없다. 아니요. 아니요. 전부
스텁 백분율 2006년 초에 위키피디아가 100만개의 기사를 넘나들면서, 나는 간단한 질문을 했다:그 기사들 중 몇 퍼센트가 단조로운가? 2005년 7월 아니요. 아니요. 기사들
위키마니아 2006 위키백과 조사 위키피디아의 성공 이유에 대한 작은 조사.종료된 질문:무엇이 처음에 사람들로 하여금 위키피디아를 편집하게 하는가?왜 편집자들은 그 프로젝트에 머무르는가?위키피디아를 편집하는 것은 그 대가로 무엇을 주었는가?더 추가하고 싶은 것은 없으십니까?나이가 어떻게 되십니까?얼마나 자주 편집하십니까?가장 높은 사용자 수준(익명, 등록된 사용자, 관리, 관료, 스튜어드, 개발자, 이사회 멤버, 짐보)은 무엇인가? 2006년 여름 반복되지 않음 아니요. 아니요. 편집자
위키백과 인터위키 및 전문 지식 테스트 위키피디아가 동화되기 위해서는 얼마나 더 많은 정보가 있는가? 2006년 7월 22일 업데이트되지 않음 아니요. 아니요. 기사들
요청된 문서 봇 통계 이 페이지는 라봇이 처리할 수 있는 요청된 각 기사 페이지의 현재 요청 수를 보여준다.또한 봇이 실행되기 시작한 이후 각 페이지에서 관찰된 최대/min의 요청 수와 라봇이 제거한 완료된 요청의 수입니다."하루당" 수치는 각 페이지에서 RABot이 보조 도구로 사용된 일 수를 반영하며, 이는 스크립트가 존재한 총 일 수보다 적을 수 있다.처음 실행될 때 제거된 수백 개의 요청을 포함한 초기 세척은 이 총계에 포함되지 않는다. 2006년 6월 2005년 6월 아니요. 기사들
위키백과:통계부 이 프로젝트인 통계부는 통계에 관심이 있는 기고자들이 언제, 어떻게 측정할 것인지에 대해 논의할 수 있는 공간을 제공한다. 비활동의 비활동의 약간의 아니요. 아니요.
글당 단어 수 위키백과의 메트릭 중 하나:크기 비교 페이지는 기사당 단어 수입니다.일부 위키피디아 사람들은 새로운 기사 작성 속도가 결국 느려질 것으로 예상하며, 대신 기존 기사들의 질을 향상시키기 위한 노력을 기울인다.이 페이지는 품질과 느슨하게 관련된 몇 가지 추세를 조사한다: 기사당 단어 수, 기사당 수정 횟수. 2005년 10월 2001년 1월 아니요. 기사들
위키피디아 트래픽은 Zipf의 법칙을 준수하는가? 지프의 법칙 2006년 9월 아니요. 아니요. 사용자
위키백과:시옹의 통계 이것은 2002년 1월부터 2005년 3월까지의 기간 동안 선택된 영어 위키백과 통계를 사전 분석하는 것이다.위키피디아 커뮤니티 가치와 문화 구성의 변화 증거를 위해 데이터를 검토한다. 2005년 3월 2002년 1월 아니요. 문서, 사용자, 편집자
위키백과:교통 2002년 말/2003년 초 영어 위키피디아의 일일 트래픽 수치(히트/데이): 2003 2002 사용자
위키프로젝트 생성 트렌드 위키프로젝트 관련 메타 데이터를 위키피디아 진화의 창구로 활용. 2005년 7월 없음 아니요. 편집자, 기사

범주:연구자를 위한 위키백과 자료

범주 설명:

이 범주는 다음 두 가지 역량으로 연구자를 위한 자원을 포함시키는 것을 목표로 한다.

  1. 위키피디아를 연구 도구로 사용(위키피디아:위키백과로 조사)
  2. 연구 주제로서의 위키백과에 대하여(메타: 참조):연구)

우리는 놀랍게도 페이지 수가 매우 적은 두 번째 하위 카테고리에 관심이 있다.

항목 설명 및 주석
위키백과:위키프로젝트 위키디아혈증 이 프로젝트인 Wikidemia는 위키백과에 대한 학문적 연구와 관련된 기사들을 위한 공간을 제공한다.반능동.위키백과:위키피디아는 잊혀진 비활성 버전이다.
위키백과:위키백과 학술 연구 위키피디아에 대한 학술 발표와 논문의 불완전한 목록.
위키백과:사용자조사 제안서를 잊어버린 경우 메타 참조: 더 고급화된 사용자에 대한 일반 사용자 설문 조사. 불행히도 또한 비활성화됨.위키백과를 참조하십시오.2005년 뷔르츠부르크 대학교 조사.
위키백과:위키백과로 연구 첫 번째 카테고리의 자료지만, 더 학문적인 관점에서 위키피디아에 대한 좋은 소개와 좋은 기사다.

범주:위키백과 도구

다음의 도구는 위키백과 및 관련 프로젝트의 연구/스태트 분석에 유용하다.

항목 설명 및 주석 키워드
API 쿼리 이 API는 응용 프로그램이 MediaWiki 서버에서 직접 데이터를 쿼리할 수 있는 방법을 제공한다.사이트에 대한 하나 이상의 정보 및/또는 지정된 페이지 목록을 검색할 수 있다.정보는 기계(xml, json, php, yaml, wddx) 또는 사람이 읽을 수 있는 형식으로 반환될 수 있다.단일 질의로 둘 이상의 정보를 요청할 수 있다.
IBM History Flow 도구 2004년(다운로드)의 멋진 도구로 이 기사를 쓰게 되었는데, 불행히도 (내게) '어떻게' 사용하는지는 없고, 1.5 이전 버전의 미디어위키(SQL 기반)용으로 설계되어 지금은 대부분 가치가 없을지도 모른다.만약 누군가가 합리적인 '사용방법'을 업데이트하고 만들 수 있다면, 그렇게 하십시오.
Whodunit질의 영어 위키백과를 위해 개발된 윈도우 기반 응용 프로그램.이를 통해 사용자는 어떤 위키백과 기사도 로드할 수 있고, 특정 구절을 선택할 수 있으며, 클릭 한 번으로 페이지 내력을 검색해 누가 구문을 추가했는지 파악할 수 있다.일부 컨텐츠 분석에는 상당히 유용할 수 있다.
카운터 편집 편집 카운터.데이터베이스 덤프를 처리하는 측면에서 유용한 통계 데이터를 얻을 수 있는 가장 쉬운 방법.특히 유용: TDS의 기사 기고 카운터: 기고자 수별 기고자 목록(범벅이 함께, 음온 목록을 얻기 위해 이것을 사용)Interiot 사용자 stats Tool 3 및 Tool 1(다른 레이아웃 - 서로 다른 통계에 접근하기 쉽음.Flcelloguy's Tool – 곧 시험해 볼 테니 매우 유망해 보인다.사용자가 만든 문서 목록.
스크립트 데이터 수집에 유용한 스크립트는 다음과 같다.기록 요약 사용량 분석(유용하지만 때때로 브라우저를 충돌할 수 있으며 계산된 일부 통계에 대한 설명('코드북...')이 명확하지 않음), 새 페이지 로그 사용자 로그 편집 카운터(아직 시도하지 않음)
위키X레이 on meta 이 프로젝트의 주요 목표는 위키백과 프로젝트 전체의 심층적인 정량적 분석을 위한 강력하고 확장 가능한 소프트웨어 도구를 개발하는 것이다.현재로선 유망해 보이지만 그다지 사용자 친화적이지 않다(알파 이전).
위키에비덴스 위키이비덴스는 위키에 대한 통계 및 시각화 도구다.

범주:위키백과 에세이

참고 항목