위키백과:통계부

Wikipedia:
이 프로젝트 페이지는 위키피디아에 관한 통계에 관한 것이다.통계 수학적 과학에 대한 위키프로젝트는 위키프로젝트 통계를 참조하십시오.

프로젝트통계부는 통계에 관심이 있는 기고자들이 무엇을, 언제, 어떻게 측정할 것인지에 대해 논의할 수 있는 공간을 제공한다.

도움이 필요하면 아래에 이름을 추가하고 토크 페이지에 자신을 소개하십시오.아래 할 일 목록은 시작에 불과하다...

Stock post message.svg작업관리:E · H · W · R
2009-02-26 업데이트

범위

위키프로젝트는 위키백과 콘텐츠, 메타콘텐트, 기고자 및 방문자에 대한 통계 수집을 설계, 구현 및 토론하는 것을 주된 목적으로 한다.우리는 사람들이 위키백과와 그 커뮤니티를 어떻게 사용하는지, 그리고 그들에게 가장 유용한 것을 더 잘 이해하려고 한다.우리는 또한 시기적절한 통계 생성의 능률화를 위한 새로운 방법을 모색하고 있다.

참가자

여기에 ~~~를 추가하여 이름을 추가하십시오.

오푸스미움 15:16, 2017년 3월 23일 (UTC)[응답]

페이지

연구 질문

기여

  • 누가 위키피디아에 기여하는가, 낮/주 중에, 그리고 얼마나 자주?
  • 독자들, 기부자들, 공공 기물 파손자들이 갑자기 급증하는 원인은 무엇인가?
  • 기부금에 패턴이 있나?예: 나이, 성별, 인종, 국적 대 범주?
  • 무엇이 최고의 기여자들에게 동기를 부여했는가?예: 평판, 상호주의, 이타주의, 관계, 역할?자유 콘텐츠, 중립성, 소프트웨어 디자인, 민주주의, 커뮤니티 등?
  • 컨텐츠의 품질, 유효성, 신뢰성을 어떻게 유지하고 있는가?누구에 의해서, 그리고 어느 정도까지?
  • 서버 로드는 사용자의 활동에 어떻게 기여하는가?경기둔화 후 몇 시간/몇 일 후에?
  • 기고자들은 어디에 있는가?en의 기여자들이다.영어권 국가의 위키백과, 스페인어/포르투갈어 랭귀지, 이베리아 또는 라틴 아메리카 또는 다른 지역의 기여자, 독일어 랭귀지, 독일어, 오스트리아, 스위츠 기고자.또는 다른 곳 등

독자성/소비촉진행

  • 누가 언제 위키백과 기사를 읽는가?
  • 그들은 사이트를 통해 어떤 링크 경로를 따르는가?
    • 방문되는 일반적인 첫 페이지는 무엇인가?
    • 기본 페이지에서 방문한 공통 페이지는 무엇인가?
  • 최근 변경사항 페이지와 주요 변경사항이 해당 페이지의 클릭에 어떤 영향을 미쳤는가?
  • 익명의 방문자/독서자(또는 Google/Yahoo의 방문자)가 RC, 랜덤, 커뮤니티 포털과 같은 페이지를 얼마나 자주 방문하는가?
  • 각 페이지의 질이나 유용성에 대한 독자들의 평가는 어떠한가?

커트테일링 데크

  • 공공 기물 파손을 어떻게 계량화할 수 있을까?트롤링?
  • 주어진 시간에 얼마나 많은 관리자가 온라인 상태인가?
  • #온라인에서 일어나는 공공 기물 파손의 양과 어떻게 관련되는가?
  • 반달은 빠른 응답 시간에 의해 단념되는가?
  • 금지와 블록은 얼마나 효과적인가?반달들은 얼마나 자주 아논이나 다른 IP로 즉시 돌아올까?
  • 평균 블록 길이는 얼마인가?블록 길이가 편집기에서 IP로 어떻게 변경되는가?
  • 공공 기물 파손 행위에 대한 수정 시간의 중간값은 얼마인가?(최근 연구: 반달리즘 서바이벌)

프로세스

  • 어떻게 다른 사람들이 콘텐츠를 추가하는가?<--- (이 페이지 편집 외)의 의미는?정교함이 필요했다.
  • 저속 대 고속 기고자, 오프라인 대 온라인 작성자
    • 오프라인 편집기를 사용하고 블록으로 업로드하는 사용자 수
  • 콘텐츠를 다른 무료 저장소에서 WM 사이트로 마이그레이션하는 사용자 수
    • 사진, 텍스트(공용 문서, 출처)

방법론

이 절에서는 연구 데이터를 수집하고 분석하는 방법을 다루어야 하며, 위키피디아의 맥락이나 프로세스(위 섹션으로 이동)를 다루지 않아야 한다.

데이터 수집

  • 웹앨라이저 통계
  • 시스템이 데이터를 수집할 수 있지만 일반 대중은 볼 수 없도록 연령, 성별, 인종, 국적 등의 모든 구성원 프로파일 양식에 선택적 필드를 추가하십시오.
  • 커뮤니티 포털의 모든 사용자에 대한 의견조사
  • 최고 기여자의 설문 조사/인터뷰
    • 다른 동기 부여 요인에 필요한 구성
  • 툴서버

데이터 분석

  • 동일한 데이터 구조 및 소프트웨어 정의 및 선택(SPSS, SAS)
  • 변수 정의
    • 결과 조치
  • 상관 설계
    • t-rays
  • 분산 분석/관리 분산 분석(상관 데이터의 경우)
    • 사후 통계(LSD, 피셔)
  • 인자분석
  • 비모수 측도( 카이-제곱)

주의사항?

  • 프라이버시
    • 가능한 해결책:공개적으로 사용할 수 있는 데이터로 제한하고, 개인 데이터를 사용해야 하는 경우 개인 식별이 가능한 정보는 절대 사용하지 마십시오.
  • 특정 설문 조사 참여 동의
    • 가능한 해결책:자가 대응은 종종 측정하기 어렵기 때문에 실험 설정을 피하고 자가 대응 조사를 피하십시오.그러나 "정신적 외상" 또는 "안전하지 않은 것"의 가능성이 거의 없는 적절히 구조화된 익명의 여론조사는 다음과 같다.p
  • 소셜 루프를 통한 특정 메트릭(편집 #)의 피드백 효과(편집 횟수를 위해 편집하는 사용자)
    • 가능한 해결책/오프셋: 효과 상호작용 betw.카운트/기타 요인 편집: RfA의 무작위 샘플 분석 실패 대 성공 및 유권자의 주요 근거 분석 방법?

참조

결과

통계 점수판
미터법 현재 값
사용자 43,323,023
관리자 1,053
사용자/관리 비율 관리자당 사용자 41142.47명
편집 1,075,518,139
페이지 55,500,908
기사별 편집 페이지당 19.38 편집


참고 항목