위키피디아에 대한 학술 연구

Academic studies about Wikipedia

2001년 위키피디아가 만들어진 이래, 온라인 백과사전에 대한 많은 학술 연구가 동료 평가 출판물에 있었다.이 연구는 두 가지 범주로 나눌 수 있다.첫 번째는 백과사전 콘텐츠의 제작과 신뢰성을 분석한 것이고, 두 번째는 사용 및 관리 등 사회적 측면을 조사했습니다.이러한 연구는 위키피디아의 데이터베이스가 사이트 [1]소유자의 도움 없이 다운로드될 수 있다는 사실에 의해 크게 촉진된다.

내용

생산.

소수의 편집자가 영속적인 내용의 대부분을 작성한다.

획기적인 peer-reviewed paper,[2]가 Guardian,[3]에 언급된에서 미네소타 대학의 6개의 연구 팀은 편집자들의 편집 횟수와 편집자들의 능력(PWV)—the번 많은 수의 단어는에 의해 소개된 위키 피디아 독자들, 지속적인 단어들의 견해 측면에서 측정한 그들의 글을 전달하는 것 사이의 관계를 측정했다.편집표시됩니다.회계방법은 저자가 직접 쓴 말을 사용하여 가장 잘 기술되어 있습니다. "기사를 볼 때마다, 각각의 글도 볼 수 있습니다.편집자 X가 쓴 글자를 보면 PWV가 1개라고 합니다.웹 서버 로그에서 기사를 본 횟수는 추정되었습니다.

연구진은 2002년 9월 1일부터 2006년 10월 31일까지 등록 사용자의 25조 PWV를 분석했다.이 기간 말에 편집자 중 상위 10%는 PWV의 86%, 상위 1%는 약 70%, 상위 0.1%(4200 사용자)는 PWV의 44%로 평가되었으며, 이는 이 연구에서 측정된 Wikipedia의 "가치"의 거의 절반에 해당한다.PWV에 의한 상위 10명의 편집자는 PWV의 2.6%에 불과했고, 편집 횟수에서는 상위 50위 안에 든 편집자는 3명뿐이었다.연구 저자는 데이터로부터 다음과 같은 관계를 도출했다.

PWV 점유율 증가는 편집 수 순위에 따라 엄청나게 증가합니다. 다시 말해, 멱함수-법칙 관계가 주어진 경우 편집 횟수가 가장 많은 엘리트 편집자(편집 횟수가 가장 많은 편집자)가 더 많은 가치를 차지합니다.

이 연구는 또한 컨텐츠에 대한 봇의 영향을 분석했습니다.편집 횟수로는 봇이 Wikipedia를 지배하고 있으며 상위 10개 중 9개와 상위 50개 중 20개가 봇입니다.반면 PWV 순위에서는 상위 50위 안에 봇이 2개만 표시되고 상위 10위 안에 봇이 없습니다.

PWV에 의한 상위 0.1% 편집자에 대한 영향력의 지속적인 증가에 근거하여, 이 연구는 명확하게 결론을 내렸다.

빈번한 편집자는 사람들이 위키피디아를 방문했을 때 보는 것을 지배한다.이 지배가 점점 더 심해지고 있습니다.

업무분배 및 사회계층

안전 점검 논문은 "관리자 계급"으로 인한 "위키피디아 사회의 사회적 계층화"에 주목했다.이 논문은 이러한 계층화가 일부 측면에서 유익할 수 있다고 제안했지만, 관리자와 다른 [4]편집자 간의 "상태와 힘의 차이"로 인해 "계층화 수준 간의 분명한 후속 권력 이동"을 인정했다.

2006년 7월까지의 영어 위키피디아 편집 이력 전체를 분석한 결과, 관리자가 전체 편집의 약 50%를 수행한 2003년부터 관리자가 편집한 2006년까지 관리자 편집이 콘텐츠에 미치는 영향이 꾸준히 감소하고 있는 것으로 나타났습니다.같은 기간 관리자 1인당 평균 편집 건수가 5배 이상 증가했음에도 불구하고 이러한 현상이 발생했습니다.이 현상은 논문 저자들에 의해 "군중의 부상"이라고 명명되었다.편집 작업 수 대신 편집한 단어 수를 메트릭으로 사용한 분석에서도 유사한 패턴이 나타났습니다.admin 클래스는 편집 횟수와 관련하여 다소 임의적이기 때문에, 본 연구에서는 수행된 편집 횟수에 기초한 범주 내 사용자 분류도 고려했다.「엘리트 유저」의 결과는, 「초보 유저의 편집수가 비례적으로 빨라지고 있지만, 엘리트 유저에 의한 단어 변경수는 초보 유저의 변경에 대응하고 있다」를 제외하고, 관리자에 의한 결과와 어느 정도 일치하고 있다.엘리트 유저는 2006년도의 변경의 약 30%를 차지했습니다.이 연구의 결론은 다음과 같습니다.

따라서 최근 몇 년 동안 영향력이 줄어들었지만, 엘리트 사용자들은 위키피디아에서 수행된 작업의 상당 부분을 계속해서 기여하고 있는 것으로 보인다.게다가 엘리트 유저에 의한 편집은, 본질적으로는 상당한 것 같습니다.즉, 단순히 철자 오류를 수정하거나 인용문을 다시 포맷하는 것 이상을 하는 것으로 보입니다.

신뢰성.

논쟁 컨퍼런스 페이퍼(2010)는 위키피디아에 대한 신뢰가 인식론적 장점과 실용적인 장점에 기초하는지 평가했다.독자는 특정 기사의 저자의 실제 지식과 전문성을 평가할 수 없지만, 프로젝트에 대한 기여자들의 열정과 그 열정이 표출되는 커뮤니케이션 설계를 평가하고 [5]신뢰의 이유를 제공할 수 있다.

구체적으로 저자는 위키피디아는 개인의 전문 지식이나 집단적 지식, 신뢰성에 대한 과거의 경험에 근거해 신뢰할 수 없다고 주장했다.익명과 가명이 지식평가를 방해하고, 반전문가 문화로 인해 이것이 바뀔 가능성은 낮기 때문이다.위키피디아를 편집하는 것은 "군중의 지혜"를 모으지 않고 엘리트 편집자 그룹으로 제한될 수 있으며, 어떤 경우에는 기사의 질을 떨어뜨릴 수도 있다.Seigenthaler의 자서전 논란을 포함한 사건들에 의해 확인된 개인적인 경험과 경험적 연구들은 위키피디아가 일반적으로 신뢰할 수 없다는 결론을 지적한다.따라서, 이러한 인식론적 요소들은 위키피디아와 상의하는 것을 정당화하지 않습니다.

저자는 이에 따라 위키피디아를 크게 두 가지 요소로 요약할 수 있는 실용적 가치를 바탕으로 신뢰하는 근거를 제시했다.첫째, 위키피디아 주변의 규모와 활동은 편집자들이 세계에 지식을 제공하기 위해 깊이 노력하고 있다는 것을 보여준다.둘째, 정책, 관행, 제도 및 기술의 투명한 발전은 눈에 띄는 대규모 노력과 더불어 위키피디아를 신뢰할 때 발생할 수 있는 우려를 해결합니다.제공된 지식의 정의, 동일한 약속을 공유하지 않는 사람들의 왜곡된 기고 방지, 편집 손상 시정, 기사 품질 관리 및 개선 등이 우려된다.

지리

Oxford Internet Institute가 실시한 연구는 2009년 현재 위키피디아의 모든 언어판 기사가 지구 상의 약 50만 곳을 커버한다는 것을 보여주었다.그러나 기사의 지리적 분포는 매우 고르지 못했다.대부분의 기사는 북미, 유럽, 동아시아에 대해 쓰여져 있으며,[6] 아프리카를 포함한 개발도상국의 많은 부분에 대해서는 거의 다루지 않고 있습니다.

자연어 처리

위키피디아의 텍스트 내용과 구조화된 계층구조는 자연어 처리인공지능 연구자들에게 중요한 지식원이 되었다.2007년 테크니온 이스라엘 공과대학의 연구원들은 영어 위키피디아 기사에 포함된 세계 지식을 사용하는 명시적 의미[7] 분석이라고 불리는 기술을 개발했습니다.단어와 텍스트의 개념적 표현은 자동으로 생성되며 단어와 텍스트 간의 유사성을 계산하기 위해 사용됩니다.

유비쿼터스 Knowledge Processing Lab의 연구원들은 Wikipedia 및 Wiktionary로 인코딩된 언어 및 세계 지식을 사용하여 WordNet과 [8]같은 전문가가 구축한 리소스와 유사한 언어 지식 기반을 자동으로 만듭니다.Strube와 Ponzetto는 영어 위키피디아를 분류 체계로 횡단함으로써 단어 간의 관계를 식별하는 알고리즘을 만들었고, 위키피디아는 "언어 처리 [9]태스크에서 WordNet과 경쟁할 수 있는 분류법"을 만들었다고 결론지었다.

콘텐츠 필드의 비판

Francesca Trippodi의 2021년 연구는 2021년 영어 위키피디아에 있는 약 150만 건의 전기 기사 중 19%만이 [10][11]여성에 관한 것이라는 것을 발견했다.그 연구는 존재하는 전기들이 기존의 남성 [10][11]기사들보다 삭제 대상으로 지명될 가능성이 상당히 높다는 것을 발견했다.

건강 정보

영어 위키피디아의 건강 정보는 검색 엔진과 검색 엔진 결과 페이지의 결과로 널리 액세스 되고 있으며, 검색 엔진 결과 페이지는 위키피디아 [12]기사에 대한 링크를 자주 제공합니다.위키피디아에서 제공하는 건강 정보의 질과 그 정보에 액세스하는 사람에 대한 독립적인 평가가 수행되었다.위키피디아에서 건강 정보를 찾는 사람들의 수와 인구 통계, 위키피디아에서 건강 정보의 범위, 위키피디아 정보의 질에 대해 [13]연구해 왔다.위키피디아를 건강 정보의 [further explanation needed]소스로 사용하는 것에는 단점이 있다.

사회적 측면

인구 통계

2007년 타임지에 [14]실린 Hitwise의 연구에 따르면 Wikipedia 방문자는 거의 50/50 남성/여성으로 나뉘지만 편집의 60%는 남성 편집자에 의해 이루어진다고 한다.

WikiWarMonitor유럽위원회자금을 지원하는 CORDIS FP7 FET-Open 지원 프로젝트인 "ICTeCollective"의 일부로서 다음과 같은 내용을 발표했습니다.

  • 2011년 IEEE Xplore에서 IEEE 제3회 소셜 컴퓨팅 국제회의(SocialCom)의 "위키피디아 전쟁 편집"이라는 제목의 위키피디아 기사가 얼마나 논란이 되고 있는지를 측정하는 새로운 방법을 보고하고 영어를 [15]포함6개의 인도유럽어 판에 대해 검증했다.
  • 2012년 위키피디아 32개 언어판의 누적 데이터를 사용한 PLoS ONE에서는 일주기 활동 패턴 분석을 바탕으로 북미와 유럽 극동-호주 영어 위키피디아에 대한 기여도가 거의 동일한 반면 유럽 극동-호주 기여도는 75%까지 증가한다고 보고했다.r 간단한 영어 위키피디아.이 연구는 또한 다른 언어로 [16]된 다른 판에 대한 몇 가지 다른 인구통계학적 분석을 다룬다.
  • 2013년 Physical Review Letters는 의견, 충돌 및 합의가 포함된 협업 환경에서 "평화적인 기사는 편집에 더 많은 [17]사람이 참여하면 갑자기 논란이 될 수 있다"고 보고했다.
  • 2014년에 "위키피디아에서 가장 논란이 많은 주제:다국어 및 지리적 분석: 다양한 언어 및 언어 그룹에서 가장 논란이 많은 주제를 설정하기 위해 위키피디아의 다양한 언어 버전에서 기사 편집량을 분석했습니다.영어판의 경우, 가장 논란이 많은 기사 3위는 조지 W 부시, 무정부주의, 무함마드였다.가장 많은 논란을 일으킨 다른 언어들의 주제는 크로아티아(독일), 세골렌 루아얄(프랑스), 칠레(스페인), 동성애(체코)[18]였다.

정책 및 가이드라인

2007년 9월까지의 영어 위키피디아 정책과 가이드라인을 분석한 기술 연구에서는[19] 다음과 같은 주요 통계를 확인했습니다.

  • 44개 공식 정책
  • 248 가이드라인

"모든 규칙을 무시한다"와 같은 짧은 정책도 많은 논의와 명확화를 야기하는 것으로 나타났습니다.

'모든 규칙 무시' 정책 자체가 16단어에 불과하지만 500단어가 넘는 정책의 의미를 설명하는 페이지는 독자들에게 7개의 다른 문서를 소개하고 8000개가 넘는 토론을 불러일으켰으며 1년도 안 돼 100여 차례 바뀌었다.

이 연구는 시작 이후 일부 주요 정책의 확장을 표본으로 삼았다.

그러나 정책이 여러 하위 정책으로 분할되었기 때문에 "삭제"의 숫자는 결정적이지 않은 것으로 간주되었습니다.

파워 플레이

2007년 워싱턴 대학과 HP 연구소의 공동 동료 검토[20] 연구는 액티브 토크 페이지의 샘플을 정량적으로 분석함으로써 정책이 어떻게 채택되고 기여자가 합의를 이끌어내는지를 조사했다.2006년 11월 영어 위키피디아 데이터베이스 덤프를 사용하여 이 조사는 배포 말미에 250개의 토크 페이지에 초점을 맞췄습니다.전체 토크 페이지의 0.3%를 차지하지만 전체 토크 페이지의 리비전은 28.4%, 더 중요한 것은 정책 링크의 51.1%를 포함합니다.이 연구는 표본 페이지의 이력에서 중요한 섹션이라고 불리는 활동이 많은 달만 조사했다. 즉, 연속적으로 기사 페이지와 토크 페이지 개정 수가 유의한 달들의 집합이다.

그 연구는 정책 유병률의 척도를 정의하고 계산했다.정책 요소가 평균의 2배 이상일 경우 중요한 섹션은 정책이 많은 섹션으로 간주되었습니다.기사에는 다음 3가지 지표 변수가 태그 부착되어 있습니다.

  • 논쟁의 여지가 있는
  • 특집
  • 정책이 많은

이 세 가지 요인의 가능한 모든 수준에서 8개의 표본 범주를 산출했습니다.이 연구는 각 표본 추출 범주에서 9개의 중요 섹션을 분석하고자 했으나, 6개의 기사(이력)만 동시에 다루고 논란이 많으며 정책이 적용되었기 때문에 69개의 중요 섹션만 선택할 수 있었다.

그 연구에 따르면 정책이 일관되게 적용되지는 않았다.이 보고서는 보다 광범위한 발견을 설명하면서 위키피디아 토크 페이지에서 다음과 같은 두 가지 발췌문을 뚜렷한 대조를 이루며 제시했다.

  • 참가자가 정부 기관에서 제공한 데이터에서 평균을 계산하는 것이 독창적인 연구를 구성한다고 결정한 토론:

비열...독창적인 연구로 여겨지지 않는가?[U3]
제가 보기에는 원래 조사는 [Gov't agency]에서 한 것 같거나 아니면 제가 놓친 것이 있나요?[U4]
만약 [Gov't agency]가 실제 평균을 발표하지 않았다면, 우리는 그것을 "계산"하고 있었을까요?전 모르겠어요.[U3]
아니, 왜?이미 이용 가능한 정보에서 데이터를 추정하는 것은 OR이 아닙니다.[ U5 ]
WP에서:NOR "논문에는 입장을 발전시키는 데 도움이 되는 출판된 주장, 개념, 데이터, 아이디어 또는 진술의 새로운 분석이나 합성을 포함할 수 없다."가치 있는 것 [U4]

  • 논리적 추론이 원래 연구 정책에 대한 반론으로 사용된 토론:

WP:반권위주의가 패니즘의 중심이 아니라는 학술적 기사를 쉽게 제공할 수 있습니다당신은 당신의 POV를 바탕으로 모든 종류의 아이디어를 종합하고 있습니다.[U6]
단순한 연역적 추론은 독창적인 연구가 아니다.패니즘은 본질적으로 반권위주의이기 때문에 권위주의 경제체제는 패니즘이 될 수 없다.당신은 전제와 결론 중 어느 것에 동의하지 않습니까?[U7]

연구에서 확인된 바에 따르면 이러한 모호성이 쉽게 파워 플레이를 발생시킨다고 주장하며, 7가지 유형의 파워 플레이가 있다.

  • 기사 범위(기사 내에서 제외된 것)
  • 사전 합의(과거 결정은 절대적이고 논쟁 없는 것으로 제시됨)
  • 해석의 힘(다른 것보다 더 큰 해석의 권한을 주장하는 하위 항목)
  • 기부자의 정당성(그/그녀의 전문 지식 등)
  • 제재 위협(제재 등)
  • 다른 페이지의 연습(다른 페이지는 후속 모델로 간주됨)
  • 출처의 정당성(인용된 참조는 논쟁의 여지가 있음)

공간 부족으로 인해, 이 연구는 단지 정책을 해석함으로써 행사된 처음 4가지 유형의 권력 유격만 상세하게 설명했습니다.다섯 번째 권력행동 카테고리가 분석되었다; 그것은 규칙을 존중하지 않음에도 불구하고 기여자가 그의 공헌을 평가받았기 때문에 용서된 노골적인 정책 위반으로 구성되었다.

기사범위

이 연구는 위키피디아의 정책이 범위 문제에 대해 모호하다고 생각한다.다음 vignette는 클레임을 설명하기 위해 사용됩니다.

난 사실을 가지고 있기 때문에 합의는 헛소리야위키피디아에서 천주교에 대한 논의를 과감하게 삭제하라고 권고하고 있습니다.고중심주의에 대한 관점은 부정확할 뿐만 아니라 WP에 위배된다.NPOV...삭제/강조하면 NPOV, 과감하게...라는 Wikipedia 정책에 위반됩니다.만약 여러분이 모두 고중심론의 과학적 이론에 대한 기사를 원한다면, 직접 쓰세요.[U12]
당신이 나타나기 전에 고중심론의 과학적 이론에 대한 기사를 썼죠[U12]... NPOV와 Be bold를 읽은 지 얼마 안 된 아이가 헌법상의 논점을 논하는 것처럼 약간 우스꽝스러운 논쟁입니다.이것들은 확립된 의미를 가진 원칙들이다.몇 년 동안 이곳에 있었던 사람들은 당신보다 그들을 훨씬 더 잘 이해해요.그들은 이 논쟁에서 당신이 휘두르는 효과적인 무기를 증명하지 못할 것이다.[U13]
"중심주의"의 사회적 영향은 "중심주의"가 아니다.Wikipedia: Wiki는 종이가 아닙니다.우리는 토픽의 모든 제3의 측면을 적절한 기사에 집어넣을 필요가 없습니다.또, 우리가 그것을 하지 않을 때, 불완전하다고 생각할 필요도 없습니다.[U14]
Wikipedia: wiki is not paper라는 링크에서 가장 먼저 언급되는 것은 다음과 같습니다.위키피디아는 백과사전이다." 브리태니커 백과사전과 같은 진짜 백과사전에는 모든 사회적, 정치적, 철학적 의미를 포함한 고중심주의에 대한 환상적인 섹션이 있다.[U12]
Wikipedia에서 논의된 바와 같이, Wiki는 종이가 아니다: Wikipedia 기사는 주제의 중심적인 중요한 측면에 대한 간략한 개요를 제공해야 한다.당신 같은 생물학자에게 고중심주의의 중심적인 측면은 확실히 사회적 의미가 아니라 사회의 다른 부분들에 대한 것입니다.[U12]
...당신이 말하는 것은 "중심주의"가 아닙니다.고중심론의 중심 이슈는 주기적 균형, 지형적 기복, 공기 흐름이다.이것들은 고생중심의 과정과 실제로 관련이 있는 문제들이다.당신이 말하는 이러한 "사회적 측면"은 "주변"이지 "중심"이 아닙니다.그것들은 "고원심주의에 관한" 고원심주의를 "주변"하지만 "고원심주의는 아니다" [U15]

이 연구는 격론을 다음과 같이 해석한다.

기사 제목이 중요하기 때문에 기사 범위를 둘러싼 이러한 싸움은 하이퍼링크 환경에서도 발생합니다."고중심주의" 기사는 "고중심주의의 사회적 효과"라는 제목의 기사보다 더 권위 있고 또한 독자들에게 더 많이 접하게 된다."

사전 합의

이 연구는 위키피디아에서 컨센서스는 결코 최종적인 것이 아니며 컨센서스를 구성하는 것은 언제든지 바뀔 수 있다고 말한다.이 연구는 이러한 시간적 모호성이 파워 플레이의 비옥한 토대임을 밝혀내고 합의점을 둘러싼 세대 간 투쟁을 기사 소유권 투쟁의 큰 그림으로 보여준다.

실제로, ... 기사 내용을 결정하는 페이지 또는 기고자의 연합체의 실질적인 소유자가 종종 있습니다.이 그룹 내에서 이전의 합의는 논란의 여지가 없는 것으로 제시될 수 있으며, 합의 확립에 들어갔을 수 있는 파워 플레이를 가릴 수 있습니다.쟁점은 사전 합의의 정당성이다.오랜 기간 기여자들은 해결되었다고 생각하는 문제에 대해 논쟁을 벌이며 시간을 낭비하고 싶지 않습니다.정책에 링크하는 것과 마찬가지로 이전의 합의를 가리키면 트롤릭 동작을 처리하는 방법이 제공됩니다.반면 신참이나 비주류 기고자들은 자신의 관점이 이전 논쟁에서 잘 드러나지 않는다고 느끼고 다시 문제를 제기하고 싶어 하는 경우가 많다.

본 연구에서는 이러한 지속적인 투쟁을 설명하기 위해 다음과 같은 토의 스니펫을 사용합니다.

아래 [U17]에서 설명하는 대부분의 내용은 이미 해쉬화되어 있습니다.마치 한 각도로 시도하면 반론이 되고두 번째 각도로 시도하면반론이 되고 세 번째 각도로 시도하면반론이 되고첫 번째 각도로 다시 반론이 됩니다[U18]
이 기사에 기고하려고 하는 유저가 얼마나 많은지, 대체 뷰를 넓히려고 해도, 「우주 극성」을 신봉하는 유저에게 괴롭힘을 당하는 것은 흥미로울 것이다.그들이 일리가 있을 수 있고 [U19], [U20], 그리고 나머지 여러분이 관리자 특권을 가진 POV를 강력하게 밀어붙여 이 기사에서 편집자를 몰아낸다는 점을 고려해 보는 것은 어떨까요?[U21]

해석의 힘

관리자가 익명화된 질병(연구에서 Frupism이라고 이름 붙여진)을 가진 사용자/환자의 개인 계정을 무시하고 삭제하는 방법을 Vignette에서 보여 줍니다.그 기사가 특집 기사로 노미네이트 되고 있을 때 관리자의 개입이 일어났다.

기부자의 정당성

이러한 유형의 권력 유세는 U24가 비생산적이고 파괴적이라고 비난하는 또 다른 기고자와 맞서기 위해 자신의 과거 기고를 이용하는 기고자(U24)에 의해 설명됩니다.

'나'가 위키피디아의 질이 떨어진다는 걸 지적하기 위해 서성거린다는 뜻인가요?제 편집수를 다시 봐주세요!!LOL. 7,000개 이상의 편집이 있습니다.아시다시피, 저는 철학의 FA 6개 또는 7개 중 2개에서 거의 모든 것을 처음부터 쓸 수 있습니다[U24].

소유권에 대한 명시적 경쟁

이 연구에 따르면 허가 없이 정책을 일관되고 성공적으로 위반하는 기여자가 있는 것으로 나타났습니다.

U24는 몇 가지 노골적인 "우리 혹은 그들"의 권력 다툼을 벌인다: U25의 행동이 지속되면 그는 떠날 것이다.이러한 행위는 물품 소유에 대한 정책, 다른 기부자에 대한 공손함 및 신규자 취급에 명백히 위배된다.U25는 새로운 기업으로서 이러한 정책을 모를 수 있지만 U26은 확실히 알고 있습니다.[U26]의 의도적인 맹목은 U24가 철학 기사에 대한 귀중한 공헌자이며 이를 지적하는 것을 부끄러워하지 않는다는 사실에서 비롯된다.고품질의 콘텐츠를 일관되게 제작할 것을 약속하는 기고자가 부족하다; 위키피디아 커뮤니티는 가치 있는 작업이 이루어지면 기꺼이 남용과 정책 위반을 용인할 것이다.

외람된 말씀이지만, 그건 질문에 답하지 않았어요...나는 U25의 제안이 받아들여지지 않는지 알고 싶었다.물론 그의 언급 부족 등은 모두 잘못이지만, 그래서 제가 제공한 것입니다(조회, 섹션 8항).[U26]
...이 점은 이미 기사에서 다루어졌습니다...좀 더 확장해야 할 수도 있어요.나도 시간 있을 때 쉽게 할 수 있어...다른 건 없나요?당신은 또한 U25가 이 기사가 "불량하다"고 생각하는 것을 지지합니까?그것은 위에서부터 아래까지 재검토해야 한다는 것입니까?그가 실제로 삽입하려고 했던 비열하지 않은 논센스나 이 페이지에 기재한 다른 OR을 지지합니까?기본적으로는 두 가지 측면이 있는데, 이 기사는 그의 이름이 뭐냐고 하는 괴짜들이 대신할 수 있다.만약 그렇다면, 내가 간다.너는 나를 지지하든 말든 할 수 있다.어디에 서 있습니까?[U24]
나는 아무리 상상해도 그 물건이 형편없다는 견해를 지지하지 않는다.사실 U25가 이 페이지에서 말한 많은 내용에 동의하지 않습니다.이 일로 기분이 언짢았다면 정말 죄송합니다.[U26]

관리자 자격 취득

2008년, 카네기 멜론 대학의 연구원들은 관리자가 [21]되기 위해 안전 점검 과정을 성공적으로 통과영어 위키피디아 편집자들프로빗 모델을 고안했다.편집 요약 텍스트를 포함한 Wikipedia 메타데이터만 사용하여 해당 모델은 합격자를 예측하는 데 74.8% 정확했습니다.

이 신문은 반대에도 불구하고 행정관 선거는 여러모로 승진이며 엘리트 핵심집단과 다수의 편집자를 구분하는 것이라고 지적했다.따라서 이 문서에서는 명목상 중요한 속성과 실제로 업무 환경에서 승진으로 이어지는 속성을 비교하는 방법인 정책[22] 캡처를 사용했습니다.

전체 프로모션 성공률은 2005년 75%, 2006년 53%, 2007년 42%로 낮아졌습니다.이러한 갑작스런 실패율 증가는 승진 관리자들이 최근 만족해야 하는 높은 기준에 기인하며, 최근 실시된 또 다른 조사에서 최근 실시된 일부[23] 초기 관리자들의 말을 인용한 일화적인 증거에 의해 뒷받침되었습니다. 이들은 최근 선출(RfA)이 실시되면 합격할 수 있을 것이라고 의심했습니다.이러한 발전에 비추어 본 연구는 다음과 같이 주장했다.

위키피디아 설립자가 한때 "별것 아니다"라고 불렀던 과정이 꽤 큰 문제가 되었다.

회귀하는 유닛당 성공한 RfA의 확률 증가/감소
(괄호 안의 값은 p<.05)에서 통계적으로 유의하지 않습니다).
요인 2006–2007 2006년 이전
각 이전 RfA 시도 -14.7% -11.1%
처음 편집한 이후 매달 0.4% (0.2%)
1000개의 기사를 편집할 때마다 1.8% (1.1%)
1000 Wikipedia 정책 편집마다 19.6% (0.4%)
Wiki Project 편집 1000회마다 17.1% (7.2%)
기사 1000건당 토크 편집 6.3% 15.4%
각 Arb/중재/위켓 편집 -0.1% -0.2%
각 다양성 점수(텍스트 참조) 2.8% 3.7%
편집 요약에서 "미미한 편집" 표시의 각 백분율 0.2% 0.2%
인간이 작성한 편집 요약의 각 백분율 0.5% 0.4%
편집 요약의 각 "감사합니다" 0.3% (0.0%)
편집 요약의 각 "POV" 표시 0.1% (0.0%)
관리자 주의/알림판의 각 편집 -0.1% (0.2%)

예상과 달리 관리자를 여러 번 "출마"하는 것은 후보의 성공 가능성에 악영향을 미칠 수 있습니다.이후의 각 시도는 이전 시도보다 성공 확률이 14.8% 낮습니다.프로젝트 참여 기간은 RfA의 성공 가능성에 대한 기여도가 미미합니다.

이 백서의 또 다른 중요한 발견은 Wikipedia 정책 편집 또는 Wiki Project 편집이 10건의 기사 편집보다 가치가 있다는 것입니다.이와 관련, 이 사이트의 여러 분야에서 경험을 쌓은 후보들의 당선 가능성이 더 높다는 관측이다.이는 편집자가 참여한 영역 수의 단순 카운트인 다양성 점수로 측정되었습니다.이 논문은 Wikipedia를 기사, 기사 토크, 기사/카테고리/템플릿 삭제(XfD), (삭제 검토) 등 16개 영역으로 나누었습니다(전체 목록은 문서 참조).예를 들어, 기사, 자신의 사용자 페이지를 편집하고 삭제 리뷰에서 한 번 올린 사용자는 다양성 점수가 3점입니다.Wikipedia의 모든 추가 영역에서 한 번 편집하는 것은 2.8%의 관리직 획득 성공 가능성을 높였습니다.

연구 저자들은 사소한 편집이 경험과 상관관계가 있기 때문에 사소한 편집도 도움이 될 수 있다고 생각한다.이와는 대조적으로 중재 또는 중재 위원회 페이지 또는 Wikuette 공지를 편집할 때마다 모든 것이 분쟁 해결의 장인 경우 성공 가능성이 0.1% 감소합니다.관리자 게시판에 메시지를 게시하는 것도 마찬가지로 유해한 영향을 미칩니다.이 연구는 이를 갈등의 고조 또는 장기화에 관여하는 편집자들이 행정관이 될 가능성을 낮춘다는 증거로 해석했다.

편집 요약에서 "고맙다"고 말하거나 그 변형과 시점("POV") 문제를 지적하는 것(연구는 메타데이터만 분석했기 때문에 편집 요약에서만)은 2006-2007년 후보자의 확률에 0.3%, 0.1%의 기여가 있었지만 이전에는 통계적으로 유의하지 않았다.

기껏해야 관련이 없거나 한계인 것으로 밝혀진 몇 가지 요인:

  • 사용자 페이지(사용자 페이지 포함)를 편집하는 것은 도움이 되지 않습니다.다소 의외로 사용자 토크 페이지의 편집도 관리 권한에 영향을 주지 않습니다.
  • 편집 요약에서 신입생을 환영하거나 "부탁합니다"라고 말하는 것은 효과가 없었습니다.
  • RfA 투표나 마을 펌프와 같은 컨센서스 구축에 참여한다고 해서 관리인이 될 가능성이 높아지는 것은 아닙니다.그러나 이 연구는 합의 참여도가 양적으로 측정되었지만 질적으로 측정되지는 않았다는 것을 인정한다.
  • 반달리즘 게시판의 편집 건수로 측정되는 반달 퇴치는 효과가 없었다."반전"의 변동을 포함하는 1,000개의 편집 내용은 2006-2007년 관리직과 양의 상관관계가 있었지만(7%) 임계값을 p <.1로 낮추려는 의지가 없는 한 통계적 유의성을 얻지 못했다.더욱 혼란스러운 것은 2006년 이전에는 복구 횟수가 관리 성공과 음의 상관관계(-6.8%)였는데, 이는 p <.1에서도 통계적 유의성을 얻지 못한 것과 비교된다.이는 [24]복귀를 줄이기 위해 2006년에 "3RR"로 알려진 정책이 도입되었기 때문일 수 있습니다.

연구 결과 25%의 원인 불명의 변동성 중 일부는 편집 품질이나 오프사이트 조정 참여 [25]등 측정되지 않은 요인(명시적으로 인용된)에 의한 것일 수 있다.이 문서의 결론:

단지 많은 제작 작업을 수행하는 것만으로는 위키피디아에서 "홍보"를 하기에는 충분하지 않습니다.후보자들의 기사 편집은 성공의 예측이 약했다.그들은 또한 더 많은 관리 행동을 보여야 한다.정책 및 Wiki Projects 개발에 대한 다양한 경험과 기여가 RfA의 성공을 예측하는 강력한 지표였습니다.이것은 위키피디아는 관료주의이며[19] 조정 작업이 [26][27]상당히 증가했다는 조사 결과와 일치합니다.2006년 이전에는 Wikipedia 정책 및 Wiki Projects에 대한 참여는 관리 업무를 예측할 수 없었습니다.이는 커뮤니티 전체가 단순한 기사 수준의 조정보다 정책 수립과 조직 경험을 우선시하기 시작했음을 시사합니다.

다른 그룹의[28] 후속 연구는 RfA 결정에 기여하는 동안 개인의 센스 메이킹 활동을 조사했다.이 연구는 RfA 후보자에 대한 결정이 위키의 증거와 이전 상호작용의 이력에 대한 공유 해석을 기반으로 한다는 것을 확립한다.

위키백과 교육

선생님들이 교실 업무의 기반으로 위키피디아를 사용하는 것을 꺼려함에도 불구하고, 학생들의 위키피디아(본 논문의 경우 Hebrew Wikipedia)를 쓰는 것은 학습 과정에 대한 그들의 관심, 그들의 작업 성과에 대한 투자, 그들의 학습과 자기 계발에 대한 그들의 진보, 그리고 스터든의 가능성을 향상시킨다는 것이 밝혀졌습니다.ts를 참조해 주세요.[29][additional citation(s) needed]

기계 학습

기계 학습 알고리즘을 사용한 자동화된 의미 지식 추출은 "상대적으로 낮은 복잡도 비용으로 기계 처리 가능한 정보를 추출"[30]하기 위해 사용됩니다.DBpedia는 기계학습 알고리즘에 의해 다른 언어로 된 위키피디아 문서의 정보 상자에서 추출된 구조화된 콘텐츠를 사용하여 시맨틱 [31]웹에 링크된 데이터의 리소스를 만듭니다.

Wikipedia에서 통계 및 인간 행동 보기

옥스퍼드 인터넷 연구소의 타하 야세리와 중앙 유럽 대학의 그의 동료들PLoS ONE[32] 실린 연구에서 영화에 관한 기사의 페이지뷰 통계는 그들의 박스 오피스 수익과 밀접한 관련이 있다는 것을 보여주었다.그들은 영화에 대한 위키피디아 페이지의 편집 횟수 및 독특한 편집자 수뿐만 아니라 페이지 뷰 수를 분석함으로써 흥행 성적을 예측하는 수학적 모델을 개발했다.이 모델은 영화용 영어 위키피디아에 대항해 개발되었지만, 언어에 의존하지 않는 방법은 영화 이외의 다른 언어 [33]및 다른 종류의 제품에 일반화될 수 있습니다.

2013년 Scientific Reports에 발표된 연구에서 Helen Susannah Moat, Tobias Preis [34]동료들은 금융 주제에 관한 영어 위키피디아 기사 조회 수 변화와 그에 따른 대규모 미국 주식 시장 [35][36]움직임 사이의 연관성을 보여주었다.

Public Opinion [37]Quarterly에 실린 기사에서 벤자민 K.Smith와 Abel Gustafon은 Wikipedia 페이지뷰의 데이터가 여론조사와 같은 전통적인 선거 예측 방법을 개선할 수 있다는 것을 보여주었다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ S - tuckman, Jeff; Purtilo, James (2009). Measuring the wikisphere. Proceedings of the 5th International Symposium on Wikis and Open Collaboration. p. 1. doi:10.1145/1641309.1641326. ISBN 978-1-60558-730-1. S2CID 17770818.
  2. ^ Priedhorsky, Reid; Chen, Jilin; Lam, Snider (Tony); Panciera, Katherine; Terveen, Loren; Austin, Shane (2007). "Creating, Destroying, and Restoring Value in Wikipedia". Proceedings of the 2007 international ACM conference on Supporting group work. Conference on Supporting Group Work. ACM Press. pp. 259–268. doi:10.1145/1316624.1316663. ISBN 978-1-59593-845-9.
  3. ^ Baker, Nicholson (10 April 2008). "How I fell in love with Wikipedia". The Guardian. Retrieved 29 November 2010.
  4. ^ Chi, Ed; Kittur, Aniket; Pendleton, Bryan A.; Suh, Bongwon & Mytkowicz, Todd (31 January 2007). "Power of the Few vs. Wisdom of the Crowd: Wikipedia and the Rise of the Bourgeoisie" (PDF). Computer/Human Interaction 2007 Conference. Association for Computing Machinery. S2CID 14770727. Retrieved 23 April 2017.
  5. ^ 굿윈, 진.(2010).위키피디아의 권위.Juho Ritola(Ed.)에서 논쟁문화: 토론학회를 위한 온타리오 학회의 진행.윈저, 온, 캐나다:온타리오 논쟁 연구회CD-ROM.24 페이지
  6. ^ Graham, Mark (12 November 2009). "Mapping the Geographies of Wikipedia Content". Mark Graham: Blog. ZeroGeography. Archived from the original on 8 December 2009. Retrieved 16 November 2009.
  7. ^ Gabrilovich, Evgeniy; Markovitch, Shaul (2007). "Computing Semantic Relatedness using Wikipedia-based Explicit Semantic Analysis". Proceedings of IJCAI. Morgan Kaufmann Publishers Inc. pp. 1606–1611. CiteSeerX 10.1.1.76.9790.
  8. ^ Zesch, Torsten; Müller, Christoph; Gurevych, Iryna (2008). "Extracting Lexical Semantic Knowledge from Wikipedia and Wiktionary" (PDF). Proceedings of the Conference on Language Resources and Evaluation (LREC).
  9. ^ M Strube; SP Ponzetto (2006). "WikiRelate! Computing semantic relatedness using Wikipedia psu.edu" (PDF). Proceedings of the National Conference. {{cite journal}}:Cite 저널 요구 사항 journal=(도움말)
  10. ^ a b Adams, Kimberly; Alvardo, Jesus (27 July 2021). "Why it's so hard for biographies about women to stay on Wikipedia". Marketplace. Retrieved 3 August 2021.
  11. ^ a b Tripodi, Francesca (June 2021). "Ms. Categorized: Gender, Notability, and Inequality on Wikipedia". New Media & Society. doi:10.1177/14614448211023772.
  12. ^ Laurent, M. R.; Vickers, T. J. (2009). "Seeking Health Information Online: Does Wikipedia Matter?". Journal of the American Medical Informatics Association. 16 (4): 471–479. doi:10.1197/jamia.M3059. PMC 2705249. PMID 19390105.
  13. ^ Heilman, JM; Kemmann, E; Bonert, M; Chatterjee, A; Ragar, B; Beards, GM; Iberri, DJ; Harvey, M; Thomas, B; Stomp, W; Martone, MF; Lodge, DJ; Vondracek, A; de Wolff, JF; Liber, C; Grover, SC; Vickers, TJ; Meskó, B; Laurent, MR (31 January 2011). "Wikipedia: a key tool for global public health promotion". Journal of Medical Internet Research. 13 (1): e14. doi:10.2196/jmir.1589. PMC 3221335. PMID 21282098.
  14. ^ Bill Tancer (25 April 2007). "Who's Really Participating in Web 2.0". Time. Archived from the original on 30 April 2007. Retrieved 30 April 2007.
  15. ^ Sumi, R.; Yasseri, T.; Rung, A.; Kornai, A.; Kertesz, J. (1 October 2011). "Edit Wars in Wikipedia". 2011 IEEE Third Int'l Conference on Privacy, Security, Risk and Trust and 2011 IEEE Third Int'l Conference on Social Computing. pp. 724–727. arXiv:1107.3689. doi:10.1109/PASSAT/SocialCom.2011.47. ISBN 978-1-4577-1931-8. S2CID 14151613 – via IEEE Xplore.
  16. ^ Szolnoki, Attila; Yasseri, Taha; Sumi, Robert; Kertész, János (2012). "Circadian Patterns of Wikipedia Editorial Activity: A Demographic Analysis". PLOS ONE. 7 (1): e30091. arXiv:1109.1746. Bibcode:2012PLoSO...730091Y. doi:10.1371/journal.pone.0030091. ISSN 1932-6203. PMC 3260192. PMID 22272279.
  17. ^ Török, J; Iñiguez, G; Yasseri, T; San Miguel, M; Kaski, K; Kertész, J (2013). "Opinions, Conflicts, and Consensus: Modeling Social Dynamics in a Collaborative Environment". Physical Review Letters. 110 (8): 088701. arXiv:1207.4914. Bibcode:2013PhRvL.110h8701T. doi:10.1103/PhysRevLett.110.088701. PMID 23473207. S2CID 2496524. 인용된
  18. ^ Yasseri T.; Spoerri A.; Graham M.; Kertész J (2014). "The most controversial topics in Wikipedia: A multilingual and geographical analysis". In Fichman P.; Hara N. (eds.). Global Wikipedia:International and cross-cultural issues in online collaboration. Lanham, Maryland: Rowman and Littlefield Press. arXiv:1305.5566. ISBN 978-0-8108-9101-2. OCLC 1026054095.
  19. ^ a b Butler, Brian; Joyce, Elisabeth; Pike, Jacqueline (2008). Don't look now, but we've created a bureaucracy. Proceedings of the Twenty-Sixth Annual CHI Conference on Human Factors in Computing Systems - CHI '08. p. 1101. doi:10.1145/1357054.1357227. ISBN 978-1-60558-011-1. S2CID 15211227.
  20. ^ Kriplean, Travis; Beschastnikh, Ivan; McDonald, David W.; Golder, Scott A. (2007). Community, consensus, coercion, control. Proceedings of the 2007 International ACM Conference on Conference on Supporting Group Work - GROUP '07. p. 167. doi:10.1145/1316624.1316648. ISBN 978-1-59593-845-9. S2CID 14491248.
  21. ^ Burke, Moira; Kraut, Robert (2008). Taking up the mop. Proceedings of the Twenty-Sixth Annual CHI Conference Extended Abstracts on Human Factors in Computing Systems - CHI '08. p. 3441. doi:10.1145/1358628.1358871. ISBN 978-1-60558-012-8.
  22. ^ Stumpf, S. A.; London, M. (1981). "Capturing rater policies in evaluating candidates for promotion". The Academy of Management Journal. 24 (4): 752–766. doi:10.2307/256174. JSTOR 256174.
  23. ^ Forte, A. 및 Bruckman, A. 스케일링 컨센서스:위키피디아 거버넌스에서의 분권화 증가.Proc. HICS 2008.
  24. ^ WP: 3RR 및 WP:EW, 반복적인 복귀를 방지하는 정책입니다.
  25. ^ Metz, Cade. "Secret mailing list rocks Wikipedia". The Register.
  26. ^ Kittur, Aniket; Suh, Bongwon; Pendleton, Bryan A.; Chi, Ed H. (2007). He says, she says: conflict and coordination in Wikipedia. Proceedings of the SIGCHI Conference on Human Factors in Computing. pp. 453–462. doi:10.1145/1240624.1240698. ISBN 978-1-59593-593-9. S2CID 17493296.
  27. ^ Viegas, Fernanda B.; Wattenberg, Martin; Kriss, Jesse; van Ham, Frank (2007). "Talk Before You Type: Coordination in Wikipedia". 40th Annual Hawaii International Conference on System Sciences: 575–582. CiteSeerX 10.1.1.210.1057. doi:10.1109/HICSS.2007.511. ISBN 978-0-7695-2755-0. S2CID 5293547.
  28. ^ 더틱, K., P. 차오, T. 크리플란, A. 보닝, M. 재크리, D.W. 맥도날드 (2011).Wikipedia에서 관리자 권한 부여 중 협업적 센스 메이킹.A.A. Ozok 및 P. Zaphiris (Eds.) : 온라인 커뮤니티, HCII 2011, LNCS 6778, 페이지 100–109.
  29. ^ Hertz, Tehila (2018). "Wikishtetl: Commemorating Jewish Communities that Perished in the Holocaust through the Wikipedia Platform". Quest. 13.
  30. ^ Baeza-Yates, Ricardo; King, Irwin, eds. (2009). Weaving services and people on the World Wide Web. Springer. ISBN 978-3-642-00569-5. LCCN 2009926100.
  31. ^ Yu, Liyang (2011). A Developer's Guide to the Semantic Web. Springer. Bibcode:2011adgt.book.....Y. doi:10.1007/978-3-642-15970-1. ISBN 978-3-642-15969-5.
  32. ^ Márton Mestyán; Taha Yasseri; János Kertész (2013). "Early Prediction of Movie Box Office Success Based on Wikipedia Activity Big Data". PLoS ONE. 8 (8): e71226. arXiv:1211.0970. Bibcode:2013PLoSO...871226M. doi:10.1371/journal.pone.0071226. PMC 3749192. PMID 23990938.
  33. ^ "Wikipedia buzz predicts blockbuster movies' takings weeks before release". The Guardian. 8 November 2012. Retrieved 2 September 2013.
  34. ^ Helen Susannah Moat; Chester Curme; Adam Avakian; Dror Y. Kenett; H. Eugene Stanley; Tobias Preis (2013). "Quantifying Wikipedia Usage Patterns Before Stock Market Moves". Scientific Reports. 3: 1801. Bibcode:2013NatSR...3E1801M. doi:10.1038/srep01801. PMC 3647164.
  35. ^ "Wikipedia's crystal ball". Financial Times. 10 May 2013. Retrieved 10 August 2013.
  36. ^ Kadhim Shubber (8 May 2013). "Wikipedia page views could predict stock market changes". Wired. Retrieved 10 August 2013.
  37. ^ Smith, Benjamin K.; Gustafson, Abel (7 September 2017). "Using Wikipedia to Predict Election Outcomes: Online Behavior as a Predictor of Voting". Public Opinion Quarterly. 81 (3): 714–735. doi:10.1093/poq/nfx007. ISSN 0033-362X.

추가 정보

외부 링크

  • WikiPaper – Wikipedia 및 Wikipedia 연구에 초점을 맞춘 자원(회의 논문, 저널 기사, 논문, 서적, 데이터 세트 및 도구) 편집