위키백과:Wikipedia 확장 모델링

Wikipedia:
확장 성장 모형 대 Gompertz 모형 대 로지스틱 모형 대 실제 성장 비교

이 에세이는 전통적인 백과사전과 주요 대중문화 기사를 넘어 많은 다른 종류의 기사에 의해 촉진되는 성장을 포함한 기사 수 측면에서 위키피디아의 장기적인 성장을 전망하는 것에 관한 많은 문제들을 고려하였다.확장 성장 모델은 삭제가 새로운 기사의 생성을 상쇄하기 전에 현재의 660만 기사(실시간 수)를 훨씬 초과하는 수백만 개의 새로운 기사를 생성하는 요인을 고려합니다.

위키피디아의 성장은 다소 줄었지만 2007년에 예상했던 것만큼 느려지지는 않았지만 2005년에 예상했던 것만큼 치솟지도 않았다.확장 모델은 Wikipedia가 연말(2009년 8월 17일)이 아닌 2009년 8월 중순에 총 300만 개의 문서를 초과할 것으로 예측했다.이 모델은 350만 번째 기사가 2010년 9월 중순에 추가될 것이라고 예측했지만, 그 대신 2010년 12월 12일에 발생했다.

Wikipedia의 사용자
영어 기사: 6,560,035
평균 리비전 수: 19.54
1일 기사 수: +2080
총 Wiki 페이지 수: 56,666,067
관리자 수: 1,030
총 사용자 수: 44,240,202
UTC 시간: 2022년 8월 3일 19:50

위키피디아 확장 성장 모델

Graph WP extended growth 2025.gif
Wikipedia의 장기적인 성장에 대한 근사치로, 매년 추가되는 수많은 종류의 새로운 후속 기사의 느린 감소를 예상합니다.

위키피디아 성장의 또 다른 가능성은 새로운 기사의 장기적이고 장기적인 감소이다: 매년 두 배로 증가하던 원래의 기하급수적인 폭발이 아니라 2006년 말에 정점에 달했던 균형잡힌 종곡선도 아니다.대신, 2010-2011년 사이에 중간 규모 또는 평균 크기를 사용하여 400만 또는 500만 기사의 두 배인 약 900만 기사의 장기 성장 모델을 고려해야 한다.주요 기사가 대부분 안정되고 나면 추가로 수백만 개의 기사는 다양한 종류의 후속 기사가 될 것이다.

후속 기사에 대한 심리적 동기는 위키피디아가 누구나 생각할 수 있는 주목할 만한 주제에 대한 몇 가지 기본적인 질문에 대답할 필요가 있다는 느낌일 것이다.이러한 동기는 각 토픽을 포괄적으로 다루도록 기존 기사를 다듬는 것보다 훨씬 강력합니다(아래 참조).심리적 동기).

그래픽 모델이 전체 패턴에 적합

이 모델은 데이터의 전체 패턴에 맞게 그래픽 곡선으로 개발되었으며, 이는 새로운 기사 묶음이 일반 대중이 무작위로 추가하는 것이 아니라 위키봇과 단기 그룹에 의해 추가되기 때문에 단순한 수학적 모델을 따르지 않는다.따라서, 로봇 봇 프로그램이 몇 달 내에 수많은 단백질 배열 기사와 같이 수많은 새로운 기사를 로드하도록 트리거될 때 크게 변동하는 실제 데이터에 부합할 수 있는 간단한 방정식은 없다.새로운 기사 성장을 시뮬레이션할 수 있는 간단한 수학적 "프로세스 생성기"는 없습니다.상세한 연산 모델은 방정식이 아니라 논리적이고 절차적인 전산 모델이 될 것입니다.그러나, 일반인의 기사의 성장 영향은, 단기적인 그룹의 노력보다 훨씬 더 컸기 때문에, 전체적인 패턴은, 수개월, 혹은 장래의 3년간의 평균적인 신상품의 성장률의 다소 선형적인 저하로 보인다.아마도 대략적인 방정식은 매년 6월/7월에는 감소세가 더 둔화되지만 아마도 북반구의 학교 방학과 관련된 매년 8월에 증가한다는 것을 이해하면서, 매년 신상품 증가율을 11% 감소시킬 것이다.만약 거대한 봇이 "Who's Who in Science"에서 70만 개의 새로운 기사를 싣게 된다면, 새로운 기사 비율은 수개월 동안 치솟을 것이고, 앞으로 20-65년 동안 하락하는 전반적인 곡선에서 항상 상승폭으로 나타나는 이상 징후로 나타날 것이라는 것을 명심하십시오.

후속 기사의 지속적인 성장

위키피디아 기사의 초기 근거는 역사적 인물, 세계 사건, 과학 용어의 카탈로그, 유명인, 연예 주제, 그리고 유명한 스포츠 인물들을 포함한 전통적인 백과사전과 주류 대중 문화 기사들을 다루었다.이러한 토픽은, 6년간의 확장 후에 포화 상태가 되어, Wikipedia의 주된 성장이 급속히 저하해, 5년 이내에 종료한다고 생각되었습니다.

그러나 다음과 같은 몇 가지 다른 유형의 기사에 대해서는 성장이 예상될 수 있습니다.

  • 해결되지 않은 Redlink 기사– 저자가 주목도를 예상했기 때문에 링크되어 있습니다(예상).
  • spinoffs – 대형 기사를 분할할 때 생성되는 서브 메시지 세트.
  • 명확화 페이지– 두 개 이상의 기사가 유사한 제목을 가질 때마다 페이지가 그것들을 분리할 것으로 예상한다.
  • 보이지 않는 기사– 이들은 왕좌의 배후에 있는 을 가진 조연출자 및 크루, 또는 보조 리더입니다.
  • 잃어버린 세계 기사 – 오랫동안 잃어버린, 묻혀있던 문명, 실패한 발명품, 비밀 조직 또는 잊혀진 영웅입니다.
  • 또한 기사 – 경쟁자 또는 경쟁자를 잃은 사람이 라임라이트 바로 바깥에 있습니다.
  • 자동차, 가전제품, 전기부품, 과학기기, 소프트웨어, 무기 등의 기술유물매년 수천 개의 새로운 모델이 시장에 출시되고 있으며, IBM 1620과 같은 과거 모델도 수백만 개에 달했습니다.
  • 화학 물질 - 2,2-디메틸부탄과 같은 약 1,000만 개의 물질이 문헌에서 비정기적으로 기술되어 있는 것으로 추정됩니다(단순한 존재와 공식 이외의 일부 정보를 포함).
  • - 수백만 종의 수에 대한 추정치로, 모두 어딘가에서 출판된 사소한 정보이다.
  • – 수백만 개의 별이 나열된 여러 의 별 카탈로그가 있지만 위키피디아에는 일부만 나와 있습니다.
  • 에 의한 기사– 주요 뉴스에서 언급되는 상세 또는 팝컬처 주제(예: 일회성 의류 디자인)입니다.

팬 크러프트 기사도 주목됩니다.단시간이라도 수천, 수백만 명의 사람들이 영향을 받을 수 있고, 이 주제는 일부 주류 미디어에서 다루어지기 때문입니다.

  • 신간, 신간, 신영화, 새롭게 주목받는 배우, 새로 선출된 정치인, 새로운 메이저 운동선수, 새로운 과학적 발견, 새로운 메이저 제품 등 새로운 종류의 새로운 것에 대한 추가 기사.주요 상들이 눈에 띄는 곳에는 매년 그 그룹에 새로운 사람들이 올 것이다.이 부분은 절대 포화 상태가 될 수 없지만 성장이 선형화될 수 있습니다.
  • enWP를 다른 문화 영역의 완전한 커버리지로 확대한다.예를 들어, 우리는 인도보다 영국 철도역에 훨씬 더 포화되어 있다.

많은 후속 기사들로 인해, 수백만 개의 전통적인 백과 사전과 주요 대중 문화 기사들을 넘어 많은 새로운 기사들을 만들 수 있는 큰 잠재력이 있는 것으로 보인다.

신상품 연간 증가율

다음 표는 영어 위키피디아에서 증가하고 있는 문서 수를 보여줍니다.

날짜. 기사수 기간 중 증가
전년도
기간 중 증가율(%)
전년도
2배의 시간(년 단위)
반올림 일수)
평균 증가 수:
전년도의 하루
2002-01-01 19,700 19,700 54
2003-01-01 96,500 76,800 390% 160일 210
2004-01-01 188,800 92,300 96% 377일 253
2005-01-01 438,500 249,700 132% 301일 682
2006-01-01 895,000 456,500 104% 355일 1251
2007-01-01 1,560,000 665,000 74% 342일 1822
2008-01-01 2,153,000 593,000 38% 1년 302일 1625
2009-01-01 2,679,000 526,000 24% 2년 326일 1437
2010-01-01 3,144,000 465,000 17% 4년 29일 1274
2011-01-01 3,518,000 374,000 12% 5년 284일 1025
2012-01-01 3,835,000 317,000 9% 7년 257일 868
2013-01-01 4,133,000 298,000 8% 8년 243일 814
2014-01-01 4,413,000 280,000 7% 9년 330일 767
2015-01-01 4,682,000 269,000 6% 11년 202일 736
2016-01-01 5,045,000 363,000 8% 8년 243일 995
2017-01-01 5,321,200 276,200 7% 9년 330일 755
2018-01-01 5,541,900 220,700 4.5% 15년 148일 605
2019-01-01 5,773,600 231,700 4.2% 16년 310일 635
2020-01-01 5,989,400 215,800 3.75% 20년 11일 591
2021-01-01 6,219,700 230,300 3.8% 20년 629
2022-08-03 6,560,035 340,307[a] 587[a]
[a] 아직까지는 부분적으로만 라이브로 계산했습니다.

해결된 레드링크 기사

위키피디아의 성장이 막바지에 다다랐다면, 많은 기사들은 이미 의도된 링크된 기사로 주요 링크들을 해결했을 것이다.그러나 많은 기사들이 여전히 6개 이상의 리다이렉트 기사를 권장하고 있습니다.일어날 것 같지 않은 레드링크는 종종 기사에서 삭제되기 때문에 일반적으로 나머지 레드링크가 눈에 띈다.여기에는 인근 산 이름, 야생동물 보호구역, 하천, 만, 마을, 주요 인력, 책/영화 제목, 특수 품종 등이 포함됩니다.이러한 토픽은 주목할 만한 것으로 쉽게 방어되기 때문에 새로운 주목할 만한 기사를 작성하는데 있어 레드링크가 큰 영향을 미칩니다.

명확화 페이지로서의 기사

새로운 기사의 일반적인 유형은 명확화 페이지이며, 이 페이지는 같은 제목과 관련된 기사를 선택할 수 있습니다.원래는 존 스미스, 메리 존스, 레오나르도 등 정확히 같은 이름을 가진 아이템 중 하나를 선택했습니다.단, 단어 프리픽스 검색과 유사한 방식으로 제목 변형이 잠재적인 일치로 추가되었습니다.그 결과, 애매모호화 페이지에는 부분 타이틀에 대한 잠재적인 매칭의 정리된 그룹이 나열되기 시작했고, 사람, 회사, 마을, 영화 등을 각각에 대한 짧은 설명과 함께 신중하게 그룹화하기 시작했다.

모호성 제거 페이지는 매우 포괄적이고 설명적일 수 있으며, 검색 엔진이 달성해야 하는 높은 목표가 되는 구조적이고 유익한 스캔으로서 "스테로이드제에 대한 검색 엔진 결과"와 같은 역할을 할 수 있습니다.명확화 페이지에 의해 추출된 예외적인 정보 때문에, 그것들은 위키피디아에 귀중한 추가가 될 수 있고, 따라서 환영받는 새로운 페이지의 주요 원천이 될 수 있다.2009년 2월, 위키피디아는 거의 108,000개의 명확화 페이지를 가지고 있었는데, 이는 2003년 초의 위키피디아 전체 크기보다 많은 수치이다.2009년 초, 신규 기사의 일일 증가율에는 대략 1~2%의 명확화 페이지가 포함되어 있었다.2014년까지 모호성 해소 페이지 수는 25만 개 이상으로 증가했습니다.

잃어버린 세계의 토픽으로서의 기사

지식의 탐구는 종종 과거의 세계를 밝혀준다.고고학자들은 수십 년 동안 중국 시안에 있는 진 황제의 테라코타 군대, 에페수스 들판, 코판 언덕, 카르케미쉬의 유적, 많은 카리브해 난파선 내부, 폼페이용암 흐름 아래, 나일강에드푸, 아비도스 또는 콤옴보의 고대 사원에서 발굴해 왔다.새로운 발견들이 결합되면서, 수천 개의 고대 주제들이 완전한 기사가 되기 위한 세부 사항들을 얻습니다.

가구와 가재도구가 있는 골동품 세계는 순식간에 수천 가지 주제를 새로운 기사에 제공한다.

고생물학자들은 많은 지역에서 화석 기록을 확대하고 있다: 북극 빙하가 녹으면서, 때때로 많은 화석이 얼음 밑 표면에서 발견되기도 한다; 그리고 공룡이 거의 발견되지 않았던 아프리카에서도 많은 화석이 발견되고 있다.

잃어버린 세계의 주제에 관한 수천 개의 기사를 기대할 수 있다.

미해결 문제로서의 기사

주요 인기 토픽의 배후에, 또는 그 아래에, 「보이지 않는」기사가 있습니다.조연과 제작진(때로는 "수천명의 출연자"로)은 결국 새로운 기사를 채울 만큼 충분히 알려지게 된다.

이 기사들에는 토마스 에디슨에게 그들의 기발한 아이디어를 팔았던 사람들이 포함되어 있다.

새로운 기사에 대한 심리적 동기

영어 위키피디아는 2005년 초부터 매일 1,000개 이상의 새로운 기사를 추가해 왔다.그러나 특집기사 지위에 맞게 다듬고 다듬는 기사는 하루에 몇 개밖에 없다.1000건당 1건의 특집기사가 차지하는 비율은 심리적으로 중요한 요소들이 관련되어 있음을 보여준다.

많은 새로운 후속 기사를 만드는 심리적 동기는 위키피디아에서 누구나 상상할 수 있는 거의 모든 주목할 만한 주제에 대한 몇 가지 기본적인 질문에 대답할 필요가 있다는 느낌일 것이다.예를 들어, 33,000개 이상의 영어 위키피디아 기사가 프로 축구 선수(축구 선수)에 관한 것이고, 그 기사들 중 상당수는 어디선가 매일 읽힌다.이와는 대조적으로, 더 전통적인 수학 분야의 경우, 총 21,000개의 기사가 있을 것이다.하지만, 새로운 기사가 여전히 추가되고 있다.

한편, 기사를 다듬어 특집 기사의 지위를 획득하는 과정에는 몇 주간의 변경과 리뷰가 수반됩니다.게다가, 기사를 선별하는 데 사용되는 기준은 엄격해질 수 있다. 어떤 사람들은 심지어 평범한 구절의 반복을 없애서 기사 내의 문구를 더 다양하게 만들 것을 요구한다.한 주제의 모든 주요 측면을 묘사하는 것만으로는 충분하지 않고, 그 기사들은 특정한 문학적 기준에 부합해야 한다.2008년에는 100개 이상의 기사가 특집 기사 지위를 잃었습니다.특집 기사 수준의 품질에 대한 기준이 엄격해졌기 때문입니다.

그 결과, 기존의 기사를 다듬거나 다듬어 토픽의 포괄적인 취급이 되기보다는, 각각의 토픽에 대한 일반적인 개요를 제공하는 새로운 (간략한) 기사를 작성하려는 의욕이 매우 강할 것이다.

전년 대비 성장률

하루 성장률 하락은 6년 정도밖에 되지 않았지만 연간 감소폭은 매년 9% 정도 줄어들 가능성이 있다.따라서 내년에는 전년도 신규 기사 수의 91%만 추가될 것입니다.이 모델의 형태를 사용하면 추가된 기사가 매일 삭제된 기사에 의해 상쇄되기 전에 2040년 이후에도 전체 기사는 계속 증가할 것입니다.

다음 표는 연간 및 일일 신규 기사 수를 나타내고 있으며, 연간 17%의 감소율을 보이고 있습니다.

2008 – 1437
2009 – 1308
2010 – 1085
2011 – 901
2012 – 748
2013 – 621
2014 – 515

2015 – 428
2016 – 355
2017 – 295
2018 – 244
2019 – 203
2020 – 168
2021 – 140

2022 – 116
2023 – 96
2024 – 80
2025 – 66
2026 – 55
2027 – 46
2028 – 38

2029 – 31
2030 – 26
2031 – 22
2032 – 18
2033 – 15
2034 – 12
2035 – 10

2036 – 9
2037 – 7
2038 – 6
2039 – 5
2040 – 4
2041 – 3
2042 – 3

2008년 이후 매일의 신규 기사 수(매년 17%씩 감소)는 대략적인 수치일 뿐입니다. 이 표의 목적은 2040년에도 기사 수가 얼마나 쉽게 증가할 수 있는지를 보여주는 것입니다.그러나 실제 신품 개수는 (표 값과) 크게 다를 수 있다.특히 소스 웹 페이지의 자동 검색, 각주 자동 생성 및 각주(소스 웹 페이지에서 복사)의 주요 문구 또는 정보 상자 세부 정보 삽입 등 레드링크용 스터브 문서를 작성(언젠가)하는 봇 프로그램이 작성되면 실제 숫자는 훨씬 더 커질 수 있습니다.

연간 감소율이 전년 평균의 83%보다 더 낮다면, 일일 신상품 수(2035년)는 하루에 10개(2035년 예상 일일 평균)가 될 수 있다.

예측이 근본적으로 바뀔 수 있다

현재 진행 중인 예측은 이전 유형의 새로운 기사를 계속 사용하는 것으로 가정합니다.대량 업로드의 급격한 변화나 새로운 기사 제한은 새로운 기사 생성 속도를 근본적으로 바꿀 수 있다.예를 들어 다음과 같습니다.

  • 일부 위키프로젝트가 "Who's who in science"라는 거대한 데이터베이스에서 stub로 생성된 새로운 기사를 자동 업로드하기로 결정하면 새로운 기사에 대한 대규모 상승이 발생할 수 있습니다.
  • 이와는 대조적으로, 위키피디아 정책이 새로운 스탭당 2개의 독립된 소스를 요구하는 등 수요원으로 빠르게 변경되었다면, 새로운 기사 작성은 하루에 수십 개로 줄어들 수 있다.

대량 업로드 또는 신규 기사 제한의 영향이 광범위하게 확산되어 있기 때문에 실제 증가율은 현재 몇 주 이내에 예상 수준을 크게 벗어날 수 있습니다.

또, 단독 파라메타로서의 기사 수에는, 용장성이 있거나 너무 작은 기사를 보다 크고 포괄적인 기사로 통합하는 작업이 진행중이기 때문에, 총 기사 수 감소는 건전한 발전의 징조이다.

「 」를 참조해 주세요.

[이 에세이는 매우 제한된 시간에 작성된 빠른 초안입니다.]