위키백과:크기 비교
Wikipedia:위키스타츠 |
---|
![]() |
메인 |
일반통계 |
고장 |
메모들 |
|
이 기사는 위키피디아의 크기를 다른 백과사전 및 정보 모음과 비교한다.
이 글의 위키백과 통계가 파생된 소스 자료를 이용할 수 있다.[1] 이 페이지 끝에 있는 위키 통계 섹션의 각주는 이 글의 기술적 토론을 제공한다.
위키백과
현재 영어 위키백과만 0개 이상의 길이를 가지고 있으며, 다른 모든 언어의 위키백과 통합 위키백과가 309개 언어로 된 5500만 개 기사에 290억 개 이상의 단어를 제공함으로써 규모면에서 영어 위키백과를 크게 능가하고 있다.[2]영어 위키백과만 해도 39억 개가 넘는 단어를 보유하고 있으며,[3] 120권 분량의 영어 백과사전 브리태니카(온라인)보다 90배 이상 많은 단어를 보유하고 있으며, 방대한 119권 분량의 스페인어 엔시클로페디아 보편적인 일루스트라다 유럽어보다 더 많은 단어를 보유하고 있다.
2005년, 영어 위키피디아는 크기가 두 배 이상 증가했고, 많은 작은 위키피디아들은 더 높은 배수로 성장했다.
2011년 6월에는 모든 위키피디아에서 1,100만 건이 넘는 기사가 났고, 영어판에서는 360만 건이 넘는 기사가 나왔다.[2][3]
위키피디아는 여전히 많은 확장성과 개선이 필요하다.많은 기사들은 질이 나쁘고 몇몇 주류 백과사전 주제들은 적절하게 다루어지지 않는다.게다가, 많은 주요 기사들은 상당히 길지만, 평균 기사 길이는 브리태니커 백과사전 크기의 반밖에 되지 않는다.[citation needed]시간이 지남에 따라 편집 노력의 균형이 기존 기사의 품질, 범위, 분류 및 연계를 높이는 데 더 큰 중점을 두는 쪽으로 서서히 기울어질 것으로 예상된다.그러나, 수용 가능한 기사 주제에 관한 위키피디아의 협약은 매년 엄청난 수의 잠재적인 새로운 기사들을 포함하고 있기 때문에, 아마도 새로운 기사들은 항상 많은 수로 만들어질 것이다.2006년 중반, 새로운 기사 작성 속도는 여전히 상승하고 있었지만, 느리기만 했다.2007년[update] 1월 현재, 후속 분석에서는 그렇지 않을 수도 있지만, 기사 작성 비율이 2006년 중반에 정점을 찍은 것처럼 보였다.위키백과 참조:위키백과의 성장률과 예상되는 미래 규모에 대해 더 많은 것을 위한 위키백과의 모델링.
기타 온라인 백과사전 리소스
몇몇 백과사전들과 백과사전 사전들을 결합하고 사용자들이 모든 작품을 동시에 검색할 수 있도록 해주는 많은 다른 온라인 데이터베이스들이 있다.한 예로 옥스퍼드 레퍼런스 온라인(Oxford Reference Online)이 있는데, 2011년[update] 현재 약 140만 개의 기사를 제공하고 있으며, 향후 확장 계획이 세워져 있다.[4]또 다른 예로는 262개의 백과사전, 사전 및 기타 참고서를 접할 수 있는 Xrefplus가 있다.[5]이 모든 것은 데이터베이스 타이틀이 225개였을 때 약 290만 건에 달했다.[6]하이빔 리서치와 게일넷도 있다.지금까지 이름이 가장 클 것으로 보이는 게일넷은 사용자가 전기자원센터(133만5000명), 게일 가상참고도서관(594권),[7] 과학자원센터(51권)[8] 등 여러 백과사전 데이터베이스를 검색할 수 있는 능력을 갖추고 있다.
종이 백과사전
지금까지 생산된 종이 백과사전 중 가장 큰 것은 1407년에 1만1095권의 책으로 완성된 용레백과사전일 가능성이 있으며, 한자는 3억7천만 자로, 용레황제가 의뢰한 것이다.[9]백과사전을 구성하는 개별 책들은 현대적인 기준으로 볼 때 작았다; 이 작품은 프랑스어 백과사전 2천만 단어의 12배에 달하는 크기로,[10] 비록 그것이 크기 면에서 백과사전과는 어떻게 다른지는 분명치 않지만, 한 권당 2억 4천만 단어에 해당하는 2만 1천 6백 단어를 주었다.또한 1772년에 완성한 《백과사전》의 원본 28권이나 1780년에 완성한 35권보다 12배가 큰 것인지도 불분명하다.영로타티엔은 원작이라기보다는 발췌한 작품과 기존 작품 전체를 모아 놓은 작품이었다.단지 두 부만 복사되었고 살아남는 것은 한 부의 극히 일부분 뿐이다.
백과사전 비교
![]() | 이 위키백과 페이지(섹션과 관련된 부분)의 일부에 대한 사실적 정확성이 시대에 뒤떨어진 정보로 인해 훼손될 수 있다.최근 이벤트 또는 새로 사용 가능한 정보를 반영하도록 이 위키백과 페이지를 업데이트하십시오.관련 토론은 토크 페이지에서 찾을 수 있다.(2009년 4월) |
총 문자 수는 평균 단어 길이 5개, 공백 1개 또는 단어당 6개 문자로 추정되는 숫자에 기반이다.
백과사전 | 판 | 기사들 (iii) | 단어 (iii) | 에스트 캐릭터 (iii) | 평균 단어 1건당 |
---|---|---|---|---|---|
위키백과 | 영어 | 6,470+ | 4,000+ | 24,000+ | 624 |
Baike.com (구 후둥) (중국 위키) | 2009년 11월 | 3,920+ | 4,300+ | — | 1097 |
Siku Quanshu (四庫全書)* | 1782† | — | 800 | — | |
용레 백과사전( (永大學) | 1403† | — | 370[11] / 770[12] | — | |
엔시클로페디아 만국 일루스트라다 유럽아메리카나 | 1933 | >1,000‡ | 200 | 1,000 | — |
Gǔjīn Túshū Jíchéng (古今圖書集成) | 1725† | — | 100 | — | |
Encyclopedia of China (中国大百科全书) | 1993 | 80 | 126.4 | 1580 | |
다이 브로카우스 에지클로페디 | 2006 | >300 | 33 | ? | — |
엔시클로페디아 이탈리아어 | 1939 | 60§ | 50 | 247 | 833 |
네셔널시클로페딘 | — | 183** | — | — | — |
브리태니커 백과사전 | 2013 | 40[13] | 44 | — | 650 |
브리태니커 백과사전 | 온라인. | 120 | 55 | 300 | 370 |
대소련 백과사전 | 1978 | 100 | 21†† | 200 | 570 |
백과사전 | 1751–1780 | 72 | 20 | — | 278 |
마이크로소프트 엔카르타 | 엔카르타 디럭스 2002 | 70‡‡ | 40 | 200 | 600 |
마이크로소프트 엔카르타 | 엔카르타 디럭스 2005** | 63 | 40 | 200 | 200 |
마이크로소프트 엔카르타 | 2002년 엔카르타 백과사전 | 40 | 26 | 200 | 200 |
아메리카나 백과사전 | 2006 | 45[14] | 25 | — | 556 |
Grolier 멀티미디어 백과사전 온라인 | — | 39[15] | 11 | 70 | 280 |
컬럼비아 백과사전 | 6부.2000 | 51 | 6.5 | 40 | 130 |
마이어스 콘버스먼트-렉시콘 | 1888-92년 제4조 | 97 | 15.5 | 110 | — |
유니버설리스 백과사전 | 2008년 12월 13일 목요일 | 41.5⁑ | 60 | 350 | 1450 |
오트슈프 슬로브니크 나우치니 | 1888–1908 | 150 | ? | 130 | ? |
*클래식 중국어(Classical Chinese)는 매우 콤팩트한 언어다.결과는 같은 내용의 매우 짧은 기사들이다.
용레가 시쿠보다 크다고 †하지만 어떻게 비교됐는지는 알 수 없다.
‡케네스 F. 키스터, 키스터의 최고 백과사전: 일반 백과사전 및 전문 백과사전에 대한 비교 안내서, (1994) 페이지 450. [기사 카운트는 119권짜리 백과사전이 아니라 82권짜리 판에 대한 것이다.]
§알피에리, G.트레카니 데글리"Enciclopedia Italiana" Diccionario Literario(2001 HORA, S.A.)
백과사전 문서 **수입니다.내셔널엔시클로페딘은 총 35만 6천 건에 달한다.
††키스터, 작전부 365쪽
**10,000개의 기록 보관소 포함.
"6만3천개 이상의 기사를 수록하고 있다"‡‡고 광고했다.36,000개 이상의 지도 위치와 29,000개 이상의 편집자가 승인한 웹 사이트 링크 포함."2006년 프리미엄 CD-ROM에는 6만8000여 편의 기사가 실렸다.[16]
6,803명의 저자가 쓴 4만1,500개의 글, 6천만개의 단어, 3억5천만개의 문자, 36만개의 링크, 포함된 사전의 12만2천개의 정의, 13만개의 참고 문헌을 포함하는 것으로 ⁑광고되고 있다.[17]
기타 정보 모음의 크기
위키피디아는 사전도 웹 색인도 아니다; 이 수치들은 단지 규모 비교를 위한 것이다.
천문학
- Guide Star Catalog II에는 온라인에서 검색할 수 있는 998,402,801개의 별개의 천문학적 객체에 대한 항목이 있다.
생물학
- 세계자원연구소는 알려지지 않은 총 종수 중 약 140만 종의 종들이 이름이 지어졌다고 주장한다.2011년 한 연구에 따르면 8700,000종(육상종 6,500,000종, 해양종 2,200,000종)이 있다고 한다.[18]
화학
- 2018년[update] 9월 현재 화학 화합물에는 2억2700만 개 이상의 CAS 등록 번호가 할당되었다.
- 빌슈타인 데이터베이스는 "8백만 개의 유기 화합물과 140만 개의 무기 및 유기 화합물"에 대한 항목을 주장한다.
- Merck Index Subscription Edition은 화학 화합물에 대한 1만 개 이상의 모노그래프를 보유하고 있다.
영화와 텔레비전
유전학
- 사람마다 2만~2만5000개의 유전자가 있는 것으로 추정된다.
- 온라인 멘델리안 상속 인 맨은[20] 2019년[update] 6월 28일 현재 각각 알려진 유전자를 설명하는 25,000개 이상의 출품작을 보유하고 있다.[21]
- 26만 종 이상의 DNA 서열 온라인 데이터베이스인 GenBank는 2008년[update] 1월 현재 100기가바이트 이상을 커버하는 1억 1천만 건 이상의 출품작(시퀀스 레코드)을 보유하고 있다.
지리
- Ordnance Survey MasterMap(공식 사이트)은 연속적인 디지털 지도에 있는 영국의 모든 고정 기능에 대한 기록이다.4억 4천만 개의 고정된 지리적 특성은 각각 고유한 TOID(TOPRIC IDENTifier)를 가지고 있다.
- 미국 국립지리정보국(NGA)(https://www.nga.mil/) GEOnet Names Server에는 미국 이외의 지역에서 지명된 지리적 특성이 약 388만 개 있으며, 이름은 534만 개에 이른다.
- 2004년[update] 3월 현재 USGS 지오그래픽 네임 정보 시스템은 미국 내에 2백만 개 이상의 물리적, 문화적 지오그래픽을 보유하고 있다고 주장한다.
- 2018년[update] 9월 현재, 지오나임스([2])는 2,500만 개 이상의 지명을 포함하고 있으며, 인구 280만 개소, 550만 개의 대체 지명을 가진 1,180만 개의 고유 지명으로 구성되어 있다.
인터넷
- 1조개가 넘는 고유 URL을 가진 250억개가 넘는 웹페이지가 2006년 2월 24일 구글에 알려졌다.
- 넷크래프트는 2018년 1월에 약 4050만 개의 개별 웹사이트를 기록했다.
- 2013년[update] 4월 현재, DMOZ 웹 지수는 500만 개 이상의 웹사이트에 대해 100만 개 이상의 카테고리를 가지고 있다고 주장한다.
- 2011년[update] 8월 현재, 인터넷 아카이브는 1,500억 페이지, +54만 8천 장의 움직이는 이미지, +82,000회의 콘서트, +94만 8천 개의 녹음, +294만 5천 개의 텍스트를 색인화했다고 주장한다.
언어
- 옥스퍼드 영어사전(옛 '뉴 옥스퍼드 영어사전')은 35만5000개의 정의와 400만 단어의 본문을 주장하고 있다.[3]
- 옥스퍼드 영어 사전, Second Edition은 301,100개의 정의(61만6,500개의 단어 양식이 정의되어 있음)와 5900만 개의 텍스트 단어를 주장한다.[4]
법
- 미국 법학, Second Edition은 미국 관습법의 231권 모음집이다.
- 블랙의 법률사전 제11판에는 5만 5천 개의 일반 법률용어가 있다.
- 법학백과사전에는 10만5천 개의 법률 항목이 있다.
도서관
- 대영 도서관은 1억 7천만 개 이상의 물품을 소장하고 있는 것으로 알려져 있다.
- 의회 도서관은 약 1억 6천 7백만 개의 아이템을 보유하고 있으며, 이 중 1천 4백만 개는 전자 검색이 가능하다고 주장한다.
- 코팩(Copac)은 영국과 아일랜드의 도서관에서 소장하고 있는 4000만 권 이상의 책을 검색 가능한 전자 카탈로그다(영국 도서관의 모든 전자 기록 포함).
음악
- freedb 데이터베이스는 약 2백만 개의 컴팩트 디스크에 대한 정보를 가지고 있다.그러나 상당수의 디스크는 중복되어 있어 고유 CD의 수가 불분명하다.
- 올뮤직 데이터베이스에는 2017년[update] 현재 300만 개 이상의 발매와 3천만 개 이상의 트랙이 수록되어 있다.
- 뉴 그로브 음악사전은 음악만을 주제로 한 '2만 9천 개 이상의 기사가 실린 2천 5백만 단어'를 주장하고 있다.
- 2011년[update] 8월 현재, Jamendo 프로젝트는 5만장 이상의 무료 및 오픈 앨범을 포함하고 있다.
사람
- 톰슨-게일의 전기 자원 센터에는 133만 5천 권 이상의 전기가 수록되어 있다.335,000개가 에세이인 반면 100만 개가 넘는 것이 썸네일 항목이다.[5]
- 옥스포드 국립 전기 사전에는 유명한 영국인에 대한 5만 개 이상의 기사가 실려 있으며, 5천만 단어로 되어 있다(평균 기사 크기는 1000단어임).
- 옛 영국 국립 전기 사전에는 5천만 단어로 된 5만 개 이상의 기사가 실려 있었다.
과학기술
- 에스파케넷 무료 온라인 서비스에는 유럽특허청 특허 데이터베이스로부터 9천만 건 이상의 특허 출판에 관한 기록이 포함되어 있다.
- Inspec 데이터베이스는 1700만 개 이상의 추상체를 포함하고 있다.
- Ei Compendex 데이터베이스는 1,800만 개 이상의 레코드를 포함하고 있다.
- 엘스비에 바이오베이스 데이터베이스는 410만 개 이상의 레코드를 포함하고 있다.
- IEEE Xplore 데이터베이스는 450만 개 이상의 레코드를 포함하고 있다.
인쇄된 위키백과의 비용
인쇄 위키백과 프로젝트는 2015년 현재 사진 없이 영어 위키백과 본문을 각각 700쪽(총 520만 페이지)으로 7473권 분량으로 모두 게재했다.Lulu는 각 책을 미화 80달러에, 세트 전체를 미화 50만 달러에 팔려고 한다.[22]
2015년[update] 7월 현재 약 230억 명의 문자가 있다.페이지당 5천자를 가정하면 460만 페이지가 나온다.사진, 테이블, 다이어그램에 25%의 공간을 더하면 575만 페이지가 나온다.이렇게 하면 각각 400페이지에 달하는 14,375권의 책이 나온다.예를 들어, 페이지당 US$0.05를 허용하면 구속력 없이 US$287,500의 비용이 발생한다.
위키백과 통계에 대한 각주
위키피디아의 거의 모든 측면에 대한 매우 상세한 통계는 https://stats.wikimedia.org/EN/Sitemap.htm에서 구할 수 있다.
이 페이지에 대한 통계는 기사 수(대체) 표와 단어 표에서 가져온다.
리디렉션 페이지는 제외하고 대략 다음과 같다(2006년 9월 1일의 수치 사용):
- 적어도 하나의 링크가 있는 140만 개의 기사.
- 적어도 하나의 링크와 200개의 읽기 가능한 문자(최소한 33개의 단어에 해당함)를 가진 130만 개의 기사.
이 두 수치의 차이를 보면 다음과 같은 것이 있다.
- 링크가 한 개 이상 200자 미만인 10만 개 기사.
링크도 없는 무수한 기사들도 있다.현재 통계는 이 마지막 범주의 크기를 나타내지 않는다.실제 6억900만 단어에는 130만 본화 기사, 나머지 10만 건의 링크 기사, 그리고 링크가 없는 알려지지 않은 기사 수에 걸쳐 있다.후자의 두 범주에서 단어 개수의 대략적인 추정치는 천만 단어다.나머지 6억 단어들을 130만 단어로 나누면 약 460단어의 평균 기사 길이가 된다.
게다가, 영어 위키피디아에 실린 기사들 중, 아마도 36,000개는 미국의 도시와 도시에 관한 "데이터 덤프"게재자 기재사항일 것이다.가제트 입력이 "진짜" 백과사전 기사의 수에 반영되어야 하는지는 논쟁의 여지가 있지만, 그들의 통계적 의미는 2002년 10월에 추가된 것에 비해 지금은 훨씬 적다.위키피디아 사람들에 의해 매우 많은 사람들이 식민지화되었는데, 그들은 그들을 다양한 범위, 어떤 경우에는 의심할 여지 없이 백과사전적인 지위로 변화시켰다.
참고 항목
참조
- ^ 물품출처자료
- ^ a b 위키백과 통계 모든 언어 (2009년 11월 60억 단어에서 추산 119억 단어 + 9개월마다 10억 단어)
- ^ a b 위키백과 통계 영어
- ^ 옥스퍼드 참조 온라인
- ^ 엑스프플러스
- ^ X참조
- ^ 게일 가상 참조 라이브러리
- ^ 과학자원센터
- ^ "용레 다디안"브리태니커 백과사전.
- ^ 융러 백과사전
- ^ 융러 백과사전
- ^ 융러 백과사전
- ^ 브리태니커 백과사전
- ^ 그로리어
- ^ 그로리어 온라인
- ^ 엔카르타
- ^ 2008년 보도자료
- ^ El calculo mas preiso de la historyia cifra las especees que viven en la Tierra en 8,7 millones. (스페인어)
- ^ IMDB
- ^ 온라인 멘델리안 상속
- ^ 현장 통계
- ^ 각각 700페이지에 7,473권의 책: 인쇄 위키백과 만나보기 wik 위키미디어 블로그