웨이백 머신

Wayback Machine
웨이백 머신
Stylized text saying: "INTERNET ARCHIVE WAYBACK MACHINE". The text is in black, except for "WAYBACK", which is in red.
사이트종류
기록 보관소
설립된
  • 1996년 5월 10일; 27년 전 (1996-05-10) (비공개)
  • 2001.10.24; 21년 전 (2001-10-24) (공개)
제공면적전 세계(중국, 러시아, 인도, 바레인 제외)
주인인터넷 아카이브
URLarchive.org/web/ Edit this at Wikidata
상업의아니요.
등록.선택적.
현황활동적인
기재.HTML, CSS, 자바스크립트, 자바, 파이썬.

웨이백 머신(Wayback Machine)은 캘리포니아주 샌프란시스코에 위치한 비영리 단체인 인터넷 아카이브(Internet Archive)가 설립한 월드 와이드 웹의 디지털 아카이브입니다.1996년에 만들어져 2001년에 대중에게 공개된 이 프로그램은 사용자가 "과거로" 돌아가서 웹사이트가 어떻게 생겼는지 볼 수 있게 해줍니다.그 설립자인 브루스터 칼과 브루스 길리어트는 웨이백 머신을 개발하여 사라진 웹 페이지의 보관된 복사본을 보존함으로써 "모든 지식에 대한 보편적인 접근"을 제공했습니다.[1]

1996년 5월 10일에 출시된 웨이백 머신은 2009년 말에 382억 개 이상의 웹 페이지를 저장했습니다.2023년 8월 20일 현재 웨이백 머신은 8,320억 개의 웹 페이지를 보관하고 있습니다.[2]

역사

웨이백 머신은 1996년 캐시된 웹 페이지를 보관하기 시작했습니다.가장 초기에 알려진 페이지 중 하나는 1996년 5월 10일 (UTC)에 보관되었습니다.[3]

인터넷 아카이브의 창시자인 브루스터 브루스 길리어트는 2001년 10월 캘리포니아 샌프란시스코에서 웨이백 머신을 출시했는데,[4][5][6] 이는 주로 웹 콘텐츠가 변경되거나 웹사이트가 종료될 때 웹 콘텐츠가 사라지는 문제를 해결하기 위한 것입니다.[7]이 서비스를 통해 사용자는 웹 페이지의 보관된 버전을 시간에 걸쳐 볼 수 있으며, 보관소는 이를 "3차원 색인"이라고 부릅니다.[8]칼과 길리어트는 인터넷 전체를 보관하고 "모든 지식에 대한 보편적인 접근"을 제공하고자 이 기계를 만들었습니다.[9]"웨이백 머신"이라는 이름은 가상의 시간 여행 및 번역 장치인 "웨이백 머신"[10][11]을 가리키는 말로, 애니메이션 로키와 불윙클과 친구들모험에서 미스터 피바디와 셔먼이 사용했습니다.만화의 한 부분인 "피바디의 불가능한 역사"에서 등장인물들은 이 기계를 사용하여 역사의 유명한 사건들을 목격하고, 참여하고, 종종 변경합니다.

1996년부터 2001년까지 이 정보는 디지털 테이프에 보관되었으며, Kahle은 때때로 연구원과 과학자들이 "터무니없는" 데이터베이스를 활용할 수 있도록 했습니다.[12]2001년 5주년이 되었을 때, 캘리포니아 대학교 버클리 캠퍼스에서 열린 기념식에서 공개되어 일반에 공개되었습니다.[13]Wayback Machine이 출시되었을 때 이미 100억개 이상의 아카이브된 페이지가 포함되어 있었습니다.[14]데이터는 Internet Archive의 Linux 노드의 대규모 클러스터에 저장됩니다.[9]때때로 새로운 버전의 웹 사이트를 다시 방문하고 보관합니다(아래 기술 세부 정보 참조).[15]웹 사이트에서 Wayback Machine이 웹 사이트를 "크롤"하고 데이터를 저장할 수 있다면 검색 상자에 웹 사이트의 URL을 입력하여 사이트를 수동으로 캡처할 수도 있습니다.[16]

2020년 10월 30일, 웨이백 머신은 팩트체크 콘텐츠를 시작했습니다.[17]2022년 1월 현재 광고 서버의 도메인은 캡처할 수 없습니다.[18]

2021년 5월, 웨이백 머신은 인터넷 아카이브 25주년을 맞아 "지식이 포위된 2046년 인터넷으로 여행"할 수 있는 "웨이포워드 머신"을 선보였습니다.[19][20]

기술정보

웨이백 머신의 소프트웨어는 웹을 "크롤링"하고 웹페이지, 고퍼 계층, 넷뉴스(유즈넷) 게시판 시스템 및 다운로드 가능한 소프트웨어의 모든 공개적으로 접근 가능한 정보 및 데이터 파일을 다운로드하도록 개발되었습니다.[21]대부분의 데이터가 게시자에 의해 제한되거나 접근할 수 없는 데이터베이스에 저장되기 때문에 이러한 "크롤러"가 수집하는 정보는 인터넷에서 사용할 수 있는 모든 정보를 포함하지 않습니다.부분적으로 캐시된 웹사이트의 불일치를 극복하기 위해, Archive-It.org 은 기관과 콘텐츠 제작자들이 자발적으로 디지털 콘텐츠를 수집하고 보존하며 디지털 아카이브를 만들 수 있는 수단으로 2005년에 인터넷 아카이브에 의해 개발되었습니다.

크롤은 다양한 소스에서 제공되며, 일부는 타사에서 가져온 것이고 다른 것은 아카이브에서 내부적으로 생성된 것입니다.[15]예를 들어 크롤은 슬론 재단알렉사에 의해 기부되며, 크롤은 NARA를 대신하여 인터넷 아카이브에서 운영되며, 인터넷 메모리 재단커먼 크롤의 거울입니다.[15]"월드와이드 웹 크롤(Worldwide Web Crawls)"은 2010년부터 운영되고 있으며 전세계 웹을 사로잡고 있습니다.[15][23]

문서 및 리소스는 다음과 같은 타임스탬프 URL과 함께 저장됩니다.20230930204055. 나가는 하이퍼링크뿐만 아니라 이미지, 스타일시트, 스크립트 등 페이지의 개별 리소스는 현재 보는 페이지의 타임스탬프와 연결되므로 시간에 가장 가까운 개별 캡처로 자동으로 리디렉션됩니다.[24]

스냅샷 캡처 빈도는 웹 사이트마다 다릅니다.[15]"Worldwide Web Crawls"의 웹 사이트는 "크롤 목록"에 포함되며, 크롤당 한 번씩 사이트가 보관됩니다.[15]크롤링은 크기에 따라 몇 달 또는 몇 년이 걸릴 수 있습니다.[15]예를 들어, "와이드 크롤 넘버 13"은 2015년 1월 9일에 시작하여 2016년 7월 11일에 완성되었습니다.[25]그러나 한 번에 여러 개의 크롤이 진행 중일 수 있고, 한 사이트가 두 개 이상의 크롤 목록에 포함될 수 있으므로 사이트가 크롤되는 빈도는 매우 다양합니다.[15]

2019년 10월부터 사용자는 분당 15개의 아카이브 요청 및 검색으로 제한됩니다.[26][why?]

스토리지 용량 및 성장성

수년간 기술이 발전함에 따라 Wayback Machine의 스토리지 용량이 증가했습니다.2003년, 대중이 겨우 2년간 접속한 후 웨이백 머신은 매월 12테라바이트의 속도로 성장하고 있었습니다.이 데이터는 Internet Archive 직원이 맞춤 설계한 PetaBox 랙 시스템에 저장됩니다.첫번째 100개TB 랙은 2004년 6월에 완전히 가동되기 시작했지만, 곧 그 이상의 스토리지가 필요할 것임이 분명해졌습니다.[27][28]

Internet Archive는 2009년 맞춤형 스토리지 아키텍처를 Sun Open Storage로 마이그레이션했으며, Sun Microsystems의 캘리포니아 캠퍼스에 있는 Sun Modular Data Center에 새로운 데이터 센터를 호스팅하고 있습니다.[29]2009년 현재 Wayback Machine은 약 3 페타바이트의 데이터를 포함하고 있으며 매월 100 테라바이트의 속도로 증가하고 있습니다.[30]

2011년에 업데이트된 인터페이스와 보관된 컨텐츠의 새로운 인덱스가 포함된 웨이백 머신의 새로운 개선된 버전이 공개 테스트에 사용될 수 있게 되었습니다. 캡처는 너비가 매일 크롤 수를 시각화하는 원이 있는 달력 레이아웃에 나타나지만 별표나 고급 검색 페이지에는 중복 표시가 없습니다.[31][32]캡처 사이를 쉽게 탐색할 수 있도록 상단 도구 모음이 추가되었습니다.막대 차트는 연도별로 월별 캡처 빈도를 시각화합니다.[33]"Changes", "Summary" 및 그래픽 사이트 맵과 같은 기능이 이어서 추가되었습니다.

그해 3월 웨이백 머신 포럼에서 "새로운 웨이백 머신의 베타는 2010년까지 모든 크롤링된 재료의 보다 완벽하고 최신 인덱스를 가지고 있으며, 앞으로도 정기적으로 업데이트될 것입니다."클래식 웨이백 머신을 주도하는 지수는 2008년 이후로 약간의 자료만을 가지고 있으며, 올해 단계적으로 폐지될 예정이므로 추가적인 지수 업데이트는 계획되어 있지 않습니다."[34]또한 2011년에 Internet Archive는 Wayback Machine의 스토리지 용량을 700테라바이트까지 증가시킨 여섯 번째 PetaBox 랙을 설치했습니다.[35]

2013년 1월, 이 회사는 2400억 개의 URL이라는 획기적인 이정표를 발표했습니다.[36]

2013년 10월에는 인터넷 사용자라면 누구나 URL 내용을 보관할 수 있는 '페이지 저장' 기능을[37][38] 선보였고, 기존 라이브 웹 기능과는 달리 영구적인 링크를 빠르게 생성할 수 있었습니다.

2014년 12월, Wayback Machine에는 거의 9페타바이트에 달하는 4,350억 개의 웹 페이지가 포함되어 있으며, 주당 약 20테라바이트의 데이터가 증가하고 있습니다.[14][39][40]

2016년 7월 웨이백 머신에는 약 15페타바이트의 데이터가 포함되어 있다고 합니다.[41]

2018년 9월, 웨이백 머신에는 25 페타바이트 이상의 데이터가 저장되었습니다.[42][43]

2020년 12월 현재 웨이백 머신에는 70 페타바이트 이상의 데이터가 저장되어 있습니다.[44]

웨이백 머신[45][46] 성장
연도별 웨이백 머신 보관된 페이지
2004
30,000,000,000 (0-100B : 연청)
2005
40,000,000,000
2008
85,000,000,000
2012
150,000,000,000 (100B-450B : 옐로우
2013
373,000,000,000
2014
400,000,000,000
2015
452,000,000 (450B-600B : 오렌지)
2016
459,000,000,000
2017
279,000,000,000
2018
310,000,000,000
2019
345,000,000,000
2020
405,000,000,000
2021
514,000,000,000
2022
640,000,000 (600B- : 레드)

웨이백 머신 API

Wayback Machine 서비스는 SavePageNow, Availability, CDX 세 가지 공용 API를 제공하며 SavePageNow는 웹 페이지를 보관하는 데 사용할 수 있습니다.[47]웹 페이지에 대한 아카이브 가용성 상태 [48]확인, 웹 페이지에 대한 아카이브 존재 여부 확인을 위한 가용성 API.CDX API는 캡처된 데이터의 복잡한 쿼리, 필터링 및 분석을 위한 것입니다.[49][50]

웹 사이트 제외 정책

역사적으로 웨이백 머신은 로봇 배제 기준(로봇)을 존중해 왔습니다.txt) 웹 사이트가 크롤링되는지 여부 또는 이미 크롤링된 경우 아카이브를 공개적으로 볼 수 있는지 여부를 판단할 때.웹사이트 소유자들은 로봇을 이용해 웨이백 머신을 탈퇴할 수 있는 선택권을 가지고 있었습니다.txt. 로봇을 적용했습니다.txt 규칙을 소급하여 실행합니다. 사이트가 Internet Archive(인터넷 보관)를 차단한 경우 도메인에서 이전에 보관된 페이지를 즉시 사용할 수 없게 됩니다.또한, 인터넷 아카이브는 "때로는 웹사이트 소유자가 직접 우리에게 연락하여 사이트를 크롤링하거나 보관하는 것을 그만두라고 요청할 때도 있습니다.우리는 이러한 요청에 응합니다."[51]또한, 웹사이트는 "인터넷 아카이브는 그들의 자료들이 소장되어 있는 것을 원하지 않는 사람들의 웹사이트나 다른 인터넷 문서들에 대한 접근을 보존하거나 제공하는 데 관심이 없습니다."[52][53]라고 말합니다.

2017년 4월 17일, 로봇을 사용하던 주차 도메인이 사라지고 주차된 사이트에 대한 보도가 나왔습니다.txt 검색 엔진에서 자신을 제외하고 결과적으로 Wayback Machine에서 의도치 않게 제외됩니다.[54]Internet Archive(인터넷 보관)가 정책을 변경하여 Wayback Machine(웨이백 머신)에서 제거하기 위해 명시적 제외 요청을 요구했습니다.[24]

오클랜드 아카이브 정책

Wayback의 소급 제외 정책은 2002년에 University of California, Berkeley의 School of Information Management and Systems에서 발표한 Recommendation for Removal Requests and Preserving Archive Integrity(제거 요청 관리 및 보관 무결성 보존을 위한 권장 사항)에 일부 기반을 두고 있습니다. 이는 웹 사이트 소유자에게 사이트의 아카이브에 대한 액세스를 차단할 수 있는 권한을 부여합니다.[55]Wayback은 값비싼 소송을 피할 수 있도록 이 정책을 준수했습니다.[56]

웨이백 소급 배제 정책은 2017년에 완화되기 시작했는데, 그 때 그것은 기어 다니고 웹 페이지를 보여주는 것 모두에 대해 미국 정부와 군대 웹 사이트에서 로봇을 예우하는 것을 중단했습니다.2017년 4월 현재 웨이백은 로봇을 무시하고 있습니다.txt는 미국 정부 웹사이트만을 위한 것이 아니라 더 광범위하게 사용됩니다.[57][58][59][60]

사용하다

웨이백 머신은 2001년 공개적으로 출시된 이후, 데이터를 저장하고 수집하는 방법과 아카이브에 포함된 실제 페이지에 대해 학자들에 의해 연구되어 왔습니다.2013년 기준으로 학자들은 웨이백 머신에 대해 350여 편의 글을 썼는데, 대부분이 정보 기술, 도서관 과학, 사회 과학 분야였습니다.사회과학 학자들은 1990년대 중반부터 현재까지 웹사이트의 발전이 회사의 성장에 어떤 영향을 미쳤는지 분석하기 위해 웨이백 머신을 사용했습니다.[14]

Wayback Machine이 페이지를 보관할 때, 대부분의 하이퍼링크가 포함되어 있기 때문에 인터넷의 불안정성으로 인해 링크가 쉽게 끊어질 수도 있었습니다.인도의 연구원들은 웨이백 머신이 온라인 학술 간행물에 하이퍼링크를 저장하는 기능의 효과를 연구한 결과 절반 이상을 절약한 것으로 나타났습니다.[61]

"기자들은 죽은 웹사이트, 날짜가 지정된 뉴스 보도, 웹사이트 내용 변경 등을 보기 위해 웨이백 머신을 사용합니다.그 내용은 정치인들에게 책임을 묻고 전쟁터의 거짓말을 폭로하는 데 사용되었습니다."[62]2014년, 우크라이나의 분리주의 반군 지도자 이고르 기르킨의 소셜 미디어 페이지에는 그가 실제로 그 비행기가 민간 말레이시아 항공 제트기라는 것이 알려지기 전에 그의 군대가 우크라이나 군용기로 의심되는 비행기를 격추했다고 자랑하는 것이 보여졌습니다(말레이시아 항공 17편).그 후 그는 게시물을 삭제하고 비행기를 격추시킨 우크라이나 군을 비난했습니다.[62][63]2017년, 과학을 위한 행진은 누군가가 Archive.org 을 방문했고 백악관 웹사이트에서 기후 변화에 대한 모든 언급이 삭제되었다는 것을 발견한 레딧에 대한 토론에서 비롯되었습니다.이에 대해 한 사용자는 "워싱턴에서 과학자들의 행진이 있어야 한다"고 말했습니다.[64][65][66]

또한 이 사이트는 위키피디아 편집자들이 참고 자료에 접근하고 콘텐츠를 만들 수 있도록 함으로써 검증에 많이 사용됩니다.[67]

2020년 9월 클라우드플레어와 파트너십을 체결하여 "Always Online" 서비스를 통해 제공되는 웹 사이트를 자동으로 보관할 수 있으며, 이를 통해 원래 호스트에 연결할 수 없는 경우 사용자에게 사이트 사본을 안내할 수 있습니다.[68]

한계

2014년에는 웹사이트가 크롤링될 때부터 웨이백 머신에서 볼 수 있게 될 때까지 6개월의 지연 시간이 있었습니다.[69]현재 지연 시간은 3시간에서 10시간 정도입니다.[24]Wayback Machine은 제한된 검색 기능만 제공합니다."사이트 검색" 기능을 통해 사용자는 웹 페이지 자체에서 발견되는 단어가 아니라 사이트를 설명하는 단어를 기반으로 사이트를 찾을 수 있습니다.[70]

Wayback Machine은 웹 크롤러의 한계로 인해 지금까지 만들어진 모든 웹 페이지를 포함하지 않습니다.Wayback Machine은 호스트 웹 사이트와의 상호 작용이 필요하기 때문에 자바스크립트로 작성된 플래시 플랫폼 및 양식과 같은 상호 작용 기능을 포함하는 웹 페이지를 완전히 아카이브할 수 없습니다.이는 2013년 7월 9일경부터 Wayback Machine이 비디오의 시청 페이지를 저장할 때 YouTube 댓글을 표시할 수 없음을 의미합니다. Archive Team에 따르면, 댓글은 더 이상 "페이지 자체에 로드"되지 않습니다.[71]Wayback Machine의 웹 크롤러는 HTML이나 그 변형 중 하나로 코딩되지 않은 것을 추출하기가 어려워 하이퍼링크가 깨지고 이미지가 누락되는 경우가 많습니다.이로 인해 웹 크롤러는 다른 페이지와 연결되지 않은 "고아 페이지"를 보관할 수 없습니다.[70][72]Wayback Machine의 크롤러는 미리 설정된 깊이 제한에 따라 정해진 수의 하이퍼링크만을 따르므로 모든 페이지의 모든 하이퍼링크를 보관할 수 없습니다.[23]

법적 증거로

민사소송

Netbula LLC 대 Cordiant Software Inc.

2009년 Netbula, LLC 대 Chordiant Software Inc. 사건에서 피고 Chordiant는 Netbula에게 로봇을 사용할 수 없도록 강제하는 동의를 제출했습니다.웹사이트의 txt 파일은 웨이백 머신이 넷불라의 사이트에서 보관했던 이전 버전의 페이지에 대한 액세스를 소급적으로 제거하도록 만들었습니다.[73]

넷불라는 피고인들이 넷불라의 웹사이트를 바꾸라고 요구하고 있고, 그들이 직접 그 페이지들을 위해 인터넷 아카이브를 소환했어야 한다는 이유로 동의안에 반대했습니다.[74]그러나 인터넷 아카이브의 한 직원은 Chordiant의 제안을 지지하는 성명서를 제출했고, "상당한 부담, 비용, 운영 중단 없이" 다른 어떤 방법으로도 웹 페이지를 제작할 수 없다고 말했습니다.[73]

캘리포니아 북부지방법원 새너제이부의 하워드 로이드 치안판사는 넷불라의 주장을 기각하고 로봇을 사용할 수 없도록 명령했습니다.Chordiant가 자신들이 찾았던 보관된 페이지를 검색할 수 있도록 txt 일시적으로 차단합니다.[73]

Telewizja Polska USA, Inc. v. Echostar 위성

2004년 10월의 판례에서, Telewizja Polska USA, Inc. v. Echostar Satellite, No. 02 C 3293, 65 Fed.R. 증거.673번 서번트 (N.D. Ill)2004년 10월 15일), 소송 당사자는 웨이백 머신 기록 보관소를 증거 자료로 사용하려고 시도했습니다.Telewizja Polska는 TVP Polonia의 제공업체이며 EchoStarDish Network를 운영하고 있습니다.시험 절차에 앞서 EchoStar는 Telewizja Polska 웹사이트의 과거 콘텐츠에 대한 증거로 Wayback Machine 스냅샷을 제공할 의도라고 밝혔습니다.텔레위자 폴스카는 소문과 출처가 확인되지 않았다는 이유로 스냅샷을 억제하자는 동의안을 제출했지만, 치안판사 알랜더 키스는 텔레위자 폴스카의 소문 주장을 기각하고 재판에서 증거를 배제하라는 TVP의 동의안을 기각했습니다.[75][76]그러나 재판에서 재판 판사인 로널드 구즈만 지방법원 판사는 키스 치안판사의 판결을 기각하고 인터넷 아카이브 직원의 진술서나 기본 페이지(즉, Telewizja Polska 웹사이트) 모두 증거로 인정되지 않는다고 판결했습니다.구즈만 판사는 직원의 진술서에 소문과 결론에 이르지 못한 지지 성명이 모두 포함되어 있으며, 웹 페이지로 알려진 출력물은 자기 인증이 아니라고 추론했습니다.[77][78]

특허법

미국 특허청유럽 특허청은 인터넷 보관소의 날짜 스탬프를 특정 웹 페이지가 언제 대중에게 접근할 수 있었는지에 대한 증거로 받아들입니다.이 날짜들은 예를 들어 특허 출원을 심사할 때 종래 기술로서 웹 페이지가 이용 가능한지 여부를 결정하는 데 사용됩니다.[79]

효용의 한계

웹사이트를 보관하는 것은 기술적인 한계가 있고, 그 결과 소송에서 상대방이 웹사이트 보관소에서 제공한 결과를 오용할 수 있습니다.이 문제는 기본 링크가 노출되지 않아 오류가 발생할 수 있는 경우 불만 사항, 답변 또는 전문가 증인 보고서에 웹 페이지의 스크린샷을 제출하는 관행으로 인해 더욱 악화될 수 있습니다.예를 들어 Wayback Machine과 같은 아카이브는 양식을 작성하지 않으므로 RESTful이 아닌 전자 상거래 데이터베이스의 내용을 아카이브에 포함하지 않습니다.[80]

법적지위

유럽에서 웨이백 머신은 저작권법을 위반하는 것으로 해석될 수 있습니다.내용 작성자만이 자신의 내용이 게시되거나 복제되는 위치를 결정할 수 있으므로, 보관은 작성자의 요청에 따라 자신의 시스템에서 페이지를 삭제해야 합니다.[81]Wayback Machine에 대한 제외 정책은 사이트의 FAQ 섹션에서 확인할 수 있습니다.[82]

일부 사례는 Wayback Machine 아카이빙을 위해 특별히 Internet Archive를 상대로 제기되었습니다.

보관된 컨텐츠의 법적 문제

사이언톨로지

2002년 말, 인터넷 아카이브는 사이언톨로지에 비판적인 다양한 사이트를 웨이백 머신에서 제거했습니다.[83]"사이트 소유자의 요청"에 대한 응답이라는 오류 메시지가 나타납니다.[84]이후 사이언톨로지 교회 소속 변호사들이 철거를 요구해왔고, 현장 소유주들이 자신들의 자료가 철거되는 것을 원하지 않는다는 사실이 밝혀졌습니다.[85]

의료 옹호자 주식회사

2003년 하딩 얼리 폴머 & 프레이리는 아카이브의 웨이백 머신을 사용하여 상표 분쟁으로부터 고객을 보호했습니다.변호사들은 수년 전부터 홈페이지 내용을 토대로 원고가 주장한 내용이 무효임을 입증할 수 있었습니다.그리고 나서 원고인 헬스케어 옹호자들은 저작권 침해뿐만 아니라 DMCA컴퓨터 사기남용법 위반을 고발하는 인터넷 아카이브를 포함하도록 그들의 고소장을 수정했습니다.의료 옹호론자들은 로봇을 설치했기 때문에 그렇게 주장했습니다.txt 파일은 그들의 웹사이트에서 최초의 소송이 제기된 후에도, 아카이브는 웨이백 머신에서 원고 웹사이트의 모든 이전 복사본을 제거했어야 했지만, 일부 자료는 웨이백에서 계속 공개되었습니다.[86]소송은 웨이백이 문제를 해결한 후에 법정 밖에서 해결되었습니다.[87]

수잔 셸

활동가인 수잔 셸(Suzanne Shell)은 인터넷 아카이브(Internet Archive)가 1999년에서 2004년 사이에 자신의 웹사이트 profane-justice.org 를 아카이브하는 데 미화 10만 달러를 지불할 것을 요구하며 2005년 12월 소송을 제기했습니다.인터넷 아카이브는 2006년 1월 20일 미국 캘리포니아 북부 지방 법원선언적 판결 소송을 제기하여 인터넷 아카이브가 셸의 저작권을 침해하지 않았다는 사법적 판단을 구했습니다.셸은 이에 응했고, 자신의 사이트를 보관한 것에 대해 인터넷 아카이브에 대한 맞소송을 제기했는데, 이는 자신의 서비스 조건을 위반한 것이라고 주장하고 있습니다.[90]2007년 2월 13일, 미국 콜로라도 지방법원 판사계약 위반을 제외한 모든 반소를 기각했습니다.[89]인터넷 아카이브는 셸이 주장한 복제 활동에서 발생한 저작권 침해 주장을 기각하지 않았습니다. 이는 앞으로도 계속될 것입니다.[91]

2007년 4월 25일, 인터넷 아카이브와 수잔 셸은 공동으로 그들의 소송의 해결을 발표했습니다.[88]인터넷 아카이브는 "... 웹 콘텐츠를 보관하지 않으려는 사람들의 웨이백 머신에 자료를 포함시키는 데 관심이 없습니다.저희는 셸 씨가 자신의 웹사이트에 유효하고 강제할 수 있는 저작권을 가지고 있다는 것을 알고 있으며, 웨이백 머신에 셸 씨의 웹사이트를 포함시킨 것이 이 소송으로 이어진 것에 대해 유감스럽게 생각합니다."Shell은 "Internet Archive의 목표의 역사적 가치를 존중합니다.그 목표를 방해하거나 해를 끼칠 생각은 전혀 없었습니다."[92]

다니엘 다비디우크

2013년과 2016년 사이에 Daniel Davydiuk이라는 포르노 배우가 웨이백 머신의 아카이브에서 자신의 아카이브된 이미지를 제거하려고 시도했습니다. 먼저 여러 개의 DMCA 요청을 아카이브에 보낸 다음 캐나다 연방 법원에 항소했습니다.[93][94][95]그 사진들은 마침내 2017년에 웹사이트에서 삭제되었습니다.

플렉시스파이

2018년 스토커웨어 애플리케이션 FlexiSpy의 웹사이트 아카이브가 웨이백 머신에서 삭제되었습니다.이 회사는 웹사이트의 아카이브를 제거하기 위해 인터넷 아카이브와 접촉했다고 주장했습니다.[96]

검열 및 기타 위협

Archive.org 은 현재 중국에서 차단되어 있습니다.이슬람 국가 테러 조직이 금지된 후, 인터넷 아카이브는 2015-16년 짧은 기간 동안 러시아에서 해당 조직의 확장 비디오 호스트로 차단되었습니다.[62][99][100][needs update]지역 상업 로비스트들이 저작권을 이유로 인터넷 아카이브를 금지하기 위해 지역 법원에 소송을 제기하고 있지만, 2016년부터 웹사이트가 다시 운영되고 있습니다.[101]

2015년 3월, 보안 연구원들이 아카이브된 사이트에서 의도치 않게 악의적인 바이너리를 호스팅함으로써 발생하는 위협에 대해 알게 되었다고 발표했습니다.[102][103]

도서관 자유 프로젝트의 책임자인 앨리슨 마크리나는 "도서관 사서들이 개인의 사생활을 깊이 존중하지만, 우리는 또한 검열을 강력히 반대한다"고 지적합니다.[62]

원래 웹 사이트에서 문서가 제거된 직후 아카이브에서 삭제된 경우가 적어도 한 가지 있습니다. 데일리 비스트 기자는 2016년 데이트 앱에서 게이를 가장한 가짜 프로필을 만든 후 몇몇 게이 올림픽 선수들을 능가하는 기사를 썼습니다.일간지 비스트는 기사가 광범위한 분노에 부딪히자 기사를 삭제했습니다. 얼마 지나지 않아 인터넷 아카이브도 곧 삭제했지만, 그들이 퇴장당한 선수들의 안전을 보호하기 위해서라는 이유로 기사를 삭제했다고 강조했습니다.[62]

기타 위협 요소로는 자연 재해,[104] 파괴(원격 또는 물리적),[105] 아카이브의 콘텐츠 조작(사이버 공격, 백업 참조), 문제가 있는 저작권법[106] 및 사이트 사용자의 감시 등이 있습니다.[107]

Long Now Foundation의 전무이사인 Alexander Rose는 "우리의 기술 문명에 연속성이 있다면, 저는 많은 맨 데이터가 찾을 수 있고 검색할 수 있는 상태로 남아있을 것이라고 의심합니다."라고 말하면서, 여러 세대의 장기적으로 "아무것도 아닌 것에 가깝다."고 의심하고 있습니다.그러나 "드루팔, 루비, 장고와 같은 콘텐츠 관리 시스템의 백엔드가 깊은" 사이트는 아카이브하기가 어렵기 때문에 제공되는 형식은 거의 인식할 수 없을 것 같습니다.[108]

디 아틀란틱은 인간 지식의 보존을 반영하는 기사에서 장기적으로 구축될 자신을 설명하는 인터넷 아카이브가 "말할 장기적인 인프라 없이 데이터가 사라지기 전에 데이터를 포착하기 위해 맹렬히 노력하고 있다"[109]고 언급했습니다.[110]

참고 항목

참고문헌

  1. ^ Kahle, Brewster (November 23, 2005). "Universal Access to all Knowledge". Internet Archive. Archived from the original on August 14, 2022. Retrieved June 5, 2022.
  2. ^ "Internet Archive: Wayback Machine". web.archive.org. Archived from the original on March 13, 2023. 보관된 페이지의 현재 수는 보관의 홈 페이지에서 볼 수 있습니다.
  3. ^ PepsiCo, Inc. (May 10, 1996). "PepsiCo Home Page". Internet Archive/Wayback Machine. Archived from the original on May 10, 1996. Retrieved October 8, 2022.
  4. ^ "Wayback Machine General Information". archive.org. Archived from the original on December 5, 2019. Retrieved March 2, 2021.
  5. ^ "WayBackMachine.org WHOIS, DNS, & Domain Info – DomainTools". WHOIS. Archived from the original on May 14, 2020. Retrieved March 13, 2016.
  6. ^ "InternetArchive.org WHOIS, DNS, & Domain Info – DomainTools". WHOIS. Archived from the original on May 12, 2020. Retrieved March 13, 2016.
  7. ^ Notess, Greg R. (March–April 2002). "The Wayback Machine: The Web's Archive". Online. 26: 59–61. INIST:13517724.
  8. ^ "The Wayback Machine", Frequently Asked Questions, archived from the original on September 18, 2018, retrieved September 18, 2018
  9. ^ a b "20,000 Hard Drives on a Mission Internet Archive Blogs". blog.archive.org. October 25, 2016. Archived from the original on October 20, 2018. Retrieved October 15, 2018.
  10. ^ Green, Heather (February 28, 2002). "A Library as Big as the World". BusinessWeek. Archived from the original on December 20, 2011.
  11. ^ Tong, Judy (September 8, 2002). "Responsible Party – Brewster Kahle; A Library Of the Web, On the Web". The New York Times. Archived from the original on February 20, 2011. Retrieved August 15, 2011.
  12. ^ Cook, John (November 1, 2001). "Web site takes you way back in Internet history". Seattle Post-Intelligencer. Archived from the original on August 12, 2014. Retrieved August 15, 2011.
  13. ^ Mayfield, Kendra (October 28, 2001). "Wayback Goes Way Back on Web". Wired. Archived from the original on October 16, 2017. Retrieved October 16, 2017.
  14. ^ a b c Arora, Sanjay K.; Li, Yin; Youtie, Jan; Shapira, Philip (May 5, 2015). "Using the wayback machine to mine websites in the social sciences: A methodological resource". Journal of the Association for Information Science and Technology. 67 (8): 1904–1915. doi:10.1002/asi.23503. ISSN 2330-1635.
  15. ^ a b c d e f g h Leetaru, Kalev (January 28, 2016). "The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web". Forbes. Archived from the original on October 16, 2017. Retrieved October 16, 2017.
  16. ^ "Internet Archive: Wayback Machine". archive.org. Archived from the original on January 3, 2014. Retrieved October 15, 2018.
  17. ^ Graham, Mark (October 30, 2020). "Fact Checks and Context for Wayback Machine Pages". Internet Archive Blogs. Retrieved January 17, 2021.
  18. ^ tpc.googlesyndication.com , s0.2mdn.net 또는 atdmt.com 또는 adbrite.com 과 같은 도메인을 '지금 페이지 저장'하려고 하면 "이 URL은 블록 목록에 있으므로 캡처할 수 없습니다."가 됩니다.
  19. ^ "Internet Archive 25th Anniversary – Universal Access to All Knowledge". Retrieved January 13, 2022.
  20. ^ "Wayforward Machine • Visit the future of the internet". Way Forward Machine. Retrieved January 13, 2022.
  21. ^ Kahle, Brewster. "Archiving the Internet". Scientific American – March 1997 Issue. Archived from the original on April 3, 2012. Retrieved August 19, 2011.
  22. ^ Kaplan, Jeff (October 27, 2014). "Archive-It: Crawling the Web Together". Internet Archive Blogs. Archived from the original on October 12, 2017. Retrieved October 16, 2017.
  23. ^ a b "Worldwide Web Crawls". Internet Archive. Archived from the original on October 19, 2017. Retrieved October 16, 2017.
  24. ^ a b c "Using The Wayback Machine". Internet Archive. Retrieved April 3, 2022.
  25. ^ "Wide Crawl Number 13". Internet Archive. Archived from the original on October 19, 2017. Retrieved October 16, 2017.
  26. ^ "Too Many Requests". Internet Archive. November 10, 2019. Retrieved November 27, 2021.
  27. ^ "Internet Archive: Petabox". archive.org. Retrieved October 25, 2018.
  28. ^ Kanellos, Michael (July 29, 2005). "Big storage on the cheap". CNET News.com. Archived from the original on April 3, 2007. Retrieved July 29, 2007.
  29. ^ "Internet Archive and Sun Microsystems Create Living History of the Internet". Sun Microsystems. March 25, 2009. Archived from the original on March 26, 2009. Retrieved March 27, 2009.
  30. ^ Mearian, Lucas (March 19, 2009). "Internet Archive to unveil massive Wayback Machine data center". Computerworld.com. Archived from the original on March 23, 2009. Retrieved March 22, 2009.
  31. ^ "Updated Wayback Machine in Beta Testing". Archived from the original on August 23, 2011. Retrieved August 19, 2011.
  32. ^ "Advanced Search". Wayback Machine. Archived from the original on January 31, 2010. Retrieved April 3, 2022.
  33. ^ "What's the difference between the classic Wayback Machine and the new Beta version?". Archived from the original on December 25, 2010. Retrieved November 17, 2021.
  34. ^ "Beta Wayback Machine, in forum". Archived from the original on April 17, 2014. Retrieved April 16, 2014.
  35. ^ "Internet Archive Forums: 6th pair of racks go into service: over 2PB of data space used". archive.org. Archived from the original on October 24, 2016. Retrieved October 25, 2018.
  36. ^ "Wayback Machine: Now with 240,000,000,000 URLs Internet Archive Blogs". January 9, 2013. Archived from the original on April 14, 2014. Retrieved April 16, 2014.
  37. ^ Rossi, Alexis (October 25, 2013). "Fixing Broken Links on the Internet". archive.org. San Francisco, CA, US: Collections Team, the Internet Archive. Archived from the original on November 7, 2014. Retrieved March 25, 2015. We have added the ability to archive a page instantly and get back a permanent URL for that page in the Wayback Machine. This service allows anyone – wikipedia editors, scholars, legal professionals, students, or home cooks like me – to create a stable URL to cite, share or bookmark any information they want to still have access to in the future.
  38. ^ Baron, Alexander (October 23, 2013). "The new Internet Archive Wayback Machine now online". Digital Journal. Archived from the original on November 19, 2020. Retrieved November 19, 2020.
  39. ^ "Internet Archive Frequently Asked Questions". Archived from the original on October 21, 2009. Retrieved January 17, 2015.
  40. ^ "Internet Archive Frequently Asked Questions". December 18, 2014. Archived from the original on December 18, 2014. Retrieved December 13, 2018.
  41. ^ "Can the manipulation of big data change the way the world thinks?". The National. Archived from the original on January 12, 2017. Retrieved May 14, 2017.
  42. ^ Crockett, Zachary (September 28, 2018). "Inside Wayback Machine, the internet's time capsule". The Hustle. Archived from the original on October 2, 2018. Retrieved October 26, 2018.
  43. ^ Heffernan, Virginia (September 18, 2018). "Things Break and Decay on the Internet—That's a Good Thing". WIRED. Archived from the original on September 25, 2018. Retrieved October 26, 2018.
  44. ^ "Donate to the Internet Archive: Digital Library of Free & Borrowable Books, Movies, Music & Wayback Machine". adafruit. Archived from the original on December 2, 2020. Retrieved December 2, 2020.
  45. ^ michelle (May 9, 2014). "Wayback Machine Hits 400,000,000,000!". Internet Archive. Archived from the original on August 26, 2014. Retrieved March 25, 2015.
  46. ^ "Internet Archive". Internet Archive. Archived from the original on December 31, 2020. Retrieved March 8, 2021.
  47. ^ "Wayback Machine APIs Internet Archive". archive.org.
  48. ^ GitHub에서 waybackpy
  49. ^ "Developers". August 22, 2014.
  50. ^ "Documentation for Public APIs at the Internet Archive". December 13, 2018.
  51. ^ "Some sites are not available because of Robots.txt or other exclusions". Archived from the original on April 15, 2011.
  52. ^ "Internet Archive Frequently Asked Questions". Archived from the original on April 17, 2014.
  53. ^ Cox, Joseph (May 22, 2018). "The Wayback Machine Is Deleting Evidence of Malware Sold to Stalkers". Archived from the original on May 23, 2018. Retrieved May 23, 2018.
  54. ^ "Robots.txt meant for search engines don't work well for web archives". Internet Archive. April 17, 2017. Retrieved June 29, 2019.
  55. ^ "Recommendations for Managing Removal Requests And Preserving Archival Integrity". University of California. December 14, 2002. Archived from the original on September 18, 2017. Retrieved September 14, 2017.
  56. ^ "Retroactive robots.txt removal of past crawls AKA Oakland Archive Policy". Internet Archive. July 7, 2014. Archived from the original on October 10, 2017. Retrieved September 14, 2017.
  57. ^ Graham, Mark (April 17, 2017). "Robots.txt meant for search engines don't work well for web archives". Internet Archive Blogs. Archived from the original on April 17, 2017. Retrieved April 16, 2017.
  58. ^ "Archivierung des Internets: Internet Archive ignoriert künftig robots.txt" (in German). heise online. April 25, 2017. Archived from the original on April 27, 2017. Retrieved May 14, 2017.
  59. ^ "Suchmaschinen: Internet Archive will künftig Robots.txt-Einträge ignorieren – Golem.de" (in German). Archived from the original on June 19, 2017. Retrieved May 14, 2017.
  60. ^ "Internet Archive will ignore robots.txt files to keep historical record accurate". Digital Trends. April 24, 2017. Archived from the original on May 16, 2017. Retrieved May 14, 2017.
  61. ^ Sampath Kumar, B.T.; Prithviraj, K.R. (October 21, 2014). "Bringing life to dead: Role of Wayback Machine in retrieving vanished URLs". Journal of Information Science. 41 (1): 71–81. doi:10.1177/0165551514552752. ISSN 0165-5515. S2CID 28320982.
  62. ^ a b c d e "Wayback Machine Won't Censor Archive for Taste, Director Says After Olympics Article Scrubbed". Archived from the original on January 6, 2017. Retrieved May 14, 2017.
  63. ^ Lepore, Jill (January 26, 2015). "What the Web Said Yesterday". The New Yorker. Archived from the original on January 25, 2015. Retrieved May 14, 2017.
  64. ^ "The March for Science began with this person's 'throwaway line' on Reddit". Washington Post. Archived from the original on April 23, 2017. Retrieved April 23, 2017.
  65. ^ "Are scientists going to march on Washington?". The Washington Post. Archived from the original on January 31, 2017. Retrieved January 31, 2017.
  66. ^ Foley, Katherine Ellen. "The global March for Science started with a single Reddit thread". Quartz. Archived from the original on April 24, 2017. Retrieved April 23, 2017.
  67. ^ Graham, Mark (October 1, 2018). "More than 9 million broken links on Wikipedia are now rescued".
  68. ^ Graham, Mark (September 17, 2020). "Cloudflare and the Wayback Machine, joining forces for a more reliable Web". Internet Archive Blogs. Retrieved September 17, 2020.
  69. ^ "Internet Archive Frequently Asked Questions". Internet Archive. April 2, 2014. Archived from the original on April 2, 2014. Retrieved November 23, 2018.
  70. ^ a b Bates, Mary Ellen (2002). "The Wayback Machine". Online. 26: 80.
  71. ^ "YouTube - Archiveteam". archiveteam.org. Archived from the original on August 5, 2020. Retrieved August 6, 2020.
  72. ^ "Internet Archive Frequently Asked Questions". archive.org. Archived from the original on April 20, 2013. Retrieved October 18, 2018.
  73. ^ a b c Lloyd, Howard (October 2009). "Order to Disable Robots.txt" (PDF). Archived from the original (PDF) on August 8, 2019. Retrieved October 15, 2009.
  74. ^ Cortes, Antonio (October 2009). "Motion Opposing Removal of Robots.txt". Archived from the original on October 27, 2010. Retrieved October 15, 2009.
  75. ^ Gelman, Lauren (November 17, 2004). "Internet Archive's Web Page Snapshots Held Admissible as Evidence". Packets. 2 (3). Archived from the original on April 30, 2011. Retrieved January 4, 2007.
  76. ^ Howell, Beryl A. (February 2006). "Proving Web History: How to use the Internet Archive" (PDF). Journal of Internet Law: 3–9. Archived from the original (PDF) on July 5, 2010. Retrieved August 6, 2008.
  77. ^ "Looking For Evidence in Virtual Places Admissibility of Internet Evidence". Archived from the original on July 1, 2019. Retrieved June 14, 2020.
  78. ^ Levitt, Carole A.; Rosch, Mark E. (2010). Find Info Like a Pro: Mining the Internet's Publicly Available Resources for Investigative Research, Tom 1. American Bar Association. pp. 194–196. ISBN 978-1-60442-890-2. Archived from the original on December 18, 2020. Retrieved June 14, 2020.
  79. ^ Coggins, Wynn W. (Fall 2002). "Prior Art in the Field of Business Method Patents – When is an Electronic Document a Printed Publication for Prior Art Purposes?". USPTO. Archived from the original on September 21, 2012. Retrieved August 15, 2012.
  80. ^ "Debunking the Wayback Machine". Archived from the original on June 29, 2010.
  81. ^ Bahr, Martin (2002). "The Wayback Machine und Google Cache - eine Verletzung deutschen Urheberrechts?". JurPC (in German): 9. doi:10.7328/jurpcb/20021719. Archived from the original on August 23, 2009.
  82. ^ "Internet Archive FAQ". Archived from the original on April 17, 2014. Retrieved April 16, 2014.
  83. ^ Bowman, Lisa M (September 24, 2002). "Net archive silences Scientology critic". CNET News.com. Archived from the original on May 15, 2012. Retrieved January 4, 2007.
  84. ^ Jeff (September 23, 2002). "exclusions from the Wayback Machine" (Blog). Wayback Machine Forum. Internet Archive. Archived from the original on February 11, 2007. Retrieved January 4, 2007. 작성자와 날짜는 포럼 스레드의 시작을 나타냅니다.
  85. ^ Miller, Ernest. "Sherman, Set the Wayback Machine for Scientology". LawMeme. Yale Law School. Archived from the original (Blog) on November 16, 2012. Retrieved January 4, 2007.
  86. ^ Dye, Jessica (2005). "Website Sued for Controversial Trip into Internet Past". EContent. 28. 11: 8–9.
  87. ^ Bangeman, Eric (August 31, 2006). "Internet Archive Settles Suit Over Wayback Machine". Ars Technica. Archived from the original on November 5, 2007. Retrieved November 29, 2007.
  88. ^ a b Internet Archive v. Shell,화씨 Internet Archive v. Shell505.Suppl. 2d 755 justia.com , 1:2006cv01726 (콜로라도 지방법원 2006. 8. 31.) ('2007. 4. 25. 화해 합의 발표').파일 65, 2007-04-30: '...따라서 이 문제는 편견을 가지고 기각되어야 한다고 명령했습니다...'"
  89. ^ a b Babcock, Lewis T., Chief Judge (February 13, 2007). "Internet Archive v. Shell Civil Action No. 06cv01726LTBCBS" (PDF). Archived (PDF) from the original on January 25, 2014. Retrieved March 25, 2015. 1) Internet Archive's motion to dismiss Shell's counterclaim for conversion and civil theft (Second Cause of Action) is GRANTED, 2) Internet Archive's motion to dismiss Shell's counterclaim for breach of contract (Third Cause of Action) is DENIED; 3) Internet Archive's motion to dismiss Shell's counterclaim for Racketeering under RICO and COCCA (Fourth Cause of Action) is GRANTED.{{cite web}}: CS1 유지 : 여러 이름 : 저자 목록 (링크)
  90. ^ Claburn, Thomas (March 16, 2007). "Colorado Woman Sues To Hold Web Crawlers To Contracts". New York, New York, US: InformationWeek, UBM Tech, UBM LLC. Archived from the original on September 4, 2014. Retrieved March 25, 2015. Computers can enter into contracts on behalf of people. The Uniform Electronic Transactions Act (UETA) says that a 'contract may be formed by the interaction of electronic agents of the parties, even if no individual was aware of or reviewed the electronic agents' actions or the resulting terms and agreements.'
  91. ^ Samson, Martin H., Phillips Nizer LLP (2007). "Internet Archive v. Suzanne Shell". internetlibrary.com. Internet Library of Law and Court Decisions. Archived from the original on August 3, 2014. Retrieved March 25, 2015. More importantly, held the court, Internet Archive's mere copying of Shell's site, and display thereof in its database, did not constitute the requisite exercise of dominion and control over defendant's property. Importantly, noted the court, the defendant at all times owned and operated her own site. Said the Court: 'Shell has failed to allege facts showing that Internet Archive exercised dominion or control over her website, since Shell's complaint states explicitly that she continued to own and operate the website while it was archived on the Wayback machine. Shell identifies no authority supporting the notion that copying documents is by itself enough of a deprivation of use to support conversion. Conversely, numerous circuits have determined that it is not.'{{cite web}}: CS1 유지 : 여러 이름 : 저자 목록 (링크)
  92. ^ brewster (April 25, 2007). "Internet Archive and Suzanne Shell Settle Lawsuit". archive.org. Denver, CO, US: Internet Archive. Archived from the original on December 5, 2010. Retrieved March 25, 2015. Both parties sincerely regret any turmoil that the lawsuit may have caused for the other. Neither Internet Archive nor Ms. Shell condones any conduct which may have caused harm to either party arising out of the public attention to this lawsuit. The parties have not engaged in such conduct and request that the public response to the amicable resolution of this litigation be consistent with their wishes that no further harm or turmoil be caused to either party.
  93. ^ Stobbe, Richard (December 5, 2014). "Copyright Implications Of A "Right To Be Forgotten"? Or How To Take-Down The Internet Archive". Mondaq. Archived from the original on November 18, 2018. Retrieved March 8, 2019.
  94. ^ McVeigh, Glennys (October 16, 2014). Philpott, James; Weissman, Adam; Bucholz, Ren; Kettles, Brent; Pearl, Aaron (eds.). "Davydiuk v. Internet Archive Canada, 2014 FC 944". CanLII. Federation of Law Societies of Canada. Archived from the original on December 18, 2020. Retrieved March 8, 2019.
  95. ^ Southcott, Richard F. (November 30, 2016). Philpott, John; Alton, Alex; Bucholz, Ren (eds.). "Davydiuk v. Internet Archive Canada and Internet Archive, 2016 FC 1313 (CanLII)". CanLII. Ottawa, Ontario: Federation of Law Societies of Canada. Archived from the original on June 29, 2019. Retrieved March 8, 2019.
  96. ^ Cox, Joseph (May 22, 2018). "The Wayback Machine Is Deleting Evidence of Malware Sold to Stalkers". Vice. Archived from the original on January 24, 2022. Retrieved January 24, 2022.
  97. ^ Conger, Kate. "Backing up the history of the internet in Canada to save it from Trump". TechCrunch. Archived from the original on December 27, 2016. Retrieved May 14, 2017.
  98. ^ "Where to find what's disappeared online, and a whole lot more: the Internet Archive". Public Radio International. Archived from the original on March 28, 2017. Retrieved May 14, 2017.
  99. ^ Chirgwin, Richard. "There's no Wayback in Russia: Putin blocks Archive.org". The Register. Archived from the original on October 7, 2016. Retrieved May 14, 2017.
  100. ^ "Russia won't go Wayback, blocks the Internet Archive". Digital Trends. June 26, 2015. Archived from the original on April 17, 2016. Retrieved May 14, 2017.
  101. ^ "В России разблокирован крупнейший интернет-архив". Российская газета (in Russian). April 18, 2016. Archived from the original on April 5, 2019. Retrieved October 18, 2020.
  102. ^ The VirusTotal Team (March 25, 2015). "207.241.226.190 IP address information". virustotal.com. Dublin, Ireland: VirusTotal. Archived from the original on July 14, 2014. Retrieved March 25, 2015. 2015-03-25: Latest URLs hosted in this IP address detected by at least one URL scanner or malicious URL dataset. ... 2/62 2015-03-25 16:14:12 [complete URL redacted]/Renegotiating_TLS.pdf ... 1/62 2015-03-25 04:46:34 [complete URL redacted]/CBLightSetup.exe
  103. ^ "Safe Browsing Diagnostic page for archive.org". google.com/safebrowsing. Mountain View, CA, US. March 25, 2015. Archived from the original on April 6, 2015. Retrieved March 25, 2015. 2015-03-25: Part of this site was listed for suspicious activity 138 time(s) over the past 90 days. ... What happened when Google visited this site? ... Of the 42410 pages we tested on the site over the past 90 days, 450 page(s) resulted in malicious software being downloaded and installed without user consent. The last time Google visited this site was on 2015-03-25, and the last time suspicious content was found on this site was on 2015-03-25. ... Malicious software includes 169 trojan(s), 126 virus, 43 backdoor(s).
  104. ^ "Help Us Keep the Archive Free, Accessible, and Reader Private Internet Archive Blogs". November 29, 2016. Archived from the original on May 21, 2017. Retrieved May 14, 2017.
  105. ^ Sakr, Sharif (November 7, 2013). "Wayback Machine web archive survives destructive fire but needs help to recover". Archived from the original on November 9, 2020. Retrieved April 3, 2022.
  106. ^ "Internet Archive: Proposed Changes To DMCA Would Make Us "Censor The Web"". Consumerist. June 7, 2016. Archived from the original on November 11, 2016. Retrieved May 14, 2017.
  107. ^ Herb, Ulrich (December 6, 2016). "Die Trump-Angst grassiert" [The Trump fear is rampant] (in German). heise online. Archived from the original on December 7, 2016. Retrieved May 14, 2017. Die Betreiber des Archives fürchten neben Zensur und Manipulation der digitalen Aufzeichnungen demnach auch die Überwachung der Archive-Nutzer. [The operators of the archive fear not only censorship and manipulation of the digital recordings, but also the surveillance of the archive users].
  108. ^ LaFrance, Adrienne (October 14, 2015). "The Internet's Dark Ages". The Atlantic. Archived from the original on May 7, 2017. Retrieved May 14, 2017.
  109. ^ "The Entire Internet Will Be Archived In Canada to Protect It From Trump". Motherboard. November 29, 2016. Archived from the original on May 16, 2017. Retrieved May 14, 2017.
  110. ^ LaFrance, Adrienne (June 3, 2016). "The Human Fear of Total Knowledge". The Atlantic. Archived from the original on December 2, 2016. Retrieved May 14, 2017.

외부 링크