아카이브.오늘

archive.today
아카이브.오늘
아카이브의 스크린샷.오늘 홈 페이지
부지유형
웹 아카이브
사용 가능한 위치다국어
URL
등록.아니요.
런칭2012년 5월 16일, 11년(2012-05-16)[2]

archive.today(또는 archive.is )는 2012년에 설립된 웹 아카이브 사이트로, 스냅샷을 온 디맨드로 저장하고 구글 과 같은 자바스크립트가 많이 사용되는 사이트와 X.archive와 같은 프로그레시브을 지원합니다.오늘날 은 두 개의 스냅샷을 기록합니다. 하나는 기능적인 라이브 링크를 포함한 원래 웹 페이지를 복제하고, 다른 하나는 페이지의 스크린샷입니다.[4]

웹사이트는 운영자의 신원에 대한 정보를 제공하지 않습니다.[5]

역사

Archive.today는 2012년에 설립되었습니다. 이 사이트는 원래 오늘날 아카이브로 브랜드화되었지만 2015년 5월 기본 미러를 archive.is 로 변경했습니다.

2019년 1월부터 archive.is 도메인을 다른 미러에 유리하게 평가절하하기 시작했습니다.

특징들

기능성

Archive.today는 명시적인 사용자 요청에 따라 개별 페이지를 캡처할 수 있습니다.[8][9][10] 처음부터 지금은 격하된 해시방 조각을 포함하는 URL이 포함된 크롤링 페이지를 지원했습니다.#!).[11]

Archive.today는 XML, RTF, 스프레드시트(xls 또는 ods) 및 기타 정적이 아닌 내용을 제외한 텍스트와 이미지만 기록합니다. 그러나 트위터와 같은 특정 사이트의 비디오는 저장됩니다.[12] 저장된 스냅샷의 기록을 추적하여 이미 저장된 페이지의 새 스냅샷을 추가하기 전에 확인을 요청합니다.[13][14]

페이지는 1,024 픽셀의 브라우저 폭으로 캡처됩니다. CSS인라인 CSS로 변환되어 반응형 디자인 및 다음과 같은 셀렉터를 제거합니다. :hover 그리고. :active . 크롤링 과정에서 자바스크립트를 이용해 생성된 콘텐츠는 냉동 상태로 나타납니다.[15]HTML 클래스 이름은 내부에 보존됩니다. old-class 속성 텍스트를 선택하면 자바스크립트 애플릿은 브라우저의 주소 표시줄에 표시되는 URL 조각을 생성하여 다시 방문할 때 텍스트의 해당 부분을 자동으로 강조 표시합니다.

웹 페이지는 archive.today에서 web.archive.org 로 2단계 백업(archive.today)으로 복제할 수 없습니다.today는 Wayback Machine을 제외하고 WARC 형식으로 스냅샷을 저장하지 않습니다. web.archive.org 에서 archive.today로의 역방향은 가능하지만, 복사는 일반적으로 직접 캡처하는 것보다 더 많은 시간이 소요됩니다. 일부 웹 사이트는 소급하여 Internet Archive 목록에서 삭제되거나 로봇으로 인해 저장되지 않습니다.txt 파일이지만 archive.today는 이 파일을 사용하지 않습니다.[10]

연구 도구 모음을 사용하면 고급 키워드 연산자가 다음과 같이 사용할 수 있습니다. * 와일드카드 문자로 지정합니다. 개의 따옴표는 제목 또는 웹 페이지 본문에 있는 키워드의 정확한 시퀀스에 대한 검색을 지정하는 반면, 사이트 운영자는 특정 인터넷 도메인으로 검색을 제한합니다.[17]

웹 페이지가 보관되면 인터넷 사용자가 직접 삭제할 수 없습니다.[18] 보관된 페이지에서 광고, 팝업을 제거하거나 링크를 확장하는 것은 소유자가 자신의 블로그에서 하도록 요청함으로써 가능합니다.[19]

동적 목록을 저장하는 동안 archive.today 검색 상자에는 목록의 이전 섹션과 다음 섹션을 연결하는 결과(예: 페이지에 대한 링크 20개)만 표시됩니다.[20] 저장된 다른 웹 페이지는 필터링되며, 때때로 해당 페이지 중 하나에서 찾을 수 있습니다.[13][clarification needed]

검색 기능은 Google 사용자 정의 검색에서 지원됩니다. 결과가 없으면 archive.today는 Yandex Search를 활용하려고 합니다.[21]

페이지를 저장하는 동안 개별 페이지 요소 및 내용 크기, HTTP 상태MIME 유형에 대한 URL 목록이 표시됩니다. 이 목록은 크롤링 과정에서만 볼 수 있습니다.

2019년 11월 29일 이후 아카이브된 페이지를 제외하고는 아카이브된 페이지를 ZIP 파일로 다운로드할 수 있습니다.오늘은 Phantom에서 브라우저 엔진을 변경했습니다.JS에서 크롬으로.[22]

2013년 7월, Archive.today는 Memento ProjectAPI를 지원하기 시작했습니다.[23][24]

전 세계 가용성

오스트레일리아와 뉴질랜드

2019년 3월, 공격 장면의 배포를 제한하기 위해 크라이스트처치 모스크 총격 사건의 여파로 호주뉴질랜드의 여러 인터넷 제공업체에 의해 6개월 동안 사이트가 차단되었습니다.[25][26] 그 이후로 차단이[citation needed] 해제되었습니다.

중국

GreatFire.org 에 따르면 archive.today는 2016년 3월부터, archive.li 은 2017년 9월부터, archive.fo 은 2018년 7월부터, archive.ph 은 2019년 12월부터 중국 본토에서 차단되었습니다.

핀란드

2015년 7월 21일, 사업자들은 모든 핀란드 IP 주소에서 서비스에 대한 액세스를 차단했으며, 트위터를 통해 핀란드 정부와 분쟁이 확대되는 것을 피하기 위해 이를 수행했다고 밝혔습니다.[31]

러시아

러시아에서는 HTTP 접속만 가능하고 HTTPS 접속은 차단됩니다.[32][33] HTTP는 HTTPS와 달리 암호화되지 않으므로 네트워크에서 듣는 에이전트는 요청된 페이지의 URL, 반환된 내용 및 보낸 사람 장치(예: User-Agent 및 쿠키)를 식별하는 문자열을 포함한 전체 통신을 읽고 수정할 수 있습니다.

Cloudflare DNS 가용성

2018년[34] 5월에서 2022년 5월 [35]사이에 Cloudflare1.1.1.1 DNS 서비스는 archive.Today의 웹 주소를 해결하지 못해 Cloudflare DNS 서비스 사용자가 액세스할 수 없게 되었습니다. 두 기관 모두 상대방이 이 문제에 책임이 있다고 주장했습니다. Cloudflare 직원은 클라우드플레어의 네트워크 시스템이 오늘 아카이브 요청을 했을 때 권한 있는 이름 서버가 잘못된 레코드를 반환하므로 이 문제가 archive.today DNS 인프라에 있다고 말했습니다. archive.today는 Cloudflare가 자신의 DNS 요청에 EDNS 클라이언트 서브넷 정보를 보내지 않기 때문에 Cloudflare 요청이 DNS 표준을 준수하지 않기 때문이라고 반박했습니다.[36][37] 그 후 문제가 해결되었습니다.[citation needed][needs update]

참고 항목

참고문헌

  1. ^ @archiveis (29 October 2019). "a current list of all tor domains and clear net domains" (Tweet) – via Twitter.
  2. ^ Archive.is blog (18 February 2014). "When did the Archive-is site originally launch?". Tumblr. Archived from the original on 20 March 2021. Retrieved 10 April 2021.
  3. ^ Brinkmann, Martin (22 April 2015). "Create publicly available web page archives with Archive.is". Ghacks. Archived from the original on 12 April 2019. Retrieved 13 June 2015.
  4. ^ Brunelle, Justin F.; Kelly, Mat; Weigle, Michele C.; Nelson, Michael L. (25 January 2015). "The impact of JavaScript on archivability" (PDF). International Journal on Digital Libraries. 17 (2): 95–117. doi:10.1007/s00799-015-0140-8. S2CID 8433375. Archived (PDF) from the original on 27 May 2019.
  5. ^ Patokallio, Jani (5 August 2023). "archive.today: On the trail of the mysterious guerrilla archivist of the Internet". Gyrovague. Retrieved 1 January 2024.
  6. ^ "Why did you change the URL back from archive-today to archive-is?". Archive.is Blog. 3 May 2015. Archived from the original on 1 June 2015. Retrieved 6 January 2019.
  7. ^ @archiveis (4 January 2019). "Please do not use archive.IS mirror for linking, use others mirrors [.TODAY .FO .LI .VN .MD .PH]. .IS might stop working soon" (Tweet). Archived from the original on 6 January 2019 – via Twitter.
  8. ^ Dascalescu, Dan (18 February 2013). "Web page archiving – Dan Dascalescu's Wiki (review)". Wiki.dandascalescu.com. Archived from the original on 22 September 2013. Retrieved 3 October 2013.
  9. ^ Koebler, Jason (29 October 2014). "Dear GamerGate: Please Stop Stealing Our Shit". Motherboard. Archived from the original on 27 May 2019. Retrieved 22 March 2017. There is no way for a website to protect itself from having an Archive.today user mirror the site.
  10. ^ a b "Archive.today FAQ". archive.today. Retrieved 15 February 2019.
  11. ^ "Home page of Archive.is in 2013". Archived from the original on 12 January 2013.
  12. ^ "Archive.today blog". Archived from the original on 7 September 2021.
  13. ^ a b Archiving Websites with the Archive.is, archived from the original on 27 January 2022, retrieved 27 January 2022
  14. ^ "Example snapshot history on archive.is".
  15. ^ 언 상태로 나타나는 데일리 모션 비디오의 자바스크립트 생성 로딩 애니메이션
  16. ^ "Example: Page saved from Web Archive to Archive.is" (in Spanish). Archived from the original on 20 May 2013. Retrieved 23 October 2019.
  17. ^ 예를 들어 insite: https://en.wikipedia.org "World Cup" 문자열은 "World+Cup"/ 관련 스냅샷을 반환합니다.
  18. ^ "Some Frequently Asked Question" (blog). archive.is. 24 January 2013. Archived from the original on 26 September 2013. Retrieved 12 November 2018.
  19. ^ "Example user request on the Archive.is blog". Archive.is blog. Archived from the original on 29 April 2022. Retrieved 7 April 2022.
  20. ^ 동적 목록의 예:
  21. ^ "Just realized that I can search for keywords in the search bar for archive today, was this a recently added feature?". Archive.is blog. 18 January 2022. Archived from the original on 27 January 2022. Retrieved 27 January 2022.
  22. ^ "The "download zip" button has been giving a "Not found" error for quite some time". Archive.is blog. 17 July 2020. Archived from the original on 3 October 2020.
  23. ^ Nelson, Michael L. (9 July 2013). "Archive.is Supports Memento". Research and Teaching Updates. Web Science and Digital Libraries Research Group at Old Dominion University. Archived from the original on 27 July 2013. Retrieved 17 September 2013.
  24. ^ "archive.is". Memento Protocol Information. Memento Development Group. Archived from the original on 15 September 2013. Retrieved 17 September 2013.
  25. ^ "ISPs in AU and NZ start censoring the internet without legal precedent". Private Internet Access. 19 March 2019. Archived from the original on 28 April 2023. Retrieved 20 March 2019.
  26. ^ "New Zealand ISPs Say They're Blocking Sites That Fail To Remove Christchurch Shooting Video". Gizmodo Australia. 19 March 2019. Archived from the original on 18 May 2019. Retrieved 20 March 2019.
  27. ^ "archive.is is 100% blocked in China". GreatFire Analyzer. 12 August 2018. Archived from the original on 12 August 2018.
  28. ^ "archive.li is 100% blocked in China". Great Fire Analyzer. 12 August 2018. Archived from the original on 12 August 2018.
  29. ^ "archive.fo is 100% blocked in China". Great Fire Analyzer. 12 August 2018. Archived from the original on 12 August 2018.
  30. ^ "archive.ph is 100% blocked in China". en.greatfire.org. Archived from the original on 29 April 2022. Retrieved 7 April 2022.
  31. ^ Lapintie, Lassi (22 July 2015). "Suomalaisilta estettiin haktivistien suosimalla verkkosivulla käynti" [Finns' access to website used by hacktivists blocked]. Iltalehti (in Finnish). Archived from the original on 27 May 2019. Retrieved 4 March 2016.
  32. ^ Elistratov, Vladimir (29 January 2016). "Roskomnadzor zablokiroval servis archive.is, khranyashchiy kopii veb-saytov" Роскомнадзор заблокировал сервис archive.is, хранящий копии веб-сайтов. TJournal (in Russian). Archived from the original on 30 August 2017. Retrieved 30 January 2016.
  33. ^ Cushing, Tim (4 February 2016). "Russia Blocks Another Archive Site Because It Might Contain Old Pages About Drugs". Techdirt. Archived from the original on 23 March 2019. Retrieved 26 February 2016.
  34. ^ "Archive.is – Error 1001". Cloudflare Community. 15 May 2018. Archived from the original on 2 December 2021. Retrieved 2 December 2021.
  35. ^ "Archive.today works again on 1.1.1.1 (and archive.{ph,is,li,vn,fo,md})". Cloudflare Community. 22 May 2022. Retrieved 12 March 2023.
  36. ^ @archiveis (16 July 2018). ""Having to do" is not so direct here. Absence of EDNS and massive mismatch (not only on AS/Country, but even on the continent level) of where DNS and related HTTP requests come from causes so many troubles so I consider EDNS-less requests from Cloudflare as invalid" (Tweet) – via Twitter.
  37. ^ "Comment by Matthew Prince on Hacker News". Hacker News. 4 May 2019. Archived from the original on 13 May 2022. Retrieved 4 October 2021.

외부 링크