학기말 웹 아카이브

End of Term Web Archive
기간 종료 웹 아카이브(EOTArchive)
North America Geological Tapestry.gif
USGS 지도 버전은 프로젝트 파트너 UNT에 의해 2008년 말 컬렉션에 보관되었다.
임무명세서"임기말 웹아카이브(The End of Term Web Archive)는 대통령 행정부 말기에 미국 정부 웹사이트를 캡처해 저장한다."
광고?아니요.
프로젝트 유형협업 정부 웹 아카이브
확립된2008
웹사이트eotarchive.cdlib.org

임기말 웹 아카이브는 행정 변경 중에 미국 연방정부 웹사이트를 보존한다.[1]

배경

말기 웹 아카이브는 2000년과 2004년에 이러한 크롤 작업을 수행한 후 2008년 국가기록원(NARA)이 전환 에는 정부 웹사이트를 보관하지 않겠다고 발표한 후 설치되었다.[2] 2004년 연방 웹 수집은 제109회 미국 의회를 시작으로 국립문서보관소에서 의회 웹 수집과 함께 접속할 수 있다.[3]

첫 번째 프로젝트 파트너는 의회 도서관, 조지 워싱턴 대학교, 스탠포드 대학교, 북텍사스 대학교, 미국 정부 출판국, 캘리포니아 디지털 도서관, 인터넷 아카이브였으며, 국제 인터넷 보존 컨소시엄의 모든 회원이었다. 이 프로젝트는 2008년 IIPC 총회를 거쳐 처음 스케치되었다.[4] NARA와 EDGI(Environmental Data & Governance Initiative)가 2020/21 프로젝트에 참여했다.[5]

프로젝트

Screenshot of a "Page Not Found" message relayed by whitehouse.gov.
2009년 웹사이트가 변경됨에 따라 whitehouse.gov 방문자를 안내하는 데 사용되는 사용자 정의 에러 페이지.

이 프로젝트는 공공의 접근과 연구를 위한 웹사이트와 문서를 보관한다.[6] 문서 파일에 대한 위험성에 대한 UNT 연구에 따르면 2008년 .gov 도메인의 PDF 중 83%가 4년 후 누락된 것으로 나타났다.[7] 이는 웹사이트 관리 요구 사항과 일치하지만, 그들의 지위는 대중과 감시 단체에 관심이 있을 수 있다는 것을 의미한다.[8] 과거 웹 자료에 대한 지속적인 접근 요구의 증거는 2017년 변경에 대한 우려에 대한 EPA의 발표에서 찾을 수 있으며, 이전 정부의 페이지를 주의 깊게 보관할 것이라고 명시했다.[9] 이러한 스냅숏 페이지는 현대 콘텐츠와 구별하기 위해 명확하게 표시되었다.[10]

아카이브는 전환 기간 동안 업데이트되거나 제거될 가능성이 있는 것으로 간주되는 영역을 관리하는 사이트의 우선순위를 정한다.[11] 대중들은 중요한 사이트들을 지명할 것을 권장받으며, 이 사이트들은 수집품을 만들기 위해 광범위한 정부 도메인의 크롤과 결합된다.[12][13] 2016년 11,382개의 사이트로 보존된 크롤 보존은 광범위하지만 포괄적이 되기는 어렵다.[14][15] 연구자들은 이러한 컬렉션을 사용하여 기후 변화 정책의 역사와 중단된 미국 정부 트위터 계정의 재사용을 조사해왔다.[16][17]

참고 항목

참조

  1. ^ Dwyer, Jim (2016-12-02). "Harvesting Government History, One Web Page at a Time (Published 2016)". The New York Times. ISSN 0362-4331. Archived from the original on 18 Jan 2020. Retrieved 2020-12-07.
  2. ^ Webster, Peter (2017). Brügger, Niels (ed.). "Users, technologies, organisations: Towards a cultural history of world web archiving". Web 25. Histories from 25 Years of the World Wide Web: 179–190. doi:10.3726/b11492. hdl:2318/1770557. ISBN 9781433140655. Archived from the original on 2020-10-21.
  3. ^ "National Archives". Congressional & Federal Government Web Harvests. Archived from the original on 2017-09-18. Retrieved 2021-01-18.
  4. ^ Seneca, Tracy; Grotke, Abbie; Hartman, Cathy Nelson; Carpenter, Kris (2012). "It Takes a Village to Save the Web: The End of Term Web Archive" (PDF). DTTP: Documents to the People. 40: 16. ISSN 0091-2085. Archived from the original (PDF) on 2015-09-08.
  5. ^ "GitHub - end-of-term/eot2020". Archived from the original on 2020-12-05. Retrieved 2020-12-14.
  6. ^ "End of Term Web Archive: U.S. Government Websites". 2020-12-06. Archived from the original on 2020-12-06. Retrieved 2020-12-15.
  7. ^ Gilmore, Courtney (4 Dec 2020). "UNT Part of Team Archiving Obama Administration Web Content". NBC 5 Dallas-Fort Worth. Archived from the original on 7 Dec 2020. Retrieved 2020-12-04.
  8. ^ "Website Monitoring". Environmental Data and Governance Initiative. Archived from the original on 2020-12-06. Retrieved 2021-02-24.
  9. ^ Mooney, Chris; Eilperin, Juliet. "EPA website removes climate science site from public view after two decades". Washington Post. ISSN 0190-8286. Archived from the original on 2017-04-29. Retrieved 2021-02-18.
  10. ^ "Climate Change US EPA". web.archive.org. 2017-04-29. Retrieved 2021-04-08.
  11. ^ "Guerrilla Archiving". The Politics of Evidence. 2016-12-05. Archived from the original on 4 Aug 2020. Retrieved 2020-12-07.
  12. ^ Jacobs, James R. (2020-08-10). "Nominations sought for the U.S. Federal Government Domain End of Term 2020 Web Archive". Free Government Information (FGI). Archived from the original on 4 Oct 2020. Retrieved 2020-12-07.
  13. ^ "End of Term Archive on Twitter: "And so it begins. We have officially started crawling the websites nominated for the End of Term 2020 web archive! But don't worry, you still have time to nominate more! What are your favorite government sites? #WebArchiveWednesday #WebArchives #GovDocs"". 2020-10-07. Archived from the original on 7 Oct 2020. Retrieved 2020-11-06.
  14. ^ O'Keefe, Ed (2015-10-08). "How many .gov sites exist? Thousands. - The Washington Post". Archived from the original on 8 Oct 2015. Retrieved 2020-12-04.
  15. ^ Young, Lauren J. "The Librarians Saving The Internet". Science Friday. Archived from the original on 9 Nov 2020. Retrieved 2020-12-04.
  16. ^ EDGI, Toly Rinberg, Maya Anjur-Dietrich, Marcy Beck, Andrew Bergman, Justin Derry, Lindsey Dillon, Gretchen Gehrke, Rebecca Lave, Chris Sellers, Nick Shapiro, Anastasia Aizman, Dan Allan, Madelaine Britt, Raymond Cha, Janak Chadha, Morgan Currie, Sara Johns, Abby Klionsky, Stephanie Knutson, Katherine Kulik, Aaron Lemelin, Kevin Nguyen, Eric Nost, Kendra Ouellette, Lindsay Poirier, Sara Rubinow, Justin Schell, Lizz Ultee, Julia Upfal, Tyler Wedrosky, Jacob Wylie. "Changing the Digital Climate". 100days.envirodatagov.org. Archived from the original on 2018-04-04. Retrieved 2021-01-14.
  17. ^ Littman, Justin (2017-11-04). "Suspended U.S. government Twitter accounts". Social Feed Manager. Archived from the original on 2017-11-07. Retrieved 2020-12-07.