보관 사이트
Archive site웹 아카이브에서 아카이브 사이트는 누구나 볼 수 있도록 과거의 웹 페이지에 정보를 저장하는 웹사이트다.
공통기법
웹 사이트를 보관하는 두 가지 일반적인 기법은 웹 크롤러를 사용하거나 사용자 제출을 요청하는 것이다.
- 웹 크롤러 사용: 웹 크롤러(예: Internet Archive)를 사용함으로써 서비스는 컨텐츠에 대한 활성 커뮤니티에 의존하지 않으며, 따라서 더 큰 데이터베이스를 더 빨리 구축할 수 있다. 그러나 웹 크롤러는 웹사이트 개발자와 시스템 관리자가 웹 크롤러가 (로봇.txt를 사용하여) 웹 페이지에 접근하는 것을 차단할 수 있기 때문에, 대중이 인터넷에 게시하기 위해 선택했거나, 탐색할 수 있는 정보를 인덱싱하고 보관할 수 있을 뿐이다.
- 사용자 제출: 잠재적으로 사용자 제출 비율이 낮아 사용자 제출 서비스를 시작하기가 어려울 수 있지만, 이 시스템은 최상의 결과를 얻을 수 있다. 웹 페이지를 탐색함으로써 대중이 온라인에 올리기로 선택한 정보만 얻을 수 있다. 그러나, 잠재적 콘텐츠 제공자들은 게시할 적절한 장소가 부족하거나 저작권에 대한 우려 때문에 아무도 관심을 갖지 않을 것이라고 가정하고 특정 정보를 게시하는 것을 귀찮게 하지 않을 수 있다.[1] 그러나, 누군가가 자신의 정보를 원하는 것을 보는 사용자들은 정보를 제출하는 경향이 더 많을 수 있다.
예
Google 그룹
2001년 2월 12일, 구글은 usenet 토론 그룹 아카이브를 Deja.com에서 인수하여 구글 그룹 서비스로 바꾸었다.[2] 그것들은 사용자들이 구글의 검색 기술로 오래된 토론을 검색하는 한편, 사용자들은 여전히 메일링 리스트에 게시할 수 있게 해준다.
인터넷 아카이브
인터넷 아카이브는 웹사이트와 디지털 미디어의 컴파운드를 만들고 있다. 1996년부터, 아카이브는 그들의 데이터베이스를 구축하기 위해 웹 크롤러를 고용하고 있다. 그것은 가장 잘 알려진 아카이브 사이트 중 하나이다.
NBCUniversal 아카이브
NBCUniversal Archives는 NBCUniversal과 그 자회사의 독점 컨텐츠에 대한 액세스를 제공한다. 그들의 NBCUniversal Archives 웹사이트는 과거 및 최근의 뉴스 클립을 쉽게 볼 수 있도록 제공하며, 그것은 뉴스 아카이브의 대표적인 예다.[3]
다음 포인트
넥스트포인트는 전자 검색을 비롯한 마케팅, 컴플라이언스 및 소송 관련 요구를 위한 자동화된 클라우드 기반 SaaS를 제공한다.
판도라 아카이브
1996년 오스트레일리아 국립도서관이 설립한 판도라 아카이브(Pandora Archive, Pandora Archive)는 그들의 사명을 캡슐화한 호주의 네트워크 다큐멘터리 자원을 보존하고 접근하는 것을 의미한다. 그들은 호주인들이 저술했거나 호주의 주제인 엄선된 온라인 출판물과 웹사이트의 장기 카탈로그를 제공한다. 그들은 카탈로그를 만들 때 판다(Pandora Digital Archiving System)를 사용한다.
textfiles.com
아마존닷컴은 제이슨 스콧 사도프스키에 의해 유지된 오래된 텍스트 파일들의 큰 도서관이다. 젊은 시절 게시판 시스템(BBS)에 떠돌던 옛 문서들을 보관하고 다른 사람의 경험을 게시판 시스템에 기록하는 게 임무다.
참고 항목
참조
- ^ Jinfang Niu, University of South Florida (March–April 2012). "An Overview of Web Archiving". D-Lib Magazine. Vol. 18, no. 3/4. doi:10.1045/march2012-niu1.
- ^ "Google Acquires Usenet Discussion Service and Significant Assets from Deja.com". 12 February 2001.
- ^ NBCUniversal 아카이브