링크 로트
Link rot링크 로트(link rot)는 리소스가 새 주소로 재배치되거나 영구적으로 사용할 수 없게 되어 하이퍼링크가 원래 대상 파일, 웹 페이지 또는 서버를 가리키지 않게 되는 현상입니다.더 이상 대상을 가리키지 않는 링크(흔히 깨진 링크, 죽은 링크 또는 고아 링크)는 매달림 포인터의 특정 형태입니다.
링크가 썩는 속도는 인터넷의 정보 보존 능력에 중요성 때문에 연구 및 연구의 대상이 되고 있습니다.이 비율의 추정치는 연구마다 매우 다릅니다.정보 전문가들은 링크가 손상되면 중요한 아카이브 데이터가 사라져 법률 시스템과 장학금에 영향을 미칠 수 있다고 경고했습니다.
유행
많은 연구에서 World Wide Web, 웹 콘텐츠를 인용하기 위해 URL을 사용하는 학술 문헌 및 디지털 라이브러리 내의 링크 로트의 보급률을 조사했습니다.
2002년의 한 연구에 따르면 디지털 라이브러리 내의 링크 회전 속도가 웹보다 상당히 느리며, 1년 후에는[1] 약 3%의 객체가 더 이상 액세스할 수 없음을 알 수 있습니다(거의 23년의 반감기에 해당).
2003년의 한 연구는 웹상에서 매주 200개의 링크 중 약 1개의 링크가 끊어지고, 138주의 반감기를 시사한다는 것을 [2]발견했습니다.이 비율은 야후!의 링크에 대한 2016-2017년 연구에서 확인되었습니다. 디렉터리 링크의 반감기가 2년으로 나타난 디렉터리(개발 21년 후 2014년에 업데이트를 중단함).[3]
2004년 연구에 따르면 웹 링크의 하위 집합(예: 특정 파일 형식을 대상으로 하는 것 또는 학술 기관에서 호스팅하는 것)은 다른 반감기를 가질 수 있다고 합니다.[4]출판을 위해 선택된 URL은 평균 URL보다 더 긴 수명을 가지고 있는 것으로 보입니다. Weblock의 2015년 연구는 3개의 주요 오픈 액세스 출판사의 전문 텍스트 말뭉치에서 180,000개 이상의 링크를 분석하여 약 14년의 반감기를 발견했습니다.[5]D-Lib Magazine 기사에 인용된 URL의 절반이 출판된 지 10년 후에 활성화된 것을 발견한 2005년의 연구를 일반적으로 확인합니다.[6]다른 연구들은 학술 문헌에서 링크가 썩는 비율이 더 높다는 것을 발견했지만 일반적으로 4년 이상의 반감기를 제시합니다.[7][8]2013년 BMC Bioinformatics의 연구에서는 Thomson Reuters의 Web of Science 인용 지수에서 추출한 약 15,000개의 링크를 분석한 결과, 웹 페이지 수명의 중앙값이 9.3년이었으며, 아카이브된 경우는 62%에 불과했습니다.[9]1996년에서 2019년 사이에 발행된 뉴욕 타임즈 기사의 외부 링크에 대한 2021년 연구에서는 약 15년의 반감기(콘텐츠 주제에 따라 상당한 차이가 있음)가 발견되었지만 기능 링크의 13%가 더 이상 원래 콘텐츠로 이어지지 않는다고 언급했습니다. 이는 콘텐츠 드리프트(content drift)라고 불리는 현상입니다.[10]
미국의 코로나19 대시보드를 살펴본 2023년 연구에 따르면 2021년 2월에 사용 가능한 상태 대시보드의 23%가 2023년 4월 이전 URL에서 더 이상 사용할 수 없는 것으로 나타났습니다.[11]
원인들
링크가 썩는 현상은 여러 가지로 인해 발생할 수 있습니다.대상 웹 페이지가 제거될 수 있습니다.대상 페이지를 호스트하는 서버가 실패하거나 서비스에서 제거되거나 새 도메인 이름으로 재배치될 수 있습니다.도메인 이름의 등록이 만료되거나 다른 사용자에게 이전될 수 있습니다.일부 원인으로 인해 링크가 대상을 찾지 못하고 HTTP 404와 같은 오류를 반환하게 됩니다.다른 원인으로 인해 링크 작성자가 의도한 내용이 아닌 대상 컨텐츠에 대한 링크가 발생합니다.
링크가 끊기는 다른 이유는 다음과 같습니다.
- URL의 변경을 야기하는 웹사이트의 재구성(예: URL 변경)
domain.net/pine_tree
이동할 수도 있습니다.domain.net/tree/pine
) - 이전에 무료였던 콘텐츠를 페이월[11] 뒤로 이전
- PHP와 같은 코드가 다르게 작동하는 서버 아키텍처의 변화
- 디자인별로 변경되는 검색 결과와 같은 동적 페이지 내용
- 대상 페이지 및/또는 해당 내용 삭제
- 링크 내 사용자별 정보(로그인 이름 등) 존재
- 콘텐츠 필터나 방화벽에 의한 의도적인 차단
- 도메인 이름 등록 만료
예방 및 감지
링크 손상을 방지하기 위한 전략은 콘텐츠의 지속 가능성이 높은 곳에 콘텐츠를 배치하거나, 링크가 끊어질 가능성이 낮은 링크를 작성하거나, 기존 링크를 보존하기 위한 조치를 취하거나, 대상이 재배치되거나 제거된 링크를 복구하는 데 초점을 맞출 수 있습니다.[citation needed]
시간에 따라 변하지 않는 URL을 만드는 것이 링크가 썩는 것을 막는 근본적인 방법입니다.예방 계획은 Tim Berners-Lee와 다른 웹 개척자들에 의해 옹호되어 왔습니다.[12]
링크의 작성자와 관련된 전략은 다음과 같습니다.
- 2차 소스보다는 1차 소스에 연결하고 안정적인 사이트[citation needed] 우선 순위를 정하는 것
- 연구자의 개인[6] 페이지에 있는 자료를 가리키는 링크를 피하기
- 깨끗한 URL을 사용하거나 URL 정규화 또는 URL 정규화를[13] 사용하는 경우
- ARK, DOI, 핸들 시스템 참조, PURL [citation needed]또는 컨텐츠 어드레싱과[14] 같은 영구적인 식별자와 영구적인 연결 사용
- 웹 페이지가[13] 아닌 다른 문서에 연결하지 않기
- 깊은 연결을[citation needed] 피하기
- Internet Archive, WebCite, archive.today, Perma.cc , Amber 또는 Arweave와 같은 웹 아카이브에 링크하기
기존 링크 보호와 관련된 전략은 다음과 같습니다.
- HTTP 301과 같은 리디렉션 메커니즘을 사용하여 브라우저 및 크롤러를 재배치된 콘텐츠에 자동으로 참조합니다.[citation needed]
- 동일한 사이트 내의 콘텐츠가 재배치될 때 링크를 자동으로 업데이트하거나 링크를 표준 URL로[20] 자동 교체할 수 있는 콘텐츠 관리 시스템 사용
- 검색 리소스를 HTTP 404 페이지에[21] 통합
끊어진 링크의 탐지는 수동 또는 자동으로 수행될 수 있습니다.자동화된 방법에는 콘텐츠 관리 시스템을 위한 플러그인뿐만 아니라 Xenu의 Link Sleuth와 같은 독립 실행형 부서진 링크 체커가 포함됩니다.자동 검사는 소프트 404를 반환하는 링크나 200 OK 응답을 반환하지만 변경된 내용을 가리키는 링크를 감지하지 못할 수 있습니다.[22]
참고 항목
추가열람
- Markwell, John; Brooks, David W. (2002). "Broken Links: The Ephemeral Nature of Educational WWW Hyperlinks". Journal of Science Education and Technology. 11 (2): 105–108. doi:10.1023/A:1014627511641. S2CID 60802264.
- Gomes, Daniel; Silva, Mário J. (2006). "Modelling Information Persistence on the Web" (PDF). Proceedings of the 6th International Conference on Web Engineering. ICWE'06. Archived from the original (PDF) on 2011-07-16. Retrieved 14 September 2010.
- Dellavalle, Robert P.; Hester, Eric J.; Heilig, Lauren F.; Drake, Amanda L.; Kuntzman, Jeff W.; Graber, Marla; Schilling, Lisa M. (2003). "Going, Going, Gone: Lost Internet References". Science. 302 (5646): 787–788. doi:10.1126/science.1088234. PMID 14593153. S2CID 154604929.
- Koehler, Wallace (1999). "An Analysis of Web Page and Web Site Constancy and Permanence". Journal of the American Society for Information Science. 50 (2): 162–180. doi:10.1002/(SICI)1097-4571(1999)50:2<162::AID-ASI7>3.0.CO;2-B.
- Sellitto, Carmine (2005). "The impact of impermanent Web-located citations: A study of 123 scholarly conference publications" (PDF). Journal of the American Society for Information Science and Technology. 56 (7): 695–703. CiteSeerX 10.1.1.473.2732. doi:10.1002/asi.20159.
참고문헌
- ^ Nelson, Michael L.; Allen, B. Danette (2002). "Object Persistence and Availability in Digital Libraries". D-Lib Magazine. 8 (1). doi:10.1045/january2002-nelson. Archived from the original on 2020-07-19. Retrieved 2019-09-24.
- ^ Fetterly, Dennis; Manasse, Mark; Najork, Marc; Wiener, Janet (2003). "A large-scale study of the evolution of web pages". Proceedings of the 12th international conference on World Wide Web. Archived from the original on 9 July 2011. Retrieved 14 September 2010.
- ^ van der Graaf, Hans. "The half-life of a link is two year". ZOMDir's blog. Archived from the original on 2017-10-17. Retrieved 2019-01-31.
- ^ Koehler, Wallace (2004). "A longitudinal study of web pages continued: a consideration of document persistence". Information Research. 9 (2). Archived from the original on 2017-09-11. Retrieved 2019-01-31.
- ^ "All-Time Weblock Report". August 2015. Archived from the original on 4 March 2016. Retrieved 12 January 2016.
- ^ a b McCown, Frank; Chan, Sheffan; Nelson, Michael L.; Bollen, Johan (2005). "The Availability and Persistence of Web References in D-Lib Magazine" (PDF). Proceedings of the 5th International Web Archiving Workshop and Digital Preservation (IWAW'05). Archived from the original (PDF) on 2012-07-17. Retrieved 2005-10-12.
- ^ Spinellis, Diomidis (2003). "The Decay and Failures of Web References". Communications of the ACM. 46 (1): 71–77. CiteSeerX 10.1.1.12.9599. doi:10.1145/602421.602422. S2CID 17750450. Archived from the original on 2020-07-23. Retrieved 2007-09-29.
- ^ Steve Lawrence; David M. Pennock; Gary William Flake; et al. (March 2001). "Persistence of Web References in Scientific Research". Computer. 34 (3): 26–31. CiteSeerX 10.1.1.97.9695. doi:10.1109/2.901164. ISSN 0018-9162. Wikidata Q21012586.
- ^ Hennessey, Jason; Xijin Ge, Steven (2013). "A Cross Disciplinary Study of Link Decay and the Effectiveness of Mitigation Techniques". BMC Bioinformatics. 14 (Suppl 14): S5. doi:10.1186/1471-2105-14-S14-S5. PMC 3851533. PMID 24266891.
- ^ "What the ephemerality of the Web means for your hyperlinks". Columbia Journalism Review. Archived from the original on 2021-08-02. Retrieved 2021-08-02.
- ^ a b Adams, Aaron M.; Chen, Xiang; Li, Weidong; Chuanrong, Zhang (27 July 2023). "Normalizing the pandemic: exploring thecartographic issues in state government COVID-19 dashboards". Journal of Maps. 19 (5): 1–9. doi:10.1080/17445647.2023.2235385.
- ^ Berners-Lee, Tim (1998). "Cool URIs Don't Change". Archived from the original on 2000-03-02. Retrieved 2019-01-31.
- ^ a b Kille, Leighton Walter (8 November 2014). "The Growing Problem of Internet "Link Rot" and Best Practices for Media and Online Publishers". Journalist's Resource, Harvard Kennedy School. Archived from the original on 12 January 2015. Retrieved 16 January 2015.
- ^ 시실리아, 미겔-엔젤 등"분산형 영구 식별자: 불변 처리기 기본 모델 Wayback Machine에서 보관 2023-05-10."프로시디아 컴퓨터 과학 146 (2019): 123-130
- ^ "Internet Archive: Digital Library of Free Books, Movies, Music & Wayback Machine". 2001-03-10. Archived from the original on 26 January 1997. Retrieved 7 October 2013.
- ^ Eysenbach, Gunther; Trudel, Mathieu (2005). "Going, going, still there: Using the WebCite service to permanently archive cited web pages". Journal of Medical Internet Research. 7 (5): e60. doi:10.2196/jmir.7.5.e60. PMC 1550686. PMID 16403724.
- ^ Zittrain, Jonathan; Albert, Kendra; Lessig, Lawrence (12 June 2014). "Perma: Scoping and Addressing the Problem of Link and Reference Rot in Legal Citations" (PDF). Legal Information Management. 14 (2): 88–99. doi:10.1017/S1472669614000255. S2CID 232390360. Archived (PDF) from the original on 1 November 2020. Retrieved 10 June 2020.
- ^ "Harvard University's Berkman Center Releases Amber, a "Mutual Aid" Tool for Bloggers & Website Owners to Help Keep the Web Available Berkman Center". cyber.law.harvard.edu. Archived from the original on 2016-02-02. Retrieved 2016-01-28.
- ^ "Arweave - A community-driven ecosystem". arweave.org. Archived from the original on 2023-03-15. Retrieved 2023-03-15.
- ^ Rønn-Jensen, Jesper (2007-10-05). "Software Eliminates User Errors And Linkrot". Justaddwater.dk. Archived from the original on 11 October 2007. Retrieved 5 October 2007.
- ^ Mueller, John (2007-12-14). "FYI on Google Toolbar's Latest Features". Google Webmaster Central Blog. Archived from the original on 13 September 2008. Retrieved 9 July 2008.
- ^ Bar-Yossef, Ziv; Broder, Andrei Z.; Kumar, Ravi; Tomkins, Andrew (2004). "Sic transit gloria telae: towards an understanding of the Web's decay". Proceedings of the 13th international conference on World Wide Web – WWW '04. pp. 328–337. CiteSeerX 10.1.1.1.9406. doi:10.1145/988672.988716. ISBN 978-1581138443.
외부 링크
- 미래를 대비한 URI
- Nielsen, Jakob (14 June 1998). "Fighting Linkrot". Archived from the original on 23 December 2012.