인용 분석

Citation analysis

인용분석이란 문서의 인용 빈도, 패턴, 그래프 등을 조사하는 것을 말한다.인용의 방향 그래프(한 문서에서 다른 문서로 링크)를 사용하여 문서의 속성을 표시합니다.전형적인 목적은 컬렉션에서 가장 중요한 문서를 식별하는 것입니다.전형적인 예가 학술 논문과 [1][2]책 사이의 인용문이다.또 다른 예로, 법관들은 이전의 판례에서 내려진 판결을 참고함으로써 그들의 판단을 지지한다(법적 맥락에서 인용 분석 참조).선행기술, 현재 클레임에 관련된 선행특허의 인용을 포함하는 특허에 의해 추가적인 예가 제공된다.

문서는 인용문 외에도 실제 텍스트뿐만 아니라 저자, 출판사, 저널과 같은 많은 다른 기능과 연관될 수 있습니다.문서 모음의 일반적인 분석은 참고 문헌학으로 알려져 있으며 인용 분석은 이 분야의 핵심 부분입니다.예를 들어, 서지 결합과 공동 인용은 인용 분석(공유 인용 또는 공유 참조)에 기초한 연관성 척도이다.문서 모음의 인용문은 데릭 J. 드 솔라 프라이스가 1965년 기고한 "과학 논문의 네트워크"[3]에서 지적한 인용 그래프와 같은 형식으로도 나타낼 수 있다.즉, 인용 분석은 소셜 네트워크 분석과 네트워크 과학 측면을 활용합니다.

자동화된 인용 색인의 초기 예는 CiteSeer인데, 이는 학술 논문 간의 인용에 사용되었습니다. 반면, Web of Science는 다양한 정보 소스를 반영하는 학술 서적과 기사 이상을 포함하는 현대 시스템의 한 예입니다.오늘날, 자동화[4] 인용 색인화는 인용 분석 연구의 성격을 변화시켰고, 대규모 패턴과 지식 발견을 위해 수백만 개의 인용문을 분석할 수 있게 되었습니다.인용 분석 도구를 사용하여 인용 [5][6][note 1]색인 데이터를 기반으로 학자에 대한 다양한 영향 측정을 계산할 수 있습니다.논문 심사, 제안서 교부 등 전문가 심사의 특정부터 학업성취도 심사, 재직, 승진 결정 등에 대한 투명한 데이터 제공까지 다양한 응용 분야를 가지고 있다.한정된 자원에 대한 이러한 경쟁은 [7][8]인용을 증가시키기 위한 윤리적으로 의심스러운 행동으로 이어질 수 있습니다.

인용 [9]패턴에 영향을 미칠 수 있는 다른 요소들을 고려하지 않고 서로 다른 학술 기사의 영향을 비교하기 위해 인용 분석을 순진하게 사용하는 관행에 대해 많은 비판이 제기되어 왔다.이러한 비판들 중 반복적인 것은 "분야 의존적 요인"에 초점을 맞추고 있는데, 이는 인용 관행이 과학 분야마다, 심지어 학문 [10]내 연구 분야마다 다르다는 사실을 의미한다.

개요

인용 색인은 원래 정보 검색을 위해 설계되었지만, 참고 문헌학 및 연구 평가를 포함한 기타 연구에 점점 더 많이 사용되고 있다.인용 데이터는 또한 인기 있는 저널 영향 인자의 기초가 된다.

인용 분석에 관한 많은 문헌들이 있는데, 때때로 사이언트메트릭스라고 불리기도 하는데, 이는 바실리 나리모프에 의해 발명된 용어, 혹은 더 구체적으로 말하면 참고 문헌메트릭스이다.과학인용인용색인의 등장으로 이 분야는 꽃을 피웠고, 이 색인은 1900년부터 지금까지의 소스 문헌을 다루고 있다.이 분야의 주요 저널은 사이언트메트릭스, 인포메트릭스, 그리고 정보과학기술협회 저널이다.ASIST는 또한 [11]ASIST에서 SIGMETRICS라는 전자 메일 목록을 호스팅합니다.이 방법은 많은 대학에서 Web of Science 및 Scopus 서브스크립션 데이터베이스와 CiteSeerX, Google Scholar 및 이전 Windows Live Academic(현재는 Microsoft Academic과 같은 추가 기능으로 제공됨)과 같은 널리 보급된 무료 인용 도구에 기초하여 부활하고 있습니다.인용 분석 연구의 방법에는 질적, 정량적, 계산적 접근법이 포함된다.그런scientometric 연구의 주요 FOCUS의 복수 생산성 비교, 기관의 연구 순위, 일지는 순위[12]작업 능력 생산성과 임기 standards,[13]와 프로파일이 개발 과학이나 기술 field,[15]의 발전 궤도 추적 articles,[14]최고 스님의 영향 평가 포함하고 있다.최고 작가들 중연구 성과에 대한 기관 및 기관.[16]

법률 인용 분석은 법률 문서를 분석하여 동일한 문서 내의 다른 조항 또는 다른 문서 간의 규정을 연결하는 인용을 조사함으로써 상호 관련 규제 준수 문서를 이해하기 쉽게 하기 위한 인용 분석 기법이다.법적 인용 분석에서는 규제 문서에서 추출한 인용 그래프사용하여 빅 [17][18][19][20]데이터 분석의 기술 혁신을 활용하는 프로세스인 전자 발견을 보완할 수 있습니다.

역사

Derek J. de Solla Price는 1965년 논문에서 SCI의 고유한 연결 특성을 "Networks of Scientific Papers"[3]라고 설명했습니다.인용 논문과 인용 논문 사이의 연계는 SCI가 온라인으로 발표되기 시작하면서 역동적이 되었다.사회과학 인용 색인은 1972년에 대화상자[21] 시스템에 최초로 탑재된 데이터베이스 중 하나가 되었다.CD-ROM 에디션의 등장으로, 연계가 더욱 쉬워졌고 관련 기록을 찾기 위한 서지 커플링을 사용할 수 있게 되었다.1973년 헨리 스몰은 공동인용분석관한 그의 고전적인 연구를 발표했는데, 는 문서 클러스터링 실험으로 이어졌고 나중에는 "리서치 리뷰"라고 불리는 "과학의 아틀라스"가 되었다.

과학 문헌의 고유 속성인 전세계 인용 네트워크의 고유한 위상 및 그래픽 특성은 1965년 [22]Ralph Garner(Drexel University)에 의해 설명되었습니다.

저널 순위를 매기기 위해 인용 카운트를 사용하는 것은 19세기 초에 사용된 기술이었지만 과학 저널에 대한 이러한 카운트의 체계적인 지속적인 측정은 과학 정보 연구소의 유진 가필드에 의해 시작되었다. 유진 가필드는 작가와 논문 순위를 매기기 위해 이러한 카운트를 사용하는 선구자이기도 했다.1965년의 획기적인 논문에서 그와 어빙 셰어는 노벨상 수상자들이 평균 논문 수의 5배를 발표했고 그들의 작품은 평균 논문 수의 30배에서 50배를 인용되었다는 을 증명함으로써 인용 빈도와 탁월성 사이의 상관관계를 보여주었다.노벨상과 다른 상들에 대한 긴 일련의 에세이에서 가필드는 이 현상을 보고했다.통상적인 요약 척도는 임팩트 팩터로 알려져 있습니다.임팩트 팩터는 이전 2년간의 저널 인용 수를 해당 연도에 발표된 기사 수로 나눈 것입니다.이는 적절하거나 부적절한 목적으로 널리 사용된다. 특히 이 측정치를 순위 매긴 저자와 논문에만 사용하는 것은 논란의 여지가 많다.

1964년 DNA의 역사를 쓸 때 인용 분석을 사용한 초기 연구에서, 가필드와 셰어는 과학 주제 역사에서 가장 중요한 단계의 위상 지도인 역사학 지도를 생성하는 가능성을 증명했습니다.이 작업은 나중에 러시아 과학 아카데미 해양생물연구소의 E. Garfield, A. I. PudovkinWashington State University의 교육, 학습, 기술 센터 V. S. Istomin에 의해 자동화되어 2002년경[23] Histcite 소프트웨어를 만들 수 있었습니다.

인용 자동 색인은 1998년 Lee Giles, Steve Lawrence 및 Kurt Bollacker[24] 의해 도입되었으며 디지털 학술 및 과학 문서에 대한 인용 자동 알고리즘 추출 및 그룹화를 가능하게 했다.이전의 인용 추출이 수동 프로세스였다면, 이제 인용 척도는 ISI와 같은 조직에 의해 선택된 것뿐만 아니라 학술적이고 과학적인 분야와 문서 행사장에 대해 확장되고 계산될 수 있다.이를 통해 CiteSeer(현재의 CiteSeerX)가 공개 및 자동 인용 인덱싱을 위한 새로운 시스템이 개발되었으며, 곧이어 Cora가 컴퓨터 과학정보 과학 분야에 주로 초점을 맞췄습니다.이후 구글 스콜라와 마이크로소프트 아카데믹과 같은 대규모 학술 도메인 인용 시스템이 도입되었습니다.이러한 자율 인용 색인은 인용 추출이나 인용 클러스터링에서 아직 완벽하지 않으며, 일부에 의해 추정된 오류율은 10%이지만, 신중한 통계 샘플링은 아직 이루어지지 않았다.이것은 앤 아버, 밀턴 케인즈, 월튼 홀과 같은 작가들이 광범위한 학술적 [25]성과로 인정받는 결과를 가져왔다.SCI는 순수하게 프로그래밍된 방법을 통해 자동 인용 인덱스를 생성한다고 주장합니다.심지어 오래된 기록들도 비슷한 수준의 오차를 가지고 있다.

인용 영향

인용 영향은 학술지 기사, 책 또는 저자가 다른 기사, 책 또는 [26][27][28][29][30]저자에 의해 인용되는 횟수를 측정하는 것입니다.인용 횟수는 학술적 작업의 영향 또는 영향의 척도로 해석되며 인용 분석을 통한 학술적 영향 패턴 연구를 전문으로 하는 서지측정학 또는 과학측정학 [31][32]분야를 낳았다.저널 임팩트 팩터, 즉 발행된 기사에 대한 인용문의 2년 평균 비율인 저널 임팩트 팩터는 저널의 중요성을 나타내는 척도이다.이는 학회들학구 재직 기간, 승진 및 채용에 대한 결정을 내릴 때 사용되며, 따라서 저자들이 어떤 저널에 게재할지를 결정할 때도 사용됩니다.인용과 유사한 척도는 Google의 PageRank 알고리즘, 소프트웨어 메트릭, 대학대학 순위, 비즈니스 성과 지표같은 순위를 매기는 다른 분야에서도 사용됩니다.

법률문서 인용분석

법률 문서에 대한 인용 분석은 동일한 문서 내 또는 다른 문서 간에 다른 조항에 대한 조항을 연결하는 인용을 조사함으로써 상호 관련 규제 준수 문서의 이해와 분석을 용이하게 하기 위한 접근법이다.인용 분석은 규제 문서에서 추출한 인용 그래프를 사용하여 빅 데이터 [19][20][33]분석의 기술 혁신을 활용하는 프로세스인 전자 발견을 보완할 수 있습니다.

논쟁

  • 전자출판: 전자자원(e-resource)의 가용성이 전례 없이 증가함에 따라 현재 검토되고 있는 질문 중 하나는 "내 분야에서 전자자원이 얼마나 자주 인용되고 있는가?"입니다.[34]예를 들어, 컴퓨터 사이언스 문헌에 대한 온라인 접속이 더 [35]높은 인용률로 이어진다는 주장도 있지만, 인쇄되지 않으면 인문학적 기사들은 어려움을 겪을 수 있다.
  • 자기주장: 저자들이 지나치게 [36]자기주장을 내세워 인용을 축적함으로써 시스템을 조작한다는 비판을 받아왔다.예를 들어,[37] 남성들이 여성들보다 더 자주 자신을 언급하는 경향이 있는 것으로 밝혀졌다.
  • 인용 공해: 철회된 연구나 가짜 연구가 합법적 연구에서 인용되고 있지만 연구의 [38]타당성에 부정적인 영향을 미치는 침투.출판 경쟁과 소위 약탈적 또는 기만적인 출판사와 관련된 비양심적인 사업 관행의 증가 등 여러 가지 요인에 의해 연구 품질은 일반적으로 다른 종류의 위협에 직면해 있다.

「 」를 참조해 주세요.

메모들

  1. ^ 예를 들어 Web of Science Scopus와 같은 독점 데이터를 기반으로 하는 구독 기반 도구와 Filippo Menczer와 그의 팀이 제공하는 Scholarometer와 같은 개방형 데이터를 기반으로 하는 무료 도구가 있습니다.

레퍼런스

  1. ^ Rubin, Richard (2010). Foundations of library and information science (3rd ed.). New York: Neal-Schuman Publishers. ISBN 978-1-55570-690-6.
  2. ^ Garfield, E. 인용 색인 - 필라델피아 과학, 기술인문학의 이론과 응용:ISI Press, 1983.
  3. ^ a b Derek J. de Solla Price (July 30, 1965). "Networks of Scientific Papers" (PDF). Science. 149 (3683): 510–515. Bibcode:1965Sci...149..510D. doi:10.1126/science.149.3683.510. PMID 14325149.
  4. ^ Giles, C. Lee; Bollacker, Kurt D.; Lawrence, Steve (1998), "CiteSeer: an automatic citation indexing system.", Digital Libraries 98 : The Third ACM Conference on Digital Libraries, June 23–26, 1998, Pittsburgh, PA, New York: Association for Computing Machinery: 89–98, doi:10.1145/276675.276685, ISBN 978-0-89791-965-4, S2CID 514080
  5. ^ Kaur, Jasleen; Diep Thi Hoang; Xiaoling Sun; Lino Possamai; Mohsen JafariAsbagh; Snehal Patil; Filippo Menczer (2012). "Scholarometer: A Social Framework for Analyzing Impact across Disciplines". PLOS ONE. 7 (9): e43235. Bibcode:2012PLoSO...743235K. doi:10.1371/journal.pone.0043235. PMC 3440403. PMID 22984414.
  6. ^ Hoang, D.; Kaur, J.; Menczer, F. (2010), "Crowdsourcing Scholarly Data", Proceedings of the WebSci10: Extending the Frontiers of Society On-Line, April 26-27th, 2010, Raleigh, NC: US, archived from the original on 2015-04-17, retrieved 2015-08-09
  7. ^ Anderson, M.S. van; Ronning, E.A. van; de Vries, R.; Martison, B.C. (2007). "The perverse effects of competition on scientists' work and relationship". Science and Engineering Ethics. 4 (13): 437–461. doi:10.1007/s11948-007-9042-5. PMID 18030595. S2CID 2994701.
  8. ^ Wesel, M. van (2016). "Evaluation by Citation: Trends in Publication Behavior, Evaluation Criteria, and the Strive for High Impact Publications". Science and Engineering Ethics. 22 (1): 199–225. doi:10.1007/s11948-015-9638-0. PMC 4750571. PMID 25742806.
  9. ^ Bornmann, L.; Daniel, H. D. (2008). "What do citation counts measure? A review of studies on citing behavior". Journal of Documentation. 64 (1): 45–80. doi:10.1108/00220410810844150. hdl:11858/00-001M-0000-0013-7A94-3.
  10. ^ Anauati, Maria Victoria and Galiani, Sebastian and Galvez, Ramiro H., 경제 연구 분야에 걸친 학술 논문의 라이프 사이클 정량화(2014년 11월 11일).SSRN에서 입수 가능:https://ssrn.com/abstract=2523078
  11. ^ "The American Society for Information Science & Technology". The Information Society for the Information Age. Retrieved 2006-05-21.
  12. ^ 라우리, 폴 벤자민, 무디스, 그레고리 D, 개스킨, 제임스, 갈레타, 데니스 F.허퍼리스, 션, 바로우, 조던 B. 그리고 윌슨, 데이비드 W. (2013).참고 문헌측정을 통해 저널의 품질과 AIS(Association for Information Systems) 시니어 스콜라 저널 바스켓의 평가: 전문가 저널 평가가 가치를 더합니까?", MISQ(MISQ), 37(4), 993–1012.또한 이 논문의 유튜브 비디오 내러티브(https://www.youtube.com/watch?v=LZQIDkA-ke0)를 참조하십시오.
  13. ^ 딘, 더글러스 L, 라우리, 폴 벤자민, 험페리스, 션(2011).「미국의 기관에서의 정보 시스템 종신 교수 연구 생산성 프로필」, MISQ(MISQ), vol. 35(1), 페이지 1~15(ISSN 0276-7783).
  14. ^ Karuga, Gilbert G., Lowry, Paul Benjamin, 그리고 Richardson, Vernon J. (2007)."최고 정보 시스템 연구의 장기간의 영향 평가", Communications of the Association for Information Systems, vol. 19(7), 페이지 115–118 (http://aisel.aisnet.org/cais/vol19/iss1/7)
  15. ^ Liu, John S.; Lu, Louis Y.Y. (2012-03-01). "An integrated approach for main path analysis: Development of the Hirsch index as an example". Journal of the American Society for Information Science and Technology. 63 (3): 528–542. doi:10.1002/asi.21692. ISSN 1532-2890.
  16. ^ 로리, 폴 벤자민, 카루가, 길버트 G, 리처드슨, 버논 J. (2007)"최고의 정보 시스템 연구 저널의 주요 기관, 교수진기사 평가", Communications of the Association for Information Systems, vol. 20(16), 페이지 142–189(http://aisel.aisnet.org/cais/vol20/iss1/16))
  17. ^ Hamou-Lhadj, Abdelwahab; Hamdaqa, Mohammad (2009). "Citation Analysis: An Approach for Facilitating the Understanding and the Analysis of Regulatory Compliance Documents". 2009 Sixth International Conference on Information Technology: New Generations. pp. 278–283. doi:10.1109/ITNG.2009.161. ISBN 978-1-4244-3770-2. S2CID 10083351.
  18. ^ Mohamad Hamdaa와 A.Hamou-Lhadj, "인용 분석:미국 라스베이거스에서 열린 제6회 정보기술 국제회의의 '규제 컴플라이언스 문서의 이해와 분석을 촉진하기 위한 접근법'
  19. ^ a b "E-Discovery Special Report: The Rising Tide of Nonlinear Review". Hudson Legal. Archived from the original on 3 July 2012. Retrieved 1 July 2012. 캣 케이시와 알레한드라 페레즈
  20. ^ a b "What Technology-Assisted Electronic Discovery Teaches Us About The Role Of Humans In Technology - Re-Humanizing Technology-Assisted Review". Forbes. Retrieved 1 July 2012.
  21. ^ "Dialog, A Thomson Business". Dialog invented online information services. Retrieved 2006-05-21.
  22. ^ http://www.garfield.library.upenn.edu/rgarner.pdf[베어 URL PDF]
  23. ^ Eugene Garfield; A. I. Pudovkin; V. S. Istomin (2002). "Algorithmic Citation-Linked Historiography—Mapping the Literature of Science". Presented the ASIS&T 2002: Information, Connections and Community. 65th Annual Meeting of ASIST in Philadelphia, PA. November 18–21, 2002. Retrieved 2006-05-21.
  24. ^ C.L. Giles, K. Bollacker, S. Lawrence, "CiteSeer: 자동 인용 색인 시스템", DL'98 디지털 라이브러리, 제3회 디지털 라이브러리 컨퍼런스, 페이지 89-98, 1998.
  25. ^ Postellon DC (March 2008). "Hall and Keynes join Arbor in the citation indexes". Nature. 452 (7185): 282. Bibcode:2008Natur.452..282P. doi:10.1038/452282b. PMID 18354457.
  26. ^ Garfield, E. (1955). "Citation Indexes for Science: A New Dimension in Documentation through Association of Ideas". Science. 122 (3159): 108–111. Bibcode:1955Sci...122..108G. doi:10.1126/science.122.3159.108. PMID 14385826.
  27. ^ Garfield, E. (1973). "Citation Frequency as a Measure of Research Activity and Performance" (PDF). Essays of an Information Scientist. 1: 406–408.
  28. ^ Garfield, E. (1988). "Can Researchers Bank on Citation Analysis?" (PDF). Essays of an Information Scientist. 11: 354.
  29. ^ Garfield, E. (1998). "The use of journal impact factors and citation analysis in the evaluation of science". 41st Annual Meeting of the Council of Biology Editors.
  30. ^ Moed, Henk F. (2005). Citation Analysis in Research Evaluation. Springer. ISBN 978-1-4020-3713-9.
  31. ^ 레이데스도르프, L. 및 밀로예비치, S. (2012).사이언트메트릭스.arXiv 프리프린트 arXiv : 1208.4566.
  32. ^ Harnad, S. (2009년)Scientometrics 및 UK Research Assessment Exchance에 오픈 액세스합니다.사이언트메트릭스, 79(1), 147-156
  33. ^ Hamdaqa, M.; A Hamou-Lhadj (2009). "Citation Analysis: An Approach for Facilitating the Understanding and the Analysis of Regulatory Compliance Documents". 2009 Sixth International Conference on Information Technology: New Generations. 2009 Sixth International Conference on Information Technology: New Generations. Las Vegas, NV: IEEE. pp. 278–283. doi:10.1109/ITNG.2009.161. ISBN 978-1-4244-3770-2. S2CID 10083351.
  34. ^ 자오, 리사.「사서의 전자 자원 사용법--CCQ에서의 인용 분석」42 (1)(2006)의 분류와 분류: 117-131.
  35. ^ 로렌스, 스티브온라인에서 무료로 이용할 수 있게 되면 논문의 영향이 크게 증가합니다.네이처 제411권 (6837호) (2001) : 521.온라인(http://citeseer.ist.psu.edu/online-nature01/)도 이용하실 수 있습니다.
  36. ^ Gálvez RH (March 2017). "Assessing author self-citation as a mechanism of relevant knowledge diffusion". Scientometrics. 111 (3): 1801–1812. doi:10.1007/s11192-017-2330-1. S2CID 6863843.
  37. ^ Singh Chawla, Dalmeet (5 July 2016). "Men cite themselves more than women do". Nature. 535 (7611): 212. doi:10.1038/nature.2016.20176. PMID 27414239. S2CID 4395779.
  38. ^ Van Der Walt, Wynand; Willems, Kris; Friedrich, Wernher; Hatsu, Sylvester; Kirstin, Krauss (2020). "Retracted Covid-19 papers and the levels of 'citation pollution': A preliminary analysis and directions for further research". Cahiers de la Documentation - Bladen voor Documentatie. 3 (4). hdl:10962/167732. Retrieved 13 January 2021.