시멘틱 스콜라

Semantic Scholar
시멘틱 스콜라
Semantic Scholar logo.svg
사이트 유형
검색 엔진
작성자앨런 인공지능연구소
URLsemanticscholar.org
개시.2015년 11월(2015-11)

시맨틱 스콜라는 앨런 AI연구소에서 개발되어 2015년 [1]11월에 공개된 학술 출판물용 인공지능 기반 검색 엔진입니다.자연어 처리의 진보를 이용하여 학술 [2]논문의 요약을 제공합니다.시맨틱 스콜라 팀은 자연어 처리, 기계학습, 인간-컴퓨터 상호작용,[3] 정보검색 에서 인공지능의 활용을 적극적으로 연구하고 있다.

시맨틱 스콜라는 컴퓨터 과학, 지구 과학, 신경 [4]과학에 관한 주제를 둘러싼 데이터베이스로 시작되었다.그러나 2017년에 이 시스템은 [4]말뭉치에 생물의학 문헌을 포함하기 시작했다.2021년 11월 현재, 그것들은 모든 과학 분야의 출판물을 포함하고 있다.

테크놀로지

Semantic Scholar는 과학 문헌의 한 문장 요약을 제공합니다.그 목적 중 하나는 모바일 [5]기기에서 수많은 제목과 장황한 요약문을 읽는 과제를 해결하는 것이었습니다.또한 매년 발행되는 300만 편의 과학논문이 독자들에게 전달될 수 있도록 하기 위해 노력하고 있다. 왜냐하면 이 문헌의 절반만이 [6]읽혀지는 것으로 추정되기 때문이다.

인공지능은 논문의 본질을 포착하기 위해 사용되며, "추상적" [2]기술을 통해 그것을 생성한다.이 프로젝트는 기계 학습, 자연 언어 처리기계 비전의 조합을 사용하여 기존의 인용 분석 방법에 의미 분석 계층을 추가하고 논문으로부터 관련 그림,[7][8] 표, 실체 및 장소를 추출합니다.

Google Scholar PubMed와 대조적으로, Semantic Scholar는 [9]논문의 가장 중요하고 영향력 있는 요소를 강조하도록 설계되었습니다.AI 기술은 연구 [10]주제 간의 숨겨진 연결고리와 연결고리를 식별하기 위해 고안되었다.앞서 인용한 검색 엔진과 마찬가지로, 시멘틱 스콜라는 마이크로소프트 학술 지식 그래프, 스프링거 네이처의 SciGraph 및 시멘틱 스콜라 [11]코퍼스를 포함한 그래프 구조를 이용합니다.

Semantic Scholar가 주최하는 각 논문은 Semantic Scholar Corpus ID(약칭 S2CID)라고 불리는 고유한 식별자가 할당됩니다.다음으로 예를 제시하겠습니다.

Liu, Ying; Gayle, Albert A; Wilder-Smith, Annelies; Rocklöv, Joacim (March 2020). "The reproductive number of COVID-19 is higher compared to SARS coronavirus". Journal of Travel Medicine. 27 (2). doi:10.1093/jtm/taaa021. PMID 32052846. S2CID 211099356.

Semantic Scholar는 무료로 사용할 수 있으며 유사한 검색 엔진(: Google Scholar)과 달리 유료 [12][4]벽 뒤에 있는 자료를 검색하지 않습니다.

한 연구에서는 체계적인 접근을 통해 시맨틱 스콜라의 검색 능력을 비교한 결과,[12] 데이터를 알아내려고 할 때 검색 엔진의 정확도가 98.88%로 나타났습니다.동일한 연구는 메타데이터를 조사하기 위한 도구와 여러 인용 [12]도구를 포함한 다른 시맨틱 스콜라 기능을 조사했다.

사용자 및 출판물의 수

2018년 1월 현재, 생물 의학 논문과 주제 요약을 추가한 2017년 프로젝트에 이어, 시맨틱 스콜라 말뭉치에는 컴퓨터 과학 및 생물 [13]의학 분야의 4,000만 개 이상의 논문이 포함되었다.2018년 3월에는 Amazon Alexa 플랫폼용 머신 러닝 이니셔티브를 개발한 Doug Raymond가 시멘틱 스콜라 프로젝트를 [14]이끌도록 고용되었습니다.Microsoft Academic Graph [16]레코드가 추가된 이후 2019년 8월 현재 포함된 논문 메타데이터(실제 PDF가 아님)의 수는 1억7300만[15] 개 이상으로 증가했다.2020년에는 시맨틱 스콜라와 시카고 대학 프레스 저널의 파트너십을 통해 시카고 대학 프레스에서 발행된 모든 기사를 시맨틱 스콜라 [17]코퍼스에서 이용할 수 있게 되었다.2020년 말 시맨틱 스콜라는 1억 9천만 개의 [18]논문을 색인화했다.

2020년에 시멘틱 스콜라 사용자는 [5]월 700만 명에 달했다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ Eunjung Cha, Ariana (3 November 2015). "Paul Allen's AI research group unveils program that aims to shake up how we search scientific knowledge. Give it a try". The Washington Post. Archived from the original on 6 November 2019. Retrieved November 3, 2015.
  2. ^ a b Hao, Karen (November 18, 2020). "An AI helps you summarize the latest in AI". MIT Technology Review. Retrieved 2021-02-16.
  3. ^ "Semantic Scholar Research". research.semanticscholar.org. Retrieved 2021-11-22.
  4. ^ a b c Fricke, Suzanne (2018-01-12). "Semantic Scholar". Journal of the Medical Library Association. 106 (1): 145–147. doi:10.5195/jmla.2018.280. ISSN 1558-9439. S2CID 45802944.
  5. ^ a b Grad, Peter (November 24, 2020). "AI tool summarizes lengthy papers in a sentence". Tech Xplore. Retrieved 2021-02-16.
  6. ^ "Allen Institute's Semantic Scholar now searches across 175 million academic papers". VentureBeat. 2019-10-23. Retrieved 2021-02-16.
  7. ^ Bohannon, John (11 November 2016). "A computer program just ranked the most influential brain scientists of the modern era". Science. doi:10.1126/science.aal0371. Archived from the original on 29 April 2020. Retrieved 12 November 2016.
  8. ^ Christopher Clark; Santosh Divvala (2016). PDFFigures 2.0: Mining figures from research papers. Proceedings of the 16th ACM/IEEE-CS Joint Conference on Digital Libraries. ISBN 978-1-4503-4229-2. Wikidata Q108172042.
  9. ^ "Semantic Scholar". International Journal of Language and Literary Studies. Retrieved 2021-11-09.
  10. ^ Baykoucheva, Svetla (2021). Driving Science Information Discovery in the Digital Age. Chandos Publishing. p. 91. ISBN 978-0-12-823724-3.
  11. ^ Jose, Joemon M.; Yilmaz, Emine; Magalhães, João; Castells, Pablo; Ferro, Nicola; Silva, Mário J.; Martins, Flávio (2020). Advances in Information Retrieval: 42nd European Conference on IR Research, ECIR 2020, Lisbon, Portugal, April 14–17, 2020, Proceedings, Part I. Cham, Switzerland: Springer Nature. p. 254. ISBN 978-3-030-45438-8.
  12. ^ a b c Hannousse, Abdelhakim (2021). "Searching relevant papers for software engineering secondary studies: Semantic Scholar coverage and identification role". IET Software. 15 (1): 126–146. doi:10.1049/sfw2.12011. ISSN 1751-8814. S2CID 234053002.
  13. ^ "AI2 scales up Semantic Scholar search engine to encompass biomedical research". GeekWire. 2017-10-17. Archived from the original on 2018-01-19. Retrieved 2018-01-18.
  14. ^ "Tech Moves: Allen Instititue Hires Amazon Alexa Machine Learning Leader; Microsoft Chairman Takes on New Investor Role; and More". GeekWire. 2018-05-02. Archived from the original on 2018-05-10. Retrieved 2018-05-09.
  15. ^ "Semantic Scholar". Semantic Scholar. Archived from the original on 11 August 2019. Retrieved 11 August 2019.
  16. ^ "AI2 joins forces with Microsoft Research to upgrade search tools for scientific studies". GeekWire. 2018-12-05. Archived from the original on 2019-08-25. Retrieved 2019-08-25.
  17. ^ "The University of Chicago Press joins more than 500 publishers working with Semantic Scholar to improve search and discoverability". RCNi Company Limited. Retrieved 2021-11-22.
  18. ^ Dunn, Adriana (December 14, 2020). "Semantic Scholar Adds 25 Million Scientific Papers in 2020 Through New Publisher Partnerships" (PDF). Semantic Scholar. Retrieved November 22, 2021.

외부 링크