아넷마이너

Arnetminer

ArnetMiner(역시 AMiner)는 빅데이터를 색인화, 검색, 채굴하는 데 사용되는 무료 온라인 서비스다.

개요

아넷마이너(AMINer)는 소셜 네트워크 분석을 통해 연구자, 회의, 출판물 간의 연관성을 파악하는 등 인터넷상학술 출판물에 대한 데이터 마이닝 작업을 검색·실행할 수 있도록 설계됐다.[1]이를 통해 전문가 발굴, 지리적 검색, 추세 분석, 검토자 추천, 연관검색, 과정검색, 학업성취도평가, 주제모델링 등의 서비스를 제공할 수 있다.

ArnetMiner는 사회영향분석, 사회관계망순위, 사회관계망추출 등의 연구과제로 만들어졌다.이 시스템의 개발로 인해 많은 동료 검토 논문들이 발표되었다.3년 이상 운영돼 1억3000만 명의 연구원과 2억6500만 건 이상의 출판물을 지수화했다.[2]이 연구는 중국 국가 하이테크 R&D 프로그램과 중국 국가과학 재단의 자금 지원을 받았다.

ArnetMiner는 일반적으로 학계에서 연구자와 연구자 사이의 관계를 파악하고 통계적 상관관계를 도출하기 위해 사용된다.220개국과 지역에서 1000만 건 이상의 독립 IP 접속을 유치했다.이 제품은 엘스비에의 SciPass 플랫폼과 [3]SIGKDD, ICDM, PKDD, WSDM 등 학술회의 등에서 활용돼 왔다.

작전

ArnetMiner는 자동으로 웹에서 연구자 프로파일을 추출한다.그것은 관련 페이지를 수집하고 식별한 다음, 통일된 접근방식을 사용하여 식별된 문서에서 데이터를 추출한다.또한 휴리스틱스 규칙을 이용하여 온라인 디지털 도서관에서 출판물을 추출한다.

추출한 연구자의 프로필과 추출한 출판물을 통합한다.그것은 연구자 이름을 식별자로 사용한다.통합에서 이름 모호성 문제를 다루기 위해 확률론적 프레임워크가 제안되었다.통합 데이터는 연구자 네트워크 지식 기반(RNKB)에 저장된다.

이 지역의 다른 주요 제품으로는 구글 스콜라, 엘스비에의 스쿠로스, 오픈소스 프로젝트인 CiteSeer 등이 있다.

역사

중국 칭화대 제탕 교수가 창안하고 만들었다.그것은 2006년 3월에 처음 발사되었다.다음은 지난 몇 년 동안의 업데이트 목록을 제공한다.

  • 2006년 3월 버전 0.1 기능에는 연구자 프로파일링, 전문가 검색, 회의 검색, 출판 검색 등이 포함된다.이 시스템은 Perl에서 개발되었다.
  • 2006년 8월 버전 1.0 시스템이 자바에서 다시 구현되었다.
  • 2007년 7월 버전 2.0, 새로운 기능에는 연구자 이익 채굴, 연관성 검색, 설문지 소견(현재 이용 불가)이 포함된다.
  • 2008년 4월 버전 3.0, 새로운 기능에는 쿼리 이해, 새로운 GUI 및 검색 로그 분석이 포함된다.
  • 2008년 11월 버전 4.0, 새로운 기능에는 그래프 검색, 주제 모델링, NSF/NSFC 자금 지원 정보 추출이 포함된다.
  • 2009년 4월 버전 5.0, 새로운 기능에는 Profile Edition, 개방형 API 서비스, Bole 검색, 과정 검색(지금 사용할 수 없음)이 포함된다.
  • 2009년 12월 버전 6.0, 새로운 기능에는 학업 성과 평가, 사용자 피드백, 회의 분석 등이 포함된다.
  • 2010년 5월 버전 7.0, 새로운 기능에는 이름 설명, 문서 검토자 권장사항, ArnetPage 생성 등이 포함된다.
  • 2012년 3월, AMiner로 개명한 버전 II는 모든 코드를 다시 작성하고 GUI를 재설계했다.새로운 기능: 지리적 검색, ArnetAPP 플랫폼.
  • 2014년 6월 AMiner로 이름이 바뀐 버전 II는 모든 코드를 다시 작성하고 GUI를 재설계했다.새로운 기능: 지리적 검색, ArnetAPP 플랫폼.
  • 2015년 12월, 완전히 새로운 버전이 온라인에 올랐다.
  • 2017년 5월, 프로페셔널 버전이 온라인에 올랐다.
  • 2018년 4월, 새로운 기능으로는 딥러닝 기반 [4]Name Discambigation인[5] Trend Analysis가 있다.

자원.

ArnetMiner는 Open Academic Graph,[6] DBLP+citation[7](Digital Bibliography & Library Project의 DBLP 데이터 인용 증대를 위한 데이터 세트), Name Disambigation,[8] Social Tie Analysis 등 학술 연구 목적으로 여러 데이터셋을 발표했다.[9]더 많은 사용 가능한 데이터셋 및 연구에 대한 소스 코드는 다음을 참조하십시오.[10]

참고 항목

참조

  1. ^ Jie Tang; Jing Zhang; Limin Yao; Juanzi Li; Li Zhang; Zhong Su (2008). "ArnetMiner: extraction and mining of academic social networks". Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM.
  2. ^ "Arnetminer: introduction". Retrieved 17 Dec 2020.
  3. ^ "SciVerse - HUB - Home". Archived from the original on 9 September 2012. Retrieved 24 April 2012.
  4. ^ "Trend Analysis". Retrieved 24 December 2018.
  5. ^ Yutao Zhang; Fanjin Zhang; Peiran Yao; Jie Tang (2018). "Name Disambiguation in AMiner: Clustering, Maintenance, and Human in the Loop". Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. London: ACM.
  6. ^ "Open Academic Graph". Retrieved 24 December 2018.
  7. ^ "DBLP Papers + Citation Relationship". Retrieved 24 December 2018.
  8. ^ "Name Disambiguation". Retrieved 24 April 2012.
  9. ^ "Inferring Social Ties in Large Networks". Retrieved 24 April 2012.
  10. ^ "Open Data and Codes by ArnetMiner". Retrieved 24 April 2012.

외부 링크

추가 읽기

  • 당, 징 장, 리민 야오, 후안지 리, 리장, 중수.Arnetminer: 학술적 소셜 네트워크의 추출과 채굴.제14회 ACM SIGKDD 국제 지식 검색 및 데이터 마이닝 회의(SIGKDD'2008)의 진행 중
  • 치왕, 자웨이 한, 옌타오 지아, 지탕, 듀오 장, 윤타오 유, 징이궈.마이닝 어드바이저-연구 출판 네트워크의 관계 개선.제16차 ACM SIGKDD 국제 지식 검색 및 데이터 마이닝 회의(SIGKDD'2010)의 진행.
  • , 지몽선, 치왕, 지양.대규모 네트워크에서의 사회적 영향 분석.제15회 ACM SIGKDD 국제 지식 검색 및 데이터 마이닝 회의(SIGKDD'2009)에서.807-816 페이지
  • 지탕, 루오밍 진, 징장.주제 모델링 접근법과 학술적 검색을 위한 무작위 워크 프레임워크로의 통합.2008년 IEEE 국제 데이터 마이닝 회의(ICDM'2008)에서.1055-1060 페이지
  • , 리민 야오, 듀오 장, 징 장.웹 사용자 프로파일링에 대한 조합 접근 방식.ACM 데이터로부터의 지식 검색에 관한 거래 (TKDD), (vol. 5 no. 1), 제2조 (2010년 12월), 44페이지.
  • 유타오 장, 판진 장, 페이란 야오, 지탕.IMT2000 3GPP - AMiner의 이름 : 클러스터링, 유지보수, 루프에서의 휴먼24번째 ACM SIGKDD 국제 지식 검색 및 데이터 마이닝 회의(KDD'18). 페이지 1002-1011.