대상(프로젝트)

Target (project)
대상
위치네덜란드 그로닝언 대학교
확립된2009년 1월
자금조달유럽 지역 개발파트너 기금 지원
웹사이트rug.nl/target

대상은 네덜란드 북부의 빅데이터 처리 및 관리를 전문으로 하는 협업 연구 프로젝트의 명칭이다.[1]2009년 시작돼 정부 보조금으로 지원되는 민관협력이다.[2]그로닝겐대학이 주관하는 학술·컴퓨터 산업 협력사 10개 컨소시엄이 운영하며 천문학, 생명과학, 인공지능, 의료 진단 분야의 과학 프로젝트 데이터 관리를 연구한다.

Target 프로젝트에 협력하는 것은 Groningen 대학교, 의료 센터, IBM, Oracle, ATALASS, 네덜란드 IT 기업 Elkog/Hiii, Nspyre의 다양한 부서들이다.

타겟의 컴퓨터 센터는 그루닝언 대학의 컴퓨팅 센터인 정보 기술 센터(Center for Information Technology)가 주최하며, 유럽 그리드 인프라일부인 IBM의 GPFS 스토리지 기술,[5] 고성능 컴퓨팅 클러스터, 그리드 클러스터 등을 기반으로 10페타바이트 이상의 스토리지로[3][4] 구성되어 있다.

타겟 데이터 센터는 네덜란드 Groningen 대학에 위치한 Donald Smits Center for Information Technology가 주최한다.

역사

이 프로젝트는 천문학자들의 대규모 데이터 처리에 대한 전문 지식을 과학의 다른 분야로 이전하기 위해 시작되었다.대상 Astro-WISE.[6][7]Astro-WISE 그 자체가 OPTICON WideField영상 워킹 그룹의 연구 용이하도록 표준화된 유럽 조사 시스템을 고려하기 위해 구성된,로 시작되었지만 분산된 컴퓨팅 환경에 집을 지으면, 데이터 정리 및 데이터 마이닝 넓은 현장 조사의 새로운 세대로부터 데이터를 사용하다.왔다ras the Target 프로젝트는 2009년 유럽 지역 개발 기금, 네덜란드 경제부("피켄 인 델타" 프로젝트), 그리고 그로닝언과 덴테 지방으로부터 5년간 3200만 유로의[9] 자금을 지원받아 시작되었다.이 프로젝트는 네덜란드 북부 지방 연합(SNN)과 그로닝언 시의 후원으로 운영된다.

기술적 소견

프로젝트를 시작할 때 한 가지 목표는 수 페타바이트 규모의 파일 시스템과[10] 몇 가지 다른 유형의 그리드 및 컴퓨팅 클러스터로 구성된 단일 통합 처리 시스템을 개발하는 것이었다.[11]첫 해 동안 다양한 e-Science 분야에 대한 요구사항이 다르다는 것이 명백해졌다.일부 지역에서는 Lofar와 마찬가지로 대규모 데이터 스트리밍 작업이 이루어진다.천문학에서 데이터 개체의 수는 데이터 열의 수가 제한되어 수십억 개에서 실행될 수 있다.[12]유전체학에서는 행의 수는 적지만 열 수는 수십만 개로 엄청날 수 있다.역사 원고를 찾기 위한 몽크 검색 엔진의 시각적 문자 검색과 같은 다른 영역은 수억 줄, 수천 차원이 넘는 중간 위치에 있다.더욱이 유전체학 애플리케이션은 엄격한 접근 통제가 필요한 경우가 많지만,[13] 다른 분야에서는 사생활 문제가 없다.결과적으로, 타겟 내의 다양한 하위 프로젝트는 WISE 기술의 측면과 타겟 하드웨어 인프라의 구성요소가 그 분야에 적용 가능한 실용적인 접근방식을 채택하였다.

프로젝트

타겟은 천문학, 빅데이터 시각화(암스테르담의 eScience Center와의 협업),[14] 손글씨 인식 알고리즘, 건강한 노화에 대한 의학 연구, 파킨슨병 진단 도구 개발 등 다양한 데이터 집약적 과학 프로젝트에 참여한다.

LOFAR 장기 보관소

타겟은 LOFAR 장기 보관소를 개발하고 유지 관리한다.

LOFAR 망원경의 많은 데이터는 우주비행사와 타겟이 설계한 LOFAR 장기 보관소에 저장, 액세스 및 보관된다.[15][16][17]데이터는 타겟 데이터 센터와 몇몇 다른 유럽 센터에서 호스팅될 것이다.

몽크

몽크에 의해 그로닝겐이라는 단어가 발견된 네덜란드 여왕의 내각 보관소(KdK)의 한 페이지의 스크린샷.

몽크(Monk)는 쇼메이커와 그로닝언 대학 인공지능연구소(ALICE) 소속 그룹이 개발한 시스템이다.다양한 기존 아카이브에서 패턴 인식과 머신러닝 알고리즘을 사용해 손으로 직접 텍스트 인식을 한다.[18][19][20]현재 네덜란드 국립문서보관소(National Archives)의 많은 책들과 서양, 중세, 수기 중국 필사본에 이르는 70여 권의 국제 역사 소장품이 몽크에 흡수되었다.이 시스템은 인터넷을 통해 지속적인 ('24/7') 머신러닝을 적용하여 근본적인 결과를 도출한다.[vague][21]MOSK 시스템은 Target의 계산 및 저장 리소스를 사용한다.그것은 최근에 교수가 이끄는 협동의 일부가 되었다.그로닝겐 대학 신학과 종교학부의 포포비치는 탄소 연대 측정, 고생술, 텍스트/이미지 인식 기술을 결합하여 인기 있는 사해 두루마리 원고의 저자들을 정확히 찾아낼 것이다.[22]

라이프라인

라이프라인(LifeLines)은 대학의료원 그루닝엔(UMCG)이 운영하는 장기 의료 연구 프로젝트다.유전자형과 표현형 데이터는 총 30년 동안 5년에 한 번 165,000명으로부터 수집될 것이다.축적된 데이터는 연구자와 의료전문가가 노화와 관련된 과정에 대한 통찰력을 얻고 나이와 관련된 건강 악화가 왜 그렇게 큰 차이를 보이는지 이해하기 위해 사용할 것이다.[23]Target은 데이터 스토리지, 액세스 및 처리를 위한 인프라를 LifeLine에 제공한다.UMCG, LUMC, Erasmus MC, UMCU, UMCU, 암스테르담 자유대학의 컨소시엄이 운영하는 네덜란드의 게놈 프로젝트에는 LifeLines, SOUPsara, Target 인프라뿐만 아니라 SUPsara의 데이터가 사용되었다.네덜란드 인구의 인구구조와 인구이력을 추론하기 위해 전유전자 염기서열을 이용한 프로젝트 결과가 6월 네이처 제네틱스 저널에 실렸다.[24][25]

글림스

K가 운영한다.GILLPS는 파킨슨병에 대한 보다 빠르고 신뢰할 수 있는 진단 도구를 찾기 위해 마련된 연구 프로젝트다.[26]GLYPS는 파킨슨병을 조기에 발견하기 위해 복잡한 영상 기반 알고리즘과 PET 스캔을 사용할 수 있는 가능성을 탐구한다.[citation needed]GLYPS는 이러한 알고리즘의 효과를 테스트하기 위해 네덜란드의 수많은 병원들이 제공하는 대규모 PET 스캔 데이터베이스를 구축하고 있다.타겟은 GLYPS 데이터베이스를 구축하고 유지관리하는 것은 물론, 컴퓨팅 시설에서 이미지 기반 알고리즘의 원활한 실행을 보장하는 역할을 담당한다.

다른이들

또한 타겟은 오메가CAM을 이용한 KiDs/VIKING 천문학 조사[27][28],[29][30] ESO의 MUSE[31] 기기(초대형 망원경에 장착됨), MICADO(E-ELT에 장착됨)와 같은 기타 천문학적 프로젝트의 데이터 관리에 관여한다.또한 타겟에 의해 촉발된 데이터 관리에 대한 데이터 센터 접근방식은 ESA유클리드 임무에 의해 채택되었다.[32]프로젝트의 스핀오프 회사인 타겟 홀딩 B.V.도 네덜란드 북부의 민간 사업자와 함께 다수의 상업 프로젝트를 관리하고 있다.[33]

공공 홍보와 교육 또한 프로젝트 소관의 일부분이며 타겟은 많은 공공 행사를 조직했다.[34]Infoversum 3D Theatre는[35][36] Target 프로젝트의 스핀오프로서 대형 그룹을 위한 과학 데이터의 시각화 및 설명을 위한 시설을 제공한다.

참조

  1. ^ "Nederlands project kan 1,5 petabytes verwerken en opslaan" [Netherlands Project can process and save 1.5 petabytes]. nu.nl (in Dutch). 2 September 2010.
  2. ^ Edelman, Pieter (June 2, 2009). "Miljoenensubsidie voor Noord-Nederlands dataminingprogramma" [Millions in subsidy for North Netherlands datamining program]. Bits & Chips.
  3. ^ Witold, Kepinski (19 November 2010). "Gronings ICT-project klaar voor petabytes data" [Groningen ICT project ready for petabytes of data]. Computable (in Dutch).
  4. ^ Huisman, Zander (27 May 2011). "Aprycus breidt capaciteit Target-project uit" [Aprycus increases the capacity of the Target project]. Computable (in Dutch).
  5. ^ IBM Case Studies, Showcasing IBM client stories. "University of Groningen breaks new ground in scientific research". www-03.ibm.com/software/businesscasestudies/us/en/corp?OpenDocument&Site=corp&cty=en_us.
  6. ^ Begeman, Kor; A.N.Belikov; D.R. Boxhoorn; E.A.Valentijn (January 2013). "The Astro-WISE data centric information system". Experimental Astronomy. 35 (1–2): 1. arXiv:1208.0447. Bibcode:2013ExA....35....1B. doi:10.1007/s10686-012-9311-4. S2CID 118620001.
  7. ^ Mwebaze, Johnson (2012). Extreme Data Lineage in Ad-hoc Astronomical Data Processing (PhD). University of Groningen. ISBN 9789036757591.
  8. ^ Gilmore, Gerald (January 2001). "OPTICON: EC Optical Infrared Coordination Network for Astronomy". Organizations and Strategies in Astronomy. Astrophysics and Space Science Library. 2: 83–102. arXiv:astro-ph/0105562. Bibcode:2001ASSL..266...83G. doi:10.1007/978-94-010-0666-8_6. ISBN 978-0-7923-7172-4. S2CID 34032027.
  9. ^ Edelman, Peter (20 July 2009). "Miljoenensubsidie voor Noord Nederland Dataminingprogram" [Millioans of subsidy for North Netherlands Datamining Programme]. Bits and Chips (in Dutch). p. 45.
  10. ^ Jain, R; Sarkar, P.; Subhraveti, D. (2013), "GPFS-SNC: An enterprise cluster file system for Big Data", IBM Journal of Research and Development, 57 (3/4): 5:1, 5:10, doi:10.1147/JRD.2013.2243531
  11. ^ Begeman, Kor; Begeman, K. G.; Belikov, A. N.; Boxhoorn, D. R.; Dijkstra, F.; Valentijn, E. A.; Vriend, W. J.; Zhao, Z. (2010), "Merging grid technologies", Journal of Grid Computing, 8 (2): 199–221, doi:10.1007/s10723-010-9147-y
  12. ^ Luri, X.; Palmer, M.; Arenou, F.; Masana, E.; De Bruijne, J.; Antiche, E.; Babusiaux, C.; Borrachero, R.; Sartoretti, P.; Julbe, F.; Isasi, Y.; Martinez, O.; Robin, A. C.; Reylé, C.; Jordi, C.; Carrasco, J. M. (2014). "Overview and stellar statistics of the expected Gaia Catalogue using the Gaia Object Generator". Astronomy & Astrophysics. 566: A119. arXiv:1404.5861. Bibcode:2014A&A...566A.119L. doi:10.1051/0004-6361/201423636. S2CID 119233012.
  13. ^ Malin, B.; Loukides, G.; Benitez, K.; Clayton, E. W. (2011). "Identifiability in biobanks: Models, measures, and mitigation strategies". Human Genetics. 130 (3): 383–392. doi:10.1007/s00439-011-1042-5. PMC 3621020. PMID 21739176.
  14. ^ "eScience Center Projects". esciencecenter.nl.
  15. ^ Belikov, A.N; Begeman, K.; Boxhoorn, D.R.; Dijkstra, F.; Holties, H.; Meyer-Zhao, Z.; Renting, G.A.; Valentijn, E.A.; Vriend, W-J. (2011). "LOFAR information system". Proc. Of ADASS XXI, ASP Conf. Series. arXiv:1111.6443. Bibcode:2012ASPC..461..693B.
  16. ^ Begeman, K.; Boxhoorn, D.; Dijkstra, F.; Holties, H.A.; Vriend, W.-J (2011). "Target for LOFAR Long Term Archive: Architecture and Implementation". Future Generation Computer Systems. 27 (3): 319–328. doi:10.1016/j.future.2010.08.010.
  17. ^ Holties, H.A; van Diepen, G.; et al. (2012). "Data Analysis in the LOFAR Long Term Archive". ASP Conference Series. 461, Astronomical Data Analysis Software and Systems XXI: 536. Bibcode:2012ASPC..461..635H.
  18. ^ van der Zant, T; Schomaker, L.R.B.; Zinger, S.; van Schie, H. (2009). "Where are the Search Engines for Handwritten Documents?". Interdisciplinary Science Reviews. 34 (2–3): 224–235. doi:10.1179/174327909X441126. S2CID 57037481.
  19. ^ van der Zant, T; Schomaker, L.R.B.; Valentijn, E.; B.A. Yanikoglu; K. Berkner (January 28, 2008). Yanikoglu, Berrin A; Berkner, Kathrin (eds.). "Large-scale parallel document-image processing". Proceedings of Document Recognition and Retrieval XV, IS&T/SPIE International Symposium on Electronic Imaging. Document Recognition and Retrieval XV. 6815: 68150N. Bibcode:2008SPIE.6815E..0SV. doi:10.1117/12.765482. S2CID 40083465.
  20. ^ Schomaker, L.R.B.; B.A. Yanikoglu; K. Berkner (January 28, 2008). "Word mining in a sparsely-labeled handwritten collection". Proceedings of Document Recognition and Retrieval XV, IS&T/SPIE International Symposium on Electronic Imaging. 6815: 6815–6823. Bibcode:2008SPIE.6815E..0NS. doi:10.1117/12.766329. S2CID 15863576.van der Zant, T; Schomaker, L.R.B.; Haak, K. (2008). "Handwritten-word spotting using biologically inspired features". IEEE Transactions on Pattern Analysis and Machine Intelligence. 30 (11): 1945–1957. doi:10.1109/tpami.2008.144. PMID 18787243. S2CID 18702898.
  21. ^ van Oosten, J.-P.; Schomaker, L.R.B. (2014). "Separability versus Prototypicality in Handwritten Word-Image Retrieval" (PDF). Pattern Recognition. 47 (3): 1031–1038. doi:10.1016/j.patcog.2013.09.006. hdl:11370/ca3dd93d-fbd9-4ae3-bfac-90bb148ea1dd.
  22. ^ RUG News. "Prestigious ERC Starting Grant for Mladen Popović". Rijksuniversiteit Groningen. Retrieved 19 January 2015.
  23. ^ Stolk, Ronald P; Rosmalen JG; Postma DS; de Boer RA; Navis G; Slaets JP; Ormel J; Wolffenbuttel BH (January 2008). "Universal risk factors for multifactorial diseases: LifeLines: a three-generation population-based study". European Journal of Epidemiology. 23 (1): 67–74. doi:10.1007/s10654-007-9204-4. PMID 18075776.
  24. ^ Francioli, Laurent; Menelaou, Androniki; et al. (29 June 2014). "Whole-genome sequence variation, population structure and demographic history of the Dutch population". Nature Genetics. 46 (8): 818–825. doi:10.1038/ng.3021. PMID 24974849. S2CID 14316238.
  25. ^ van Wijngaarden, Arend (June 30, 2014). "Genoom Nederlandse volk ontrafeld". Dagblad van het Noorden. {{cite news}}:외부 링크 위치 ref=(도움말)
  26. ^ Teune, Laura Klaaske (2013). Glucose metabolic patterns in neurodegenerative brain diseases. PhD Dissertation.
  27. ^ Jong, J.T.; J.T. de Jong; G.A.V. Kleijn; K.H. Kuijken; E.A. Valentijn (2013). "The kilo-degree survey". Experimental Astronomy. 35 (1–2): 25–44. arXiv:1206.1254. Bibcode:2013ExA....35...25D. doi:10.1007/s10686-012-9306-1. S2CID 3082399.
  28. ^ Netherlands, Research School for Astronomy (NOVA). "NOVA Annual Report 2011-2011-2012" (PDF). nova-astronomy. NOVA.
  29. ^ Schilling, Govert (8 June 2011). "Direct succes met supercamera" [Immediate success with super camera]. De Volkskrant (in Dutch).
  30. ^ "Superscherpe hemelfotos vanaf Chileense berg" [Super sharp photos of the heavens from Chilean mountain]. NRC Handelsblad (in Dutch). 9 June 2011.
  31. ^ Weilbacher, Peter; Peter M. Weilbacher; Ole Streicher; Tanya Urrutia; Aurélien Jarno; Arlette Pécontal-Rousset; Roland Bacon; Petra Böhm (September 2012). Radziwill, Nicole M; Chiozzi, Gianluca (eds.). "Design and capabilities of the MUSE data reduction software and pipeline". Proc. SPIE. Software and Cyberinfrastructure for Astronomy II. 8451: 84510B. Bibcode:2012SPIE.8451E..0BW. doi:10.1117/12.925114. S2CID 120263291.
  32. ^ Pasian, Fabio; Fabio Pasian; John Hoar; Marc Sauvage; Christophe Dabin; Maurice Poncet; Oriana Mansutti (September 2012). Radziwill, Nicole M; Chiozzi, Gianluca (eds.). "Science ground segment for the ESA Euclid Mission". Proc. SPIE. Software and Cyberinfrastructure for Astronomy II. 8451: 845104. Bibcode:2012SPIE.8451E..04P. doi:10.1117/12.926026. S2CID 123008296.
  33. ^ Huisman, Zander (31 January 2013). "Target-project levert vier nieuwe bedrijven op" [Target project delivers four new companies]. Computable (in Dutch).
  34. ^ Wind, Maike (12 May 2014). "Rapportage Big Data: De man met één been en vijf kinderen" [Big Data Report: The man with one leg and five children]. Dagblad van het Noorden (in Dutch). p. 2.
  35. ^ Wind, Maike (19 June 2014). "Theater Infoversum open voor publiek" [Infoversum Theatre Opens to the public]. Groninger Gezinsbode (in Dutch). p. 19.
  36. ^ "Infoversum". De Telegraaf (in Dutch). 4 July 2014.