GDELT 프로젝트
GDELT Project야후와 조지타운 대학의 Kalev Leetaru가 Philip Schrodt와 함께 만든 GDELT Project 또는 Global Database of Events, Language, and Tone은 스스로를 "모든 개인, 조직, 조직을 연결하면서 전 세계에 걸쳐 인간의 사회적 규모의 행동과 신념 카탈로그를 구축하기 위한 이니셔티브"라고 표현하고 있습니다.세계 각지에서 일어나고 있는 일, 상황, 관련자, 그리고 세계가 어떻게 느끼고 있는지를 매일 [1][2][3]포착하는 하나의 거대한 네트워크로 만들어지고 있습니다."GDELT의 생성에 이르는 초기 탐사는 공동 창조자인 Philip Schrodt에 의해 2011년 [4]1월 컨퍼런스 논문에서 설명되었습니다.데이터 세트는 Google Cloud [5]Platform에서 사용할 수 있습니다.
데이터.
GDELT는 1979년부터 현재까지 데이터를 포함하고 있다.데이터는 Microsoft Excel [6]또는 유사한 스프레드시트 소프트웨어로 쉽게 가져올 수 있도록 CSV 확장자를 사용하여 탭으로 구분된 값 형식의 zip 파일로 사용할 수 있습니다.1979년부터 2005년까지의 데이터는 연간 1개의 zip 파일 형태로 제공되며, 1979년 14.3MB에서 2005년 125.9MB로 파일 크기가 점차 증가하여 뉴스 매체의 수와 사건 [7]기록의 빈도 및 포괄성을 반영하고 있다.2006년 1월부터 2013년 3월까지의 데이터 파일은 월 단위로 사용할 수 있으며 압축 파일 크기는 2006년 1월 11MB에서 2013년 3월 103.2MB로 증가했습니다.2013년 4월 1일 이후의 데이터 파일은 매일 세부적으로 제공됩니다.각 날짜의 데이터 파일은 다음날 오전 6시까지 제공됩니다.2014년 6월 현재 일일 압축 파일의 크기는 약 5~12MB입니다.[6][7]데이터 파일은 이벤트를 [8]기록하기 위해 Conflict and Mediation Event Observations(CAMEO; 충돌 및 중재 이벤트 관찰) 코드를 사용합니다.
포린폴리시 블로그 투고에서 공동창작자 Kalev Leetaru는 GDELT 데이터를 사용하여 시위에 관련된 총 사건 건수의 비율을 시간 추세가 연구된 [9]시위 강도의 척도로 사용하여 전 세계적으로 시위를 촉발했는지에 대한 질문에 답하려고 시도했다.정치학자이자 데이터 과학/예측 전문가인 Jay Ulfelder는 개인 블로그에서 Leetaru의 정상화 방법이 언론 [10]보도의 성격과 구성의 변화를 적절하게 설명하지 못했을 수 있다고 말했다.
데이터 세트는 Google Cloud Platform에서도 사용할 수 있으며 Google [5]BigQuery를 사용하여 액세스할 수 있습니다.
접수처
학술적 리셉션
GDELT는 (Wikipedia 및 Straits Times [11]Index와 함께) 싱가포르 뉴스의 시각적 및 예측적 분석 연구 및 정치적 [12]갈등 연구와 같은 많은 학술 연구에서 인용되고 사용되어 왔다.
2014년 SBP(International Social Computing, Behavioral Modeling and Prediction Conference)의 도전 문제는 참가자들에게 GDELT를 탐색하여 소셜 네트워크, 행동 및 [13]예측 분석에 적용할 것을 요청했습니다.
블로그 및 미디어에서의 수신
GDELT는 데이터혁신센터[14] 웹사이트와 GIS [15]라운지에서 다루어졌습니다.그것은 또한 정치 폭력과 위기 [10][16][17]예측에 대해 블로그에서 논의되고 비판되었다.이 데이터 세트는 시리아,[19] 아랍의 [9][20]봄,[21] 나이지리아에서의 정치적 사건에 대한 논의를 포함하여 포린 [2][18]폴리시에서 반복적으로 인용되고 비판되고 있다.그것은 또한 [22]뉴사이언티스트, 파이브서티에이트 웹사이트[23], 앤드류 설리번 [24]블로그에 인용되었다.
예측 휴리스틱스 블로그 및 기타 블로그에서는 GDELT와 ICEWS([25][26]Integrated Conflict Early Warning System)를 비교하고 있습니다.Alex Hanna는 손으로 코딩한 데이터로 GDELT를 평가한 실험에 대해 블로그를 통해 Dynamics of Collective Action 데이터 [27]세트와 비교했습니다.
2014년 5월 Google Cloud Platform 블로그는 전체 GDELT 데이터 세트를 Google BigQuery에서 [5]공개 데이터 세트로 사용할 수 있다고 발표했습니다.
「 」를 참조해 주세요.
레퍼런스
- ^ "About GDELT: The Global Database of Events, Language, and Tone". Retrieved June 2, 2014.
- ^ a b "Mapped: Every Protest on the Planet Since 1979". Foreign Policy. Retrieved June 2, 2014.
- ^ "Global Database of Events, Language, and Tone". datahub.io. Retrieved June 2, 2014.
- ^ Schrodt, Philip (January 20, 2011). "Automated Production of High-Volume, Near-Real-Time Political Event Data" (PDF). Archived from the original (PDF) on 2017-07-02. Retrieved June 12, 2014.
- ^ a b c "World's largest event dataset now publicly available in BigQuery". Google Cloud Platform. May 29, 2014. Retrieved June 2, 2014.
- ^ a b "Raw data files". Global Database of Events, Language, and Tone.
- ^ a b "All GDELT Event Files". Retrieved June 12, 2014.
- ^ "Documentation". Global Database of Events, Language, and Tone.
- ^ a b Leetaru, Kalev (May 29, 2014). "Did the Arab Spring Really Spark a Wave of Global Protests? The world may look like it's roiling now, but the 1980s were far worse". Foreign Policy. Retrieved June 2, 2014.
- ^ a b Ulfelder, Jay (June 6, 2014). "Another Note on the Limitations of Event Data". Retrieved June 12, 2014.
- ^ Phua, Clifton; Feng, Yuzhang; Ji, Junyao; Soh, Timothy. "Visual and Predictive Analytics on Singapore News: Experiments on GDELT, Wikipedia, and ^STI". arXiv:1404.1996.
- ^ Yonamine, James E. "A nuanced study of political conflict using the Global Datasets of Events Location and Tone (GDELT) dataset". Retrieved June 2, 2014.
- ^ "SBP 2014 Grand Challenge: explore GDELT, Global Database of Events, Language and Tone". Retrieved June 2, 2014.
- ^ "Creating a Real-Time Global Database of Events, People, and Places in the News". Center for Data Innovation. December 15, 2013. Retrieved June 2, 2014.
- ^ Caitlin Dempsey Morais (September 5, 2013). "Mapping Global Events Since 1979". GIS Lounge. Retrieved June 2, 2014.
- ^ "Raining on the Parade: Some Cautions Regarding the Global Database of Events, Language and Tone Dataset". Political Violence at a Glance. February 20, 2014. Retrieved June 2, 2014.
- ^ Jongman, Berto (January 5, 2014). "Global Database of Events, Language, and Tone (GDELT) — (Old) Big Data to See (New) Crises?". Public Intelligence Blog. Retrieved June 2, 2014.
- ^ Keating, Joshua (April 10, 2013). "What can we learn from the last 200 million things that happened in the world?". Foreign Policy. Archived from the original on June 6, 2014. Retrieved June 2, 2014.
- ^ Keating, Joshua (July 9, 2013). "How Well Does GDELT Follow Events in Syria?". Foreign Policy. Archived from the original on June 6, 2014. Retrieved June 2, 2014.
- ^ Steinert-Threlkeld, Zachary (September 27, 2013). "The Arab Spring and GDELT". Retrieved June 18, 2014.
- ^ Leetaru, Kalev (March 13, 2014). "Mapping Violence and Protests in Nigeria: How Big Data can find the big story". Foreign Policy. Retrieved June 2, 2014.
- ^ Heaven, Douglas (May 13, 2013). "World's largest events database could predict conflict". New Scientist. Retrieved June 2, 2014.
- ^ Chalabi, Mona (May 6, 2014). "Kidnapping of Girls in Nigeria Is Part of a Worsening Problem (Updated)". FiveThirtyEight. Retrieved June 2, 2014.
- ^ Sullivan, Andrew (May 30, 2014). "Not Your Father's Global Uprising". Retrieved June 2, 2014.
- ^ mdwardlab (October 17, 2013). "GDELT and ICEWS, a short comparison". Predictive Heuristics. Archived from the original on July 17, 2014. Retrieved June 18, 2014.
- ^ Beieler, John (October 28, 2013). "Noise in GDELT". Retrieved June 21, 2014.
- ^ Hanna, Alex (February 24, 2014). "Assessing GDELT with handcoded protest data". Bad Hessian. Retrieved June 21, 2014.