지오다
GeoDaGeoDa는 공간 데이터 분석, 지구 시각화, 공간 자기 상관 및 공간 모델링을 수행하는 무료 소프트웨어 패키지입니다.
Windows, Mac OS 및 Linux의 다른 버전에서 실행됩니다.이 패키지는 일리노이 대학교 어바나 샴페인의 공간 분석 연구소에서 Luc Anselin의 지시로 처음 개발되었습니다.2016년부터 시카고 [1]대학의 공간 데이터 과학 센터(CSDS)에서 개발을 계속하고 있습니다.
GeoDa는 공간 분석, 다변량 탐색 데이터 분석, 전역 및 로컬 공간 자기 상관을 수행할 수 있는 강력한 기능을 가지고 있습니다.기본 선형 회귀 분석도 수행합니다.공간모델은 최대우도로 추정되는 공간지연모델과 공간오차모델을 모두 포함한다.
OpenGeoDa는 GNU GPL 버전 3.0으로 [2]출시됩니다.
역사
GeoDa는 이전 ArcView 3.x에서 작동하여 탐색적 공간 데이터 분석(ESDA)을 수행하던 모듈인 DynESDA를 대체했습니다.GeoDa의 현재 릴리스는 더 이상 ArcView 또는 기타 GIS 패키지의 존재 여부에 의존하지 않습니다.
기능
GeoDa의 프로젝트는 기본적으로 격자 데이터를 정의하는 쉐이프 파일과 .dbf 형식의 속성 테이블로 구성됩니다.속성 테이블은 GeoDa 내에서 편집할 수 있습니다.
이 패키지는 탐색적 데이터 분석 및 지리 시각화에 특화되어 동적 링크 및 브러싱 기술을 활용합니다.즉, 사용자가 프로젝트에 여러 뷰 또는 창을 가지고 있는 경우 그 중 하나의 개체를 선택하면 다른 모든 창에서 동일한 개체가 강조 표시됩니다.
GeoDa는 히스토그램, 상자 그림, 산점도 등을 생성하여 데이터에 대한 간단한 탐색 분석을 수행할 수도 있습니다.그러나 가장 중요한 것은 통계 장치를 사용자가 연구하고 있는 현상의 공간적 분포와 매핑하고 연결하는 능력입니다.
GeoDa의 동적 링크 및 브러싱
동적 링크 및 브러싱은 사용자가 인터랙티브하게 데이터의 공간 배치 패턴을 검출 또는 확인하거나 데이터의 존재를 폐기할 수 있도록 하기 때문에 강력한 장치입니다.이를 통해 사용자는 숫자를 처리하고 유용한 통계 결과를 얻기 위해 매우 무거운 컴퓨터 루틴이 필요할 수 있는 공간 배열의 데이터로부터 정보를 추출할 수 있다.후자는 또한 전문적인 지식과 소프트웨어 능력 측면에서 사용자에게 상당한 비용이 소요될 수 있습니다.
안셀린의 모란 산점도
GeoDa에서 우주에서 자기 상관의 글로벌 패턴을 탐색하기 위해 사용할 수 있는 매우 흥미로운 장치는 Anselin의 Moran 산점도입니다.이 그래프는 x축의 표준화된 변수 대 해당 표준화된 변수의 공간적 지연을 나타냅니다.공간적 지연은 인접한 공간 단위의 효과를 요약한 것에 불과하다.이 요약은 다양한 형태를 취할 수 있는 공간 가중치 매트릭스를 통해 얻을 수 있지만, 가장 일반적으로 사용되는 것은 인접성 매트릭스이다.인접 행렬은 공간 단위 j가 단위 i에 인접할 때마다 위치(i, j)에 1의 값을 갖는 배열이다.편의상 행렬은 각 값을 원래 행렬의 행 합계로 나누어 행 합계가 1이 되도록 표준화되어 있습니다.
본질적으로, Anselin의 Moran 산점도에서는 인접 위치의 변수 값에 대한 위치 i의 변수 관계를 나타냅니다.구성상 산점도에서의 선의 기울기는 Moran의 I 계수와 동일합니다.후자는 글로벌 공간 자기 상관을 설명하는 잘 알려진 통계량입니다.이 기울기가 양수이면 양의 공간 자기 상관 관계가 있음을 의미합니다. 위치 i의 변수 값이 높으면 i의 이웃인 위치에 동일한 변수의 값이 높게 군집화되는 경향이 있고, 그 반대도 마찬가지입니다.산란도의 기울기가 음수인 경우, 이는 일종의 체커보드 패턴이나 위치 i의 변수에서 높은 값이 인접한 위치에서는 낮은 값과 같은 위치에 위치하는 경향이 있다는 것을 의미합니다.
안셀린의 모란 산점도에서는 곡선의 기울기가 계산되어 그래프 위에 표시됩니다.이 경우, 이 값은 양수입니다.즉, 범죄율이 높은 지역에도 높은 이웃이 있는 경향이 있으며, 그 반대의 경우도 마찬가지입니다.
GeoDa의 글로벌 분석과 로컬 분석
글로벌 레벨에서는 클러스터화, 즉 클러스터화 맵의 일반적인 경향에 대해 이야기할 수 있습니다.로컬 레벨에서는 클러스터의 위치를 특정할 수 있습니다.후자는 LISA(Local Indicators of Spatial Association)를 사용하여 평가할 수 있습니다.LISA 분석을 통해 인접 영역에서 높은 값으로 둘러싸인 변수의 높은 값이 어디에 있는지 확인할 수 있습니다. 즉, 높은 클러스터라고 합니다.이 분석에서 저-저 군집도 확인할 수 있습니다.
이 맥락에서 분석해야 할 또 다른 유형의 현상은 인접 위치에서 낮은 값으로 둘러싸인 주어진 위치에서 변수의 높은 값을 나타내는 특이치가 존재한다는 것이다.이 기능은 GeoDa에서 Anselin의 Moran 산란도를 통해 사용할 수 있습니다.다만, 인접 로케이션의 값에 비해 값이 높다고 해서, 그 관계의 통계적 유의성을 평가할 필요가 있기 때문에, 반드시 특이치라고는 할 수 없습니다.즉, 클러스터가 있는 것처럼 보이거나 클러스터가 있는 것처럼 보이는 영역을 찾을 수 있지만 통계 절차를 수행하면 통계적으로 유의하지 않은 클러스터 또는 특이치로 바뀝니다.통계적 유의성 평가에 채택된 절차는 데이터의 다양한 배열에 대한 몬테카를로 시뮬레이션과 시뮬레이션 통계의 경험적 분포 구축으로 구성된다.그 후, 원래 구한 값을 시뮬레이션 값의 분포와 비교하고, 값이 95h 백분위수를 넘으면 그 관계가 5%로 유의하다고 한다.
레퍼런스
- ^ "About". The Center for Spatial Data Science, The University of Chicago. Archived from the original on 7 July 2016. Retrieved 23 September 2020.
- ^ "GeoDa Release". GeoDa Center, University of Chicago. Retrieved 23 September 2020.
추가 정보
- 안셀린, 룩, 쉰리, 줄리아 코신스키(2021년).GeoDa, 데스크톱에서 공간 데이터 탐색을 위한 생태계로.프리프린트
- Anselin, Luc, Ibnu Shabri 및 Youngihn Kho(2006).GeoDa: 공간 데이터 분석 소개.지리적 분석 38, 5-22
- 안셀린, 뤽, 레이, 세르지오 J. (2014).실천 중인 현대 공간 계량학:GeoDa, GeoDaSpace 및 PySAL 가이드GeoDa Press LLC, 시카고, 일리노이 주