주소 지오코딩

Address geocoding

어드레스 지오코딩 또는 단순히 지오코딩주소장소의 이름과 같은 위치에 대한 텍스트 기반 설명을 취하고 지구 표면의 위치를 식별하기 위해 자주 위도/경도 쌍인 지리 좌표를 반환하는 과정이다.[1]반면지오코딩지리적 좌표를 위치 설명, 일반적으로 장소 이름 또는 주소 지정 가능한 위치로 변환한다.지오코딩은 주소지, 거리/도로망의 컴퓨터 표현과 우편 및 행정 경계에 의존한다.

  • 지오코드([2]verb): (위치)에 해당하는 지리적 좌표를 제공한다.
  • 지오코드(noun): 지리적 실체(위치 또는 객체)를 나타내는 코드다.
    때때로 이 용어는 더 넓은 의미로 사용될 수 있다:[3] 민족 구성과 같은 인구학적 특징이나 주민의 평균 소득 또는 교육 수준, 특히 마케팅에 사용되는 것과 같은 인구학적 특성에 따른 이웃의 특성화, 지역성 등.
  • 지오코더(noun): 지오코딩 프로세스를 구현하는 소프트웨어 또는 (웹) 서비스, 즉 기술 위치 참조를 위한 공간적 표현을 위해 함께 작동하는 운영, 알고리즘 및 데이터 소스의 형태로 상호 관련 구성요소 세트를 구현한다.

위치를 나타내는 지리적 좌표는 위치 정확도에 따라 크게 달라지는 경우가 많다.예를 들어 건물 중심지, 토지 구획 중심지, 도로 구획 중심지, 도로 구간 중심지, 우편 번호 중심지(예: 우편 번호, CEDEX), 행정 구역 중심지가 포함된다.

역사

지리정보시스템(GIS) 공간분석의 일부인 지오코딩은 1960년대 초부터 관심의 대상이 되어 왔다.

1960년대

1960년에 캐나다 지리정보시스템(CGIS)이라는 이름의 최초의 운영 GIS가 그 후 GIS의 아버지로 인정받은 로저 톰린슨 박사에 의해 발명되었다.CGIS는 캐나다 시골지역의 토지 능력을 규제하기 위해 농업, 야생동물, 임업 등에 관한 정보를 1:50,000의 규모로 지도화한 캐나다 토지재고에 수집된 데이터를 저장하고 분석하는 데 사용되었다.하지만, CGIS는 1990년대까지 지속되었고 상업적으로 이용된 적이 없었다.

1963년 7월 1일, 미국 우체국(USPOD)에 의해 전국적으로 다섯 자리 ZIP 코드가 도입되었다.1983년, 9자리 ZIP+4 코드는 주소를 보다 정확하게 찾을 수 있는 추가 식별자로 도입되었다.

1964년에 하버드 컴퓨터 그래픽스 공간 분석 연구소는 GRID, SYMAP와 같은 획기적인 소프트웨어 코드를 개발했는데, 모두 GIS의 상업적 개발을 위한 원천이었다.

1967년, 인구조사국(수학자 제임스 코벳과[4] 도널드 쿡[5]) 팀은 최초의 현대식 벡터 매핑 모델인 DIME(Dual Independent Map Encoding)를 발명했는데, 이 모델은 주소 범위를 거리 네트워크 파일로 분류하고 "% 따라" 지오코딩 알고리즘을 통합했다.[6]여전히 Google 지도MapQuest와 같은 플랫폼에서 사용 중인 "percent arrow" 알고리즘은 참조 기능을 따라 일치하는 주소가 있는 위치를 참조 기능의 전체 길이의 백분율로 나타낸다.DIME은 미국 인구조사국(United Status Bureau)을 사용하기 위한 것으로, 블록 면의 정확한 매핑, 거리 교차로들을 나타내는 노드 디지털화, 공간적 관계 형성이 포함되었다.코네티컷 주의 뉴 헤이븐은 지구상에서 지리정보가 가능한 거리 네트워크 데이터베이스를 가진 최초의 도시였다.

1980년대

1970년대 후반에는 GRASS GIS와 MOSS라는 두 가지 주요 공공 영역 지오코딩 플랫폼이 개발되고 있었다.1980년대 초에는 인터그래프, ESRI, CARIS, ERDAS, MapInfo Corporation과 같은 지오코딩 소프트웨어의 더 많은 상업적 공급자들이 증가했다.이러한 플랫폼들은 공간정보를 데이터베이스 구조로 구성하는 접근방식과 분리하는 1960년대 접근방식을 통합하였다.

1986년 MIDAS(Mapping Display and Analysis System)는 DOS 운영체제용으로 설계된 최초의 데스크톱 지오코딩 소프트웨어가 되었다.지오코딩은 MapInfo의 MIDAS 인수로 연구부에서 비즈니스 세계로 승격되었다.그 후 MapInfo는 Pitney Bowes에 의해 인수되었고, 지오코딩과 비즈니스 인텔리전스를 융합하는 것을 개척했다; 위치 인텔리전스가 공공 부문과 민간 부문에 솔루션을 제공할 수 있도록 한다.

1990년대

20세기 말 지오코딩은 특히 오픈소스 GIS 소프트웨어를 통해 사용자 지향적이 되었다.응용 프로그램과 지리공간 데이터를 매핑하는 것은 인터넷을 통해 더 쉽게 접근할 수 있게 되었다.

1980년 인구조사에서 메일-아웃/메일-백(mail-out/mail-back) 기술이 매우 성공적이었기 때문에, 미국 인구조사국은 보간된 거리 지오코딩을 사용하여 대규모 지리공간 데이터베이스를 작성할 수 있었다.[7]이 데이터베이스(Census의 전국적인 가구 범위와 함께)는 TIGER(Topology Integrated Geographic Encoding and Referenceing)의 탄생에 허용된다.

개별 주소 대신 주소 범위를 포함하는 TIGER는 현재 사용되는 거의 모든 지오코딩 소프트웨어 플랫폼에서 구현되었다.1990년 센서스 종료까지, TIGER는 "3천만 개 이상의 특징 교차로와 엔드포인트, 그리고 1,200만 개 이상의 다각형을 윤곽으로 나타낸 4200만 개 이상의 특징 세그먼트를 정의한 거의 1억 4,500만 개의 특징 '모양' 지점에 대해 위도/경도 조정을 포함했다."[8]

TIGER는 "빅 데이터" 지리공간 솔루션의 돌파구였다.

2000년대

2000년대 초반에는 CASS(Coding Accuracy Support System) 어드레스 표준화가 증가했다.CASS 인증은 미국 우편 서비스(USPS)가 주소 표준화 소프트웨어의 품질을 평가하기를 원하는 모든 소프트웨어 공급업체와 광고 우편 발송인에게 제공된다.매년 갱신되는 CASS 인증은 배송지 코드, ZIP 코드, ZIP+4 코드에 기초한다.소프트웨어 벤더가 CASS 인증 소프트웨어를 채택하면 대량 우편 및 배송 비용을 할인받을 수 있다.그들은 인증된 데이터베이스를 가진 후에 대량 우편물의 정확성과 효율성의 향상으로부터 이익을 얻을 수 있다.2000년대 초반 지오코딩 플랫폼도 여러 데이터셋을 지원할 수 있었다.

2003년에 지오코딩 플랫폼은 우편번호를 거리 데이터와 통합할 수 있었고, 매달 갱신되었다.이 과정은 "화합"으로 알려지게 되었다.

2005년부터 지오코딩 플랫폼은 구획 중심 지오코딩을 포함했다.구획 중심 지오코딩은 주소 지오코딩에 있어 많은 정밀도를 허용한다.예를 들어, 구획 중심은 지질학자가 특정 건물이나 토지의 중심을 결정할 수 있도록 했다.플랫폼 또한 이제 특정 소포의 표고를 결정할 수 있었다.

2005년에는 심사원의 소포 번호(APN)도 도입되었다.관할 세무사는 이 번호를 부동산 소포에 배정할 수 있었다.이를 통해 적절한 식별 및 기록 보관이 가능했다.APN은 가스 또는 석유 리스가 적용되는 지역을 지오코딩하고 대중에게 제공되는 재산세 정보를 인덱싱하는 데 중요하다.

2006년에는 역 지오코딩 플랫폼에 역 지오코딩과 역 APN 조회가 도입되었다.작업에는 경도와 위도를 포함한 숫자 점 위치를 텍스트 및 읽을 수 있는 주소로 지오코딩하는 작업이 포함되었다.

2008년과 2009년 양방향 사용자 지향 지오코딩 플랫폼인 맵퀘스트, 구글 맵, 빙 맵, 위성 위치 확인 시스템(GPS)의 성장세를 보였다.이러한 플랫폼은 모바일 산업, 특히 스마트폰의 동반성장과 함께 대중이 더욱 쉽게 접근할 수 있도록 만들어졌다.

2010년대

2010년대는 공급업체가 전 세계적으로 지오코딩과 역 지오코딩을 완벽하게 지원한다고 보았다.클라우드 기반 지오코딩 애플리케이션 프로그래밍 인터페이스(API)와 사내 지오코딩을 통해 매치율, 정밀도, 속도도 높일 수 있었다.이제 지오코딩이 사업 결정에 영향을 미칠 수 있다는 생각에서 인기가 있다.이것이 지오코딩 프로세스와 비즈니스 인텔리전스의 통합이다.

지오코딩의 미래는 또한 3차원 지오코딩, 실내 지오코딩, 그리고 지오코딩 플랫폼에 대한 복수 언어 반환을 포함한다.

지오코딩 프로세스

지오코딩은 여러 데이터셋과 프로세스를 포함하는 작업으로, 모두 함께 작동한다.지오코더는 두 가지 중요한 구성 요소, 즉 참조 데이터 집합과 지오코딩 알고리즘으로 만들어진다.이들 각 구성요소는 서브 오퍼레이션과 서브 컴포넌트로 구성된다.이러한 지오코딩 프로세스가 어떻게 작용하는지를 이해하지 못하면 지오코딩에 근거한 정보에 입각한 사업 결정을 내리기가 어렵다.

입력 데이터

입력 데이터는 사용자가 지오코딩 프로세스를 통해 수치, 공간 데이터(위도 및 경도)로 전환하고자 하는 기술, 텍스트 정보(주소 또는 건물 이름)이다.

입력 데이터의 분류

입력 데이터는 상대 입력 데이터와 절대 입력 데이터의 두 가지 범주로 분류된다.

상대입력자료

상대적 입력 데이터는 단독으로 해당 위치의 공간 표현을 출력할 수 없는 위치에 대한 텍스트 설명이다.이러한 데이터는 다른 기준 위치에 종속적이고 지리적으로 상대적인 지오코드를 출력한다.상대적 지오코드의 예로는 영역 단위나 선 벡터를 이용한 주소간극화가 있다."엠파이어 스테이트 빌딩에서 건너편"은 상대적인 입력 데이터의 예다.찾고 있는 위치는 엠파이어 스테이트 빌딩을 확인하지 않고는 결정할 수 없다.지오코딩 플랫폼은 이러한 상대적 위치를 지원하지 않는 경우가 많지만, 이러한 방향으로 진보가 이루어지고 있다.

절대입력데이터

절대 입력 데이터는 단독으로 해당 위치의 공간 표현을 출력할 수 있는 위치에 대한 텍스트 설명이다.이 데이터 유형은 다른 위치와 독립적으로 절대적으로 알려진 위치를 출력한다.예를 들어, USPS ZIP 코드, USPS ZIP+4 코드, 완전하고 부분적인 우편 주소, USPS PO 박스, 시골길, 도시, 카운티, 교차로, 그리고 명명된 장소들은 모두 데이터 소스에서 절대적으로 참조될 수 있다.

너무 많은 입력 데이터 또는 너무 적은 입력 데이터 등 주소 표시 방법이 다양할 경우 지오코더들은 이 문제를 해결하기 위해 주소 정규화와 주소 표준화를 사용한다.

주소 보간

간단한 지오코딩 방법은 주소 보간법이다.이 방법은 거리 네트워크가 지리적 좌표 공간 내에 이미 매핑되어 있는 거리 지리 정보 시스템의 데이터를 이용한다.각 거리 세그먼트는 주소 범위(예: 한 구역에서 다음 구역까지의 주택 번호)로 간주된다.지오코딩은 주소를 받아 거리 및 특정 구역(: "블록" 규약을 사용하는 마을에서 블록)과 일치시킨다.그런 다음 지오코딩은 세그먼트를 따라 범위 내에서 주소의 위치를 보간한다.

예를 들어: 742 에버그린 테라스

에버그린 테라스의 이 구간(예를 들어 블록)은 700에서 799까지 이어진다고 하자.짝수 주소는 에버그린 테라스의 동쪽에 있으며, 거리 서쪽에 홀수 번호 주소가 있다. 742 에버그린 테라스는 (아마도) 블록의 절반도 안 되는 동쪽에 위치할 것이다.한 지점은 길을 따라 그 위치에 지도화 될 것이며, 아마도 거리 중심선의 동쪽까지의 거리를 상쇄할 것이다.

복잡인자

그러나 이 과정이 항상 이 예에서처럼 간단하지는 않다.어려움은 다음에 발생한다.

  • 에버그린 테라스 742와 W 에버그린 테라스 742와 같은 모호한 주소를 구분한다.
  • 지리적 정보 시스템 데이터베이스에 아직 추가되지 않은 거리에 대한 새로운 주소의 지오코딩 시도.

스프링필드에 742개의 에버그린 테라스가 있을 수도 있지만 쉘비빌에는 742개의 에버그린 테라스가 있을 수도 있다.도시명(그리고 필요에 따라 주, 도, 국가 등)을 묻는 것이 이 문제를 해결할 수 있다.매사추세츠[9]보스턴은 여러 도시가 거리 이름을 바꾸지 않고 합병되었기 때문에 여러 개의 "워싱턴 스트리트 100" 지점이 있다. 따라서 해체를 위해 고유한 우편 번호나 지역 이름을 사용해야 한다.지오코딩 정확도는 우선 좋은 주소 검증 관행을 활용하면 크게 향상될 수 있다.주소 검증은 주소의 존재를 확인하고 모호성을 없앨 것이다.일단 유효한 주소가 결정되면 지오코드를 하고 위도/경도 좌표를 결정하는 것은 매우 쉽다.마지막으로 보간 사용에 대한 몇 가지 주의사항:

  • 거리 구획의 일반적인 귀속성은 짝수 소포가 구획의 한 쪽에 있고 홀수 소포가 모두 다른 쪽에 있다고 가정한다.현실에서는 그렇지 않은 경우가 많다.
  • 보간술은 주어진 소포가 세그먼트의 길이에 따라 균등하게 분포된다고 가정한다.이것은 실생활에서 거의 절대 사실이 아니다; 지리적으로 표시된 주소가 수천 피트 떨어진 것은 드문 일이 아니다.
  • 보간술도 거리가 직선인 것으로 가정한다.거리가 곡선인 경우 지오코딩된 위치가 주소의 물리적 위치에 반드시 맞지는 않을 것이다.
  • 세그먼트 정보(TIGER와 같은 출처의 정보)는 주소에 대한 최대 상한을 포함하며 전체 주소 범위를 사용하는 것처럼 보간된다.예를 들어, 세그먼트(블록)의 나열 범위는 100–199이지만 블록 끝의 마지막 주소는 110이다.이 경우 어드레스 110은 끝에서 가까운 거리가 아니라 세그먼트에서 10%로 지오코딩된다.
  • 대부분의 보간 구현은 결과 주소 위치로 점을 생성할 것이다.실제로 물리적 주소는 세그먼트의 길이에 따라 분포한다. 즉, 쇼핑몰의 주소를 지오코딩하는 것을 고려한다. 물리적 로트는 거리 세그먼트를 따라 먼 거리를 달릴 수 있다(또는 다중 리브가 있는 도시의 경우 여러 다른 거리에 전방에 있을 수 있는 2차원 공간을 채우는 다각형으로 생각할 수 있음).l거리, 여러 층에서 서로 다른 거리들과 만나는 3차원 형태) 그러나 보간법은 그것을 특이점으로 취급한다.

매우 일반적인 오류는 주어진 지도의 지오코딩 가능한 속성의 정확도를 믿는 것이다.공급업체에 의해 인용된 그러한 정확성은 주소가 정확한 세그먼트 또는 세그먼트의 정확한 측면에 귀속되는 것과 관련이 없으며, 정확한 세그먼트를 따라 정확한 위치가 되는 것은 아니다.미국 인구 조사 TIGER 데이터 집합에 사용되는 지오코딩 프로세스와 함께, 주소의 5~7.5%를 다른 인구 조사소에 할당할 수 있는 반면, 호주의 TIGER와 유사한 시스템을 연구한 결과 지오코딩 지점의 50%가 잘못된 재산 소포에 매핑된 것으로 나타났다.[10]지오코딩 데이터의 정확성은 또한 이 데이터를 사용하는 연구의 품질과도 관계가 있을 수 있다.아이오와주 연구팀의 한 연구에[11] 따르면 위에서 설명한 것처럼 TIGER 데이터 집합을 사용하는 일반적인 지오코딩 방법은 통계 분석의 전력의 최대 40%를 잃을 수 있다.대안은 영국 Ordnance Survey의 Address Point 데이터와 같은 정형화된 데이터나 이미지 코딩된 데이터를 사용하는 것이지만, 그러한 데이터 집합은 일반적으로 비용이 많이 든다.

이 때문에 비중요 응용 분야를 제외한 보간 결과의 사용을 피하는 것이 상당히 중요하다.보간된 지오코딩은 예를 들어 생명 안전이 해당 결정의 영향을 받는 경우 권위 있는 결정을 내리는 데 일반적으로 적절하지 않다.예를 들어, 응급 구조대는 그들의 보간법에 근거하여 권위 있는 결정을 내리지 않는다; 구급차나 소방차는 지도에 나와 있는 것과 상관없이 항상 파견될 것이다.[citation needed]

기타 기법

고품질의 거리 네트워크 데이터와 주소가 부족한 시골지역이나 다른 장소에서 GPS는 위치 지도 작성에 유용하다.교통사고의 경우 가로교차로 또는 가로 중심선을 따라 중간점으로 지오코딩하는 것이 적절한 기법이다.선진국의 대부분의 고속도로에는 비상 대응, 정비, 항해에 도움이 되는 마일 표지가 있다.또한 이러한 지오코딩 기술을 조합하여 사용하는 것도 가능하다. 특정 사례와 상황에 대한 특정 기법 및 다른 경우에 대한 다른 기법을 사용하는 것이다.구조화된 우편 주소 레코드의 지오코딩과 대조적으로, 토폰어 해상도 맵은 해당 공간 발자국에 대해 구조화되지 않은 문서 컬렉션에 이름을 배치한다.

플레이스 코드는 위성 이미지 및 기계 학습(예: Robocode)을 사용하여 정보가 존재하지 않는 디지털 생성 주소를 만드는 새로운 방법을 제공한다.

리서치

연구는 에이전트 기반 패러다임을 사용함으로써 지오코딩의 제어 및 지식 측면에 대한 새로운 접근법을 도입했다.[12]지오코딩에 대한 새로운 패러다임 외에도 추가적인 보정 기법과 제어 알고리즘이 개발되었다.[13]접근방식은 개별 에이전트로서 주소에서 흔히 볼 수 있는 지리적 요소를 나타낸다.이것은 통제와 지리적 표현을 위한 공통성과 이중성을 제공한다.과학적인 출판물 외에도, 새로운 접근법과 후속 프로토타입은 호주에서 전국 언론의 보도를 얻었다.[14]이 연구는 호주 서부 퍼스에 있는 커틴 대학에서 실시되었다.[15]

최근 딥러닝과 컴퓨터 비전(Deep Learning and Computer Vision)의 발전으로, Object Detection 기법을 활용하여 건물 옥상의 중심을 지오코딩 출력물로 직접 추출하는 새로운 지오코딩 워크플로우가 제안되었다.[16]

사용하다

지오코딩된 위치는 많은 GIS 분석, 지도 제작, 의사 결정 워크플로우, 트랜잭션 매시업 또는 대규모 비즈니스 프로세스에 투입되는 데 유용하다.웹에서 지오코딩은 라우팅과 로컬 검색과 같은 서비스에서 사용된다.지오코딩은 GPS와 함께 사진이나 RSS 아이템과 같은 지오태깅 매체를 위한 위치 데이터를 제공한다.

프라이버시 문제

지오코딩(및 역 지오코딩) 서비스에 대한 접근의 확산과 용이성은 프라이버시 우려를 야기한다.예를 들어, 범죄 사건을 지도화하는 데 있어서, 법 집행 기관은 피해자와 범죄자의 사생활 권리와 대중의 알 권리 사이의 균형을 맞추는 것을 목표로 한다.법 집행 기관은 위치 세부사항의 일부를 가릴 수 있는 대체 지오코딩 기법을 실험했다(예: 피해자나 범죄자를 식별할 수 있는 구체적인 사항을 다룬다).또한, 대중에게 온라인 범죄 지도를 제공함에 있어서, 그들은 또한 지도에 포인트의 위치적 정확성에 관한 면책권을 부여하고, 이러한 위치 마스킹 기술을 인정하며, 정보에 대한 이용 조건을 부과한다.

참고 항목

참조

  1. ^ https://pelias.io/
  2. ^ "지오코드"라는 용어는 동사로서 옥스퍼드 영어 사전 https://en.oxforddictionaries.com/definition/geocode에서 정의한 것이다.
  3. ^ "지오코드" 용어는 명사로서 http://www.dictionary.com/browse/geocode에서 사용하는 정의다.
  4. ^ Corbett, James P. Topological principles in cartography. Vol. 48. US Department of Commerce, Bureau of the Census, 1979.
  5. ^ "Short CV" (PDF).
  6. ^ Olivares, Miriam. "Geographic Information Systems at Yale: Geocoding Resources". guides.library.yale.edu. Retrieved 22 June 2016.
  7. ^ "Spatially enabling the data: What is geocoding?". National Criminal Justice Reference Service. Retrieved 22 June 2016.
  8. ^ "25th Anniversary of TIGER". census.maps.arcgis.com. Retrieved 22 June 2016.
  9. ^ Google 지도
  10. ^ Ratcliffe, Jerry H. (2001). "On the accuracy of TIGER-type geocoded address data in relation to cadastral and census areal units" (PDF). International Journal of Geographical Information Science. 15 (5): 473–485. doi:10.1080/13658810110047221. S2CID 14061774. Archived from the original (PDF) on 23 June 2006.
  11. ^ Mazumdar S, Rushton G, Smith B, et al. (2008). "Geocoding accuracy and the recovery of relationships between environmental exposures and health". International Journal of Health Geographics. 7: 1–13. doi:10.1186/1476-072X-7-13. PMC 2359739. PMID 18387189.
  12. ^ Hutchinson, Matthew J (2010). Developing an Agent-Based Framework for Intelligent Geocoding (PhD thesis). Curtin University.
  13. ^ 지능형 지오코딩 서비스를 지원하는 에이전트 기반 프레임워크
  14. ^ Jennifer Foreshew (24 November 2009). "Difficult addresses no problem for IntelliGeoLocator". The Australian. Retrieved 9 May 2011.
  15. ^ Department of Education, Western Australia (April 2011). "X marks the spot". School Matters. Retrieved 9 May 2011.
  16. ^ Yin, Zhengcong; et al. (2019). "A deep learning approach for rooftop geocoding". Transactions in GIS. doi:10.1111/tgis.12536.

외부 링크