Article 1. 시공간 데이터 탐색 2221

2 minute read

Section 2. 고급 데이터 탐색

Paragraph 1. 시공간 데이터

Subparagraph 1. 시공간 데이터(Spatio-Temporal Data)의 개념

공간적 객체에 시간의 개념이 추가되어 시간에 따라 위치나 형사이 변하는 데이터이다.

Subparagraph 2. 시공간 데이터의 특징

시공간 데이터는 데이터를 공간과 시간의 흐름상에 위치시킬 수 있는 거리 속성과 시간 속성을 가지고 있다.

특징 설명
이산적 변화 • 데이터 수집의 주기가 일정하지 않은 데이터를 이용하여 표현함
• 시간의 변화에 따라 데이터가 추가됨
연속적 변화 • 일정한 주기로 수집되는 데이터를 이용하여 연속적으로 표현함
• 연속적인 변화를 일종의 함수를 이용하여 표현함

Subparagraph 3. 시공간 데이터의 타입

타입 내용
포인트 타입 하나의 노드로 구성되는 공간 데이터 타입
라인 타입 서로 다른 두 개의 노드와 두 노드를 잇는 하나의 세그먼트로 구성
폴리곤 타입 n개(n ⪰ 3)의 노드와 n개의 세그먼트로 구성
폴리라인 타입 n개(n ⪰ 3)의 노드와 n-1개의 세그먼트로 구성

Paragraph 2. 시공간 데이터 탐색 절차

Subparagraph 1. 주소를 행정구역으로 변환

  • 엑셀 또는 스프레드 시트의 문자열 처리 함수를 이용해 쉽게 변환할 수 있다.
  • 보통은 공백문자를 기준으로 분할할 수 있다.

⬇문자열 처리 함수

  1. split

    • 문자열을 구분 문자 기준(공백이나 쉼표 등)으로 나눔

    • split(문자열, 구분자)

      예) split(“a,b,c”, ‘,’)

  2. find

    • 찾는 문자가 문자열에서 가장 왼쪽으로부터 몇 번째에 있는지 숫자를 반환

    • find(찾는 문자, 문자열)

      예) find(“,’, “a,b”)

  3. left

    • 문자열의 가장 왼쪽부터 정해진 개수만큼의 문자열 반환

    • left(문자열, 개수)

      예) left(“abc”, 1)

  4. mid

    • 문자열의 시작 위치에서부터 정해진 개수만큼의 문자열 반환

    • mid(문자열, 시작 위치, 개수)

      예) mid(“abc”, 1, 2)

엑셀에서 함수는 동작되지 않거나 문법이 다를 수도 있다.

Subparagraph 2. 주소를 좌표계로 변환

  • 시공간 데이터의 주소를 이용하여 위도와 경도로 변환한다.
  • 지오 코딩 서비스를 이용하여 좌표계로 변환한다.
서비스 설명
Geocoder.us 위도 경도 반환 서비스
Google Maps Latitude Longitude Popup 구글 매쉬업 프로젝트
Geopy 파이썬용 지오 코딩 도구 모음

Subparagraph 3. 행정구역 및 좌표계를 지도에 표시

  • 시공간 데이터에 따라 행정구역 데이터를 지도에 표시하거나 좌표계를 지도에 표시한다.
  • 지도에는 코로플레스 지도, 카토그램, 버블 플롯맵 등이 있다.

Clause 1. 코로플레스 지도(Choropleth Map)

  • 어떤 데이터 수치에 따라 지정한 색상 스케일로 영역을 색칠해서 표현하는 방법으로 등치지역도라고도 한다.
  • 영역별 데이터를 표현하는 가장 보편적인 방법으로 데이터값의 크기에 따라 지역별로 색을 다르게 표시한다.

예)

범주형 데이터는 서로 다른 색상들로 구분

연속형 데이터는 한 색상의 명도를 몇 단계로 나누어 적용하는 방법으로 지역별 데이터를 표시

  • 인구밀도가 매우 높은 지역과 낮은 지역에 동일한 척도를 적용할 경우 표시된 지역의 면적이 실제 데이터값의 크기를 반영할 수 없다는 단점이 있다.

코로플레스 지도 예시

Clause 2. 카토그램(Cartogram)

  • 특정한 데이터값의 변화에 따라 지도의 면적이 왜곡되는 지도로 변량비례도라고도 한다.
  • 데이터값이 큰 지역의 면적이 시각적으로도 더 크게 표시됨으로써 데이터값의 크기를 직관적으로 인지할 수 있다는 장점이 있다.
  • 지도의 형태를 왜곡시킴으로써 데이터 지각의 왜곡을 방지하도록 보정한다. (예를 들어 지도상으로는 넓은 지역이지만 실제 거주하는 인구가 적은 지역의 경우 선거인단의 규모가 작으므로 이런 경우 선거인단의 규모에 따라 지도의 형태를 왜곡시켜서 전체적인 선거의 판세를 알아보기 쉽게 할 수 있다.

카토그램(Cartogram) - 선거 결과 지도를 효과적으로 나타내는 방법

Clause 3. 버블 플롯맵(Bubble Plot Map)

  • 버블 플롯맵은 버블차트에 위도와 경도 정보를 적용하여 좌표를 원으로 시각화한 지도이다.
  • 원의 크기, 색깔 등을 반영하여 시각화 표현한다.

Bubble Map - Charts - Data Visualization and Human Rights