위치기반데이터처리

목차
⚫ GIS란?
⚫ geopandas
⚫ Folium

## 1. GIS란? -> 지리정보시스템

❖ GIS(Geographic Information System)
▪ 인간생활에 필요한 지리 정보를 컴퓨터 데이터로 변환하여 효율적으로 활
용하기 위한 정보시스템
▪ 즉, 지리 정보의 관측과 수집에서부터 보존과 분석, 출력에 이르기까지의
일련의 조작을 위한 정보시스템

▪ GIS는 지리적 위치를 갖고 있는 대상에 대한 위치 자료와(spatial
data)와 속성 자료(attribute data)를

❖ Vector 데이터
▪ Point
• 시설, 건물, 교차로 등
▪ Line
• 도로, 경로, 네트워크
• 철도 등
▪ Polygon
• 지역, 군, 영역 등

❖ Raster 데이터
▪ 이미지 형태의 데이터

Python 기반 주요 라이브러리

❖ geopandas
▪ pandas와 유사한 라이브러리로 공간 정보를 가진 데이터 프레임을 다루는
데 유용한 패키지
▪ pandas처럼 GeoSeries, GeoDataFrame의 타입으로 다루며 function이
나 attribute들도 큰 차이가 없음
▪ shapely와 연계되어 있음

❖ folium
▪ Open Street Map과 같은 지도 데이터에 ‘Leaflet.js’를 이용하여 위치
정보를 시각화하기 위한 인터랙티브 라이브러리
▪ 기본적으로 GeoJSON(http://GeoJSON.org/) 형식 또는 topoJSON 형식의
로 데이터를 지정하면, 오버레이를 통해 여러 가지 형태로 위치 정보를
지도상에 표현할 수 있음

Shapefiles
❖ 공간(지리) 정보를 벡터 데이터 포맷으로 저장한 파일
❖ 파일의 종류
▪ *.shp: 기하구조(geometry)가 포함된 파일(*.geojson, *.csv)
▪ *.shx: 기하구조(geometry)의 인덱스 파일
▪ *.dbf: 각 기하구조의 특성 또는 속성이 테이블 포맷으로 저장된 파일
▪ *.prj: 좌표계 정의 파일

좌표계(CRS: Coordinate Reference System)
❖ 지구상의 한 점을 위도와 경도의 조합으로 나타내는 좌표 체계

❖ 좌표계의 종류
▪ WGS84(EPSG:4326): GPS가 사용하는 좌표계(경도와 위도)
▪ Bessel 1841(EPSG:4004): 한국과 일본에 잘 맞는 지역 타원체를 사용한 좌
표기
▪ GRS80 UTM-K(EPSG:5179): 한반도 전체를 하나의 좌표계로 나타낼 때 많이
사용하는 좌표계
• 네이버 지도 => 통계청 지리 정보 좌표계 : UTM-K(GRS80타원체)(EPSG5179)
▪ GRS80 중부원점(EPSG:5181): 과거 지리원 좌표계에서 타원체 문제를 수정한
좌표계
• 다음 카카오 지도
▪ Web mercator projection(Pseudo-Mercator, EPSG:3857) : 구글 지도/비에 지
도/야후 지도/OSM 등에서 사용 중인 좌표계
▪ Albers projection(EPSG:9822) : 미국 지질 조사국에서 사용하는 좌표계

## 2. geopandas

In [None]:
!pip install wheel
!pip install pipwin
!pipwin install numpy
!pipwin install pandas
!pipwin install shapely
!pipwin install gdal
!pipwin install Fiona
!pipwin install pyproj
!pipwin install six
!pipwin install rtree
!pipwin install Descartes
!pipwin install mapclassify
!pipwin install geopandas
!pipwin install geopy

❖ shapely
▪ 평면 기하학적 객체의 조작 및 분석을 위한 Python 패키지
▪ Python 3.6 이상, GEOS 3.3 이상을 요구
• GEOS : 오픈소스 Geometry 엔진(C++ 라이브러리)
❖ 참고 사이트
▪ https://shapely.readthedocs.io/en/stable/manual.html

In [None]:
# pioint
from shapely.geometry import Point 
point = Point(2.0, 2.0)
point

In [None]:
# MultiPoint
from shapely.geometry import MultiPoint 
points = MultiPoint([(0,0), (3,3)]) 
points

In [None]:
# LineString
from shapely.geometry import LineString 
line = LineString([(0,0), (10,10)]) 
line

In [None]:
#LinearRing
from shapely.geometry.polygon import LinearRing 
ring = LinearRing([(0,0), (3,3), (3,0)])
ring

In [None]:
# MultiLineString
from shapely.geometry import MultiLineString
coords = MultiLineString([((0,0), (1,1)),((-1,0), (1,0))]) 
coords

In [None]:
# Polygon
from shapely.geometry import Polygon
p2 = Polygon(((6,6), (7,6), (10,4), (11,8), (6,6))) 
p2

In [None]:
# MultiPolygon
from shapely.geometry import MultiPolygon 
polygons = MultiPolygon([p1,p2]) 
polygons

In [None]:
# 공간함수
from shapely.geometry import Polygon
p1 = Polygon(((1,2), (5,3), (5,7), (1,9), (1,2)))
print(p1.area)      # 면적    구하기
print(p1.bounds)    # 경계    구하기
print(p1.length)    # 길이    구하기 
p1

geopandas 실습용    데이터셋
1. 세계지도(1)

In [None]:
import geopandas as gpd
countries = gpd.datasets.get_path('naturalearth_lowres')
country = gpd.GeoDataFrame.from_file(countries)
country.head()

'''
▪  pop_est: 국가별    인구    추정치
▪ gdp_md_est: 국가별 GDP 추정치
'''

In [None]:
import geopandas as gpd
cities = gpd.datasets.get_path('naturalearth_cities')
city = gpd.GeoDataFrame.from_file(cities)
city.head()

In [None]:
import geopandas as gpd
countries = gpd.datasets.get_path('naturalearth_lowres')
country = gpd.GeoDataFrame.from_file(countries)
country.geom_type

In [None]:
import geopandas as gpd
countries = gpd.datasets.get_path('naturalearth_lowres') 
country = gpd.GeoDataFrame.from_file(countries)
print(country.geometry[113]) 
country.geometry[113]

In [None]:
import geopandas as gpd
countries = gpd.datasets.get_path('naturalearth_lowres') 
country = gpd.GeoDataFrame.from_file(countries)
korea = country[country.name == 'South Korea'].geometry 
korea.boundary.squeeze()

### geopandas.GeoDataFrame.plot()


❖ plot(column, kind=‘geo’, cmap=None, ax=None, categorical=False, legend=False, scheme=None, k=5, figsize=None)  
• column: DataFrame의 column  
• kind:  
− ‘geo’, ‘line’, ‘bar’, ‘barh’, ‘hist’, ‘box’, ‘kde’, ‘density’, ‘area’, ‘pie’,‘scatter’  
• cmap: matplotlib의 colormap 이름   
• ax: matplotlib.pyplot.Artist  
• categorical: cmap이 숫자 값에 영향을 받음(숫자가 아니면 True)  
• legend: 범례 출력 여부 

• scheme: 등치 분류체계  
− 'BoxPlot', 'EqualInterval', 'FisherJenks', 'FisherJenksSampled',   'HeadTailBreaks',  
'JenksCaspall', 'JenksCaspallForced', 'JenksCaspallSampled', 'MaximumPampled',  
'NaturalBreaks', 'Quantiles', 'Percentiles', 'StdMean', 'UserDefined'  

• k: 클래스의 개수  
• figsize: 크기 지정(tuple)  

In [None]:
#셰계지도 그리기
import geopandas as gpd
import matplotlib.pyplot as plt
countries = gpd.datasets.get_path('naturalearth_lowres') 
world = gpd.GeoDataFrame.from_file(countries)
ax = world.plot(figsize=(10,10), column="continent", legend=True)

ax.set_title("World") 
ax.set_axis_off() 
plt.show()

❖ 참고: Encoding 방식
▪ ASCII / ANSI
• ASCII는 7비트로 한 문자를 표현하는 방식
• ANSI는 8비트로 한 문자를 표현하는 방식
▪ UTF-8 / UTF-16
• UTF-8은 유니코드 한 글자를 8bit(1byte)로 표현하는 인코딩 방식이고 한 문
자를 표현할 때 1-4bytes의 가변 길이 인코딩 방식(Variable-width
encoding).
• UTF-16은 한 문자를 나타내는데 2 또는 4 바이트를 사용하는 가변 길이 인코
딩 방식
▪ EUC-KR / CP949
• EUC-KR은 한글 표현을 위한 것으로 한글을 2byte를 표현하며, 가변 길이 인코딩
방식
• CP949는 EUC-KR의 확장이며 euc-kr에서 표현할 수 없는 한글도 표현할 수 있
음. 따라서 cp949를 euc-kr로 인코딩 할 수 있지만, euc-kr을 cp949로 인코
딩 하는 것은 안됨

## 3. Folium

❖  설치
▪  pip install folium
❖ 청주시 지도 출력하기

In [None]:
import folium
m = folium.Map(location=[36.6421169, 127.4891742], zoom_start=13) 
m

In [None]:
#참고: geopy로 위치정보 가져오기
from geopy.geocoders import Nominatim 
# 노미나팀(nominatim) : 지명, 임명
app = Nominatim(user_agent="user_agent", timeout=None) 
location = app.geocode('청주시')
location

❖ folium.Map(location=None, width='100%’, height='100%’,
tiles='OpenStreetMap’, zoom_start=10, ...)
▪  location : 시작    위치(위도, 경도)  
▪  width, height : 출력    크기  
▪  tiles : 지도    스타일  
−    Open street map (기본값)   
−    Map Quest Open  
−    Mapbox Bright  
−    Stamenterrain  
−    Stamentoner  
−    cartodbpositron 등  
▪  zoom_start : 시작    스케일  

In [1]:
!pip install openpyxl

