### 안내페이지
#### https://www.notion.so/rollinstar/Python-cc8a370daf784bf9b084ca06a37c5a1e

# GIS (Geographic Information System or Science)

* 지리공간데이터를 생성/편집/저장/분석/시각화하기 위한 모든 Science

#### Geographic
* 지표상에 있는 모든 지리(地理)적 사상(Feature)

#### Information
* 디지털화된 데이터

#### System / Science
* 지리공간데이터를 처리하기 위한 모든 기법/방법

# GeoPandas

* `python`으로 지리공간데이터(Geospatial Data)를 다루기 위한 오픈소스 라이브러리
* `pandas`를 확장한 라이브러리
* `python`에는 다양한 지리공간데이터를 처리할 수 있는 라이브러리들이 존재 (ex:  `GDAL/OGR`, `shapely`, `fiona`, `descrates`)
    * `GeoPandas`는 내부적으로 이런 라이브러리들을 내부적으로 활용하고 있다.

In [None]:
# GeoPandas설치하기
# !pip3 install shapely
# !pip3 install geopandas

#### Import library

In [None]:
# _01 라이브러리 추가하기
import geopandas as gpd

#### Reading data
- `GeoPandas`는 vector 타입의 대부분 포맷 들을 읽을 수 있습니다.
    - `shp`, `geojson`, `GML`, `KML`...

In [None]:
# _02 서울시 행정동 .shp파일
_h_dong = './maps/seoul_h_dong/seoul_h_dong.shp'

In [None]:
# _03 지도 파일을 불러와 GeoDataFrame 생성하기
seoul_h_dong_gdf = gpd.read_file(_h_dong)

In [None]:
# _04 데이터 확인하기
seoul_h_dong_gdf.head(100)

In [None]:
# _05 Dataframe 개요정보 확인하기
seoul_h_dong_gdf.info()

In [None]:
# _06 데이터 확인 요령 info() & head()를 동시에.... 취향대로
seoul_h_dong_gdf.info()
seoul_h_dong_gdf.head()

In [None]:
# _07 Dataframe 통계정보 확인하기
seoul_h_dong_gdf.describe()

In [None]:
# _08 평균값 가져오기
seoul_h_dong_gdf.TOTAL_POP.describe().mean()

In [None]:
# _09 Serise 데이터 가져오기
# seoul_h_dong_gdf.DONG_NM
seoul_h_dong_gdf['DONG_NM'][:10]

#### GeoPandas Data Structure(데이터 구조)
##### GeoDataFrame / Series / GeoSeries

In [None]:
# _10 GeoPandas 데이터구조 확인하기
print(type(seoul_h_dong_gdf))
print(type(seoul_h_dong_gdf['DONG_NM']))
print(type(seoul_h_dong_gdf['geometry']))

### GeoSeries 알아보기
* Pandas의 Series + Geometry

#### GeoSeries 속성(Attributes)
* geom_type
* area
* bounds
* total_bounds

In [None]:
# _11 geometry type 확인하기
seoul_h_dong_gdf['geometry'].geom_type[:10]

In [None]:
# _12 Polygon 확인하기 
seoul_h_dong_gdf['geometry'][0]

In [None]:
# _13 GeoSeries 면적 계산하기
seoul_h_dong_gdf['geometry'].area[:5]

In [None]:
# _14 길이 확인하기
seoul_h_dong_gdf['geometry'].length[:5]

In [None]:
# _15 좌표체계 확인하기
# seoul_h_dong_gdf.crs = {'init': 'epsg:4326'}
seoul_h_dong_gdf.crs

In [None]:
# _16 GeoSeries bbox가져오기
seoul_h_dong_gdf['geometry'].bounds[:5]

In [None]:
# _17 지도 전체 bbox가져오기
seoul_h_dong_gdf['geometry'].total_bounds

##### GeoSeries Method
* centroid
* distance()
* representative_point()
* plot()

In [None]:
# _18 폴리곤 중심점 
seoul_h_dong_gdf['geometry'].centroid[:5]

In [None]:
# _19 폴리곤 내 Point 
seoul_h_dong_gdf['geometry'].representative_point()[:5]

In [None]:
# _20 두점 거리 계산하기
start_point = seoul_h_dong_gdf['geometry'].centroid[0]
end_point = seoul_h_dong_gdf['geometry'].centroid[1]

start_point.distance(end_point)

### GeoDataFrame 알아보기

##### GeoDataFrame Method

In [None]:
# !pip3 install descartes

In [None]:
# _21 지도 그리기
%matplotlib inline
seoul_h_dong_gdf.plot()

In [None]:
# _22 현재 위치정보(좌표)가 저장된 GeoSeries명 확인하기 - gemetry name확인
seoul_h_dong_gdf.geometry.name

In [None]:
# _23 컬럼명 변경하기
seoul_h_dong_gdf = seoul_h_dong_gdf.rename(columns={'geometry': 'geom'})

In [None]:
# _24 GeoDataFrame의 gemetry 확인하기
seoul_h_dong_gdf.geometry.name

In [None]:
# _25 GeoDataFrame에 geometry 등록하기
seoul_h_dong_gdf = seoul_h_dong_gdf.set_geometry('geom')
seoul_h_dong_gdf.geometry.name

In [None]:
# _26 GeoDataFrame의 새로운 컬럼에 폴리곤 중심점 값을 할당하기
seoul_h_dong_gdf['centoroid'] = seoul_h_dong_gdf.centroid
seoul_h_dong_gdf.head()

In [None]:
# _27 해당 Dataframe의 geometry컬럼 변경하기
seoul_h_dong_gdf = seoul_h_dong_gdf.set_geometry('centoroid')
seoul_h_dong_gdf.geometry.name

In [None]:
# _28 plot
seoul_h_dong_gdf.plot()

In [None]:
print(type(seoul_h_dong_gdf['geom']))
print(type(seoul_h_dong_gdf['centoroid']))

##  Writing data

In [None]:
# 폴더생성
!mkdir ./maps/output

In [None]:
# _29 shp파일 저장하기 (에러발생)
seoul_h_dong_gdf.to_file('./maps/output/seoul_h_dong', encoding='utf-8')

In [None]:
# _30 불필요한 컬럼 제거하기
# 파일 저장 시 GeoDataFrame에는 좌표정보가 반드시 하나만 있어야 한다.
columns = ['SGG_NM', 'DONG_NM','SGG_CODE', 'H_CODE', 'SEDAE', 'SEDAE_INGU', 'TOTAL_POP', 'MALE_POP', 'FEMALE_POP', '65_OVER','geom']
gdf = gpd.GeoDataFrame(seoul_h_dong_gdf[columns], geometry='geom')
gdf.head()

In [None]:
# _31 Dataframe 타입 확인
type(gdf)

In [None]:
# _32 shp파일로 저장하기
gdf.to_file('./maps/output/seoul_h_dong', encoding='utf-8')

In [None]:
# _33 geojson으로 저장하기
gdf.to_file('./maps/output/seoul_h_dong.geojson', driver='GeoJSON')