# [실습] 지도를 이용한 데이터 시각화하기

##### [실습] 지도에 우리집 표시하기
##### [미션] 여행가고 싶은 장소(국내외) 3곳을 지도에 다른 색상 마커로 표시하기
##### [실습-옵션] (나의) 구글 Location History 데이터 지도에 표시하기
##### [실습] 우리나라 행정구역 경계 지도에 표시하기
##### [실습] 서울지역 구별 인구수 지도에 시각화하기
##### [미션] 제주도 지역별 인구수 지도에 시각화하기


-------------------------------

### 지도에 표시하기 위해 필요한 정보
- **위도(Latitude)**: 가로선, 적도를 기준으로 북쪽/남쪽으로 얼마나 떨어져 있는지 나타내는 위치, 위도 1도는 대략 111km, 
- **경도(longitude)**: 세로선, 그리니치 천문대를 기준으로 동/서를 세로로 표시하는 선, 오른쪽 동경(East~180)/왼쪽 서경(West~180)

In [1]:
# 인터넷에 있는 이미지 보여주기
from IPython.display import Image
Image(url='http://4.bp.blogspot.com/-7nTuhDQ2gSE/VYgQiE8sJzI/AAAAAAAAALw/JFVQKIhZyF4/s1600/This_is_a_basic_photo_showing_that_latitude_lines_are_horizontal_and_longitude_lines_are_vertical-_2014-07-25_20-36.jpg'
     , width=400, height=300)

- **우리나라의 위도 경도 **
> 위도(33 ~ 43), 경도(124 ~ 132)

In [2]:
Image(url='https://mblogthumb-phinf.pstatic.net/MjAxOTA3MTJfMTgg/MDAxNTYyOTAxMzQ0MzE0.KPkhwGuXiIxf5gKHa28kdazfvAFi8x_8pYqQf5wCgIIg.bFcsxsI-MmUaKUW_zBJWhCE6Z7mbbaI4z7a7NW6G2wog.PNG.lkokvse78/image.png?type=w800'
          , width=400, height=300)

--------------

### [실습] 지도에 우리집 표시하기

#### 지도 라이브러리
- 공식 사이트: https://python-visualization.github.io/folium/
- 참고 사이트: https://teddylee777.github.io/visualization/folium 
- 참고 사이트: https://dailyheumsi.tistory.com/m/144?category=854906
    

#### 1. 지도 라이브러리 folium 설치

In [None]:
!pip install folium

In [None]:
import folium

folium.__version__

#### 2. 우리집 주소 지도에 표시하기
- 구글 지도 또는 네이버 지도 등에서 우리집 위도&경도 값 확인하기
- **지도 테마(종류**:  (기본테마)OpenStreetMap, Stamen Terrain, Stamen Toner, cartodbpositron
 > tile 옵션 사용하여 적용: ex(tiles='Stamen Toner') <br>
 >‘Mapbox Bright’, 와 ‘Mapbox Control room tiles’ 은 등록키가 있어야함.
 
- **location**: 마커를 추가할 위도/경도 좌표를 입력 후

- **popup**: 표기할 팝업 문구 지정 (마우스 클릭시 표기되는 문구)

- **tooltip**: 표기할 툴팁 지정 (마우스 오버시 표기되는 문구)

#### # 마커 종류
- icon : star/cloud/info-sign/
- color : red/blue/green/등

In [28]:
import folium

#------------------
# 우리집 [위도,경도]=[Latitude, longitude]
#------------------
# 방법1 : location에 직접 넣기
m = folium.Map(location=[37.5393556, 127.0667081],
               zoom_start=16)

# 방법2 : 딕셔너리 정보 이용해서 넣기
data = {'우리집': [37.5393556, 127.0667081] }
m = folium.Map(location=data['우리집'], zoom_start=16)


#------------------
# 지도 종류 변경하기
#------------------
m = folium.Map(location=data['우리집'], zoom_start=16, tiles='OpenStreetMap')

#------------------
# 마커 표시하기
#------------------
folium.Marker(location = data['우리집'],
              popup = '동부여성발전센터', 
              icon=folium.Icon(color='purple', icon='star')
).add_to(m)


m

#### 3. 우리 집 반경에 CircleMarker 표시하기
- location Point [위도, 경도] 를 중심으로 radius 만큼의 원을 그린다

In [34]:
import folium

data = {'우리집': [37.5393556, 127.0667081] }
m = folium.Map(location=data['우리집'], zoom_start=16)

folium.Marker(location = data['우리집'],
              popup = '동부여성발전센터', 
              icon=folium.Icon(color='red', icon='star')
).add_to(m)


# 방법1: CircleMarker 색칠 안하기
folium.CircleMarker(
    location= data['우리집'],
    radius = 100,      # 원 크기
    fill=False,         # 원 칠하기
    color='#3366ff',   # 원 선 색상
    popup='CircleMarker popup',
    tooltip = '우리집'
).add_to(m)

# 방법2: CircleMarker 색칠하기 
# folium.CircleMarker(
#     location= data['우리집'],
#     radius = 100,      # 원 크기
#     fill=True,         # 원 칠하기
#     color='#3366ff',   # 원 선 색상
#     fill_color='#ff3366', # 원 내부 색상
#     popup='CircleMarker popup',
#     tooltip = '우리집'
# ).add_to(m)

m

#### 4. html 파일로 저장하기

In [41]:
import webbrowser

# html 파일로 저장하기
m.save('data/map_myhouse.html')
webbrowser.open('c:/python/projectmanager/data/map_myhouse.html') # fullpath를 사용해야 오류가 없다

True

------------------------------------------------

### [미션] 여행가고 싶은 장소(국내외) 3곳을 지도에 다른 색상 마커로 표시하기

- 영국-내셔널 갤러리: 51.508929,-0.128299
- 뉴욕-브로드웨이: 40.8124199,-73.9627283
- 로마-트레비 분수: 41.9010333,12.4810789
- tiles='Mapbox'
> - Stamen Terrain: 녹색 지도
> - Stamen Toner: 흑백 토너

In [None]:
buckets = {'영국-내셔널 갤러리': [51.508929,-0.128299],
           '뉴욕-브로드웨이': [40.8124199,-73.9627283],
           '로마-트레비 분수': [41.9010333,12.4810789],
          }

m = folium.Map(location= [41.9010333, 12.4810789], 
               zoom_start=2, 
               tiles='Stamen Toner')  

folium.Marker(location= buckets['영국-내셔널 갤러리'],
              icon=folium.Icon(icon='glyphicon glyphicon-thumbs-up',
                                   color='purple', icon_color='white',),
              popup='영국-내셔널 갤러리',
              tooltip = '1st travel'
).add_to(m)
folium.Marker(location= buckets['뉴욕-브로드웨이'],
              icon=folium.Icon(icon='info-sign', color='green'),
              popup='뉴욕 브로드웨이',
              tooltip = '2nd travel'
).add_to(m)
folium.Marker(location= buckets['로마-트레비 분수'],
              icon=folium.Icon(icon='cloud', color='red'),
              popup='로마 트레비 분수',
              tooltip = '3rd travel'
).add_to(m)

m.save('data/map_mytravel.html')
webbrowser.open('c:/python/highschool/data/map_mytravel.html') # fullpath를 사용해야 오류가 없다


----------------------

--------------

### [실습] (나의) 구글 Location History 데이터 지도에 표시하기

#### 참고 글
https://betterprogramming.pub/loading-location-history-places-from-google-timeline-into-pandas-and-csv-c26cb0ac5e89

#### 1. 구글 Location History 데이터 다운로드
- 구글 크롬 브라우저에 로그인 된 상태에서
- https://takeout.google.com/settings/takeout 사이트로 이동하기
- 모두 체크를 해제시키고 **[위치 기록]** 만 체크표시하고 
- takeout-20220803T011231Z-001.zip 파일이 다운로드 된다.

#### 2. 필요한 라이브러리 설치하기
설치시 오류가 발생하면 윈도우 명령프롬프트창에서 timezonefinder 설치를 진행해 본다.

In [49]:
import numpy as np

np.__version__

'1.19.5'

In [50]:
!pip install timezonefinder

Collecting numpy>=1.20.3
  Downloading numpy-1.23.3-cp39-cp39-win_amd64.whl (14.7 MB)
     --------------------------------------- 14.7/14.7 MB 11.9 MB/s eta 0:00:00
Installing collected packages: numpy
  Attempting uninstall: numpy
    Found existing installation: numpy 1.19.5
    Uninstalling numpy-1.19.5:
      Successfully uninstalled numpy-1.19.5


ERROR: Could not install packages due to an OSError: [WinError 5] 액세스가 거부되었습니다: 'C:\\python\\Python39\\Lib\\site-packages\\~%mpy\\.libs\\libopenblas.WCDJNK7YVMPZQ2ME2ZZHJJRJ3JIKNDB7.gfortran-win_amd64.dll'
Consider using the `--user` option or check the permissions.


[notice] A new release of pip available: 22.2.1 -> 22.2.2
[notice] To update, run: python.exe -m pip install --upgrade pip


In [51]:
# 경도, 위도값으로 시간대 정보 가져오기
from timezonefinder import TimezoneFinder

tzf= TimezoneFinder()
tz = tzf.timezone_at(lng=128, lat=38)  # 'Asia/Seoul'
#tz = tzf.timezone_at(lng=13.358, lat=52.5061)  # 'Europe/Berlin'
tz

'Asia/Seoul'

#### 3.나의 Local History데이터 정보를 딕셔너리타입으로 변환하기

In [52]:
from zipfile import ZipFile
import pandas as pd
import json
from timezonefinder import TimezoneFinder

In [53]:
# path to Google Location History takeout file
history_data_file = "data/takeout-20220803T011231Z-001.zip"

# store all places into this array
place_visits = []

with ZipFile(history_data_file) as myzip:
    for file in myzip.filelist[:]:
        filename = file.filename
        
        if "Semantic Location History" in filename:
            # process all files in "Semantic Location History" directory
            history_json = json.load(myzip.open(filename))

            for timeline_object in history_json["timelineObjects"]:
               
                if "placeVisit" in timeline_object:
                    place_visit_json = timeline_object["placeVisit"]
                    
                    # skip places without geographical coordinates
                    if not "location" in place_visit_json or not "latitudeE7" in place_visit_json["location"]:
                        continue
                    
                    place_visit = {
                        "placeId": place_visit_json["location"]["placeId"],
                        "locationConfidence": place_visit_json["location"]["locationConfidence"],
                        "startTimestamp": place_visit_json["duration"]["startTimestamp"],
                        "endTimestamp": place_visit_json["duration"]["endTimestamp"],
                        "placeVisitImportance": place_visit_json["placeVisitImportance"],
                        "placeVisitType": place_visit_json["placeVisitType"],
                        "latitudeE7": place_visit_json["location"]["latitudeE7"],
                        "longitudeE7": place_visit_json["location"]["longitudeE7"],
                    }
                    
                    for optional_field in ["centerLatE7", "centerLngE7"]:
                        if optional_field in place_visit_json:
                            place_visit[optional_field] = place_visit_json[optional_field]
                        else:
                            place_visit[optional_field] = None
                    
                    for optional_field in ["name", "address"]:
                        if optional_field in place_visit_json["location"]:
                            place_visit[optional_field] = place_visit_json["location"][optional_field]
                        else:
                            place_visit[optional_field] = None
                        
                    
                    place_visits.append(place_visit)

place_visits   

[{'placeId': 'ChIJ-TPmtZ5hezUR_ynve8y3RN8',
  'locationConfidence': 94.88838,
  'startTimestamp': '2022-08-01T07:58:34.215Z',
  'endTimestamp': '2022-08-01T08:44:38.168Z',
  'placeVisitImportance': 'MAIN',
  'placeVisitType': 'SINGLE_PLACE',
  'latitudeE7': 374472973,
  'longitudeE7': 1268854894,
  'centerLatE7': 374479545,
  'centerLngE7': 1268851510,
  'name': '개성손만두',
  'address': '대한민국 광명시 소하동 1337번지 103호 광명시 경기도 KR'},
 {'placeId': 'ChIJiWKXIGxhezURSdDzm8-jpb0',
  'locationConfidence': 71.79532,
  'startTimestamp': '2022-08-01T09:21:21.989Z',
  'endTimestamp': '2022-08-02T08:39:53.052Z',
  'placeVisitImportance': 'MAIN',
  'placeVisitType': 'SINGLE_PLACE',
  'latitudeE7': 374308554,
  'longitudeE7': 1268842593,
  'centerLatE7': 374308490,
  'centerLngE7': 1268843140,
  'name': '501 광명역세권휴먼시아5단지',
  'address': '대한민국 광명시 소하2동'},
 {'placeId': 'ChIJkT4EGUFhezURmFNNjUBhZdw',
  'locationConfidence': 91.55132,
  'startTimestamp': '2022-08-02T08:54:19.849Z',
  'endTimestamp': '2022-08-02T0

#### 4. DataFrame 형태로 변환하기

In [55]:
# 1.DataFrame형태로 변환하기
place_visits_df = pd.DataFrame(place_visits)
place_visits_df.head(2)


# 2.데이터 전처리하기
# convert to datetime type
place_visits_df["startTimestamp"] = pd.to_datetime(place_visits_df["startTimestamp"])
place_visits_df["endTimestamp"] = pd.to_datetime(place_visits_df["endTimestamp"])

# get geo coordinates as float value
place_visits_df["latitude"] = place_visits_df.latitudeE7/10**7   #(1E7 = 1e7 = 1x10^7 = 10**7)
place_visits_df["longitude"] = place_visits_df.longitudeE7/1e7
place_visits_df["centerLat"] = place_visits_df.centerLatE7/1E7
place_visits_df["centerLng"] = place_visits_df.centerLngE7/1E7
 
# add timezone based on geo coordinates
tf = TimezoneFinder()
place_visits_df["timezone"] = place_visits_df.apply(lambda row: tf.timezone_at(lng=row.longitude, lat=row.latitude), axis=1)

# convert UTC time to local timezone
place_visits_df['startTimestamp_local'] = place_visits_df.apply(lambda row: row.startTimestamp.tz_convert(row.timezone), axis=1)
place_visits_df['endTimestamp_local'] =place_visits_df.apply(lambda row: row.endTimestamp.tz_convert(row.timezone), axis=1)

# remove TZ info from datetime
place_visits_df['startTimestamp_local'] = pd.to_datetime(place_visits_df['startTimestamp_local'].apply(lambda x: x.replace(tzinfo=None)))
place_visits_df['endTimestamp_local'] = pd.to_datetime(place_visits_df['endTimestamp_local'].apply(lambda x: x.replace(tzinfo=None)))

# add datetime parts as a separate column to data frame
for datetime_type in [("year", lambda x: x.year), ("month", lambda x: x.month), ("day", lambda x: x.day), ("hour", lambda x: x.hour), ("minute", lambda x: x.minute), ("weekday", lambda x: x.weekday)]:
    for tztype in ["", "_local"]:
        place_visits_df[f"{datetime_type[0]}{tztype}"] = datetime_type[1](place_visits_df[f"startTimestamp{tztype}"].dt)
        

place_visits_df.drop(columns=["latitudeE7", "longitudeE7", "centerLatE7", "centerLngE7"], inplace=True)
place_visits_df["duration"] = place_visits_df.endTimestamp - place_visits_df.startTimestamp
place_visits_df["duration_minutes"] = place_visits_df.duration.dt.total_seconds()/60


# 3. 파일로 저장하기
file = "data/place_visits.csv"
place_visits_df.to_csv(file, index=False)


place_visits_df

Unnamed: 0,placeId,locationConfidence,startTimestamp,endTimestamp,placeVisitImportance,placeVisitType,name,address,latitude,longitude,...,day,day_local,hour,hour_local,minute,minute_local,weekday,weekday_local,duration,duration_minutes
0,ChIJ-TPmtZ5hezUR_ynve8y3RN8,94.888380,2022-08-01 07:58:34.215000+00:00,2022-08-01 08:44:38.168000+00:00,MAIN,SINGLE_PLACE,개성손만두,대한민국 광명시 소하동 1337번지 103호 광명시 경기도 KR,37.447297,126.885489,...,1,1,7,16,58,58,0,0,0 days 00:46:03.953000,46.065883
1,ChIJiWKXIGxhezURSdDzm8-jpb0,71.795320,2022-08-01 09:21:21.989000+00:00,2022-08-02 08:39:53.052000+00:00,MAIN,SINGLE_PLACE,501 광명역세권휴먼시아5단지,대한민국 광명시 소하2동,37.430855,126.884259,...,1,1,9,18,21,21,0,0,0 days 23:18:31.063000,1398.517717
2,ChIJkT4EGUFhezURmFNNjUBhZdw,91.551320,2022-08-02 08:54:19.849000+00:00,2022-08-02 09:47:05.617000+00:00,MAIN,SINGLE_PLACE,Costco Wholesale Gwangmyeong,대한민국 경기도 광명시 일직로 40,37.420856,126.885813,...,2,2,8,17,54,54,1,1,0 days 00:52:45.768000,52.762800
3,ChIJiWKXIGxhezURSdDzm8-jpb0,70.120850,2022-08-02 10:03:04.965000+00:00,2022-08-02 18:20:28.867000+00:00,MAIN,SINGLE_PLACE,501 광명역세권휴먼시아5단지,대한민국 광명시 소하2동,37.430855,126.884259,...,2,2,10,19,3,3,1,1,0 days 08:17:23.902000,497.398367
4,ChIJl4xz5DalfDUR5J-cZDd1bDM,87.759590,2022-07-02 02:07:57.776000+00:00,2022-07-02 08:29:09.583000+00:00,MAIN,SINGLE_PLACE,COEX,대한민국 서울특별시 강남구 영동대로 513,37.511683,127.059151,...,2,2,2,11,7,7,5,5,0 days 06:21:11.807000,381.196783
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
249,ChIJe_OEVTZhezURZVZOKT15c9A,82.448265,2022-05-29 04:04:34.437000+00:00,2022-05-29 04:56:10.241000+00:00,MAIN,SINGLE_PLACE,중앙대학교광명병원,대한민국 경기도 광명시 일직동 501,37.424214,126.886020,...,29,29,4,13,4,4,6,6,0 days 00:51:35.804000,51.596733
250,ChIJiWKXIGxhezURSdDzm8-jpb0,65.565040,2022-05-29 05:13:53.788000+00:00,2022-05-30 00:23:38.362000+00:00,MAIN,SINGLE_PLACE,501 광명역세권휴먼시아5단지,대한민국 광명시 소하2동,37.430855,126.884259,...,29,29,5,14,13,13,6,6,0 days 19:09:44.574000,1149.742900
251,ChIJkT4EGUFhezURmFNNjUBhZdw,93.717640,2022-05-30 00:52:54.475000+00:00,2022-05-30 02:07:52.426000+00:00,MAIN,SINGLE_PLACE,Costco Wholesale - Gwangmyeong Branch,대한민국 경기도 광명시 일직로 40,37.420684,126.886428,...,30,30,0,9,52,52,0,0,0 days 01:14:57.951000,74.965850
252,ChIJiWKXIGxhezURSdDzm8-jpb0,57.597305,2022-05-30 02:22:31.502000+00:00,2022-05-30 09:50:19+00:00,MAIN,SINGLE_PLACE,501 광명역세권휴먼시아5단지,대한민국 광명시 소하2동,37.430855,126.884259,...,30,30,2,11,22,22,0,0,0 days 07:27:47.498000,447.791633


#### 5. (나의)Location History 지도에 표시하기

In [57]:
import folium
import webbrowser
import pandas as pd

# 파일 불러오기
# df = pd.read_csv(file)
df = place_visits_df


center = [37.4306881, 126.8845086]
# m = folium.Map(location=center ,
#                   zoom_start=6, 
#                   width=750, 
#                   height=500)
m = folium.Map(location=center ,
                  zoom_start=6)

# df에서 위도&경도 정보 지도 Marker에 추가하기
folium.Marker(location=center, 
                popup='우리집', icon=folium.Icon(color='red', icon='star'),
                color='tomato', radius = 50,
).add_to(m)


# 구글 Location History 마커로 표시하기
for i, row in df.iterrows():    
    folium.Marker(location= [row['latitude'], row['longitude']], 
                  icon=folium.Icon(icon='cloud', color='green'),
                  popup=row['name']
    ).add_to(m)
    
m    

#html 파일로 저장하여 불러오기
m.save('data/map_google_lh.html')
webbrowser.open('C:/python/projectmanager/data/map_google_lh.html')

True

--------------------

### 우리나라 행정구역 경계 지도에 표시하기

####  1. 우리나라 행정구역 경계 데이터 다운로드하기
- https://github.com/southkorea/southkorea-maps  > /kostat/2018/json/
- **Provinces (시도)** :  skorea-provinces-2018-geo.json  
- **Municipalities (시군구)** : skorea-municipalities-2018-geo.json

#### 2. 우리나라 행정구역 시/도 경계 표시하기

In [72]:
import folium
import json


file = 'data/geo/skorea-provinces-2018-geo.json'          # 대한민국 시도 행정구역
# file = 'data/skorea-municipalities-2018-geo.json'   # 대한민국 시군구 
# file = 'data/skorea-submunicipalities-2018-geo.json'       # 대한민국 시군구 읍면동
rfile = open(file, 'r', encoding='utf-8').read()
jsonData = json.loads(rfile)

m = folium.Map(location=[37.566345, 126.977893], zoom_start=6)
folium.GeoJson(jsonData, name='json_data').add_to(m)
m

import webbrowser

m.save('data/map_provinces.html')
webbrowser.open('c:/python/projectmanager/data/map_provinces.html') # fullpath를 사용해야 오류가 없다

True

-----------

### [실습] 서울지역 시군구/ 인구수 지도에 시각화하기

### 1. 데이터 준비하기 ( 서울지역 행정구역 데이터)


|구분 | geocode데이터(json) | 인구 데이터(csv) |
|:----|:----|:----|
|다운로드 |https://github.com/raqoon886/Local_HangJeongDong    |https://jumin.mois.go.kr/index.jsp |
|파일명 |hangjeongdong_서울특별시.geojson <br> seoul_municipalities_geo_simple.json | 202205_202205_주민등록인구및세대현황_월간_서울.csv|
|URL |https://raw.githubusercontent.com/southkorea/seoul-maps/master/kostat/2013/json/seoul_municipalities_geo_simple.json | |

In [81]:
#----------------------------
### 1. 데이터 준비하기
#----------------------------

import pandas as pd

file = 'data/geo/202205_202205_주민등록인구및세대현황_월간_서울.csv'
df = pd.read_csv(file, encoding='euc-kr')
df_t = df.copy()
df_t.head()


#----------------------------
### 2. 데이터 전처리하기
#----------------------------
# 불필요한 행 제거
df_t.drop( [df_t.index[0]], inplace=True  ) # 첫째행 삭제

# 불필요한 열 제거
df_t.drop( ['2022년05월_세대수','2022년05월_세대당 인구','2022년05월_남여 비율'], 
               axis=1, inplace=True ) # 특정 컬럼 삭제

# 컬럼명 변경
df_t.columns = ['행정구역','total','man','woman']
df_t.head(2)


# 행정구역 시, 군 분리하기
# 특정 위치에 컬럼 추가
df_t.insert(1, 'sido', df_t['행정구역'].str.split(' ').str[0]) # 인덱스 1 위치에 추가
df_t.insert(2, 'name', df_t['행정구역'].str.split(' ').str[1]) # 인덱스 2 위치에 추가

# 맨 뒤에 컬럼 추가
# df_t['시'] = df_t['행정구역'].str.split(' ').str[0]
# df_t['군'] = df_t['행정구역'].str.split(' ').str[1]

# 숫자안에 콤마 제거 
df_t['total'] = df_t['total'].str.replace(pat=r',', repl=r'', regex=True)
df_t['man'] = df_t['man'].str.replace(pat=r',', repl=r'', regex=True)
df_t['woman'] = df_t['woman'].str.replace(pat=r',', repl=r'', regex=True)

# 최종 불필요한 컬럼 제거
df_t.drop( ['행정구역'], axis=1, inplace=True ) # 특정 컬럼 삭제
df_t.head(2)

# 파일로 저장하기
file = 'data/geo/서울시_행정구역별_인구-m.csv'
df_t.to_csv(file)


#----------------------------
### 3. 지도에 표시하기
#----------------------------

import pandas as pd

# 행정구역별 인구 데이터 불러오기.
df = pd.read_csv(file)
df.drop(['Unnamed: 0'], axis = 1, inplace = True)


# 방법1: 행정구역별 Geocode 데이터 불러오기-
geo_data = 'https://raw.githubusercontent.com/southkorea/seoul-maps/master/kostat/2013/json/seoul_municipalities_geo_simple.json'

# 방법2: 행정구역별 Geocode 데이터 불러오기 - 
# import json
# file = 'data/geo/seoul_municipalities_geo_simple.json'
# with open(file, 'r', encoding='utf-8') as f:
#     geo_data = json.load(f)
    
geo_data


# 자도에 표시하기
import folium

# 서울시 중심부의 위도, 경도 입니다.
center = [37.541, 126.986]

# 맵이 center 에 위치하고, zoom 레벨은 11로 시작하는 맵 m을 만듭니다.
m = folium.Map(location=center, tiles="OpenStreetMap", zoom_start=10)

#Choropleth 레이어를 만들고, 맵 m에 추가합니다.
folium.Choropleth(
    geo_data=geo_data,
    name='인구수',
    data=df,
    columns=('name', 'total'),
    key_on='feature.properties.name',
    fill_color='YlGn',
    legend_name='total',
).add_to(m)

# 맵 m을 출력합니다.
m

import webbrowser
m.save('data/seoul_provinces.html')
webbrowser.open('c:/python/projectmanager/data/seoul_provinces.html') # fullpath를 사용해야 오류가 없다

True

### [실습문제] 서울시 읍면동 시각화하기
- 행정구역 인구수: 202205_202205_주민등록인구및세대현황_월간_전국_읍면동.csv (2022년)
- geojson지도정보: seoul_submunicipalities_geo_simple.json (2013년)

In [86]:
#--------------------
### 1. 데이터 준비하기
#--------------------
import pandas as pd

file = 'data/geo/202207_202207_주민등록인구및세대현황_월간_전국_읍면동.csv'
df = pd.read_csv(file, encoding='euc-kr')
df_t = df.copy()
df_t = df.query(" 행정구역.str.contains('서울특별시') ")
df_t.head()

#--------------------
### 2. 데이터 전처리
#--------------------
# 불필요한 행 제거
df_t.drop( [df_t.index[0]], inplace=True  ) # 첫째행 삭제

# 불필요한 열 제거
df_t.drop( ['2022년07월_세대수','2022년07월_세대당 인구','2022년07월_남여 비율'], 
               axis=1, inplace=True ) # 특정 컬럼 삭제


# 컬럼명 변경
df_t.columns = ['행정구역','total','man','woman']
df_t.head(2)


# 행정구역 시, 군 분리하기
# 특정 위치에 컬럼 추가
df_t.insert(1, 'sido', df_t['행정구역'].str.split(' ').str[0]) # 인덱스 1 위치에 추가
df_t.insert(2, 'gugun', df_t['행정구역'].str.split(' ').str[1]) # 인덱스 2 위치에 추가
df_t.insert(3, 'name', df_t['행정구역'].str.split(' ').str[2]) # 인덱스 3 위치에 추가
df_t['name'] = df_t['name'].str.split('(').str[0].str.strip()

# 숫자안에 콤마 제거 
df_t['total'] = df_t['total'].str.replace(pat=r',', repl=r'', regex=True)
df_t['man'] = df_t['man'].str.replace(pat=r',', repl=r'', regex=True)
df_t['woman'] = df_t['woman'].str.replace(pat=r',', repl=r'', regex=True)

# 최종 불필요한 컬럼 제거
df_t.drop( ['행정구역'], axis=1, inplace=True ) # 특정 컬럼 삭제
df_t.dropna(subset=['name'], inplace=True)  # null인 데이터 삭제
df_t = df_t.query(" name != '' ")

# 파일로 저장하기
file = 'data/geo/서울시_행정구역별_읍면동_인구-m.csv'
df_t.to_csv(file)
df_t


#--------------------
### 3. 지도에 표시하기
#--------------------
import pandas as pd

# 행정구역별 인구 데이터 불러오기.
df = pd.read_csv(file)
df.drop(['Unnamed: 0'], axis = 1, inplace = True)


# 행정구역별 Geocode 데이터 불러오기 - # 방법2 (동 단위까지 있는 지리정보)
import json
file = 'data/geo/seoul_submunicipalities_geo_simple.json'
with open(file, 'r', encoding='utf-8') as f:
    geo_data = json.load(f)
    
geo_data




import folium

# 서울시 중심부의 위도, 경도 입니다.
center = [37.541, 126.986]

# 맵이 center 에 위치하고, zoom 레벨은 11로 시작하는 맵 m을 만듭니다.
m = folium.Map(location=center, tiles="OpenStreetMap", zoom_start=10)

#Choropleth 레이어를 만들고, 맵 m에 추가합니다.
folium.Choropleth(
    geo_data=geo_data,
    name='인구수',
    data=df,
    columns=('name', 'total'),
    key_on='feature.properties.name',
    fill_color='YlOrRd',
    legend_name='total',
).add_to(m)

# 맵 m을 출력합니다.
m  

import webbrowser
m.save('data/seoul_detail_provinces.html')
webbrowser.open('c:/python/projectmanager/data/seoul_detail_provinces.html') # fullpath를 사용해야 오류가 없다

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_t.drop( [df_t.index[0]], inplace=True  ) # 첫째행 삭제
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_t.drop( ['2022년07월_세대수','2022년07월_세대당 인구','2022년07월_남여 비율'],
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_t['name'] = df_t['name'].str.split('(').str[0].str.strip()
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats 

True

### [실습문제] 제주도 행정구역정보 이용하여 지도 영역 표시하기

- https://github.com/southkorea/southkorea-maps/tree/master/kostat/2013/json  
- 행정구역 인구수: 202207_202207_주민등록인구및세대현황_월간_제주.csv
- geojson지도정보: skorea_municipalities_geo_simple-jeju.json

In [87]:
#----------------------------
### 1. 데이터 준비하기
#----------------------------

import pandas as pd

file = 'data/geo/202207_202207_주민등록인구및세대현황_월간_제주.csv'
df = pd.read_csv(file, encoding='euc-kr')
df_t = df.copy()
df_t.head()


#----------------------------
### 2. 데이터 전처리하기
#----------------------------
# 불필요한 행 제거
df_t.drop( [df_t.index[0]], inplace=True  ) # 첫째행 삭제

# 불필요한 열 제거
df_t.drop( ['2022년07월_세대수','2022년07월_세대당 인구','2022년07월_남여 비율'], 
               axis=1, inplace=True ) # 특정 컬럼 삭제

# 컬럼명 변경
df_t.columns = ['행정구역','total','man','woman']
df_t.head(2)


# 행정구역 시, 군 분리하기
# 특정 위치에 컬럼 추가
df_t.insert(1, 'sido', df_t['행정구역'].str.split(' ').str[0]) # 인덱스 1 위치에 추가
df_t.insert(2, 'name', df_t['행정구역'].str.split(' ').str[1]) # 인덱스 2 위치에 추가

# 맨 뒤에 컬럼 추가
# df_t['시'] = df_t['행정구역'].str.split(' ').str[0]
# df_t['군'] = df_t['행정구역'].str.split(' ').str[1]

# 숫자안에 콤마 제거 
df_t['total'] = df_t['total'].str.replace(pat=r',', repl=r'', regex=True)
df_t['man'] = df_t['man'].str.replace(pat=r',', repl=r'', regex=True)
df_t['woman'] = df_t['woman'].str.replace(pat=r',', repl=r'', regex=True)

# 최종 불필요한 컬럼 제거
df_t.drop( ['행정구역'], axis=1, inplace=True ) # 특정 컬럼 삭제
df_t.head(2)

# 파일로 저장하기
file = 'data/geo/제주_행정구역별_인구-m.csv'
df_t.to_csv(file)


#----------------------------
### 3. 지도에 표시하기
#----------------------------

import pandas as pd

# 행정구역별 인구 데이터 불러오기.
df = pd.read_csv(file)
df.drop(['Unnamed: 0'], axis = 1, inplace = True)


# 행정구역별 Geocode 데이터 불러오기-방법1
# geo_data = 'https://raw.githubusercontent.com/southkorea/southkorea-maps/master/kostat/2013/json/skorea_municipalities_geo_simple.json'

# 행정구역별 Geocode 데이터 불러오기 - # 방법2 (동 단위까지 있는 지리정보)
import json
file = 'data/geo/jeju_municipalities_geo_simple.json'
with open(file, 'r', encoding='utf-8') as f:
    geo_data = json.load(f)

# 자도에 표시하기
import folium

# 서울시 중심부의 위도, 경도 입니다.
center = [33.446958, 126.5678683]

# 맵이 center 에 위치하고, zoom 레벨은 11로 시작하는 맵 m을 만듭니다.
m = folium.Map(location=center, tiles="OpenStreetMap", zoom_start=8)


#Choropleth 레이어를 만들고, 맵 m에 추가합니다.
folium.Choropleth(
    geo_data=geo_data,
    name='인구수',
    data=df,
    columns=('name', 'total'),
    key_on='feature.properties.name',
    fill_color='YlGn',
    legend_name='total',
).add_to(m)

# 맵 m을 출력합니다.
m

------------------------------------