# 우리나라 인구 소멸 위기 지역 분석

### 인구 소멸 위기 지역 조건은?

65세 이상 노인 인구와 20∼39세 여성 인구를 비교
- 젊은 여성 인구가 노인 인구의 절반에 미달할 경우 소멸 위험 지역으로 분류

# 데이타 획득 

- 국가통계포탈 (http://kosis.kr/index/index.do)

# 공통 패키지 임포트

In [1]:
import numpy as np
import pandas as pd
import matplotlib
import matplotlib.pyplot as plt
%matplotlib inline

import seaborn

#  한글글꼴로 변경
plt.rcParams['font.size'] = 20.0
# plt.rcParams['font.family'] = 'batang'
plt.rcParams['font.family'] = 'Malgun Gothic'
print(plt.rcParams['font.family'])
print(plt.rcParams['font.size'])

import folium

['Malgun Gothic']
20.0


# 인구 데이터 확보하고 정리하기

### 엑셀 파일 읽어오기 

In [2]:
population = pd.read_excel('../data/05. population_raw_data.xlsx', header=1)
population.shape

(846, 16)

In [3]:
population.index

RangeIndex(start=0, stop=846, step=1)

In [4]:
population.columns

Index(['행정구역(동읍면)별(1)', '행정구역(동읍면)별(2)', '항목', '계', '20 - 24세', '25 - 29세',
       '30 - 34세', '35 - 39세', '65 - 69세', '70 - 74세', '75 - 79세', '80 - 84세',
       '85 - 89세', '90 - 94세', '95 - 99세', '100+'],
      dtype='object')

### 누락데이터 처리하기 

- fillna(method='pad', inplace=True) : 가장 가까운 앞의 셀로 내용 채우기 

In [5]:
# 누락데이타 갯수 구하기 
population.isnull().sum()

행정구역(동읍면)별(1)    828
행정구역(동읍면)별(2)    564
항목                 0
계                  0
20 - 24세           0
25 - 29세           0
30 - 34세           0
35 - 39세           0
65 - 69세           0
70 - 74세           0
75 - 79세           0
80 - 84세           0
85 - 89세           0
90 - 94세           0
95 - 99세           0
100+               0
dtype: int64

In [6]:
# 누락데이타 행만 추출 
population[population.isnull()].head()

Unnamed: 0,행정구역(동읍면)별(1),행정구역(동읍면)별(2),항목,계,20 - 24세,25 - 29세,30 - 34세,35 - 39세,65 - 69세,70 - 74세,75 - 79세,80 - 84세,85 - 89세,90 - 94세,95 - 99세,100+
0,,,,,,,,,,,,,,,,
1,,,,,,,,,,,,,,,,
2,,,,,,,,,,,,,,,,
3,,,,,,,,,,,,,,,,
4,,,,,,,,,,,,,,,,


In [7]:
# 가장 가까운 데이타값으로 교체하기 
population.fillna(method='pad', inplace=True)

In [8]:
population.isnull().sum()

행정구역(동읍면)별(1)    0
행정구역(동읍면)별(2)    0
항목               0
계                0
20 - 24세         0
25 - 29세         0
30 - 34세         0
35 - 39세         0
65 - 69세         0
70 - 74세         0
75 - 79세         0
80 - 84세         0
85 - 89세         0
90 - 94세         0
95 - 99세         0
100+             0
dtype: int64

### 컬럼명 변경하기 

In [9]:
population.columns

Index(['행정구역(동읍면)별(1)', '행정구역(동읍면)별(2)', '항목', '계', '20 - 24세', '25 - 29세',
       '30 - 34세', '35 - 39세', '65 - 69세', '70 - 74세', '75 - 79세', '80 - 84세',
       '85 - 89세', '90 - 94세', '95 - 99세', '100+'],
      dtype='object')

In [10]:
population.rename(columns = {'행정구역(동읍면)별(1)':'광역시도', 
                             '행정구역(동읍면)별(2)':'시도', 
                             '계':'인구수'}, inplace=True)

In [11]:
population.head(20)

Unnamed: 0,광역시도,시도,항목,인구수,20 - 24세,25 - 29세,30 - 34세,35 - 39세,65 - 69세,70 - 74세,75 - 79세,80 - 84세,85 - 89세,90 - 94세,95 - 99세,100+
0,전국,소계,총인구수 (명),51696216.0,3541061.0,3217367.0,3517868,4016272.0,2237345.0,1781229.0,1457890,909130.0,416164.0,141488.0,34844,17562.0
1,전국,소계,남자인구수 (명),25827594.0,1877127.0,1682988.0,1806754,2045265.0,1072395.0,806680.0,600607,319391.0,113221.0,32695.0,7658,4137.0
2,전국,소계,여자인구수 (명),25868622.0,1663934.0,1534379.0,1711114,1971007.0,1164950.0,974549.0,857283,589739.0,302943.0,108793.0,27186,13425.0
3,서울특별시,소계,총인구수 (명),9930616.0,690728.0,751973.0,803507,817467.0,448956.0,350580.0,251961,141649.0,66067.0,24153.0,7058,5475.0
4,서울특별시,소계,남자인구수 (명),4876789.0,347534.0,372249.0,402358,410076.0,211568.0,163766.0,112076,54033.0,19595.0,6146.0,1900,1406.0
5,서울특별시,소계,여자인구수 (명),5053827.0,343194.0,379724.0,401149,407391.0,237388.0,186814.0,139885,87616.0,46472.0,18007.0,5158,4069.0
6,서울특별시,종로구,총인구수 (명),152737.0,11379.0,11891.0,10684,10379.0,7411.0,6636.0,5263,3104.0,1480.0,602.0,234,220.0
7,서울특별시,종로구,남자인구수 (명),75201.0,5620.0,6181.0,5387,5034.0,3411.0,3009.0,2311,1289.0,506.0,207.0,89,73.0
8,서울특별시,종로구,여자인구수 (명),77536.0,5759.0,5710.0,5297,5345.0,4000.0,3627.0,2952,1815.0,974.0,395.0,145,147.0
9,서울특별시,중구,총인구수 (명),125249.0,8216.0,9529.0,10332,10107.0,6399.0,5313.0,4127,2502.0,1260.0,469.0,158,160.0


### '소계' 값이 있는 데이타행 삭제하기 

In [12]:
# '소계' 값이 있는 데이타행 레코드 확인하기 

population[population['시도'] == '소계'].shape

(54, 16)

In [13]:
population = population[(population['시도'] != '소계')]

In [14]:
population[population['시도'] == '소계'].shape

(0, 16)

In [15]:
population.head()

Unnamed: 0,광역시도,시도,항목,인구수,20 - 24세,25 - 29세,30 - 34세,35 - 39세,65 - 69세,70 - 74세,75 - 79세,80 - 84세,85 - 89세,90 - 94세,95 - 99세,100+
6,서울특별시,종로구,총인구수 (명),152737.0,11379.0,11891.0,10684,10379.0,7411.0,6636.0,5263,3104.0,1480.0,602.0,234,220.0
7,서울특별시,종로구,남자인구수 (명),75201.0,5620.0,6181.0,5387,5034.0,3411.0,3009.0,2311,1289.0,506.0,207.0,89,73.0
8,서울특별시,종로구,여자인구수 (명),77536.0,5759.0,5710.0,5297,5345.0,4000.0,3627.0,2952,1815.0,974.0,395.0,145,147.0
9,서울특별시,중구,총인구수 (명),125249.0,8216.0,9529.0,10332,10107.0,6399.0,5313.0,4127,2502.0,1260.0,469.0,158,160.0
10,서울특별시,중구,남자인구수 (명),62204.0,4142.0,4792.0,5192,5221.0,3113.0,2405.0,1752,929.0,414.0,132.0,56,51.0


## 컬럼명 변경2

* 위 표를 보면 **항목**이라는 컬럼의 내용이 각 행정구역 마다 **총인구수, 남자인구수, 여자인구수**로 나눠있는 것을 알 수 있음
* 이를 지금 정리하기 위해 간단히 반복문(for)으로 **합계, 남자, 여자**로 변경하고 **구분**이라는 컬럼으로 저장함
* 특히 이후 데이터 처리에서 copy 관련 warning을 피하기 위해 **.copy()**옵션으로 재지정함
* 그리고, **항목**을 지우기로 함

In [16]:
population.is_copy = False
population.rename(columns = {'항목':'구분'}, inplace=True)

  object.__getattribute__(self, name)
  return object.__setattr__(self, name, value)


In [17]:
population.loc[population['구분'] == '총인구수 (명)', '구분'] = '합계'
population.loc[population['구분'] == '남자인구수 (명)', '구분'] = '남자'
population.loc[population['구분'] == '여자인구수 (명)', '구분'] = '여자'

population.columns

Index(['광역시도', '시도', '구분', '인구수', '20 - 24세', '25 - 29세', '30 - 34세',
       '35 - 39세', '65 - 69세', '70 - 74세', '75 - 79세', '80 - 84세', '85 - 89세',
       '90 - 94세', '95 - 99세', '100+'],
      dtype='object')

In [18]:
population['구분'].unique()

array(['합계', '남자', '여자'], dtype=object)

# 인구 소멸 위기 지역 계산하고 데이터 정리하기

### '20-39세', '65세이상' 의 컬럼 추가하기 

In [19]:
population['20-39세'] = population['20 - 24세'] + population['25 - 29세'] + \
                        population['30 - 34세'] + population['35 - 39세']
    
population['65세이상'] = population['65 - 69세'] + population['70 - 74세'] + \
                        population['75 - 79세'] + population['80 - 84세'] + \
                        population['85 - 89세'] + population['90 - 94세'] + \
                        population['95 - 99세'] + population['100+']
            
population.columns

Index(['광역시도', '시도', '구분', '인구수', '20 - 24세', '25 - 29세', '30 - 34세',
       '35 - 39세', '65 - 69세', '70 - 74세', '75 - 79세', '80 - 84세', '85 - 89세',
       '90 - 94세', '95 - 99세', '100+', '20-39세', '65세이상'],
      dtype='object')

### pivot_table() 기능을 이용하여 데이터 정리하기 

* **pivot_table**을 이용하여 **광역시도, 시도**를 index로 두고, **구분**으로 세로를 첫 번째 컬럼을 잡고, value에 **인구수, 20~39세, 65세이상**으로 정리해 둔다.

In [20]:
pop = pd.pivot_table(population, 
                     index = ['광역시도', '시도'], 
                     columns = ['구분'],
                     values = ['인구수', '20-39세', '65세이상'])
pop

Unnamed: 0_level_0,Unnamed: 1_level_0,20-39세,20-39세,20-39세,65세이상,65세이상,65세이상,인구수,인구수,인구수
Unnamed: 0_level_1,구분,남자,여자,합계,남자,여자,합계,남자,여자,합계
광역시도,시도,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2,Unnamed: 8_level_2,Unnamed: 9_level_2,Unnamed: 10_level_2
강원도,강릉시,26286.0,23098.0,49384.0,15767.0,21912.0,37679.0,106231.0,107615.0,213846.0
강원도,고성군,4494.0,2529.0,7023.0,2900.0,4251.0,7151.0,15899.0,14215.0,30114.0
강원도,동해시,11511.0,9753.0,21264.0,6392.0,8732.0,15124.0,47166.0,46131.0,93297.0
강원도,삼척시,8708.0,7115.0,15823.0,5892.0,8718.0,14610.0,35253.0,34346.0,69599.0
강원도,속초시,9956.0,8752.0,18708.0,5139.0,7613.0,12752.0,40288.0,41505.0,81793.0
...,...,...,...,...,...,...,...,...,...,...
충청북도,진천군,9391.0,7622.0,17013.0,4731.0,6575.0,11306.0,36387.0,33563.0,69950.0
충청북도,청원구,32216.0,27805.0,60021.0,8417.0,11914.0,20331.0,97006.0,93807.0,190813.0
충청북도,청주시,128318.0,115719.0,244037.0,37882.0,53671.0,91553.0,419323.0,415874.0,835197.0
충청북도,충주시,26600.0,22757.0,49357.0,14407.0,20383.0,34790.0,104877.0,103473.0,208350.0


### 소멸비율 컬럼 추가하기 

* **소멸비율**이라는 컬럼에 인구소멸위기지역을 계산하기 위한 식을 적용한다
* 이 비율이 1보다 작으면 **인구소멸위기지역**으로 볼 수 있다.

In [22]:
pop['소멸비율'] = pop['20-39세','여자'] / (pop['65세이상','합계'] / 2)
# pop.head()

In [24]:
# pop['소멸비율']

### 소멸위기지역 컬럼 추가하기 

* 소멸위기지역인지를 boolean으로 지정해 둔다

In [27]:
pop['소멸위기지역'] = pop['소멸비율'] < 1.0
pop['소멸위기지역']

광역시도  시도 
강원도   강릉시    False
      고성군     True
      동해시    False
      삼척시     True
      속초시    False
             ...  
충청북도  진천군    False
      청원구    False
      청주시    False
      충주시    False
      흥덕구    False
Name: 소멸위기지역, Length: 264, dtype: bool

### 소멸위기 지역의 인덱스 출력하기 

In [155]:
# 전체 확인 
# pop[pop['소멸위기지역']==True].index.get_level_values

In [31]:
# 전체 확인 => 튜플 
pop[pop['소멸위기지역']==True].index

# 1레벨에서만 확인하기 => 리스트 
pop[pop['소멸위기지역']==True].index.get_level_values(1)

Index(['고성군', '삼척시', '양양군', '영월군', '정선군', '평창군', '홍천군', '횡성군', '가평군', '양평군',
       '연천군', '거창군', '고성군', '남해군', '밀양시', '산청군', '의령군', '창녕군', '하동군', '함안군',
       '함양군', '합천군', '고령군', '군위군', '문경시', '봉화군', '상주시', '성주군', '영덕군', '영양군',
       '영주시', '영천시', '예천군', '울릉군', '울진군', '의성군', '청도군', '청송군', '동구', '영도구',
       '강화군', '옹진군', '강진군', '고흥군', '곡성군', '구례군', '담양군', '보성군', '신안군', '영광군',
       '영암군', '완도군', '장성군', '장흥군', '진도군', '함평군', '해남군', '화순군', '고창군', '김제시',
       '남원시', '무주군', '부안군', '순창군', '임실군', '장수군', '정읍시', '진안군', '공주시', '금산군',
       '논산시', '보령시', '부여군', '서천군', '예산군', '청양군', '태안군', '홍성군', '괴산군', '단양군',
       '보은군', '영동군', '옥천군'],
      dtype='object', name='시도')

In [32]:
pop.columns

MultiIndex([('20-39세', '남자'),
            ('20-39세', '여자'),
            ('20-39세', '합계'),
            ( '65세이상', '남자'),
            ( '65세이상', '여자'),
            ( '65세이상', '합계'),
            (   '인구수', '남자'),
            (   '인구수', '여자'),
            (   '인구수', '합계'),
            (  '소멸비율',   ''),
            ('소멸위기지역',   '')],
           names=[None, '구분'])

### reset_index()로 인덱스 다시 설정하기 

* pivot_table로 잘 정리가 된 상태에서 **.reset_index**로 pivot_table의 result 속성을 다시 설정한다.

In [33]:
pop.reset_index(inplace=True) 
pop.head()

Unnamed: 0_level_0,광역시도,시도,20-39세,20-39세,20-39세,65세이상,65세이상,65세이상,인구수,인구수,인구수,소멸비율,소멸위기지역
구분,Unnamed: 1_level_1,Unnamed: 2_level_1,남자,여자,합계,남자,여자,합계,남자,여자,합계,Unnamed: 12_level_1,Unnamed: 13_level_1
0,강원도,강릉시,26286.0,23098.0,49384.0,15767.0,21912.0,37679.0,106231.0,107615.0,213846.0,1.226041,False
1,강원도,고성군,4494.0,2529.0,7023.0,2900.0,4251.0,7151.0,15899.0,14215.0,30114.0,0.707314,True
2,강원도,동해시,11511.0,9753.0,21264.0,6392.0,8732.0,15124.0,47166.0,46131.0,93297.0,1.289738,False
3,강원도,삼척시,8708.0,7115.0,15823.0,5892.0,8718.0,14610.0,35253.0,34346.0,69599.0,0.97399,True
4,강원도,속초시,9956.0,8752.0,18708.0,5139.0,7613.0,12752.0,40288.0,41505.0,81793.0,1.372647,False


## 2개의 컬럼 합치기 

* 이중 column을 해제하기 위해 두 컬럼 제목을 합쳐 다시 지정한다.

In [34]:
pop.columns.get_level_values(0)

Index(['광역시도', '시도', '20-39세', '20-39세', '20-39세', '65세이상', '65세이상', '65세이상',
       '인구수', '인구수', '인구수', '소멸비율', '소멸위기지역'],
      dtype='object')

In [35]:
pop.columns.get_level_values(1)

Index(['', '', '남자', '여자', '합계', '남자', '여자', '합계', '남자', '여자', '합계', '', ''], dtype='object', name='구분')

In [36]:
tmp_coloumns = [pop.columns.get_level_values(0)[n] + \
                pop.columns.get_level_values(1)[n] 
                for n in range(0,len(pop.columns.get_level_values(0)))]

pop.columns = tmp_coloumns

pop.columns

Index(['광역시도', '시도', '20-39세남자', '20-39세여자', '20-39세합계', '65세이상남자', '65세이상여자',
       '65세이상합계', '인구수남자', '인구수여자', '인구수합계', '소멸비율', '소멸위기지역'],
      dtype='object')

In [38]:
pop.info()
pop.describe()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 264 entries, 0 to 263
Data columns (total 13 columns):
광역시도        264 non-null object
시도          264 non-null object
20-39세남자    264 non-null float64
20-39세여자    264 non-null float64
20-39세합계    264 non-null float64
65세이상남자     264 non-null float64
65세이상여자     264 non-null float64
65세이상합계     264 non-null float64
인구수남자       264 non-null float64
인구수여자       264 non-null float64
인구수합계       264 non-null float64
소멸비율        264 non-null float64
소멸위기지역      264 non-null bool
dtypes: bool(1), float64(10), object(2)
memory usage: 25.1+ KB


Unnamed: 0,20-39세남자,20-39세여자,20-39세합계,65세이상남자,65세이상여자,65세이상합계,인구수남자,인구수여자,인구수합계,소멸비율
count,264.0,264.0,264.0,264.0,264.0,264.0,264.0,264.0,264.0,264.0
mean,33785.602273,31404.295455,65189.897727,12900.575758,17603.606061,30504.181818,116842.962121,116944.454545,233787.4,1.736759
std,32024.215896,30854.741369,62815.676152,9006.782345,11824.054369,20805.025188,103231.618505,103893.096201,207053.4,1.015926
min,1252.0,863.0,2115.0,966.0,1188.0,2154.0,5430.0,4571.0,10001.0,0.334339
25%,6794.0,5297.75,12171.5,5949.0,8909.75,15015.5,31919.5,32483.25,63869.5,0.7595
50%,27881.0,24353.5,52153.0,10794.0,14833.0,25427.0,98913.0,96087.5,194524.0,1.716131
75%,49536.75,47121.0,95423.25,17223.0,22418.0,39698.75,168800.25,169432.75,339776.5,2.452575
max,197479.0,183461.0,380940.0,49915.0,67293.0,117208.0,601152.0,592889.0,1194041.0,5.895413


# 대한민국 지도 그리는 방법 소개 

- 지도 경계선을 그려주는 json 파일 구하기 
- LUCKY PARK http://goo.gl/xi5pKD
- 해식님의 블로그 

# 지도 시각화를 위해 지역별 고유 ID 만들기

In [40]:
# pop['시도'].unique()

### si_name 리스트를 None 값으로 초기화 

In [42]:
si_name = [None] * len(pop)
# si_name

### tmp_gu_dict 딕셔너리 구조로 구를 가지고 있는 시와 행정구 선언하기 

In [44]:
tmp_gu_dict = {'수원':['장안구', '권선구', '팔달구', '영통구'], 
                '성남':['수정구', '중원구', '분당구'], 
                '안양':['만안구', '동안구'], 
                 '안산':['상록구', '단원구'], 
                '고양':['덕양구', '일산동구', '일산서구'], 
                  '용인':['처인구', '기흥구', '수지구'], 
                       '청주':['상당구', '서원구', '흥덕구', '청원구'], 
                       '천안':['동남구', '서북구'], 
                       '전주':['완산구', '덕진구'], 
                       '포항':['남구', '북구'], 
                       '창원':['의창구', '성산구', '진해구', '마산합포구', '마산회원구'], 
                       '부천':['오정구', '원미구', '소사구']}
tmp_gu_dict 

{'수원': ['장안구', '권선구', '팔달구', '영통구'],
 '성남': ['수정구', '중원구', '분당구'],
 '안양': ['만안구', '동안구'],
 '안산': ['상록구', '단원구'],
 '고양': ['덕양구', '일산동구', '일산서구'],
 '용인': ['처인구', '기흥구', '수지구'],
 '청주': ['상당구', '서원구', '흥덕구', '청원구'],
 '천안': ['동남구', '서북구'],
 '전주': ['완산구', '덕진구'],
 '포항': ['남구', '북구'],
 '창원': ['의창구', '성산구', '진해구', '마산합포구', '마산회원구'],
 '부천': ['오정구', '원미구', '소사구']}

#### 고유 ID 만들기 

- 광역시도에 있는 이름의 3글자가 '광역시', '특별시', '자치시' 가 아니면 일반시나 군으로 지정 
- 고성군의 경우 강원도와 경상남도에 동일 , '고성(강원)', '고성(경남)' 으로 처리 
- '세종특별자치시'는 세종으로 처리 

In [45]:
for n in pop.index:
    if pop['광역시도'][n][-3:] not in ['광역시', '특별시', '자치시']:
        if pop['시도'][n][:-1]=='고성' and pop['광역시도'][n]=='강원도':
            si_name[n] = '고성(강원)'
        elif pop['시도'][n][:-1]=='고성' and pop['광역시도'][n]=='경상남도':
            si_name[n] = '고성(경남)'
        else:
             si_name[n] = pop['시도'][n][:-1]
                
        for keys, values in tmp_gu_dict.items():
            if pop['시도'][n] in values:
                if len(pop['시도'][n])==2:
                    si_name[n] = keys + ' ' + pop['시도'][n]
                elif pop['시도'][n] in ['마산합포구','마산회원구']:
                    si_name[n] = keys + ' ' + pop['시도'][n][2:-1]
                else:
                    si_name[n] = keys + ' ' + pop['시도'][n][:-1]
        
    elif pop['광역시도'][n] == '세종특별자치시':
        si_name[n] = '세종'
        
    else:
        if len(pop['시도'][n])==2:
            si_name[n] = pop['광역시도'][n][:2] + ' ' + pop['시도'][n]
        else:
            si_name[n] = pop['광역시도'][n][:2] + ' ' + pop['시도'][n][:-1]

In [46]:
si_name
# len(si_name)

['강릉',
 '고성(강원)',
 '동해',
 '삼척',
 '속초',
 '양구',
 '양양',
 '영월',
 '원주',
 '인제',
 '정선',
 '철원',
 '춘천',
 '태백',
 '평창',
 '홍천',
 '화천',
 '횡성',
 '가평',
 '고양',
 '과천',
 '광명',
 '광주',
 '구리',
 '군포',
 '수원 권선',
 '용인 기흥',
 '김포',
 '남양주',
 '안산 단원',
 '고양 덕양',
 '동두천',
 '안양 동안',
 '안양 만안',
 '부천',
 '성남 분당',
 '안산 상록',
 '성남',
 '부천 소사',
 '수원',
 '성남 수정',
 '용인 수지',
 '시흥',
 '안산',
 '안성',
 '안양',
 '양주',
 '양평',
 '여주',
 '연천',
 '수원 영통',
 '오산',
 '부천 오정',
 '용인',
 '부천 원미',
 '의왕',
 '의정부',
 '이천',
 '고양 일산동',
 '고양 일산서',
 '수원 장안',
 '성남 중원',
 '용인 처인',
 '파주',
 '수원 팔달',
 '평택',
 '포천',
 '하남',
 '화성',
 '거제',
 '거창',
 '고성(경남)',
 '김해',
 '남해',
 '창원 합포',
 '창원 회원',
 '밀양',
 '사천',
 '산청',
 '창원 성산',
 '양산',
 '의령',
 '창원 의창',
 '진주',
 '창원 진해',
 '창녕',
 '창원',
 '통영',
 '하동',
 '함안',
 '함양',
 '합천',
 '경산',
 '경주',
 '고령',
 '구미',
 '군위',
 '김천',
 '포항 남구',
 '문경',
 '봉화',
 '포항 북구',
 '상주',
 '성주',
 '안동',
 '영덕',
 '영양',
 '영주',
 '영천',
 '예천',
 '울릉',
 '울진',
 '의성',
 '청도',
 '청송',
 '칠곡',
 '포항',
 '광주 광산',
 '광주 남구',
 '광주 동구',
 '광주 북구',
 '광주 서구',
 '대구 남구',
 '대구 달서',
 '대구 달성',
 '대구 동구

### ID 컬럼 추가하기 

- 지도 시각화에 사용하기 위해 위 과정에서 만들어진 행정구역의 고유한 이름을 ID로 지정한다

In [47]:
pop['ID'] = si_name
# pop['ID']

In [166]:
pop.head()

Unnamed: 0,광역시도,시도,20-39세남자,20-39세여자,20-39세합계,65세이상남자,65세이상여자,65세이상합계,인구수남자,인구수여자,인구수합계,소멸비율,소멸위기지역,ID
0,강원도,강릉시,26286.0,23098.0,49384.0,15767.0,21912.0,37679.0,106231.0,107615.0,213846.0,1.226041,False,강릉
1,강원도,고성군,4494.0,2529.0,7023.0,2900.0,4251.0,7151.0,15899.0,14215.0,30114.0,0.707314,True,고성(강원)
2,강원도,동해시,11511.0,9753.0,21264.0,6392.0,8732.0,15124.0,47166.0,46131.0,93297.0,1.289738,False,동해
3,강원도,삼척시,8708.0,7115.0,15823.0,5892.0,8718.0,14610.0,35253.0,34346.0,69599.0,0.97399,True,삼척
4,강원도,속초시,9956.0,8752.0,18708.0,5139.0,7613.0,12752.0,40288.0,41505.0,81793.0,1.372647,False,속초


In [48]:
pop[pop['광역시도']=='세종특별자치시']

Unnamed: 0,광역시도,시도,20-39세남자,20-39세여자,20-39세합계,65세이상남자,65세이상여자,65세이상합계,인구수남자,인구수여자,인구수합계,소멸비율,소멸위기지역,ID
176,세종특별자치시,세종특별자치시,35826.0,36648.0,72474.0,10048.0,14149.0,24197.0,121505.0,121543.0,243048.0,3.029136,False,세종


In [49]:
# pop[pop['광역시도']=='경기도']
# pop[pop['광역시도']=='경상남도']
# pop[pop['ID']=='성남']
pop[pop['ID']=='용인']

Unnamed: 0,광역시도,시도,20-39세남자,20-39세여자,20-39세합계,65세이상남자,65세이상여자,65세이상합계,인구수남자,인구수여자,인구수합계,소멸비율,소멸위기지역,ID
53,경기도,용인시,134278.0,135898.0,270176.0,47956.0,61012.0,108968.0,492374.0,498752.0,991126.0,2.494274,False,용인


## 컬럼 삭제하기 

In [50]:
del pop['20-39세남자']
del pop['65세이상남자']
del pop['65세이상여자']

pop.head()

Unnamed: 0,광역시도,시도,20-39세여자,20-39세합계,65세이상합계,인구수남자,인구수여자,인구수합계,소멸비율,소멸위기지역,ID
0,강원도,강릉시,23098.0,49384.0,37679.0,106231.0,107615.0,213846.0,1.226041,False,강릉
1,강원도,고성군,2529.0,7023.0,7151.0,15899.0,14215.0,30114.0,0.707314,True,고성(강원)
2,강원도,동해시,9753.0,21264.0,15124.0,47166.0,46131.0,93297.0,1.289738,False,동해
3,강원도,삼척시,7115.0,15823.0,14610.0,35253.0,34346.0,69599.0,0.97399,True,삼척
4,강원도,속초시,8752.0,18708.0,12752.0,40288.0,41505.0,81793.0,1.372647,False,속초


## Folium에서 인구 소멸 위기 지역 표현하기

In [170]:
pop_folium = pop.set_index('ID')
pop_folium.head()

Unnamed: 0_level_0,광역시도,시도,20-39세여자,20-39세합계,65세이상합계,인구수남자,인구수여자,인구수합계,소멸비율,소멸위기지역
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
강릉,강원도,강릉시,23098.0,49384.0,37679.0,106231.0,107615.0,213846.0,1.226041,False
고성(강원),강원도,고성군,2529.0,7023.0,7151.0,15899.0,14215.0,30114.0,0.707314,True
동해,강원도,동해시,9753.0,21264.0,15124.0,47166.0,46131.0,93297.0,1.289738,False
삼척,강원도,삼척시,7115.0,15823.0,14610.0,35253.0,34346.0,69599.0,0.97399,True
속초,강원도,속초시,8752.0,18708.0,12752.0,40288.0,41505.0,81793.0,1.372647,False


### folium, json 임포트 

In [171]:
import folium
import json
import warnings
warnings.simplefilter(action='ignore', category=FutureWarning)

### folium.Map 이용하기 

In [174]:
map = folium.Map(location=[36.2002, 127.054], zoom_start=7)
map

### choropleth() 시각화 

- 색상 참조  https://github.com/dsc/colorbrewer-python
- choropleth 레퍼런스 
folium.Map.choropleth.__doc__   

In [176]:
geo_path = '../data/05. skorea_municipalities_geo_simple.json'
geo_str = json.load(open(geo_path, encoding='utf-8'))

In [177]:
# 인구수 기준
map.choropleth(geo_data = geo_str,
               data = pop_folium['인구수합계'],
               columns = [pop_folium.index, pop_folium['인구수합계']],
               fill_color = 'Accent', #PuRd, YlGnBu
               key_on = 'feature.id',
           
            )

map

In [178]:
# 소멸 위기지역 기준 
map = folium.Map(location=[36.2002, 127.054], zoom_start=7)
map.choropleth(geo_data = geo_str,
               data = pop_folium['소멸위기지역'],
               columns = [pop_folium.index, pop_folium['소멸위기지역']],
               fill_color = 'RdGy', #PuRd, YlGnBu , RdYlGn, RdGy, 
               key_on = 'feature.id',
              legend_name='test'
              ,
              threshold_scale=[0, 0.2, 0.5, 0.7, 1.0])

map

In [179]:
# print(folium.Map.choropleth.__doc__)

### csv 파일로 저장하기 

In [180]:
draw_korea.to_csv("../data/05. draw_korea.csv", encoding='utf-8', sep=',')