# データ・サイエンス	データ・サイエンス社会応用論 / ICT社会応用演習Ⅳ
## 13-3. 基礎自治体の人口の確認

### 1. e-Stat のデータの読み込み
#### 1-a) 下準備

In [None]:
import pandas as pd
import geopandas as gpd
from shapely.geometry import Polygon
import japanize_matplotlib

In [None]:
CENSUS_POPULATION_PATH = 'data/FEH_00200521_250109003235.csv'
LG_CODE_PATH = 'data/000925835.xlsx'
TOKYO_ADMIN_PATH = 'data/shape/N03-20240101_13.geojson'

#### 1-b) DataFrameへの読み込み

In [None]:
df_population = pd.read_csv(CENSUS_POPULATION_PATH, encoding='shift-jis', skiprows=14)
df_population

#### 1-c) DataFrameの下処理

In [None]:
df_population = df_population.rename(columns={
    '全国，都道府県，市区町村（2000年市区町村含む） コード': 'code',
    '全国，都道府県，市区町村（2000年市区町村含む）': 'name',
    '総数': 'total',
    '男': 'male',
    '女': 'female'
})
df_population['total'] = df_population['total'].apply(pd.to_numeric, errors='coerce')
df_population['male'] = df_population['male'].apply(pd.to_numeric, errors='coerce')
df_population['female'] = df_population['female'].apply(pd.to_numeric, errors='coerce')
df_population['ratio'] = df_population['male'] / df_population['female']
df_population = df_population[['code', 'name', 'total', 'male', 'female', 'ratio']]
df_population 

### 2. 地方公共団体コードの読み込み
#### 2-a) DataFrameへの読み込み

In [None]:
df_lg = pd.read_excel(LG_CODE_PATH, dtype=str)
df_lg

#### 2-b) DataFrameの下処理

In [None]:
df_lg = df_lg.rename(columns = {
    '団体コード': 'code',
    '都道府県名\n（漢字）': 'prefecture',
    '市区町村名\n（漢字）': 'city'
})
df_lg = df_lg[['code', 'prefecture', 'city']]
df_lg

In [None]:
df_lg['code'] = df_lg['code'].apply(lambda x: x[:5])
df_lg = df_lg[~df_lg['code'].str.endswith('000')]
df_lg

### 3. 国勢調査のデータと基礎自治体データの結合
#### 3-a) DataFrameの結合

In [None]:
df_lg_population = df_population.merge(df_lg, how='inner')
df_lg_population

#### 3-b) データの確認

In [None]:
df_lg_population.sort_values('total', ascending=False)

In [None]:
df_lg_population.sort_values('ratio', ascending=False)

### 4. コロプレス図の作成
#### 4-a) 行政区域データの読み込み

In [None]:
gdf_tokyo_admin = gpd.read_file(TOKYO_ADMIN_PATH)
gdf_tokyo_admin

#### 4-b) 地方公共団体コードでグルーピング

In [None]:
gdf_tokyo_admin_grouped = gdf_tokyo_admin.dissolve(by='N03_007')
gdf_tokyo_admin_grouped = gdf_tokyo_admin_grouped.reset_index()
gdf_tokyo_admin_grouped

#### 4-c) 国勢調査のDataFrameを結合

In [None]:
gdf_tokyo_population = gdf_tokyo_admin_grouped.merge(df_population, left_on='N03_007', right_on='code')
gdf_tokyo_population

#### 4-d) 島嶼部の削除

In [None]:
min_lon, min_lat = 138.0, 35.0
max_lon, max_lat = 140.0, 36.0
   
bbox_polygon = Polygon([(min_lon, min_lat), (min_lon, max_lat), (max_lon, max_lat), (max_lon, min_lat)])

In [None]:
gdf_tokyo_population_clipped = gdf_tokyo_population[gdf_tokyo_population.within(bbox_polygon)]
gdf_tokyo_population_clipped

#### 4-e) コロプレス図の表示

In [None]:
gdf_tokyo_population_clipped.plot(column='total', cmap='OrRd', legend=True, figsize=(20,4))

In [None]:
gdf_tokyo_population_clipped.plot(column='ratio', cmap='OrRd', legend=True, figsize=(20,4))