# 市区町村のポリゴン作成

使用するデータ：[国土数値情報 \| 行政区域データ](https://nlftp.mlit.go.jp/ksj/gml/datalist/KsjTmplt-N03-v3_1.html)

上記全国版のオリジナルのファイルを用いることもできるが、以下のような問題がある。
- ファイルサイズが大きい(1GB以上)
- 一つの自治体に対して複数のフィールドを持つため、結合などの処理が面倒

上記問題を解決するため、geometryを六角形メッシュ状に簡略化し、各自治体毎に1行にまとめたGISファイルを作成した。

六角形メッシュとすることで相当程度拡大しても視認性に違和感なく、ファイルサイズを15MB程度に縮小できた。


## 行政区域データのダウンロード

全国版のデータもあるが、処理する上で読み込みに時間が掛かるため、都道府県毎にデータを取得する。

In [None]:
RAW_PATH = 'raw/kukaku'

In [None]:
import urllib.request as rq
import os

def download_data(n):
    name = f'{n:02}'
    
    url = f'https://nlftp.mlit.go.jp/ksj/gml/data/N03/N03-2022/N03-20220101_{name}_GML.zip'
    
    save_path = f'{RAW_PATH}/{name}.zip'
    
    if os.path.exists(save_path): return
    
    print(f'downloading {name}... ', end='')
    with open(save_path, "wb") as f:
        f.write(rq.urlopen(url).read())
        
    print("done!!")

In [None]:
for i in range(1, 48):
    download_data(i)

## データ整形


In [None]:
import pandas as pd
import geopandas as gpd
import plotly.express as px
import zipfile as zf
import matplotlib.pyplot as plt
import h3pandas

In [None]:
def preproc(n, resolution):
    
    df = gpd.read_file(f'{RAW_PATH}/{n:02}.zip')
    df = df.drop(index=df[df['N03_007'].isna()].index)

    df["area"] = df.area
    new = []
    
    for code in df["N03_007"].unique():
        new.append(
            df[df["N03_007"] == code]
            .sort_values(by="area").tail(3)
            .h3.polyfill_resample(resolution)
            .dissolve()
        )
        
    return pd.concat(new)

処理の実施。5分ほど掛かる。

ポリゴンの粒度を細かくしたい場合は`preproc`関数に渡す第2引数を`9`や`10`などにするとよい。(その分処理時間は倍増する)

In [None]:
jp = []

for i in range(1, 48):
    jp.append(preproc(i, 8))

jpdf = pd.concat(jp).drop(columns=["index", "N03_002", "N03_003", "area"]).reset_index(drop=True)
jpdf.rename(columns={"N03_001": "都道府県名", "N03_004": "市区町村名", "N03_007": "code"}, inplace=True)

## ファイル出力

GISファイルとして出力する。  
ここでは`geojson`ファイルにしているが、シェープファイルにすることもできる。

### 団体コードとポリゴンのみ

In [None]:
jpdf.loc[:, ["code", "geometry"]].to_file("sikuchoson.json", driver='GeoJSON')

### 団体コードとポリゴンと市区町村名

In [None]:
jpdf.loc[:, ["市区町村名", "code", "geometry"]].to_file("sikuchoson_name.json", driver='GeoJSON')

### 団体コードとポリゴンと市区町村名と都道府県名

In [None]:
jpdf.loc[:, ["都道府県名", "市区町村名", "code", "geometry"]].to_file("sikuchoson_name_pref.json", driver='GeoJSON')