## 標準地域コード - 全国CSV から city_code.csv を作成するサンプルノートブック

[統計に用いる標準地域コード](https://www.soumu.go.jp/toukei_toukatsu/index/seido/9-5.htm) で入手可能な全国CSV をもとに、
[Agricultural Land Pin Tools](https://github.com/EsriJapan/agricultural-land-tools) で利用する **city_code.csv** に加工するサンプルノートブックです。

参考：統計に用いる標準地域コード  
https://www.soumu.go.jp/toukei_toukatsu/index/seido/9-5.htm

### 全国CSVを読込み、埼玉県の市区町村を例に抽出します

In [1]:
import os
import pandas as pd
#フォルダー（それぞれ変更のこと）
folder = r"C:\TEMP\標準メッシュコード"
#全国CSVのファイル名（取得した時点の状況により変更のこと）
in_csv_file = os.path.join(folder, "000323625.csv")
#city_code.csv（ツールで指定しているファイル名なので基本的に固定）
out_csv_file = os.path.join(folder, "city_code.csv")

In [2]:
#全ての列をobjectとして読み込み
df = pd.read_csv(in_csv_file, encoding='cp932', dtype = 'object')

In [3]:
#ken-codeとsityouson-name3がNaNでないものを抽出（ken-code:11 は埼玉の例なので、状況により変更のこと）
df_city = df[ (df['ken-code'] == '11') & (df['sityouson-name3'].isnull() == False) ]
df_city

Unnamed: 0,ken-code,sityouson-code,tiiki-code,ken-name,sityouson-name1,sityouson-name2,sityouson-name3,yomigana
631,11,101,11101,埼玉県,さいたま市,,西区,にしく
632,11,102,11102,埼玉県,さいたま市,,北区,きたく
633,11,103,11103,埼玉県,さいたま市,,大宮区,おおみやく
634,11,104,11104,埼玉県,さいたま市,,見沼区,みぬまく
635,11,105,11105,埼玉県,さいたま市,,中央区,ちゅうおうく
...,...,...,...,...,...,...,...,...
703,11,385,11385,埼玉県,児玉郡,,上里町,かみさとまち
705,11,408,11408,埼玉県,大里郡,,寄居町,よりいまち
707,11,442,11442,埼玉県,南埼玉郡,,宮代町,みやしろまち
709,11,464,11464,埼玉県,北葛飾郡,,杉戸町,すぎとまち


###  city_code.csvでの出力列 code, name になるように加工します

In [4]:
# 出力用にDataFrame をコピー
out_df = df_city.copy()
# sityouson-name1 と sityouson-name3 から name 列を作成
out_df['name'] = out_df['sityouson-name1'].fillna('') + out_df['sityouson-name3'].fillna('')

In [5]:
# tiiki-code を code に変更
out_df.rename(columns={'tiiki-code': 'code'}, inplace=True)
out_df

Unnamed: 0,ken-code,sityouson-code,code,ken-name,sityouson-name1,sityouson-name2,sityouson-name3,yomigana,name
631,11,101,11101,埼玉県,さいたま市,,西区,にしく,さいたま市西区
632,11,102,11102,埼玉県,さいたま市,,北区,きたく,さいたま市北区
633,11,103,11103,埼玉県,さいたま市,,大宮区,おおみやく,さいたま市大宮区
634,11,104,11104,埼玉県,さいたま市,,見沼区,みぬまく,さいたま市見沼区
635,11,105,11105,埼玉県,さいたま市,,中央区,ちゅうおうく,さいたま市中央区
...,...,...,...,...,...,...,...,...,...
703,11,385,11385,埼玉県,児玉郡,,上里町,かみさとまち,児玉郡上里町
705,11,408,11408,埼玉県,大里郡,,寄居町,よりいまち,大里郡寄居町
707,11,442,11442,埼玉県,南埼玉郡,,宮代町,みやしろまち,南埼玉郡宮代町
709,11,464,11464,埼玉県,北葛飾郡,,杉戸町,すぎとまち,北葛飾郡杉戸町


### city_code.csv へ保存します

In [6]:
out_df.to_csv(out_csv_file, columns=['code', 'name'] ,index=False)