<a href="https://colab.research.google.com/github/z-guard/analysis/blob/main/notebooks/all_town_detail.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 町の詳細情報
- input:
    - population_master.csv
        - 町丁ごとの位置
    - nursery_score.csv
        - 保育園
        - 児童館
    - public_school_score.csv
        - 幼稚園
        - 小学校
        - 中学校
    - library_score.csv
        - 図書館
    - convenience_score.csv
        - コンビニ
        - スーパー
        - 最寄り駅
    - park_score.csv
        - 公園
    - sports_score.csv
        - 運動場
        - 体育館
        - プール
    - medical_score.csv
        - 病院
        - 小児科
        - 薬局
    - crime_score.csv
        - 犯罪件数
    - population_core.csv
        - ○○割合スコア
    - place_photo_all.csv
        - 町写真
    - character_town.csv
        - 町ごとのキャラクタ
- output:
    - all_town_detail.csv
        - 町丁ごとの詳細データ

In [1]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [2]:
DIR_NAME = '/content/drive/MyDrive/z-gard/data'

In [3]:
import os
import pandas as pd

pd.set_option('display.max_columns', 50)
pd.set_option('display.max_rows', 100)

In [4]:
output_file = 'all_town_detail.csv'

### 人口マスタ

In [5]:
df_population = pd.read_csv(os.path.join(DIR_NAME, 'population_master.csv'))[
    ['town_id', '市区町村名', '町丁目']
].set_index('town_id')
print(df_population.shape)
df_population.head()

(3145, 2)


Unnamed: 0_level_0,市区町村名,町丁目
town_id,Unnamed: 1_level_1,Unnamed: 2_level_1
101003,千代田区,丸の内１丁目
101004,千代田区,丸の内２丁目
101005,千代田区,丸の内３丁目
101007,千代田区,大手町１丁目
101008,千代田区,大手町２丁目


### 保育園・児童館

In [6]:
df_nursery = pd.read_csv(os.path.join(DIR_NAME, 'nursery_score.csv'))[[
    'town_id', '保育園(最近傍距離)', '保育園(数)', '児童館(最近傍距離)', '児童館(数)'
]].set_index('town_id')
print(df_nursery.shape)
df_nursery.head()

(3145, 4)


Unnamed: 0_level_0,保育園(最近傍距離),保育園(数),児童館(最近傍距離),児童館(数)
town_id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
101003,0.771,0.0,1.251,0.0
101004,0.867,0.0,1.63,0.0
101005,0.66,0.0,1.61,0.0
101007,0.361,1.0,1.391,0.0
101008,0.312,1.0,1.014,0.0


### 小学校・中学校・幼稚園

In [7]:
df_school = pd.read_csv(os.path.join(DIR_NAME, 'public_school_score.csv'))[[
    'town_id', '小学校(最近傍距離)', '中学校(最近傍距離)', '幼稚園(最近傍距離)', '学習塾(数)'
]].set_index('town_id')
print(df_school.shape)
df_school.head()

(3145, 4)


Unnamed: 0_level_0,小学校(最近傍距離),中学校(最近傍距離),幼稚園(最近傍距離),学習塾(数)
town_id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
101003,0.354,1.69,0.312,10
101004,0.567,1.628,0.55,8
101005,0.551,1.288,0.551,9
101007,0.594,0.935,0.594,5
101008,0.296,1.342,0.293,6


### 図書館・書店

In [8]:
df_library = pd.read_csv(os.path.join(DIR_NAME, 'library_score.csv'))[[
    'town_id', '図書館(最近傍距離)', '書店(最近傍距離)',
]].set_index('town_id')
print(df_library.shape)
df_library.head(5)

(3145, 2)


Unnamed: 0_level_0,図書館(最近傍距離),書店(最近傍距離)
town_id,Unnamed: 1_level_1,Unnamed: 2_level_1
101003,1.29,0.102
101004,1.208,0.278
101005,0.981,0.238
101007,0.708,0.182
101008,0.785,0.379


### コンビニ・スーパー・最寄り駅

In [9]:
df_convenience = pd.read_csv(os.path.join(DIR_NAME, 'convenience_score.csv'))[[
    'town_id', 'コンビニ(数)', 'スーパー(数)', '商店街(数)', '銭湯(数)', 'カラオケ(数)',
       'ネットカフェ(数)', 'クリーニング(数)', '本DVD(数)',
       'カフェ(数)', 'カフェ(チェーン店)(数)', 'ファストフード(数)', 'レストラン(数)',
       'レストラン(チェーン店)(数)', '飲み屋(数)', '最寄駅(距離)'
]].set_index('town_id')
eat_drink_col = ['カフェ(数)', 'カフェ(チェーン店)(数)', 'ファストフード(数)', 'レストラン(数)', 'レストラン(チェーン店)(数)', '飲み屋(数)']
df_convenience['飲食店(数)'] = df_convenience[eat_drink_col].sum(axis=1)
df_convenience = df_convenience.drop(columns=eat_drink_col)
print(df_convenience.shape)
df_convenience.head()

(3145, 10)


Unnamed: 0_level_0,コンビニ(数),スーパー(数),商店街(数),銭湯(数),カラオケ(数),ネットカフェ(数),クリーニング(数),本DVD(数),最寄駅(距離),飲食店(数)
town_id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
101003,72,3,0,0,2,0,0,3,0.037,66
101004,54,1,0,0,0,0,0,3,0.359,77
101005,46,1,0,1,2,0,0,2,0.219,84
101007,37,1,0,1,0,0,1,3,0.308,65
101008,45,3,0,0,0,0,2,3,0.447,58


### 公園

In [10]:
df_park = pd.read_csv(os.path.join(DIR_NAME, 'park_score.csv'))[[
    'town_id', '公園(平均距離)', '公園(数)'
]].set_index('town_id')
print(df_park.shape)
df_park.head()

(3145, 2)


Unnamed: 0_level_0,公園(平均距離),公園(数)
town_id,Unnamed: 1_level_1,Unnamed: 2_level_1
101003,0.718,1
101004,0.911,0
101005,0.908,0
101007,0.71,1
101008,0.593,1


### 各種教室

In [11]:
df_lesson_score = pd.read_csv(os.path.join(DIR_NAME, 'lesson_score.csv')).set_index('town_id')
print(df_lesson_score.shape)
df_lesson_score.head()

(3145, 4)


Unnamed: 0_level_0,音楽教室(数),英語教室(数),プログラミング(数),囲碁将棋(数)
town_id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
101003,0,0,0,0
101004,0,0,0,0
101005,0,0,0,0
101007,0,2,0,0
101008,0,2,0,0


### 運動場・体育館・プール

In [12]:
df_sports = pd.read_csv(os.path.join(DIR_NAME, 'sports_score.csv'))[[
    'town_id', '運動場他(最近傍距離)', '体育館(最近傍距離)', 'プール(最近傍距離)', 'フィットネス(数)', 'テニス教室(数)', 'ゴルフ練習場(数)'
]].set_index('town_id')
print(df_sports.shape)
df_sports.head()

(3145, 6)


Unnamed: 0_level_0,運動場他(最近傍距離),体育館(最近傍距離),プール(最近傍距離),フィットネス(数),テニス教室(数),ゴルフ練習場(数)
town_id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
101003,1.734,0.846,0.846,3,0,1
101004,2.113,1.079,1.079,3,0,1
101005,2.291,1.405,1.405,5,0,2
101007,1.827,0.341,0.341,5,0,2
101008,1.478,0.323,0.323,3,0,1


### 病院・小児科・薬局

In [13]:
df_medical = pd.read_csv(os.path.join(DIR_NAME, 'medical_score.csv'))[[
    'town_id', '病院(平均距離)', '病院(数)', '小児科(平均距離)', '小児科(数)', '薬局(平均距離)', '薬局(数)'
]].set_index('town_id')
print(df_medical.shape)
df_medical.head()

(3145, 6)


Unnamed: 0_level_0,病院(平均距離),病院(数),小児科(平均距離),小児科(数),薬局(平均距離),薬局(数)
town_id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
101003,0.273,8.0,0.248,4.0,0.189,13.0
101004,0.471,2.0,0.422,2.0,0.332,3.0
101005,0.255,11.0,0.316,3.0,0.196,12.0
101007,0.152,8.0,0.399,2.0,0.098,13.0
101008,0.239,12.0,0.414,3.0,0.161,17.0


### 犯罪件数

In [14]:
df_security = pd.read_csv(os.path.join(DIR_NAME, 'security_score.csv'))
df_security['犯罪(数)'] = df_security['凶悪犯計'] + df_security['粗暴犯計'] + df_security['侵入窃盗計'] + df_security['非侵入窃盗計'] + df_security['その他計']
df_security['警察署・交番(数)'] = df_security['警察署(数)'] + df_security['交番(数)']
df_security['交通事故(数)'] = df_security['負傷事故(数)'] + df_security['死亡事故(数)']
df_security = df_security[['town_id', '犯罪(数)', '警察署・交番(数)', '交通事故(数)', '総合危険度ランク']].set_index('town_id')
print(df_security.shape)
df_security.head()

(3145, 4)


Unnamed: 0_level_0,犯罪(数),警察署・交番(数),交通事故(数),総合危険度ランク
town_id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
101003,242.0,4,36,1
101004,40.0,6,26,1
101005,141.0,6,49,1
101007,36.0,1,53,1
101008,24.0,0,55,1


### 近隣の町

In [15]:
df_geo_master = pd.read_csv(os.path.join(DIR_NAME, 'geocoding.csv'))[['town_id', 'neighbor_town']].set_index('town_id')
print(df_geo_master.shape)
df_geo_master.head()

(3145, 1)


Unnamed: 0_level_0,neighbor_town
town_id,Unnamed: 1_level_1
101003,"['102090', '101004', '102002', '101008', '1020..."
101004,"['101005', '101003', '101040', '102002', '1010..."
101005,"['101004', '101014', '101013', '102008', '1020..."
101007,"['101095', '101086', '101008', '101087', '1010..."
101008,"['102048', '102047', '102049', '102046', '1010..."


### 町写真

In [16]:
df_place_photo = pd.read_csv(os.path.join(DIR_NAME, 'place_photo_20231122_2.csv')).rename(columns={
    'no': 'town_id', 'width': 'photo_width'
}).dropna(subset=['photo_reference'])[['town_id', 'photo_width', 'photo_reference']].set_index('town_id')
df_place_photo['photo_width'] = df_place_photo['photo_width'].astype(int)
print(df_place_photo.shape)
df_place_photo.head()

(3058, 2)


Unnamed: 0_level_0,photo_width,photo_reference
town_id,Unnamed: 1_level_1,Unnamed: 2_level_1
101003,1080,AWU5eFgPasDCEmZ_Jfx7lw_DOiYJEwQO5C2sf_oYlTjQ-Z...
101004,4000,AWU5eFhq6XsspnuhJLOH9kJZmlZjy_nSzBQG9HT4YznIFg...
101007,2592,AWU5eFgr5mkU2W2MvOvRP453JPg5uVHpnua87f89NLvfvz...
101008,4000,AWU5eFhx7PSuwEfB9W40MGO7TESt5VKVS0RRpuvBoUrgOB...
101010,1094,AWU5eFjIEU3FxJPvoD9Mgt7La-CEbXgP1i_36gpfjc4eZE...


### 町のキャラクタ

In [17]:
df_character = pd.read_csv(
    '/content/drive/MyDrive/z-guard/200_企画構想/04_キャラクター利用/行政情報/キャラクター/character_town_20230618.csv',
)[[
    'town_id', 'キャラクターファイル名', 'コメント1', 'リンク'
]].rename(columns={
    'キャラクターファイル名': 'character',
    'コメント1': 'copyright',
    'リンク': 'link',
}).fillna('').set_index('town_id')
print(df_character.shape)

(3145, 3)


In [18]:
list(df_character[df_character['character'] != '']['character'].unique())

['shinagawa_01.png',
 'shinagawa_osaki_01.png',
 'shinagawa_higashioi_01.png',
 'shinagawa_musashikoyama_01.jpg',
 'shinagawa_togoshi_01.png',
 'shinagawa_togoshi_02.png',
 'suginami_01.png',
 'suginami_02.png',
 'suginami_03.png',
 'suginami_04.png',
 'suginami_05.png',
 'suginami_06.png',
 'suginami_07.png',
 'suginami_08.png',
 'suginami_09.png',
 'suginami_10.png',
 'suginami_11.png',
 'suginami_12.png',
 'suginami_13.png',
 'suginami_14.png',
 'suginami_15.png',
 'suginami_16.png',
 'suginami_17.png',
 'suginami_18.png',
 'suginami_19.png',
 'suginami_20.png',
 'suginami_21.png',
 'suginami_22.png',
 'suginami_23.png',
 'suginami_24.png',
 'suginami_25.png',
 'suginami_26.png',
 'suginami_27.png',
 'suginami_28.png',
 'suginami_29.png',
 'suginami_30.png',
 'suginami_31.png',
 'suginami_32.png',
 'suginami_33.png',
 'suginami_34.png',
 'suginami_35.png',
 'suginami_36.png',
 'suginami_37.png',
 'suginami_38.png',
 'suginami_39.png',
 'suginami_40.png',
 'suginami_41.png',
 'sugina

In [19]:
list(df_character[df_character['copyright'] != '']['copyright'].unique())

['品川区',
 '大崎一番太郎',
 '立会川龍馬通り繁栄会「りょうくん」',
 '提供：武蔵小山商店街振興組合',
 '© 2020 togoshiginza.',
 '協力 戸越公園駅前南口商店会',
 '©SUGINAMI_CITY',
 '足立区のより安心なまちづくりを目指す「ビューティフル・ウィンドウズ運動」の理念を伝えるメッセンジャー「ビュー坊」',
 '©2007-2023 Aokui Jun',
 '©江戸川区商店街連合会']

### 全て結合

In [20]:
df_all_town_detail = pd.concat([
    df_population,
    df_nursery,
    df_school,
    df_library,
    df_convenience,
    df_park,
    df_lesson_score,
    df_sports,
    df_medical,
    df_security,
    df_geo_master,
    df_place_photo,
    df_character,
], axis=1)
print(df_all_town_detail.shape)

(3145, 50)


In [21]:
count_cols = [col for col in df_all_town_detail.columns if col.endswith('(数)')]
for col in count_cols:
    if col != '犯罪(数)':
        df_all_town_detail[col] = df_all_town_detail[col].fillna(0).astype(int)

### 距離を徒歩(分)に変換
- 1分＝80m

In [22]:
dist_cols = [col for col in df_all_town_detail.columns if col.endswith('距離)')]
for col in dist_cols:
    df_all_town_detail[col] = (df_all_town_detail[col] * 1000 / 80 + 0.5).round()

In [23]:
df_all_town_detail[1000:1005]

Unnamed: 0_level_0,市区町村名,町丁目,保育園(最近傍距離),保育園(数),児童館(最近傍距離),児童館(数),小学校(最近傍距離),中学校(最近傍距離),幼稚園(最近傍距離),学習塾(数),図書館(最近傍距離),書店(最近傍距離),コンビニ(数),スーパー(数),商店街(数),銭湯(数),カラオケ(数),ネットカフェ(数),クリーニング(数),本DVD(数),最寄駅(距離),飲食店(数),公園(平均距離),公園(数),音楽教室(数),英語教室(数),プログラミング(数),囲碁将棋(数),運動場他(最近傍距離),体育館(最近傍距離),プール(最近傍距離),フィットネス(数),テニス教室(数),ゴルフ練習場(数),病院(平均距離),病院(数),小児科(平均距離),小児科(数),薬局(平均距離),薬局(数),犯罪(数),警察署・交番(数),交通事故(数),総合危険度ランク,neighbor_town,photo_width,photo_reference,character,copyright,link
town_id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1,Unnamed: 25_level_1,Unnamed: 26_level_1,Unnamed: 27_level_1,Unnamed: 28_level_1,Unnamed: 29_level_1,Unnamed: 30_level_1,Unnamed: 31_level_1,Unnamed: 32_level_1,Unnamed: 33_level_1,Unnamed: 34_level_1,Unnamed: 35_level_1,Unnamed: 36_level_1,Unnamed: 37_level_1,Unnamed: 38_level_1,Unnamed: 39_level_1,Unnamed: 40_level_1,Unnamed: 41_level_1,Unnamed: 42_level_1,Unnamed: 43_level_1,Unnamed: 44_level_1,Unnamed: 45_level_1,Unnamed: 46_level_1,Unnamed: 47_level_1,Unnamed: 48_level_1,Unnamed: 49_level_1,Unnamed: 50_level_1
109098,品川区,小山７丁目,2.0,3,10.0,0,8.0,6.0,5.0,15,7.0,8.0,4,3,1,1,0,0,0,0,4.0,34,7.0,2,0,0,0,0,29.0,12.0,15.0,1,0,0,5.0,5,7.0,1,4.0,11,,2,28,2,"['109106', '110071', '109097', '109117', '1100...",1080.0,AWU5eFgtp1oaAbdnIYD7Q6s3vqXtbX-z5YoUuy0zolmgQp...,shinagawa_01.png,品川区,
109100,品川区,荏原１丁目,4.0,5,4.0,3,5.0,2.0,5.0,16,5.0,4.0,8,2,0,1,0,0,5,3,6.0,12,2.0,13,1,0,0,0,22.0,15.0,8.0,1,0,0,6.0,4,7.0,1,4.0,7,14.0,0,72,3,"['109046', '109101', '109109', '109092', '1090...",2160.0,AWU5eFhIIIxHVffL23tx-p1uxfcIelj3xh4bl3iVaT48UV...,shinagawa_01.png,品川区,
109101,品川区,荏原２丁目,3.0,7,5.0,2,6.0,3.0,6.0,18,9.0,3.0,9,5,0,0,1,0,3,2,6.0,28,3.0,13,0,1,1,0,23.0,14.0,9.0,2,0,0,4.0,8,4.0,3,3.0,16,6.0,1,64,3,"['109109', '109102', '109100', '109093', '1091...",4032.0,AWU5eFiiY991QpBMCpB2xFVcBITWQT50mkBkKGhO2Qf_Aj...,shinagawa_01.png,品川区,
109102,品川区,荏原３丁目,2.0,11,5.0,1,6.0,7.0,5.0,13,9.0,1.0,14,5,1,0,2,1,5,4,5.0,76,3.0,13,0,1,3,0,25.0,10.0,12.0,3,0,0,3.0,18,4.0,6,1.0,26,32.0,2,55,3,"['109103', '109094', '109101', '109093', '1090...",4032.0,AWU5eFgRHIUN5sElaJR-BaIH175yrfAfMcAMmz7vkMQkwJ...,shinagawa_musashikoyama_01.jpg,提供：武蔵小山商店街振興組合,
109103,品川区,荏原４丁目,2.0,9,5.0,1,5.0,9.0,2.0,18,7.0,4.0,10,3,1,0,2,1,4,3,8.0,34,3.0,13,0,1,0,0,26.0,11.0,12.0,4,0,0,3.0,10,4.0,4,2.0,16,16.0,2,61,2,"['109102', '109126', '109104', '109110', '1091...",3264.0,AWU5eFjDWRPQmYY39J6gCUFimqHi1P7MqV0XL3zADCkxdy...,shinagawa_01.png,品川区,


### 出力

In [24]:
df_all_town_detail.to_csv(os.path.join(DIR_NAME, output_file), index=True, encoding='utf-8-sig')

### 区ごとのキャラクタ

In [25]:
# df_city_character = pd.read_csv(
#     '/content/drive/MyDrive/z-guard/200_企画構想/04_キャラクター利用/行政情報/キャラクター/character_city_20230622.csv',
# ).set_index('市区町村名').fillna('')
# print(df_city_character.shape)

In [None]:
# city_character = df_city_character.to_dict(orient='index')
# output_city_character = {}
# output_img_file = []
# for key, val in city_character.items():
#     output_city_character[key] = list(val.values())

#     if val['キャラクターファイル名'] != '':
#         output_img_file.append(val['キャラクターファイル名'])

In [None]:
# output_city_character

In [None]:
# output_img_file