In [1]:
import json
import urllib.parse
import urllib.request
import pprint
import pandas as pd

In [2]:
url_base = 'https://opendata.resas-portal.go.jp/api/v1/cities'

In [3]:
p = {'prefCode': 13}
url = url_base + '?' + urllib.parse.urlencode(p)
print(url)

https://opendata.resas-portal.go.jp/api/v1/cities?prefCode=13


In [4]:
pref_code = 13
url = url_base + '?prefCode=' + str(pref_code)
print(url)

https://opendata.resas-portal.go.jp/api/v1/cities?prefCode=13


In [5]:
with open('setting/api_key.json') as f:
    api_key = json.load(f)

In [6]:
req = urllib.request.Request(url, headers=api_key)

In [7]:
with urllib.request.urlopen(req) as response:
    data = response.read()

In [8]:
d = json.loads(data.decode())

In [9]:
pprint.pprint(d, width=100)

{'message': None,
 'result': [{'bigCityFlag': '3', 'cityCode': '13101', 'cityName': '千代田区', 'prefCode': 13},
            {'bigCityFlag': '3', 'cityCode': '13102', 'cityName': '中央区', 'prefCode': 13},
            {'bigCityFlag': '3', 'cityCode': '13103', 'cityName': '港区', 'prefCode': 13},
            {'bigCityFlag': '3', 'cityCode': '13104', 'cityName': '新宿区', 'prefCode': 13},
            {'bigCityFlag': '3', 'cityCode': '13105', 'cityName': '文京区', 'prefCode': 13},
            {'bigCityFlag': '3', 'cityCode': '13106', 'cityName': '台東区', 'prefCode': 13},
            {'bigCityFlag': '3', 'cityCode': '13107', 'cityName': '墨田区', 'prefCode': 13},
            {'bigCityFlag': '3', 'cityCode': '13108', 'cityName': '江東区', 'prefCode': 13},
            {'bigCityFlag': '3', 'cityCode': '13109', 'cityName': '品川区', 'prefCode': 13},
            {'bigCityFlag': '3', 'cityCode': '13110', 'cityName': '目黒区', 'prefCode': 13},
            {'bigCityFlag': '3', 'cityCode': '13111', 'cityName': '大田区', 'prefCode

In [10]:
l = []
url_base = 'https://opendata.resas-portal.go.jp/api/v1/cities'

for pref_code in range(1, 48):
    url = url_base + '?prefCode=' + str(pref_code)
    req = urllib.request.Request(url, headers=api_key)
    with urllib.request.urlopen(req) as response:
        data = response.read()
    d = json.loads(data.decode())
    l.append(pd.io.json.json_normalize(d['result']))

df_all = pd.concat(l, ignore_index=True)

In [11]:
print(df_all.head())

  bigCityFlag cityCode cityName  prefCode
0           2    01100      札幌市         1
1           1    01101   札幌市中央区         1
2           1    01102    札幌市北区         1
3           1    01103    札幌市東区         1
4           1    01104   札幌市白石区         1


In [12]:
print(df_all.shape)

(1920, 4)


In [13]:
print(df_all.dtypes)

bigCityFlag    object
cityCode       object
cityName       object
prefCode        int64
dtype: object


In [14]:
print(df_all.query('bigCityFlag == "2"'))

     bigCityFlag cityCode cityName  prefCode
0              2    01100      札幌市         1
265            2    04100      仙台市         4
529            2    11100    さいたま市        11
602            2    12100      千葉市        12
724            2    14100      横浜市        14
743            2    14130      川崎市        14
751            2    14150     相模原市        14
785            2    15100      新潟市        15
1020           2    22100      静岡市        22
1024           2    22130      浜松市        22
1065           2    23100     名古屋市        23
1183           2    26100      京都市        26
1220           2    27100      大阪市        27
1245           2    27140       堺市        27
1294           2    28100      神戸市        28
1451           2    33100      岡山市        33
1482           2    34100      広島市        34
1627           2    40100     北九州市        40
1635           2    40130      福岡市        40
1742           2    43100      熊本市        43


In [15]:
print(df_all.query('bigCityFlag == "1" & prefCode == 14'))

    bigCityFlag cityCode  cityName  prefCode
725           1    14101    横浜市鶴見区        14
726           1    14102   横浜市神奈川区        14
727           1    14103     横浜市西区        14
728           1    14104     横浜市中区        14
729           1    14105     横浜市南区        14
730           1    14106  横浜市保土ケ谷区        14
731           1    14107    横浜市磯子区        14
732           1    14108    横浜市金沢区        14
733           1    14109    横浜市港北区        14
734           1    14110    横浜市戸塚区        14
735           1    14111    横浜市港南区        14
736           1    14112     横浜市旭区        14
737           1    14113     横浜市緑区        14
738           1    14114    横浜市瀬谷区        14
739           1    14115     横浜市栄区        14
740           1    14116     横浜市泉区        14
741           1    14117    横浜市青葉区        14
742           1    14118    横浜市都筑区        14
744           1    14131    川崎市川崎区        14
745           1    14132     川崎市幸区        14
746           1    14133    川崎市中原区        14
747       

In [16]:
s_code = df_all.set_index('cityCode')['cityName']
print(s_code.head())

cityCode
01100       札幌市
01101    札幌市中央区
01102     札幌市北区
01103     札幌市東区
01104    札幌市白石区
Name: cityName, dtype: object


In [17]:
print(s_code['14100'])

横浜市


In [18]:
s_name = df_all.set_index('cityName')['cityCode']
print(s_name.head())

cityName
札幌市       01100
札幌市中央区    01101
札幌市北区     01102
札幌市東区     01103
札幌市白石区    01104
Name: cityCode, dtype: object


In [19]:
print(s_name['横浜市'])

14100


In [20]:
df_all.to_csv('download/city_code_list.csv', index=None)

In [21]:
df_all.to_json('download/city_code_list.json', orient='records', force_ascii=False)

In [22]:
with open('download/city_code_list.json') as f:
    data_json = json.load(f)

In [23]:
print(type(data_json))

<class 'list'>


In [24]:
pprint.pprint(data_json[:5])

[{'bigCityFlag': '2', 'cityCode': '01100', 'cityName': '札幌市', 'prefCode': 1},
 {'bigCityFlag': '1', 'cityCode': '01101', 'cityName': '札幌市中央区', 'prefCode': 1},
 {'bigCityFlag': '1', 'cityCode': '01102', 'cityName': '札幌市北区', 'prefCode': 1},
 {'bigCityFlag': '1', 'cityCode': '01103', 'cityName': '札幌市東区', 'prefCode': 1},
 {'bigCityFlag': '1', 'cityCode': '01104', 'cityName': '札幌市白石区', 'prefCode': 1}]


In [25]:
print(len(data_json))

1920


In [26]:
df_from_json = pd.read_json('download/city_code_list.json')
print(df_from_json.head())

   bigCityFlag  cityCode cityName  prefCode
0            2      1100      札幌市         1
1            1      1101   札幌市中央区         1
2            1      1102    札幌市北区         1
3            1      1103    札幌市東区         1
4            1      1104   札幌市白石区         1


In [27]:
print(df_from_json.shape)

(1920, 4)
