# Opendataを可視化してみる
## やってみた理由
- 日本政府が発表しているデータがあるというのを知った。    
- お役所データは結構ぐちゃぐちゃで触りがいがあるのではない。      
- pandasでデータを前処理する練習に持って来いではないか。     
- 趣味で触っていて面白い傾向とか見つかって、お仕事とかにつながったら最高やなぁ。      
## やること
- 京都の旅館業法に基づく許可施設一覧というのがありました。    
- [旅館業法に基づく許可施設一覧](https://data.city.kyoto.lg.jp/node/14909)
- データはPDFとエクセルだったので、エクセルデータを取得してそれを加工していこうと思います。     
- そのデータを地図上にプロットしてみることにしました。    
----     
### まずは
1. urllibでローカルにデータを落とす     
1. データを見る      
1. pandasでエクセルを読み込む     
1. データを加工しやすい形にする    

In [1]:
import urllib.request

In [2]:
url = 'https://data.city.kyoto.lg.jp/file/6616/download?token=tLX__V4v'
urllib.request.urlretrieve(url, 'kyotohotel.xls')

('kyotohotel.xls', <http.client.HTTPMessage at 0x108998320>)

In [3]:
import pandas as pd

In [4]:
df = pd.read_excel('kyotohotel.xls', sheet_name=0)

In [5]:
df

Unnamed: 0,施設名称１,施設所在地,申請者氏名,旅館業の種別,許可日,施設所在地１,施設所在地２,申請者法人名,申請者役職名,申請者氏名.1,Unnamed: 10
0,株式会社　洛雲荘,京都市北区雲ケ畑出谷町343,株式会社　洛雲荘\n代表取締役　波多野　勝造,旅館,S32.10.01,京都市北区雲ケ畑出谷町343,,株式会社　洛雲荘,代表取締役,波多野　勝造,
1,京都イン加茂川,京都市北区鞍馬口通り寺町東入鞍馬口町302-5.302-6,成瀬　幸甫\n,簡易宿所,S55.08.13,京都市北区鞍馬口通り寺町東入鞍馬口町302-,5.302-6,成瀬　幸甫,,,
2,旅館　ホテル　マイアミ,京都市北区上賀茂桜井町32,関西総合通商　株式会社\n代表取締役　大宮　方子,旅館,S60.02.08,京都市北区上賀茂桜井町32,,関西総合通商　株式会社,代表取締役,大宮　方子,
3,四季育む宿　然林房,京都市北区鷹峯北鷹峯町40,株式会社　然林房 \n代表取締役　馬渕　真理子,旅館,H01.08.22,京都市北区鷹峯北鷹峯町40,,株式会社　然林房,代表取締役,馬渕　真理子,
4,大森キャンプ場,"京都市北区大森東町340-2,358番地",有限会社　大森リゾート\n代表取締役　谷本　弘治,簡易宿所,H08.12.26,"京都市北区大森東町340-2,358番地",,有限会社　大森リゾート,代表取締役,谷本　弘治,
5,島津製作所共済会　柴明荘,京都市北区出雲路俵町５２ー８,（株）島津製作所共済会\n理事長　藤城　亨,旅館,H09.04.25,京都市北区出雲路俵町５２ー８,,（株）島津製作所共済会,理事長,藤城　亨,
6,小世界旅社,京都市北区紫野下鳥田町２９,山本　亮太\n,簡易宿所,H17.01.17,京都市北区紫野下鳥田町２９,,山本　亮太,,,
7,ゲストハウス“ボン”,京都市北区紫野上門前町６３－２,谷口　和生\n,簡易宿所,H17.03.29,京都市北区紫野上門前町６３－２,,谷口　和生,,,
8,び庵,京都市北区小山下総町５１,小西　歩\n,簡易宿所,H17.04.01,京都市北区小山下総町５１,,小西　歩,,,
9,月光荘,京都市北区紫野南舟岡町73-18,雨宮　しゅう一郎\n,簡易宿所,H17.09.09,京都市北区紫野南舟岡町73-18,,雨宮　しゅう一郎,,,


In [6]:
hotel = pd.ExcelFile('kyotohotel.xls')

In [7]:
hotel.sheet_names

['北区',
 'Kita-ku',
 '上京区',
 'Kamigyo-ku',
 '左京区',
 'Sakyo-ku',
 '中京区',
 'Nakagyo-ku',
 '東山区',
 'Higashiyama-ku',
 '山科区',
 'Yamashina-ku',
 '下京区',
 'Shimogyo-ku',
 '南区',
 'Minami-ku',
 '右京区',
 'Ukyo-ku',
 '西京区',
 'Nisikyo-ku',
 '伏見区',
 'Fushimi-ku']

In [8]:
len(hotel.sheet_names)

22

In [9]:
df = pd.read_excel('kyotohotel.xls', sheet_name=2)

In [10]:
df

Unnamed: 0,施設名称１,施設所在地,申請者氏名,旅館業の種別,許可日,施設所在地１,施設所在地２,申請者法人名,申請者役職名,申請者氏名.1
0,松葉屋旅館,京都市上京区下立売通堀川東入東橋詰町173,岡田　鉞子\n,旅館,S29.03.15,京都市上京区下立売通堀川東入東橋詰町173,,岡田　鉞子,,
1,宿屋　西陣荘,京都市上京区元誓願寺通油小路西入西町458,柏　ヤエ\n,旅館,S38.11.05,京都市上京区元誓願寺通油小路西入西町458,,柏　ヤエ,,
2,梨の木,京都市上京区今出川通寺町西入２筋目上る柳風呂町184番地,有限会社　山森商会\n代表取締役　山森　都代子,旅館,S45.11.19,京都市上京区今出川通寺町西入２筋目上る,柳風呂町184番地,有限会社　山森商会,代表取締役,山森　都代子
3,四季育む宿　然林房,京都市上京区御前通今出川上る馬喰町885,株式会社　然林房 \n,旅館,S49.06.25,京都市上京区御前通今出川上る馬喰町885,,株式会社　然林房,,
4,宣妙院,京都市上京区智恵光院通五辻上る紋屋町330,宣妙院\n代表役員　笹木　則栄,簡易宿所,S50.05.29,京都市上京区智恵光院通五辻上る紋屋町330,,宣妙院,代表役員,笹木　則栄
5,レディスホテル西陣,京都市上京区寺之内通大宮東入妙蓮寺前町355,渡辺　ふじ子\n,簡易宿所,S51.07.19,京都市上京区寺之内通大宮東入妙蓮寺前町355,,渡辺　ふじ子,,
6,玉峰院,京都市上京区智恵光院通五辻上る紋屋町330,宗教法人　玉峰院\n代表役員　矢放　眞文,簡易宿所,S51.08.24,京都市上京区智恵光院通五辻上る紋屋町330,,宗教法人　玉峰院,代表役員,矢放　眞文
7,妙蓮寺,京都市上京区寺ノ内通大宮東入妙蓮寺前町875,宗教法人　大本山妙蓮寺\n代表役員　松下　日肆,簡易宿所,S52.06.30,京都市上京区寺ノ内通大宮東入妙蓮寺前町875,,宗教法人　大本山妙蓮寺,代表役員,松下　日肆
8,妙顕寺,京都市上京区寺之内通新町西入妙顕寺前町514,宗教法人　妙顕寺\n代表役員　三田村　鳳治,簡易宿所,S52.08.01,京都市上京区寺之内通新町西入妙顕寺前町514,,宗教法人　妙顕寺,代表役員,三田村　鳳治
9,京都シティホテル,京都市上京区堀川通今出川上る北舟橋町857,株式会社　京都シティホテル\n代表取締役　柴田　能英,ホテル,S55.02.28,京都市上京区堀川通今出川上る北舟橋町857,,株式会社　京都シティホテル,代表取締役,柴田　能英


In [11]:
sheetName=[i for i in range(21) if i % 2 == 0]
df = pd.read_excel('kyotohotel.xls', sheet_name=sheetName)

In [12]:
df

OrderedDict([(0,
                                           施設名称１                          施設所在地  \
              0                         株式会社　洛雲荘                 京都市北区雲ケ畑出谷町343   
              1                          京都イン加茂川  京都市北区鞍馬口通り寺町東入鞍馬口町302-5.302-6   
              2                      旅館　ホテル　マイアミ                  京都市北区上賀茂桜井町32   
              3                        四季育む宿　然林房                  京都市北区鷹峯北鷹峯町40   
              4                          大森キャンプ場           京都市北区大森東町340-2,358番地   
              5                     島津製作所共済会　柴明荘                 京都市北区出雲路俵町５２ー８   
              6                            小世界旅社                  京都市北区紫野下鳥田町２９   
              7                       ゲストハウス“ボン”                京都市北区紫野上門前町６３－２   
              8                               び庵                   京都市北区小山下総町５１   
              9                              月光荘               京都市北区紫野南舟岡町73-18   
              10                       ホワイトハウス西陣                京都市北区紫

In [13]:
df[18]

Unnamed: 0,施設名称１,施設所在地,申請者氏名,旅館業の種別,許可日,施設所在地１,施設所在地２,申請者法人名,申請者役職名,申請者氏名.1
0,嵐山温泉彩四季の宿花筏,京都市西京区嵐山中尾下町57-1,株式会社　嵐山観光ホテル花筏\n代表取締役　中西　眞,旅館,S45.03.04,京都市西京区嵐山中尾下町57-1,,株式会社　嵐山観光ホテル花筏,代表取締役,中西　眞
1,京嵐山亭,京都市西京区嵐山西一川町２－１,トヨタ販売連合健康保険組合\n理事長　伊藤　隆之,旅館,S45.05.08,京都市西京区嵐山西一川町２－１,,トヨタ販売連合健康保険組合,理事長,伊藤　隆之
2,三井物産　嵐山寮,京都市西京区嵐山中尾下町３４番地１,三井物産　株式会社\n代表取締役　安永竜夫,旅館,S52.09.07,京都市西京区嵐山中尾下町３４番地１,,三井物産　株式会社,代表取締役,安永竜夫
3,渡月亭　秀山閣,京都市西京区嵐山中尾下町56,株式会社　渡月亭 \n代表取締役　古川　拓也,旅館,S52.12.28,京都市西京区嵐山中尾下町56,,株式会社　渡月亭,代表取締役,古川　拓也
4,ホテル嵐山洛西店,京都市西京区大枝沓掛町22-1,有限会社　サンサン\n代表取締役　山田　初子,旅館,S60.02.08,京都市西京区大枝沓掛町22-1,,有限会社　サンサン,代表取締役,山田　初子
5,朝日新聞健康保険組合　嵐山保養所,京都市西京区嵐山中尾下町8-1,朝日新聞健康保険組合\n理事長　中村　博信,旅館,S60.10.14,京都市西京区嵐山中尾下町8-1,,朝日新聞健康保険組合,理事長,中村　博信
6,渡月亭　碧川閣,京都市西京区嵐山中尾下町54-4,株式会社　渡月亭\n代表取締役　古川　拓也,旅館,S60.11.11,京都市西京区嵐山中尾下町54-4,,株式会社　渡月亭,代表取締役,古川　拓也
7,ホテル　アルシュ,京都市西京区山田大吉見町19-1,丸玉興行　株式会社\n代表取締役　玉村　賢二,ホテル,H01.12.22,京都市西京区山田大吉見町19-1,,丸玉興行　株式会社,代表取締役,玉村　賢二
8,ホテル　ラ・シエスタ,"京都市西京区大枝沓掛町26-29,26-819",株式会社　山井産業\n代表取締役　山本　八郎,ホテル,H05.05.19,"京都市西京区大枝沓掛町26-29,26-819",,株式会社　山井産業,代表取締役,山本　八郎
9,リゾートインセルバ　ＲＥＳＯＲＴ ＩＮＮ ｓｅｌｖａ,京都市西京区大枝沓掛町22番地２９,大枝観光株式会社\n代表取締役　正木　昭七,ホテル,H06.03.14,京都市西京区大枝沓掛町22番地２９,,大枝観光株式会社,代表取締役,正木　昭七


### 欲しいデータ
- 施設名称1、申請者氏名、旅館業の種別、許可日、施設所在地１くらいかなぁ


In [14]:
df[18].iloc[:, [0,2,3,4,5]]

Unnamed: 0,施設名称１,申請者氏名,旅館業の種別,許可日,施設所在地１
0,嵐山温泉彩四季の宿花筏,株式会社　嵐山観光ホテル花筏\n代表取締役　中西　眞,旅館,S45.03.04,京都市西京区嵐山中尾下町57-1
1,京嵐山亭,トヨタ販売連合健康保険組合\n理事長　伊藤　隆之,旅館,S45.05.08,京都市西京区嵐山西一川町２－１
2,三井物産　嵐山寮,三井物産　株式会社\n代表取締役　安永竜夫,旅館,S52.09.07,京都市西京区嵐山中尾下町３４番地１
3,渡月亭　秀山閣,株式会社　渡月亭 \n代表取締役　古川　拓也,旅館,S52.12.28,京都市西京区嵐山中尾下町56
4,ホテル嵐山洛西店,有限会社　サンサン\n代表取締役　山田　初子,旅館,S60.02.08,京都市西京区大枝沓掛町22-1
5,朝日新聞健康保険組合　嵐山保養所,朝日新聞健康保険組合\n理事長　中村　博信,旅館,S60.10.14,京都市西京区嵐山中尾下町8-1
6,渡月亭　碧川閣,株式会社　渡月亭\n代表取締役　古川　拓也,旅館,S60.11.11,京都市西京区嵐山中尾下町54-4
7,ホテル　アルシュ,丸玉興行　株式会社\n代表取締役　玉村　賢二,ホテル,H01.12.22,京都市西京区山田大吉見町19-1
8,ホテル　ラ・シエスタ,株式会社　山井産業\n代表取締役　山本　八郎,ホテル,H05.05.19,"京都市西京区大枝沓掛町26-29,26-819"
9,リゾートインセルバ　ＲＥＳＯＲＴ ＩＮＮ ｓｅｌｖａ,大枝観光株式会社\n代表取締役　正木　昭七,ホテル,H06.03.14,京都市西京区大枝沓掛町22番地２９


In [15]:
# 一つのデータフレームに纏める
df1 = pd.DataFrame()
for i in sheetName:
    dfa = df[i].iloc[:, [0,2,3,4,5]].dropna()
    df1 = pd.concat([df1, dfa])

In [16]:
df1

Unnamed: 0,施設名称１,申請者氏名,旅館業の種別,許可日,施設所在地１
0,株式会社　洛雲荘,株式会社　洛雲荘\n代表取締役　波多野　勝造,旅館,S32.10.01,京都市北区雲ケ畑出谷町343
1,京都イン加茂川,成瀬　幸甫\n,簡易宿所,S55.08.13,京都市北区鞍馬口通り寺町東入鞍馬口町302-
2,旅館　ホテル　マイアミ,関西総合通商　株式会社\n代表取締役　大宮　方子,旅館,S60.02.08,京都市北区上賀茂桜井町32
3,四季育む宿　然林房,株式会社　然林房 \n代表取締役　馬渕　真理子,旅館,H01.08.22,京都市北区鷹峯北鷹峯町40
4,大森キャンプ場,有限会社　大森リゾート\n代表取締役　谷本　弘治,簡易宿所,H08.12.26,"京都市北区大森東町340-2,358番地"
5,島津製作所共済会　柴明荘,（株）島津製作所共済会\n理事長　藤城　亨,旅館,H09.04.25,京都市北区出雲路俵町５２ー８
6,小世界旅社,山本　亮太\n,簡易宿所,H17.01.17,京都市北区紫野下鳥田町２９
7,ゲストハウス“ボン”,谷口　和生\n,簡易宿所,H17.03.29,京都市北区紫野上門前町６３－２
8,び庵,小西　歩\n,簡易宿所,H17.04.01,京都市北区小山下総町５１
9,月光荘,雨宮　しゅう一郎\n,簡易宿所,H17.09.09,京都市北区紫野南舟岡町73-18


## 一先ず一つのデータにできたのでCSVで保存します

In [17]:
df1.to_csv('kyotohotel1.csv')

## 続いてやりたいこと
1. 許可日のデータを西暦にしたい     
1. 住所を経度と緯度で示したい

### 許可日のデータを西暦に
- SとHで分けて西暦にすればよさげ     
- 年、月、日の分かれ目はピリオドで分けられているっぽい

In [18]:
import re
from datetime import datetime

In [19]:
def seireki(data):
    if re.search('S', data):
        data = data[1:]
        data = data.split('.')
        day = datetime(1925 + int(data[0]), int(data[1]), int(data[2]))
        return day
    elif re.search('H', data):
        data = data[1:]
        data = data.split('.')
        day = datetime(1988 + int(data[0]), int(data[1]), int(data[2]))
        return day
    else:
        print(data)

In [20]:
seireki('H30.08.01')

datetime.datetime(2018, 8, 1, 0, 0)

In [21]:
df_day = pd.DataFrame()
for i in range(len(df1)):
    sei = seireki(str(df1.iloc[i, 3]))
    df_day[i] = sei 

2018-09-10 00:00:00
2018-09-10 00:00:00
2018-09-10 00:00:00
2006-10-31 00:00:00
2018-09-10 00:00:00
2009-03-30 00:00:00
2018-09-10 00:00:00


In [22]:
df1[df1['許可日']==datetime(2018,9,10)]

Unnamed: 0,施設名称１,申請者氏名,旅館業の種別,許可日,施設所在地１
110,町屋の宿　臥雲,岩滝株式会社\n代表取締役　程　穌姝,簡易宿所,2018-09-10 00:00:00,京都市北区紫野下柏野町２２番地１７
110,四季十楽　５号,株式会社　長谷ホテルシステムズ\n代表取締役　長谷　拓治郎,簡易宿所,2018-09-10 00:00:00,京都市上京区油小路通下立売上る近衛町１６５番地
110,アーバンホテル　京都二条　プレミアム,アーバンホテルシステム株式会社\n代表取締役　杉本　豊平,ホテル,2018-09-10 00:00:00,京都市中京区聚楽廻南町２５番地５
110,京都東山荘,日本通信機器株式会社\n代表取締役　村井　政幸,旅館,2018-09-10 00:00:00,京都市東山区松原通広道東入清水四丁目１５９番地
110,ＭＩＹＡＫＯ　ｉｎｎ　ＦＵＳＨＩＭＩ,株式会社　アチーブ\n代表取締役　浦田　裕子,簡易宿所,2018-09-10 00:00:00,京都市伏見区竹田浄菩提院町１４５番地，１４６番地


In [23]:
len('2018-09-10 00:00:00')

19

In [24]:
def seireki(data):
    if re.search('S', data):
        data = data[1:]
        data = data.split('.')
        day = datetime(1925 + int(data[0]), int(data[1]), int(data[2]))
        return day
    elif re.search('H', data):
        data = data[1:]
        data = data.split('.')
        day = datetime(1988 + int(data[0]), int(data[1]), int(data[2]))
        return day
    elif len(data) == 19:
        data = data.split(' ')
        data1 = data[0]
        data2 = data1.split('-')
        day = datetime(int(data2[0]), int(data2[1]), int(data2[2]))
        return day
    else:
        print(data)

In [25]:
df_day = pd.DataFrame()
for i in range(len(df1)):
    sei = seireki(str(df1.iloc[i, 3]))
    df_day[i] = i, sei

In [26]:
df_day

Unnamed: 0,0,1,2,3,4,5,6,7,8,9,...,3266,3267,3268,3269,3270,3271,3272,3273,3274,3275
0,0,1,2,3,4,5,6,7,8,9,...,3266,3267,3268,3269,3270,3271,3272,3273,3274,3275
1,1957-10-01 00:00:00,1980-08-13 00:00:00,1985-02-08 00:00:00,1989-08-22 00:00:00,1996-12-26 00:00:00,1997-04-25 00:00:00,2005-01-17 00:00:00,2005-03-29 00:00:00,2005-04-01 00:00:00,2005-09-09 00:00:00,...,2018-07-30 00:00:00,2018-08-01 00:00:00,2018-08-06 00:00:00,2018-08-07 00:00:00,2018-08-13 00:00:00,2018-08-24 00:00:00,2018-08-24 00:00:00,2018-09-18 00:00:00,2018-09-25 00:00:00,2018-10-11 00:00:00


In [27]:
df_day.T

Unnamed: 0,0,1
0,0,1957-10-01 00:00:00
1,1,1980-08-13 00:00:00
2,2,1985-02-08 00:00:00
3,3,1989-08-22 00:00:00
4,4,1996-12-26 00:00:00
5,5,1997-04-25 00:00:00
6,6,2005-01-17 00:00:00
7,7,2005-03-29 00:00:00
8,8,2005-04-01 00:00:00
9,9,2005-09-09 00:00:00


In [28]:
df_day1 = df_day.T

# 続いてやりたいこと
- 住所を経度緯度に変える
- yahooのサービスを使う
- yahoo ジオコーダーAPI　https://developer.yahoo.co.jp/webapi/map/openlocalplatform/v1/geocoder.html
- idを取らないといけないけど・・(appid)

In [29]:
import requests
import json

In [10]:
base_url= "https://map.yahooapis.jp/geocode/V1/geoCoder"
app_id = 'your_id'

params = {
    'appid' : app_id,
    'output': 'json',
    'ei': 'utf-8',
    'al': 4,
    'ar': 'ge',
    'recursive': True,
    'query': '京都市伏見区竹田浄菩提院町145'
}

address_data = requests.get(base_url, params=params)

NameError: name 'requests' is not defined

In [31]:
address_data.json()

{'ResultInfo': {'Count': 0,
  'Total': 0,
  'Start': 1,
  'Status': 200,
  'Description': '',
  'Copyright': '',
  'Latency': 0.025}}

## 出てこない・・・
- recursive: True にしているので出てきそうなものなのに・・・     
(trueを指定すると、指定した住所レベルでマッチしなかった場合、上位のレベルで再検索を行います)      
- arでレベルを上げていくってのも選択しているにもかかわらず出ない・・     
- とりあえず出るまで住所を削ってみると・・・     

In [32]:
base_url= "https://map.yahooapis.jp/geocode/V1/geoCoder"
app_id = 'dj00aiZpPUxZOTMwOXA4a2FkViZzPWNvbnN1bWVyc2VjcmV0Jng9MmU-'

params = {
    'appid' : app_id,
    'output': 'json',
    'ei': 'utf-8',
    'al': 4,
    'ar': 'ge',
    'recursive': True,
    'query': '京都市伏見区竹田浄菩提院町1'
}

address_data1 = requests.get(base_url, params=params)

In [33]:
address_data1.json()

{'ResultInfo': {'Count': 2,
  'Total': 2,
  'Start': 1,
  'Status': 200,
  'Description': '',
  'Copyright': '',
  'Latency': 0.025},
 'Feature': [{'Id': '26109.157.1',
   'Gid': '',
   'Name': '京都府京都市伏見区竹田浄菩提院町1',
   'Geometry': {'Type': 'point',
    'Coordinates': '135.75725277,34.95131085',
    'BoundingBox': '135.75165277,34.94571085 135.76285277,34.95691085'},
   'Category': [],
   'Description': '',
   'Style': [],
   'Property': {'Uid': '1585ba3110afe094ca802008d9e9d63849023111',
    'CassetteId': 'b22fee69b0dcaf2c2fe2d6a27906dafc',
    'Yomi': 'キョウトフキョウトシフシミクタケダジョウボダイインチョウ',
    'Country': {'Code': 'JP', 'Name': '日本'},
    'Address': '京都府京都市伏見区竹田浄菩提院町1',
    'GovernmentCode': '26109',
    'AddressMatchingLevel': '6',
    'AddressType': '地番・戸番'}},
  {'Id': '26109.157.1.3',
   'Gid': '',
   'Name': '京都府京都市伏見区竹田浄菩提院町1-3',
   'Geometry': {'Type': 'point',
    'Coordinates': '135.75735556,34.95159139',
    'BoundingBox': '135.75175556,34.94599139 135.76295556,34.95719139'},
   'Cate

## 2つ出てきた！！！
- しかしググってみると・・・　   　
     
     
1. 京都府京都市伏見区竹田浄菩提院町1      
1. 京都府京都市伏見区竹田浄菩提院町1-3        
1. ＭＩＹＡＫＯ　ｉｎｎ　ＦＵＳＨＩＭＩ       
      
      
      
- 伏見が都を名乗ってよいのかって話は置いて億としても場所が全然違う・・・      
- なので、まぁ場所のプロットは参考程度みたいな感じになります。      

## 良いサービスがあれば教えていただきたい

- 複数出てきたら一番最初のを使うとします。

In [34]:
address_data1.json()['Feature']

[{'Id': '26109.157.1',
  'Gid': '',
  'Name': '京都府京都市伏見区竹田浄菩提院町1',
  'Geometry': {'Type': 'point',
   'Coordinates': '135.75725277,34.95131085',
   'BoundingBox': '135.75165277,34.94571085 135.76285277,34.95691085'},
  'Category': [],
  'Description': '',
  'Style': [],
  'Property': {'Uid': '1585ba3110afe094ca802008d9e9d63849023111',
   'CassetteId': 'b22fee69b0dcaf2c2fe2d6a27906dafc',
   'Yomi': 'キョウトフキョウトシフシミクタケダジョウボダイインチョウ',
   'Country': {'Code': 'JP', 'Name': '日本'},
   'Address': '京都府京都市伏見区竹田浄菩提院町1',
   'GovernmentCode': '26109',
   'AddressMatchingLevel': '6',
   'AddressType': '地番・戸番'}},
 {'Id': '26109.157.1.3',
  'Gid': '',
  'Name': '京都府京都市伏見区竹田浄菩提院町1-3',
  'Geometry': {'Type': 'point',
   'Coordinates': '135.75735556,34.95159139',
   'BoundingBox': '135.75175556,34.94599139 135.76295556,34.95719139'},
  'Category': [],
  'Description': '',
  'Style': [],
  'Property': {'Uid': '994deab35497746bf80d723f829de06b5b17e979',
   'CassetteId': 'b22fee69b0dcaf2c2fe2d6a27906dafc',
   

In [35]:
address_data1.json()['Feature'][0]['Geometry']['Coordinates']

'135.75725277,34.95131085'

In [36]:
address_data.json()['Feature'][0]['Geometry']['Coordinates']

KeyError: 'Feature'

## 存在しないとエラーになる
- これを使って再帰関数を書こう！     
- どうして再帰関数か？　＝＝＞　最近書けるようになったからw

In [82]:
def change_address(address):   # まだ出力できない問題が・・・
    base_url= "https://map.yahooapis.jp/geocode/V1/geoCoder"
    app_id = 'dj00aiZpPUxZOTMwOXA4a2FkViZzPWNvbnN1bWVyc2VjcmV0Jng9MmU-'
    params = {
        'appid' : app_id,
        'output': 'json',
        'ei': 'utf-8',
        'al': 4,
        'ar': 'ge',
        'recursive': True,
        'query': address
    }
    res = requests.get(base_url, params=params)
    try:
        keidoido = res.json()['Feature'][0]['Geometry']['Coordinates'].split(',')
        keido = float(keidoido[0])
        ido = float(keidoido[1])
        k_list = [keido, ido]
        return k_list
    except:
        return change_address(address[:-1])
    

In [80]:
test= change_address('京都市上京区丸太町通黒門東入藁屋町５３５番地６０')

京都市上京区丸太町通黒門東入藁屋町５３５番地


In [81]:
test

[135.74866682, 35.01678257]

In [70]:
test

[136.92758145, 35.06686268]

In [63]:
test

[135.75486678, 34.95124684]

In [83]:
df_keido = pd.DataFrame()
for i in range(len(df1)):
    df_keido[i] = change_address(df1.iloc[i, 4])

In [84]:
df_keido

Unnamed: 0,0,1,2,3,4,5,6,7,8,9,...,3266,3267,3268,3269,3270,3271,3272,3273,3274,3275
0,135.715497,135.764338,135.760393,135.72901,135.700128,135.766654,135.751569,135.747389,135.757508,135.744931,...,135.757047,135.760081,135.771041,135.769199,135.770899,135.769607,135.75898,135.76976,135.768252,135.766236
1,35.124776,35.03805,35.051037,35.054331,35.146629,35.035867,35.042586,35.045346,35.038036,35.037314,...,34.947436,34.964937,34.96909,34.948878,34.969151,34.966662,34.946806,34.968926,34.970731,34.967373


In [85]:
df_keido1 = df_keido.T

# 加工したデータをデータフレームに付け加える


In [87]:
pd.concat([df1, df_day1], axis=1)

InvalidIndexError: Reindexing only valid with uniquely valued Index objects

In [88]:
df1.index = [i for i in range(len(df1))]

In [89]:
df1

Unnamed: 0,施設名称１,申請者氏名,旅館業の種別,許可日,施設所在地１
0,株式会社　洛雲荘,株式会社　洛雲荘\n代表取締役　波多野　勝造,旅館,S32.10.01,京都市北区雲ケ畑出谷町343
1,京都イン加茂川,成瀬　幸甫\n,簡易宿所,S55.08.13,京都市北区鞍馬口通り寺町東入鞍馬口町302-
2,旅館　ホテル　マイアミ,関西総合通商　株式会社\n代表取締役　大宮　方子,旅館,S60.02.08,京都市北区上賀茂桜井町32
3,四季育む宿　然林房,株式会社　然林房 \n代表取締役　馬渕　真理子,旅館,H01.08.22,京都市北区鷹峯北鷹峯町40
4,大森キャンプ場,有限会社　大森リゾート\n代表取締役　谷本　弘治,簡易宿所,H08.12.26,"京都市北区大森東町340-2,358番地"
5,島津製作所共済会　柴明荘,（株）島津製作所共済会\n理事長　藤城　亨,旅館,H09.04.25,京都市北区出雲路俵町５２ー８
6,小世界旅社,山本　亮太\n,簡易宿所,H17.01.17,京都市北区紫野下鳥田町２９
7,ゲストハウス“ボン”,谷口　和生\n,簡易宿所,H17.03.29,京都市北区紫野上門前町６３－２
8,び庵,小西　歩\n,簡易宿所,H17.04.01,京都市北区小山下総町５１
9,月光荘,雨宮　しゅう一郎\n,簡易宿所,H17.09.09,京都市北区紫野南舟岡町73-18


In [90]:
pd.concat([df1, df_day1, df_keido1], axis=1)

Unnamed: 0,施設名称１,申請者氏名,旅館業の種別,許可日,施設所在地１,0,1,0.1,1.1
0,株式会社　洛雲荘,株式会社　洛雲荘\n代表取締役　波多野　勝造,旅館,S32.10.01,京都市北区雲ケ畑出谷町343,0,1957-10-01 00:00:00,135.715497,35.124776
1,京都イン加茂川,成瀬　幸甫\n,簡易宿所,S55.08.13,京都市北区鞍馬口通り寺町東入鞍馬口町302-,1,1980-08-13 00:00:00,135.764338,35.038050
2,旅館　ホテル　マイアミ,関西総合通商　株式会社\n代表取締役　大宮　方子,旅館,S60.02.08,京都市北区上賀茂桜井町32,2,1985-02-08 00:00:00,135.760393,35.051037
3,四季育む宿　然林房,株式会社　然林房 \n代表取締役　馬渕　真理子,旅館,H01.08.22,京都市北区鷹峯北鷹峯町40,3,1989-08-22 00:00:00,135.729010,35.054331
4,大森キャンプ場,有限会社　大森リゾート\n代表取締役　谷本　弘治,簡易宿所,H08.12.26,"京都市北区大森東町340-2,358番地",4,1996-12-26 00:00:00,135.700128,35.146629
5,島津製作所共済会　柴明荘,（株）島津製作所共済会\n理事長　藤城　亨,旅館,H09.04.25,京都市北区出雲路俵町５２ー８,5,1997-04-25 00:00:00,135.766654,35.035867
6,小世界旅社,山本　亮太\n,簡易宿所,H17.01.17,京都市北区紫野下鳥田町２９,6,2005-01-17 00:00:00,135.751569,35.042586
7,ゲストハウス“ボン”,谷口　和生\n,簡易宿所,H17.03.29,京都市北区紫野上門前町６３－２,7,2005-03-29 00:00:00,135.747389,35.045346
8,び庵,小西　歩\n,簡易宿所,H17.04.01,京都市北区小山下総町５１,8,2005-04-01 00:00:00,135.757508,35.038036
9,月光荘,雨宮　しゅう一郎\n,簡易宿所,H17.09.09,京都市北区紫野南舟岡町73-18,9,2005-09-09 00:00:00,135.744931,35.037314


In [91]:
df2 = pd.concat([df1, df_day1, df_keido1], axis=1)
df2.columns = ['hotel_name', 'app_name', 'category', 'permit_day', 'address', 'num', 'permit_date', 'keido', 'ido']

In [92]:
df2.head()

Unnamed: 0,hotel_name,app_name,category,permit_day,address,num,permit_date,keido,ido
0,株式会社　洛雲荘,株式会社　洛雲荘\n代表取締役　波多野　勝造,旅館,S32.10.01,京都市北区雲ケ畑出谷町343,0,1957-10-01 00:00:00,135.715497,35.124776
1,京都イン加茂川,成瀬　幸甫\n,簡易宿所,S55.08.13,京都市北区鞍馬口通り寺町東入鞍馬口町302-,1,1980-08-13 00:00:00,135.764338,35.03805
2,旅館　ホテル　マイアミ,関西総合通商　株式会社\n代表取締役　大宮　方子,旅館,S60.02.08,京都市北区上賀茂桜井町32,2,1985-02-08 00:00:00,135.760393,35.051037
3,四季育む宿　然林房,株式会社　然林房 \n代表取締役　馬渕　真理子,旅館,H01.08.22,京都市北区鷹峯北鷹峯町40,3,1989-08-22 00:00:00,135.72901,35.054331
4,大森キャンプ場,有限会社　大森リゾート\n代表取締役　谷本　弘治,簡易宿所,H08.12.26,"京都市北区大森東町340-2,358番地",4,1996-12-26 00:00:00,135.700128,35.146629


In [95]:
df3 = df2.iloc[:, [0,1,2,3,4,6,7,8]]

In [96]:
df3.to_csv('kyoto_hotel_comp.csv')

# 可視化します
- 使うのはplotlyです。     
- 簡単にぐりぐり動いてできる人感が出ます。     
- 作り方はドキュメントに詳しくあります。(https://plot.ly/python/scattermapbox/)
- 可視化ツールは色々あるしこれまたいいのがあったら教えていただきたい。    
     
### 作り方
- mapbox_access_tokenを取得する
- 経度、緯度、ホテル名のリストを作る
- plotする

In [4]:
import pandas as pd
import plotly.plotly as py
import plotly.graph_objs as go
import numpy as np

In [6]:
df3 = pd.read_csv('kyoto_hotel_comp.csv', index_col=0)

In [9]:
mapbox_access_token="your_token"

data = [
    go.Scattermapbox(
        lat = df3['ido'],
        lon = df3['keido'],
        mode='markers',
        opacity=0.6,
        marker=dict(
            size=9
        ),
        text = df3['hotel_name']
    )
]
layout = go.Layout(
    autosize=True,
    hovermode="closest",
    mapbox = dict(
        accesstoken=mapbox_access_token,
        bearing=0,
        center=dict(
            lat = np.mean(df3['ido']),
            lon = np.mean(df3['keido'])
        ),
        pitch=90,
        zoom=11
    ),
    height = 800,
    width = 1200
)

fig = dict(data=data, layout=layout)
py.iplot(fig, filename='Kyoto Hotel Plot')