In [1]:
import numpy as np
import pandas as pd

# import data
residential_data_path = './data/10401_10811_residential_burglary.csv'
residential_data = pd.read_csv(residential_data_path, engine='python')

In [2]:
residential_data.head()

Unnamed: 0,編號,案類,發生(現)日期,發生時段,發生(現)地點
0,1,住宅竊盜,1040101,00~02,台北市文山區萬美里萬寧街1~30號
1,2,住宅竊盜,1040101,00~02,台北市信義區富台里忠孝東路5段295巷6弄1~30號
2,3,住宅竊盜,1040101,06~08,台北市中山區新生北路1段91~120號
3,4,住宅竊盜,1040101,10~12,台北市文山區明興里興隆路4段1~30號
4,5,住宅竊盜,1040101,12~14,台北縣新莊市思源路332巷1~30號


In [3]:
residential_data = residential_data.rename(columns={'編號': 'No', '發生(現)日期': 'date', '案類': 'type',\
                                                    '發生時段': 'time', '發生(現)地點': 'location'})
residential_data['location']

0                 台北市文山區萬美里萬寧街1~30號
1        台北市信義區富台里忠孝東路5段295巷6弄1~30號
2               台北市中山區新生北路1段91~120號
3               台北市文山區明興里興隆路4段1~30號
4                台北縣新莊市思源路332巷1~30號
                   ...             
3020          台北市信義區中興里光復南路541~570號
3021    台北市文山區華興里020鄰木柵路1段238巷1~30號
3022              台北市中山區樂群二路91~120號
3023      台北市文山區萬興里028鄰新光路1段91~120號
3024      台北市大安區昌隆里忠孝東路3段217巷2弄4-6號
Name: location, Length: 3025, dtype: object

In [4]:
residential_data['city'] = residential_data.location.str[:3]
residential_data['area'] = residential_data.location.str[3:6]
residential_data.head()

Unnamed: 0,No,type,date,time,location,city,area
0,1,住宅竊盜,1040101,00~02,台北市文山區萬美里萬寧街1~30號,台北市,文山區
1,2,住宅竊盜,1040101,00~02,台北市信義區富台里忠孝東路5段295巷6弄1~30號,台北市,信義區
2,3,住宅竊盜,1040101,06~08,台北市中山區新生北路1段91~120號,台北市,中山區
3,4,住宅竊盜,1040101,10~12,台北市文山區明興里興隆路4段1~30號,台北市,文山區
4,5,住宅竊盜,1040101,12~14,台北縣新莊市思源路332巷1~30號,台北縣,新莊市


In [5]:
# Check all kinds of city 
np.unique([residential_data.city])

array(['三民一', '中元路', '中興路', '仁孝路', '六路里', '南投縣', '南斗路', '台中市', '台北市',
       '台北縣', '嘉義縣', '基隆市', '宜蘭縣', '屏東縣', '建國路', '彰化縣', '新竹市', '新竹縣',
       '東山路', '桃園縣', '澎湖縣', '自立路', '苗栗縣', '雲林縣', '高雄市', '龍肚路'],
      dtype=object)

In [6]:
# 去除台北市以外的
filtered_data = residential_data[(residential_data.city == '台北市')]
filtered_data.head()

Unnamed: 0,No,type,date,time,location,city,area
0,1,住宅竊盜,1040101,00~02,台北市文山區萬美里萬寧街1~30號,台北市,文山區
1,2,住宅竊盜,1040101,00~02,台北市信義區富台里忠孝東路5段295巷6弄1~30號,台北市,信義區
2,3,住宅竊盜,1040101,06~08,台北市中山區新生北路1段91~120號,台北市,中山區
3,4,住宅竊盜,1040101,10~12,台北市文山區明興里興隆路4段1~30號,台北市,文山區
5,6,住宅竊盜,1040102,00~02,台北市士林區天福里1鄰忠誠路2段130巷1~30號,台北市,士林區


In [7]:
# 檢查是否有遺漏
print(np.unique([filtered_data.city]))
print("共有", len(filtered_data), "筆")

['台北市']
共有 2763 筆


In [12]:
# 地址轉換成經緯度
from selenium import webdriver
from selenium.webdriver.common.keys import Keys

driver = webdriver.Chrome('./crawler_drive/chromedriver')
url = 'https://maplocation.sjfkai.com/'
driver.get(url)
input_form = driver.find_element_by_id("locations")
input_form.send_keys(filtered_data.location.to_string(index=False))
input_form.send_keys(Keys.ENTER)


ModuleNotFoundError: No module named 'selenium'

In [9]:
import json
from bokeh.io import show
from bokeh.models import (CDSView, ColorBar, ColumnDataSource,
                          CustomJS, CustomJSFilter, 
                          GeoJSONDataSource, HoverTool,
                          LinearColorMapper, Slider)
from bokeh.layouts import column, row, widgetbox
from bokeh.palettes import brewer
from bokeh.plotting import figure

# Input GeoJSON source that contains features for plotting
geosource = GeoJSONDataSource(geojson = filtered_data.to_json())

In [10]:
# Create figure object.
p = figure(title = 'Lead Levels in Water Samples, 2018', 
       plot_height = 600 ,
       plot_width = 950, 
       toolbar_location = 'below',
       tools = "pan, wheel_zoom, box_zoom, reset")
p.xgrid.grid_line_color = None
p.ygrid.grid_line_color = None
# Add patch renderer to figure.
states = p.patches('xs','ys', source = geosource,
               fill_color = None,
               line_color = 'gray', 
               line_width = 0.25, 
               fill_alpha = 1)
# Create hover tool
p.add_tools(HoverTool(renderers = [states],
                  tooltips = [('State','@NAME'),
                            ('Population','@POPESTIMATE2018')]))
show(p)