# データ・サイエンス	データ・サイエンス社会応用論 / ICT社会応用演習Ⅳ
## 9-4. 交通事故統計情報の分析（東京都内毎時集計）

### 1. 下準備
#### 1-a) ライブラリのインポート

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
from datetime import datetime, timedelta
import jpholiday
import japanize_matplotlib

#### 1-b) 交通事故統計情報の読み込み

In [None]:
df_accident1 = pd.read_csv('data/accident/honhyo_2019.csv', encoding='SHIFT-JIS')
df_accident2 = pd.read_csv('data/accident/honhyo_2020.csv', encoding='SHIFT-JIS')
df_accident3 = pd.read_csv('data/accident/honhyo_2021.csv', encoding='SHIFT-JIS')
df_accident = pd.concat([df_accident1, df_accident2, df_accident3])
df_accident['年月日時'] = pd.to_datetime({
    'year' : df_accident['発生日時　　年'], 'month' : df_accident['発生日時　　月'], 
    'day' : df_accident['発生日時　　日'], 'hour' : df_accident['発生日時　　時']
})
df_accident

#### 1-c) 東京都内の2019年1月1日以降のデータの抽出

In [None]:
df_accident_tokyo = df_accident[df_accident['都道府県コード'] == FILL_IN_HERE]
df_accident_tokyo = df_accident_tokyo[df_accident_tokyo['年月日時'] >= datetime(2019, 1, 1)]
df_accident_tokyo

#### 1-d) 日時毎の集計

In [None]:
df_accident_tokyo_hourly = df_accident_tokyo.groupby(['年月日時'], as_index=False)[['死者数', '負傷者数']].sum()
df_accident_tokyo_hourly

#### 1-e) 気象データの読み込み

In [None]:
df_weather1 = pd.read_csv('data/weather/rain_tokyo_2019.csv', encoding='SHIFT-JIS', header=2)
df_weather1 = df_weather1.drop([0,1]).reset_index(drop=True)

df_weather2 = pd.read_csv('data/weather/rain_tokyo_2020.csv', encoding='SHIFT-JIS', header=2)
df_weather2 = df_weather2.drop([0,1]).reset_index(drop=True)

df_weather3 = pd.read_csv('data/weather/rain_tokyo_2021.csv', encoding='SHIFT-JIS', header=2)
df_weather3 = df_weather3.drop([0,1]).reset_index(drop=True)

df_weather = pd.concat([df_weather1, df_weather2, df_weather3])
df_weather['年月日時'] = pd.to_datetime(df_weather['年月日時']) - timedelta(hours=1)
df_weather

#### 1-f) 事故データと天候データの結合

In [None]:
df_accident_weather = pd.merge(df_accident_tokyo_hourly, df_weather, on='年月日時', how='right').fillna(0)
df_accident_weather

#### 1-g) 曜日と祝日の追加

In [None]:
df_accident_weather['曜日'] = df_accident_weather['年月日時'].dt.weekday
df_accident_weather['祝日'] = df_accident_weather['年月日時'].dt.date.map(jpholiday.is_holiday).astype(int)
df_accident_weather['時'] = df_accident_weather['年月日時'].dt.hour
df_accident_weather

### 2. 気象データと組み合わせた分析
#### 2-a) 平日と休日の分割

In [None]:
df_accident_weather_normal = df_accident_weather[(df_accident_weather['曜日'] < 5) & (df_accident_weather['祝日'] == False)]
df_accident_weather_normal

In [None]:
df_accident_weather_holiday = df_accident_weather[(df_accident_weather['曜日'] >= 5) | (df_accident_weather['祝日'] == True)]
df_accident_weather_holiday

#### 2-b) 平日の1時間あたりの負傷者数の分布

In [None]:
df_accident_weather_normal_rain = df_accident_weather_normal[df_accident_weather_normal['降水量(mm)'] > 0]
df_accident_weather_normal_norain = df_accident_weather_normal[df_accident_weather_normal['降水量(mm)'] == 0]

In [None]:
rain = df_accident_weather_normal_rain.groupby('時')['負傷者数'].mean()
norain = df_accident_weather_normal_norain.groupby('時')['負傷者数'].mean()

df_accident_weather_normal_average = pd.DataFrame({ '雨天' : rain, '雨以外' : norain })
df_accident_weather_normal_average.plot(figsize=(10, 4))
plt.show()

#### 2-c) 休日の1時間あたりの負傷者数の分布

In [None]:
df_accident_weather_holiday_norain = df_accident_weather_holiday[df_accident_weather_holiday['降水量(mm)'] == 0]
df_accident_weather_holiday_rain = df_accident_weather_holiday[df_accident_weather_holiday['降水量(mm)'] > 0]

In [None]:
rain = df_accident_weather_holiday_rain.groupby('時')['負傷者数'].mean()
norain = df_accident_weather_holiday_norain.groupby('時')['負傷者数'].mean()

df_accident_weather_holiday_average = pd.DataFrame({ '雨天' : rain, '雨以外' : norain })
df_accident_weather_holiday_average.plot(figsize=(10, 4))
plt.show()