In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
sns.set_theme(style='whitegrid', font_scale=1.0)
sns.set_palette('Set2', n_colors=10)
plt.rc('font', family='malgun gothic')

In [None]:
d_cds = pd.read_csv('data/csd_대전광역시.csv', encoding='utf-8')

In [None]:
d_cds.head()

In [None]:
filter = d_cds['시군구'].str.contains('둔산동')
d_cds = d_cds[filter]

In [None]:
d_cds['사고일시'] = pd.to_datetime(d_cds['사고일시'], format='%Y년 %m월 %d일 %H시')

In [None]:
d_cds['가해운전자 연령'] = d_cds['가해운전자 연령'].str.replace('세','')
d_cds[d_cds['가해운전자 연령'] == '미분류'] = np.nan
d_cds['가해운전자 연령'] = d_cds['가해운전자 연령'].astype('float')

In [None]:
d_cds['피해운전자 연령'] = d_cds['피해운전자 연령'].str.replace('세 이상', '')
d_cds['피해운전자 연령'] = d_cds['피해운전자 연령'].str.replace('세','')
d_cds[d_cds['피해운전자 연령'] == '미분류'] = np.nan
d_cds['피해운전자 연령'] = d_cds['피해운전자 연령'].astype('float')

In [None]:
d_cds['가해운전자 연령'] = d_cds['가해운전자 연령'].clip(lower=20)

In [None]:
d_cds['피해운전자 연령'] = d_cds['피해운전자 연령'].clip(lower=20)


In [None]:
# 시간별
plt.figure(figsize=(10,4))
sns.countplot(x=d_cds['사고일시'].dt.hour, data=d_cds)

In [None]:
# 월별
plt.figure(figsize=(7,4))
sns.countplot(x=d_cds['사고일시'].dt.month, data=d_cds)

In [None]:
from pandas.api.types import CategoricalDtype

order = ['월요일', '화요일', '수요일', '목요일', '금요일', '토요일', '일요일']
weekday = CategoricalDtype(categories=order, ordered=True)
d_cds['요일'] = d_cds['요일'].astype(weekday)

In [None]:
plt.figure(figsize=(6,4))
sns.countplot(x='요일', data=d_cds)

In [None]:
plt.figure(figsize=(7, 4))
sns.countplot(x='사고내용', data=d_cds)

In [None]:
plt.figure(figsize=(7, 4))
plt.xticks(rotation=-90)
sns.countplot(x='사고유형', data=d_cds)

In [None]:
plt.figure(figsize=(7, 4))
plt.xticks(rotation=-90)
sns.countplot(x='법규위반', data=d_cds)

In [None]:
plt.figure(figsize=(7, 4))
plt.xticks(rotation=-90)
sns.countplot(x='노면상태', data=d_cds)

In [None]:
plt.figure(figsize=(7, 4))
plt.xticks(rotation=-90)
sns.countplot(x='기상상태', data=d_cds)

In [None]:
plt.figure(figsize=(7, 4))
plt.xticks(rotation=-90)
sns.countplot(x='도로형태', data=d_cds)

In [None]:
plt.figure(figsize=(7, 4))
plt.xticks(rotation=-90)
sns.countplot(x='가해운전자 차종', data=d_cds)

In [None]:
plt.figure(figsize=(7, 4))
plt.xticks(rotation=-90)
sns.countplot(x='가해운전자 성별', data=d_cds)

In [None]:
sns.displot(x='가해운전자 연령', kind='hist', rug=True, bins=50, height=7, data=d_cds);

In [None]:
plt.figure(figsize=(7, 4))
plt.xticks(rotation=-90)
sns.countplot(x='가해운전자 상해정도', data=d_cds)

In [None]:
plt.figure(figsize=(7, 4))
plt.xticks(rotation=-90)
sns.countplot(x='피해운전자 차종', data=d_cds)

In [None]:
plt.figure(figsize=(7, 4))
plt.xticks(rotation=-90)
sns.countplot(x='피해운전자 성별', data=d_cds)

In [None]:
sns.displot(x='피해운전자 연령', kind='hist', rug=True, bins=50, height=7, data=d_cds)

In [None]:
plt.figure(figsize=(7, 4))
plt.xticks(rotation=-90)
sns.countplot(x='피해운전자 상해정도', data=d_cds)

In [None]:
d_cds.select_dtypes(['object']).describe().T

In [None]:
sns.set_theme(style='whitegrid', font_scale=2)
sns.set_palette('Set2', n_colors=10)
plt.rc('font', family='malgun gothic')

plt.figure(figsize=(40, 10))

plt.subplot(1, 3, 1)
plt.title('사고 요일')
sns.countplot(x='요일', data=d_cds)

plt.subplot(1, 3, 2)
plt.title('가해자 연령')
sns.histplot(x='가해운전자 연령', bins=50, data=d_cds)

plt.subplot(1, 3, 3)
plt.title('피해자 연령')
sns.histplot(x='피해운전자 연령', bins=50, data=d_cds)

plt.savefig('대전광역시_taas.png')