In [None]:
import matplotlib.pyplot as plt

!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf

# 한글 폰트 설정
plt.rcParams['font.family'] = 'Malgun Gothic'  # Windows의 경우
plt.rcParams['axes.unicode_minus'] = False  # 한글 폰트 사용 시, 마이너스 기호 깨짐 방지

## 구글드라이브 마운트

In [1]:
from google.colab import drive
drive.mount('/gdrive')

Mounted at /gdrive


## 필요 라이브러리 임포트
- 추가 사용자 정의함수 불러오기

In [2]:
# 라이브러리 임포트
import os
import numpy as np
import pandas as pd
import chardet

import time

import folium

# 사용자 정의함수 경로 설정
import sys
# sys.path.append("H:/내 드라이브/_Projects/재정데이터분석_미니프로젝트/Source/_Custom_Function")
sys.path.append("/gdrive/MyDrive/_Projects/재정데이터분석_미니프로젝트/Source/_Custom_Function")

# 사용자 정의함수 불러오기
import ExcelFile_Merge as em
import ExcelFile_Read as er
import ExcelFile_EDA as ee

import dataset_function as ds_f
import folium_function as fl_f
import plot_function as pl_f

### 데이터셋 기본 경로 설정

In [3]:
# 나의 루트 경로 설정
path_dateset = '/gdrive/MyDrive/_Projects/재정데이터분석_미니프로젝트/DataSet/'

### 파일 이름 설정

In [5]:
file_name_1 = '전처리/가해운전자_차량용도별_교차로형태별_교통사고_2020_2023.csv'
file_name_2 = '전처리/가해운전자_차량용도별_도로종류별_교통사고_2020_2023.csv'
file_name_3 = '전처리/가해운전자_차량용도별_도로형태별_교통사고_2020_2023.csv'
file_name_4 = '전처리/가해운전자_차량용도별_연령층별_교통사고_2020_2023.csv'

In [86]:
file_name = file_name_2
x_label = '도로종류'

### 데이터의 행 개수만큼만 읽기
- 대용량 파일의 경우, 파일의 형식을 먼저 확인하기 위해서 사용

In [87]:
er.Read_nrows(path_dateset + file_name, 3)

Unnamed: 0,연도,구분,일반국도,지방도,특별광역시도,시도,군도,고속국도,기타
0,2020,사고[건],30,23,528,222,10,,84
1,2020,사망[명],1,1,4,4,0,,0
2,2020,부상[명],33,27,572,245,11,,97


### 파일읽기

In [88]:
df_temp = em.Read_File(path_dateset + file_name)

read_file - file_path :  /gdrive/MyDrive/_Projects/재정데이터분석_미니프로젝트/DataSet/전처리/가해운전자_차량용도별_도로종류별_교통사고_2020_2023.csv , encoding :  UTF-8-SIG


In [89]:
df_temp.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 12 entries, 0 to 11
Data columns (total 9 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   연도      12 non-null     int64  
 1   구분      12 non-null     object 
 2   일반국도    12 non-null     int64  
 3   지방도     12 non-null     int64  
 4   특별광역시도  12 non-null     int64  
 5   시도      12 non-null     int64  
 6   군도      12 non-null     int64  
 7   고속국도    0 non-null      float64
 8   기타      12 non-null     int64  
dtypes: float64(1), int64(7), object(1)
memory usage: 992.0+ bytes


In [90]:
df_temp.columns

Index(['연도', '구분', '일반국도', '지방도', '특별광역시도', '시도', '군도', '고속국도', '기타'], dtype='object')

In [91]:
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', None)

In [92]:
df_temp

Unnamed: 0,연도,구분,일반국도,지방도,특별광역시도,시도,군도,고속국도,기타
0,2020,사고[건],30,23,528,222,10,,84
1,2020,사망[명],1,1,4,4,0,,0
2,2020,부상[명],33,27,572,245,11,,97
3,2021,사고[건],88,73,754,552,23,,245
4,2021,사망[명],1,0,5,8,1,,4
5,2021,부상[명],94,80,841,599,25,,262
6,2022,사고[건],187,113,805,880,31,,370
7,2022,사망[명],3,1,9,11,0,,2
8,2022,부상[명],212,121,910,985,37,,419
9,2023,사고[건],199,99,946,835,27,,283


In [93]:
import pandas as pd
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import plotly.express as px

# 데이터 준비 (df_temp가 이미 존재한다고 가정)
gb = ['사고[건]', '사망[명]', '부상[명]']

# 색상 팔레트 생성 (더 선명하고 대비되는 색상)
color_palette = px.colors.qualitative.Set1

# 서브플롯 생성
fig = make_subplots(rows=len(gb), cols=1, subplot_titles=[f'<b>{x_label}별 사고 현황 ({g})</b>' for g in gb], vertical_spacing=0.1)

for i, g in enumerate(gb, start=1):
    df = df_temp[df_temp['구분'] == g].drop(columns=['구분'])
    df_melted = df.melt(id_vars=['연도'], var_name=x_label, value_name='사고수')
    df_melted['사고수'] = df_melted['사고수'].fillna(0).astype(int)

    for j, year in enumerate(sorted(df_melted['연도'].unique())):
        subset = df_melted[df_melted['연도'] == year]
        color = color_palette[j % len(color_palette)]
        fig.add_trace(
            go.Scatter(
                x=subset[x_label],
                y=subset['사고수'],
                mode='lines+markers+text',
                name=str(year),
                line=dict(color=color, width=2),
                marker=dict(color=color, size=8),
                text=subset['사고수'],
                textposition='top center',
                hovertemplate=f'{x_label}: %{{x}}<br>사고수: %{{y}}<br>연도: {year}<extra></extra>',
                showlegend=(i==1)
            ),
            row=i, col=1
        )

    fig.update_xaxes(title_text=f'<b>{x_label}</b>', row=i, col=1, tickangle=15)
    fig.update_yaxes(title_text='<b>사고 수</b>', row=i, col=1)

# 전체 레이아웃 업데이트
fig.update_layout(
    height=350 * len(gb),
    width=1000,
    title_text=f'<b>{x_label}별 사고 현황</b>',
    title_font=dict(size=24),
    legend_title_text='<b>연도</b>',
    font=dict(family='NanumGothic', size=14),
    legend=dict(
        orientation="h",
        yanchor="bottom",
        y=1.02,
        xanchor="right",
        x=1
    ),
    plot_bgcolor='rgba(0,0,0,0)',
    paper_bgcolor='rgba(0,0,0,0)',
)

# X축과 Y축 눈금 글씨 크기 조정 및 그리드 추가
fig.update_xaxes(tickfont=dict(size=12, family='Arial', color='black'), showgrid=True, gridwidth=1, gridcolor='lightgrey')
fig.update_yaxes(tickfont=dict(size=12, family='Arial', color='black'), showgrid=True, gridwidth=1, gridcolor='lightgrey')

# 그래프 표시
fig.show()

In [94]:
import pandas as pd
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import plotly.express as px

# 데이터 준비 (df_temp가 이미 존재한다고 가정)
gb = ['사고[건]', '사망[명]', '부상[명]']

# 색상 팔레트 생성 (더 선명하고 대비되는 색상)
color_palette = px.colors.qualitative.Bold

# 서브플롯 생성
fig = make_subplots(rows=len(gb), cols=1, #subplot_titles=[f'<b>{x_label}별 사고 현황 ({g})</b>' for g in gb],
                    vertical_spacing=0.1)

for i, g in enumerate(gb, start=1):
    df = df_temp[df_temp['구분'] == g].drop(columns=['구분'])
    df_melted = df.melt(id_vars=['연도'], var_name=x_label, value_name='사고수')
    df_melted['사고수'] = df_melted['사고수'].fillna(0).astype(int)

    for j, year in enumerate(sorted(df_melted['연도'].unique(), reverse=True)):
        subset = df_melted[df_melted['연도'] == year]
        color = color_palette[j % len(color_palette)]
        fig.add_trace(
            go.Bar(
                x=subset[x_label],
                y=subset['사고수'],
                name=str(year),
                marker_color=color,
                showlegend=(i==1),
                text=subset['사고수'],
                textposition='inside',
                textfont=dict(color='white', size=10),
                hovertemplate=f'{x_label}: %{{x}}<br>사고수: %{{y}}<br>연도: {year}<extra></extra>'
            ),
            row=i, col=1
        )

    fig.update_xaxes(title_text=f'<b>{x_label}</b>', row=i, col=1, tickangle=45)
    fig.update_yaxes(title_text=f'<b>{g}</b>', row=i, col=1)

# 전체 레이아웃 업데이트
fig.update_layout(
    height=350*len(gb),
    width=1000,
    title_text=f'<b>{x_label}별 사고 현황</b>',
    title_font=dict(size=24),
    legend_title_text='<b>연도</b>',
    font=dict(family='NanumGothic', size=14),
    legend=dict(
        orientation="h",
        yanchor="bottom",
        y=1.02,
        xanchor="right",
        x=1
    ),
    barmode='stack',
    plot_bgcolor='rgba(0,0,0,0)',
    paper_bgcolor='rgba(0,0,0,0)',
    margin=dict(l=50, r=50, t=100, b=50)
)

# X축과 Y축 눈금 글씨 크기 조정 및 그리드 추가
fig.update_xaxes(tickfont=dict(size=12, family='Arial', color='black'), showgrid=True, gridwidth=1, gridcolor='lightgrey')
fig.update_yaxes(tickfont=dict(size=12, family='Arial', color='black'), showgrid=True, gridwidth=1, gridcolor='lightgrey')

# 그래프 표시
fig.show()