In [None]:
import pandas as pd
import os

import plotly.express as px
import plotly.graph_objects as go
import chart_studio.plotly as py
import cufflinks as cf
cf.go_offline(connected=True)


---
# <center><b>1. 파일 불러오기</b></center>
---


In [None]:
# 파일 읽기
os.chdir('C:\민원분석참조모델\data\결과')
df_list = list(os.listdir(os.getcwd()))
index = 0
df_ = pd.read_csv(df_list[index], encoding='euc-kr')

In [None]:
# 필요한 컬럼 추출
df = df_[['부서구분', '처리부서명', '처리담당자명', '민원등록일자']]
df

In [None]:
# 파일 그룹핑
df = df.groupby(['부서구분', '처리부서명', '처리담당자명']).count()
df.rename(columns={'민원등록일자':'빈도'}, inplace=True)
df.sort_values('빈도', ascending=False, inplace=True)
df

In [None]:
# 파일 저장
df.to_csv(f'../../result/7.처리부서/처리부서_빈도_{df_list[index]}', encoding='euc-kr', index=True)

---
# <center><b>2. 데이터 전처리</b></center>
---

In [None]:
# 부서구분 유일치 확인
df['부서구분'].unique()

In [None]:
# 부서구분 결측치 제거
df = df[(df['부서구분'] == '주관') ^ (df['부서구분'] == '협조')]

In [None]:
# 부서구분별 빈도
df_kind = df.groupby('부서구분').count()
df_kind = df_kind[['처리부서명']]
df_kind.rename(columns={'처리부서명': '빈도'}, inplace=True)
df_kind.to_csv(
    f'../../result/7.처리부서/처리부서_처리부서명_빈도_{df_list[index]}', encoding='euc-kr', index=True)
df_kind


In [None]:
# 처리부서명별 빈도
df_part = df.groupby('처리부서명').count()
df_part = df_part[['부서구분']]
df_part.rename(columns={'부서구분': '빈도'}, inplace=True)
df_part.to_csv(
    f'../../result/7.처리부서/처리부서_처리부서명_빈도_{df_list[index]}', encoding='euc-kr', index=True)
df_part


In [None]:
# 처리담당자명 별 빈도
df_emp = df.groupby('처리담당자명').count()
df_emp = df_emp[['부서구분']]
df_emp.rename(columns={'부서구분': '빈도'}, inplace=True)
df_emp.to_csv(
    f'../../result/7.처리부서/처리부서_처리담당자명_빈도_{df_list[index]}', encoding='euc-kr', index=True)
df_emp


In [None]:
df_part_emp = df.groupby(['처리부서명', '처리담당자명'], as_index=False).count()
df_part_emp.rename(columns={'부서구분': '빈도'}, inplace=True)
df_part_emp.to_csv(
    f'../../result/7.처리부서/처리부서_처리부서담당자명_빈도_{df_list[index]}', encoding='euc-kr', index=False)
df_part_emp


---
# <center><b>3. 데이터 시각화</b></center>
---

In [None]:
layout = {
    'title': {
        'text': '<b>처리담당자 파이차트 분석</b>',
        'font': {
            'size': 20
        },
        'x': 0.5,
    },
    'showlegend': True,
    'legend': {
        'title': {
            'text': '<b>처리담당자명</b>',
            'font': {
                'size': 15
            },
        },
        'borderwidth': 25,
        'bordercolor': '#fff',
        'bgcolor': '#F0F8FF',
        # 'orientation': 'h',
    },
    'autosize': True,
    # 'width': 600,
    # 'height': 600,
}

In [None]:
# 부서구분 파이차트
fig1 = go.Figure()

fig1.add_trace(
    go.Pie(
        labels=df_kind.index,
        values=df_kind['빈도'],
        text=df_kind.index,
        textinfo='label+value+percent',
        texttemplate='%{text}<br>%{value}건<br>%{percent}',
        textposition='auto',
    )
)

# fig1.update_layout(layout)
fig1.show()


In [None]:
# 처리부서명 파이차트
fig2 = go.Figure()

fig2.add_trace(
    go.Pie(
        labels=df_part.index,
        values=df_part['빈도'],
        text=df_part.index,
        textinfo='label+value+percent',
        texttemplate='%{text}<br>%{value}건<br>%{percent}',
        textposition='inside',
    )
)

fig2.update_layout(layout)
fig2.show()


In [None]:
# 처리담당자명 
fig3 = go.Figure()

fig3.add_trace(
    go.Pie(
        labels=df_emp.index,
        values=df_emp['빈도'],
        text= df_emp.index,
        textposition='inside',
        textinfo='label+value',
        texttemplate='%{label}<br>%{value}건'
    )
)

# fig3.add_trace(
#     go.Scatter(
#         x=df_emp.index,
#         y=df_emp['빈도']
#     )
# )

fig3.update_layout(layout)
fig3.show()


In [None]:
fig4 = px.sunburst(
    df_part_emp,
    path=['처리부서명', '처리담당자명'],
    values=df_part_emp['빈도'],
)
# fig4.update_layout(layout)
fig4.show()