In [None]:
import pandas as pd
import numpy as np
import warnings
warnings.filterwarnings('ignore')
import seaborn as sns
import matplotlib.pyplot as plt
# 한글처리
plt.rc('font', family='Malgun Gothic')
# '-' 문자 처리
plt.rc('axes', unicode_minus=False)

import chart_studio.plotly as py
import cufflinks as cf
cf.go_offline(connected=True)

import plotly.graph_objects as go
import plotly.offline as pyo
# jupyter notebook 에서 표시되도록 설정하기
pyo.init_notebook_mode()

## 식습관과 월별, 연도별 상관관계

### 가설
 - 월별 제철음식(식습관)이 식중독 발병에 영향을 미칠 것이다
 - 연도별 GDP(국내총생산)가 식중독 발병에 영향을 미칠 것이다
 
### data 출처
  - 식품안전나라 > 식중독 통계
  https://www.foodsafetykorea.go.kr/portal/healthyfoodlife/foodPoisoningStat.do?menu_no=4425&menu_grp=MENU_NEW02
  
  - 나무위키(월별 제철음식)
  https://namu.wiki/w/%EA%B3%84%EC%A0%88%20%EC%9D%8C%EC%8B%9D
  
  - 연도별 GDP
  https://datacommons.org/place/country/KOR?utm_medium=explore&mprop=amount&popt=EconomicActivity&cpv=activitySource%2CGrossDomesticProduction&hl=ko
  <br>datacatalog.worldbank.org
  
### 주요 질문
  - 1) 월별 제철음식에는 어떤 것들이 있는가?
      - 제철음식별 어떠한 특징이 식중독 발병에 영향이 있을 것 같은가?
  - 2) 년도별 GDP(국내총생산)가 어떻게 변화되었는가?
      - 그 차이가 사람들의 식습관에 어떤 영향을 끼치는가?
      

In [None]:
# Data
month_df =  pd.read_excel('data/month_FP.xlsx')
year_df =  pd.read_excel('data/year_FP.xlsx')
gdp_df = pd.read_csv('data/year_gdp.csv')

In [None]:
# Data 확인
print(month_df.shape)
print(year_df.shape)
print(gdp_df.shape)

### month_df

In [None]:
# month_df의 행과 열 확인
print(month_df.columns[0])
print(month_df.columns[1])
print(month_df.columns[2])
print(month_df.index)

In [None]:
# month_df DataFrame 확인
display(month_df)

In [None]:
# '합계'행(12번째 행) 삭제
month_df = month_df.drop(12, axis = 0)
month_df

In [None]:
# 월별 식중독 발생건수
month_df_case = month_df.drop(['환자수(명)'], axis = 1)
month_df_case

In [None]:
print(month_df_case.index)
month_df_case.columns

In [None]:
print(month_df_case['월'])
month_df_case.index

In [None]:
##############################################
# marker_color에 들어갈 색 정하기! cf) colors# 미완성
##############################################
print(month_df_case['월'])
month_length = len(month_df_case['월'])
print(month_length)

In [None]:
# month_df_case 시각화
fig = go.Figure()
fig.add_trace(
    go.Bar(
        x = month_df_case['월'],
        y = month_df_case['발생건수(건)'],
        text = month_df_case['발생건수(건)'],
        textposition = 'auto',
        texttemplate = '%{text} 건'
#         marker_color = colors
    )
)
fig.update_layout(
    {
        'title' : {
            'text' : '<b>월별 식중독 발생건수</b>',
            'x' : 0.5, 'y' : 0.9,
            'font':{
                'size' : 15
            }
        },
        'xaxis' : {
            'title' : '1월 ~ 12월',
            'showticklabels' : True,
            'tick0' : '1월',
            'dtick' : 'M1',
            'tickfont' : {
                'size' : 10
            }
        },
        'yaxis' : {
        'title' : '발생건수(건)'
        },
        'template' : 'plotly_white'
    }
)
fig.show()

In [None]:
# 월별 식중독 환자수
month_df_count = month_df.drop(['발생건수(건)'], axis = 1)
month_df_count

In [None]:
# month_df_count 시각화
fig = go.Figure()
fig.add_trace(
    go.Bar(
        x = month_df_count['월'],
        y = month_df_count['환자수(명)'],
        text = month_df_count['환자수(명)'],
        textposition = 'auto',
        texttemplate = '%{text} 명'
#         marker_color = colors
    )
)
fig.update_layout(
    {
        'title' : {
            'text' : '<b>월별 식중독 환자수</b>',
            'x' : 0.5, 'y' : 0.9,
            'font':{
                'size' : 15
            }
        },
        'xaxis' : {
            'title' : '1월 ~ 12월',
            'showticklabels' : True,
            'tick0' : '1월',
            'dtick' : 'M1',
            'tickfont' : {
                'size' : 10
            }
        },
        'yaxis' : {
        'title' : '환자수(명)'
        },
        'template' : 'plotly_white'
    }
)
fig.show()

### year_df

In [None]:
# month_df의 행과 열 확인
print(year_df.columns[0])
print(year_df.columns[1])
print(year_df.columns[2])
print(year_df.index)

In [None]:
# year_df DataFrame 확인
display(year_df)

In [None]:
# '합계'(18번째)행 삭제
year_df = year_df.drop(18, axis = 0)
year_df

In [None]:
# 연도별 식중독 발생건수
year_df_case = year_df.drop(['환자수(명)'], axis = 1)
year_df_case

In [None]:
# 연도별 식중독 환자수
year_df_case = year_df.drop(['발생건수(건)'], axis = 1)
year_df_case