In [None]:
import pandas as pd
import seaborn as sns

In [None]:
import matplotlib.pyplot as plt
import numpy as np
from matplotlib.ticker import MaxNLocator
import glob, os
from pyecharts import *
import json

import plotly.graph_objects as go
import plotly.express as px
import plotly.io as pio
pio.renderers.default='notebook'

In [None]:
# matplotlib 설정하기

plt.rc('font', family = '/usr/share/fonts/opentype/noto')
plt.rcParams['axes.unicode_minus'] = False
plt.style.use("ggplot")

In [None]:
data_file = "/home/datastory/05.경기도 일자리 설문조사 데이터 분석/TC_JB_QESTNAR_ANSWER.csv"

df = pd.read_csv(data_file, encoding = 'utf-8')

In [None]:
df['질문명'] = df['질문명'].str.replace("|", "")
df['질문명']

In [None]:
df = df.drop(["설문조사번호", '우편번호'], axis = 1)

In [None]:
df.columns

In [None]:
df.isna().sum()

In [None]:
df.dropna(inplace=True)
df.isna().sum()

In [None]:
len(df)

In [None]:
df['시도명'].unique()

In [None]:
df

In [None]:
df = df.drop(['설문조사답변번호', '회원유형명'], axis = 1)

In [None]:
df['설문명'].unique()

In [None]:
df

In [None]:
labels = ['여성', '남성']

### 설문조사 남녀 참여비율

In [None]:
gender_ratio = df['성별코드'].value_counts()
gender_ratio.values

In [None]:
img_1_1 = px.pie(df, 
                 values=list(gender_ratio.values), 
                 names=labels) 

img_1_1.update_traces(textposition='inside', textinfo='percent+label')

img_1_1.update_layout(
    title={
        'text': "설문조사 남녀 참여비율",
        'y':0.95,
        'x':0.5,
        'xanchor': 'center',
        'yanchor': 'top'},
        font=dict(
            family="Noto Sans KR",
            size=12
        ),
    showlegend=False
)
# png 추출

img_1_1.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_1_1.png")


# json 추출 

img_1_1_json = img_1_1.to_json()

img_1_1_json_obj = json.loads(img_1_1_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_1_1.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_1_1_json_obj, make_file, indent="\t", ensure_ascii=False)
    

img_1_1.show()

### 설문조사 참여 출생년도 분포

In [None]:
df[df['출생년도'] > 1980]

In [None]:
born_year = sorted(list(df[df['출생년도'] > 1980]['출생년도'].value_counts().index))
born_year

In [None]:
year_count = list(df[df['출생년도'] > 1980].groupby('출생년도').count()['설문명'])
year_count[::-1]

In [None]:
born_year_count = df[df['출생년도'] > 1980]['출생년도'].value_counts()
born_year_count.values

In [None]:
img_1_2 = px.histogram(df[df['출생년도'] > 1980], y="출생년도", color="출생년도", orientation='h')

img_1_2.update_layout(
    coloraxis_showscale = False,
    showlegend=False,
    title_text="""설문조사에 참여한 출생년도 분포""",
    title_x=0.5,
    xaxis_title="참여자 수",
    yaxis_title="출생년도",
    font=dict(
        family="Noto Sans KR",
        size=12,
    )
)

img_1_2.update_yaxes(categoryorder="trace")

# png 추출

img_1_2.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_1_2.png")


# json 추출 

img_1_2_json = img_1_2.to_json()

img_1_2_json_obj = json.loads(img_1_2_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_1_2.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_1_2_json_obj, make_file, indent="\t", ensure_ascii=False)
    
img_1_2.show()

### 설문조사 참여 직업 분포

In [None]:
img_1_3 = px.histogram(df, y="직업명", color="직업명", orientation='h')

img_1_3.update_layout(
    coloraxis_showscale = False,
    showlegend=False,
    title_text="""설문조사에 참여한 직업 분포""",
    title_x=0.5,
    xaxis_title="참여자 수",
    yaxis_title="직업",
    font=dict(
        family="Noto Sans KR",
        size=12,
    )
)

img_1_3.update_yaxes(categoryorder="trace")

# png 추출

img_1_3.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_1_3.png")


# json 추출 

img_1_3_json = img_1_3.to_json()

img_1_3_json_obj = json.loads(img_1_3_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_1_3.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_1_3_json_obj, make_file, indent="\t", ensure_ascii=False)

img_1_3.show()

### 설문조사 참여 이유 분포

In [None]:
img_1_4 = px.pie(df, 
                 values=df.groupby('가입목표명').count()['설문명'], 
                 names=list(df.groupby('가입목표명').count()['설문명'].index)) 

img_1_4.update_traces(textposition='inside', textinfo='percent+label')

img_1_4.update_layout(
    title={
        'text': "참여 이유",
        'y':0.95,
        'x':0.5,
        'xanchor': 'center',
        'yanchor': 'top'},
        font=dict(
            family="Noto Sans KR",
            size=12
        ),
    showlegend=False
)

# png 추출

img_1_4.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_1_4.png")


# json 추출 

img_1_4_json = img_1_4.to_json()

img_1_4_json_obj = json.loads(img_1_4_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_1_4.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_1_4_json_obj, make_file, indent="\t", ensure_ascii=False)


img_1_4.show()


### 설문조사 가입경로

In [None]:
df['가입경로명'].value_counts()

In [None]:
img_1_5 = px.histogram(df['가입경로명'], 
                       y="가입경로명", 
                       color="가입경로명", 
                       orientation='h')

img_1_5.update_layout(
    coloraxis_showscale = False,
    showlegend=False,
    title_text="""설문조사 가입경로명""",
    title_x=0.5,
    xaxis_title="참여자 수",
    yaxis_title="설문명",
    font=dict(
        family="Noto Sans KR",
        size=12,
    )
)

img_1_5.update_yaxes(categoryorder="trace")

# png 추출

img_1_5.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_1_5.png")


# json 추출 

img_1_5_json = img_1_5.to_json()

img_1_5_json_obj = json.loads(img_1_5_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_1_5.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_1_5_json_obj, make_file, indent="\t", ensure_ascii=False)


img_1_5.show()


### 설문명별 참여인원 통계 (막대)


In [None]:
df['설문명'].unique()

In [None]:
df.groupby('설문명').count()['질문명']

In [None]:
img_1_6 = px.histogram(df['설문명'], 
                       y="설문명", 
                       color="설문명", 
                       orientation='h')

img_1_6.update_layout(
    coloraxis_showscale = False,
    showlegend=False,
    title_text="""설문명별 참여인원 통계""",
    title_x=0.5,
    xaxis_title="참여자 수",
    yaxis_title="설문명",
    font=dict(
        family="Noto Sans KR",
        size=12,
    )
)

img_1_6.update_yaxes(categoryorder="trace")

# png 추출

img_1_6.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_1_6.png")


# json 추출 

img_1_6_json = img_1_6.to_json()

img_1_6_json_obj = json.loads(img_1_6_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_1_6.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_1_6_json_obj, make_file, indent="\t", ensure_ascii=False)

img_1_6.show()


### '정규과정 설문조사에 참여한 인원 연령 분포

In [None]:
from datetime import datetime

df['나이'] = (datetime.today().year - df['출생년도']+1)
df['나이']

In [None]:
정규과정설문_df = df[df['설문명'] == '정규과정 설문']
정규과정설문_df

In [None]:
print(정규과정설문_df['나이'].min())
print(정규과정설문_df['나이'].max())

In [None]:
def age(x):
    if 10 <= x < 20:
        return '10대'
    elif 20 <= x < 30:
        return '20대'
    elif 30 <= x < 40:
        return '30대'
    elif 40 <= x < 50:
        return '40대'
    elif 50 <= x < 60:
        return '50대'
    elif 60 <= x < 70:
        return '60대'
    elif 70 <= x < 80:
        return '70대'
    elif 80 <= x:
        return '80대'

정규과정설문_df['연령대'] = 정규과정설문_df['나이'].apply(lambda x: age(x))

정규과정설문_df.head()    

In [None]:
img_2_1 = px.histogram(정규과정설문_df[정규과정설문_df['출생년도'] > 1980], y="연령대", color="연령대", orientation='h')

img_2_1.update_layout(
    coloraxis_showscale = False,
    showlegend=False,
    title_text="""'정규과정' 설문조사에 참여한 인원 연령대 분포""",
    title_x=0.5,
    xaxis_title="참여자 수",
    yaxis_title="연령대",
    font=dict(
        family="Noto Sans KR",
        size=12,
    )
)

img_2_1.update_yaxes(categoryorder="trace")

# png 추출

img_2_1.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_2_1.png")


# json 추출 

img_2_1_json = img_2_1.to_json()

img_2_1_json_obj = json.loads(img_2_1_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_2_1.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_2_1_json_obj, make_file, indent="\t", ensure_ascii=False)


img_2_1.show()

### '진로코치; 진로교육 설문지' 설문조사에 참여한 인원 연령 분포


In [None]:
df['설문명'].unique()

In [None]:
진로_df = df[df['설문명'] == '진로코치;진로교육 설문지']
진로_df

In [None]:
print(진로_df['나이'].min())
print(진로_df['나이'].max())

In [None]:
진로_df['연령대'] = 진로_df['나이'].apply(lambda x: age(x))

진로_df.head()    

In [None]:
img_2_2 = px.histogram(진로_df, y='연령대', color="연령대", orientation='h')

img_2_2.update_layout(
    coloraxis_showscale = False,
    showlegend=False,
    title_text="""'진로코치;진로교육 설문지' 설문조사에 참여한 인원 연령대 분포""",
    title_x=0.5,
    xaxis_title="참여자 수",
    yaxis=dict(
        {'categoryorder':'category descending'},
        title_text='연령대'
    ),
    font=dict(
        family="Noto Sans KR",
        size=12,
    )
)

# png 추출

img_2_2.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_2_2.png")


# json 추출 

img_2_2_json = img_2_2.to_json()

img_2_2_json_obj = json.loads(img_2_2_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_2_2.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_2_2_json_obj, make_file, indent="\t", ensure_ascii=False)


img_2_2.show()

### '농협대 설문지' 설문조사에 참여한 인원 연령 분포


In [None]:
농협대_df = df[df['설문명'] == '농협대 설문지']

In [None]:
print(농협대_df['나이'].min())
print(농협대_df['나이'].max())

In [None]:
농협대_df['연령대'] = 농협대_df['나이'].apply(lambda x: age(x))

농협대_df.head()    

In [None]:
img_2_3 = px.histogram(농협대_df, y="연령대", color="연령대", orientation='h')

img_2_3.update_layout(
    coloraxis_showscale = False,
    showlegend=False,
    title_text="""'농협대 설문지' 설문조사에 참여한 인원 연령대 분포""",
    title_x=0.5,
    xaxis_title="참여자 수",
    yaxis=dict(
        {'categoryorder':'category descending'},
        title_text='연령대'
    ),
    font=dict(
        family="Noto Sans KR",
        size=12,
    )
)


# png 추출

img_2_3.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_2_3.png")


# json 추출 

img_2_3_json = img_2_3.to_json()

img_2_3_json_obj = json.loads(img_2_3_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_2_3.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_2_3_json_obj, make_file, indent="\t", ensure_ascii=False)


img_2_3.show()

### 정규과정 설문조사 분석 결과

In [None]:
정규과정설문_df['성별코드'].value_counts()

### 설문조사 남녀 참여비율

In [None]:
img_3_1 = px.pie(정규과정설문_df, 
                 values=정규과정설문_df['성별코드'].value_counts(), 
                 names=labels) 

img_3_1.update_traces(textposition='inside', textinfo='percent+label')

img_3_1.update_layout(
    title={
        'text': "정규과정 설문조사 남녀 참여비율",
        'y':0.95,
        'x':0.5,
        'xanchor': 'center',
        'yanchor': 'top'},
        font=dict(
            family="Noto Sans KR",
            size=12
        ),
    showlegend=False
)

# png 추출

img_3_1.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_3_1.png")


# json 추출 

img_3_1_json = img_3_1.to_json()

img_3_1_json_obj = json.loads(img_3_1_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_3_1.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_3_1_json_obj, make_file, indent="\t", ensure_ascii=False)
    


img_3_1.show()

### 설문조사 참여 출생년도 분포

In [None]:
정규과정설문_df[정규과정설문_df['출생년도'] > 1980]

In [None]:
정규과정설문_df.columns

In [None]:
born_year_count = 정규과정설문_df[정규과정설문_df['출생년도'] > 1980]['출생년도'].value_counts()
born_year_count.values

In [None]:
img_3_2 = px.histogram(정규과정설문_df[정규과정설문_df['출생년도'] > 1980], y="출생년도", color="출생년도", orientation='h')

img_3_2.update_layout(
    coloraxis_showscale = False,
    showlegend=False,
    title_text="""정규과정 설문조사에 참여한 출생년도 분포""",
    title_x=0.5,
    xaxis_title="참여자 수",
    yaxis_title="출생년도",
    font=dict(
        family="Noto Sans KR",
        size=12
    )
)

img_3_2.update_yaxes(categoryorder="trace")

# png 추출

img_3_2.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_3_2.png")


# json 추출 

img_3_2_json = img_3_2.to_json()

img_3_2_json_obj = json.loads(img_3_2_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_3_2.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_3_2_json_obj, make_file, indent="\t", ensure_ascii=False)


img_3_2.show()

### 설문조사 참여 직업 분포 (막대)

In [None]:
img_3_3 = px.histogram(정규과정설문_df, y="직업명", color="직업명", orientation='h')

img_3_3.update_layout(
    coloraxis_showscale = False,
    showlegend=False,
    title_text="""정규과정 설문조사 참여 직업 분포""",
    title_x=0.5,
    xaxis_title="참여자 수",
    yaxis_title="직업",
    font=dict(
        family="Noto Sans KR",
        size=12
    )
)

img_3_3.update_yaxes(categoryorder="trace")


# png 추출

img_3_3.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_3_3.png")


# json 추출 

img_3_3_json = img_3_3.to_json()

img_3_3_json_obj = json.loads(img_3_3_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_3_3.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_3_3_json_obj, make_file, indent="\t", ensure_ascii=False)
    

img_3_3.show()

### 설문조사 가입경로 통계 (막대) 

In [None]:
img_3_4 = px.histogram(정규과정설문_df, 
                       y="가입경로명", 
                       color="가입경로명", 
                       orientation='h')

img_3_4.update_layout(
    coloraxis_showscale = False,
    showlegend=False,
    title_text="""정규과정 설문조사 가입경로 통계""",
    title_x=0.5,
    xaxis_title="참여자 수",
    yaxis_title="설문명",
    font=dict(
        family="Noto Sans KR",
        size=12
    )
)

img_3_4.update_yaxes(categoryorder="trace")


# png 추출

img_3_4.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_3_4.png")


# json 추출 

img_3_4_json = img_3_4.to_json()

img_3_4_json_obj = json.loads(img_3_4_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_3_4.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_3_4_json_obj, make_file, indent="\t", ensure_ascii=False)



img_3_4.show()


### 정규과정 설문조사 가입목표 통계 (막대)

In [None]:
img_3_5 = px.histogram(정규과정설문_df, 
                       y="가입목표명", 
                       color="가입목표명", 
                       orientation='h')

img_3_5.update_layout(
    coloraxis_showscale = False,
    showlegend=False,
    title_text="""정규과정 설문조사 가입목표 통계""",
    title_x=0.5,
    xaxis_title="참여자 수",
    yaxis_title="설문명",
    font=dict(
        family="Noto Sans KR",
        size=12
    )
)

img_3_5.update_yaxes(categoryorder="trace")

# png 추출

img_3_5.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_3_5.png")


# json 추출 

img_3_5_json = img_3_5.to_json()

img_3_5_json_obj = json.loads(img_3_5_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_3_5.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_3_5_json_obj, make_file, indent="\t", ensure_ascii=False)


img_3_5.show()


In [None]:
list(정규과정설문_df['질문명'].unique())

In [None]:
questions = [
    '사이트 게시판 및 학습지원센터 등을 통한 운영진의 응대(질의응답; 불편사항 처리)에 만족하십니까?',
    '꿈날개의 홈페이지 이용에 만족하십니까?',
    '평가(퀴즈; 최종 시험; 과제) 난이도는 적절하였습니까?',
    '운영진에 의한 학습독려(메일; 문자; 전화독려)가 학습진행에 도움이 되었습니까?',
    '본인의 수강목적에 적합한 학습내용이었습니까?',
    '다시 신청한다면; 그 이유는 무엇입니까? (복수응답 가능)',
    '본 과정을 학습한 이후에 다른 온라인교육 과정도 꿈날개에서 다시 수강신청 하시겠습니까?',
    '본 교육과정이 여러분의 경력개발 또는 취·창업에 도움이 되었습니까?',
    '이 과정을 다른 분들에게도 추천하실 의향이 있으십니까?',
    '학습지원(질문답변; 과제첨삭 등)에 만족하십니까?', 
    '다시 신청하지 않는다면; 그 이유는 무엇입니까? (복수응답 가능)'
]

In [None]:
정규과정설문_df['질문명']

In [None]:
정규과정설문_df[정규과정설문_df['질문명']=='평가(퀴즈; 최종 시험; 과제) 난이도는 적절하였습니까?']['답변항목명']

In [None]:
for i, question in enumerate(questions):
    img_3_6_to_16 = px.histogram(
        정규과정설문_df[정규과정설문_df['질문명']==question]['답변항목명'], 
        y="답변항목명",
        color="답변항목명", 
        orientation='h'
    )
    
    img_3_6_to_16.update_layout(
        title_text="%s<br>에 대한 답변 통계" %(question),
        title_x=0.5,
        yaxis_title="답변항목명",
        xaxis_title="응답자 수",
        font=dict(
            family="Noto Sans KR",
            size=12,
        ),    
        coloraxis_showscale = False,
        showlegend=False,
)
    # png 추출

    img_3_6_to_16.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_3_%d.png" %(i+6))


    # json 추출 

    img_3_6_to_16_json = img_3_6_to_16.to_json()

    img_3_6_to_16_json_obj = json.loads(img_3_6_to_16_json, encoding="utf-8")

    with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_3_%d.json' %(i+6), 'w', encoding='utf-8') as make_file:
        json.dump(img_3_6_to_16_json_obj, make_file, indent="\t", ensure_ascii=False)

    img_3_6_to_16.show()

In [None]:
img_3_6 = px.histogram(
        정규과정설문_df[정규과정설문_df['질문명']==questions[0]]['답변항목명'], 
        y="답변항목명",
        color="답변항목명", 
        orientation='h'
)
    
img_3_6.update_layout(
    title_text="사이트 게시판 및 학습지원센터 등을 통한<br>운영진의 응대(질의응답; 불편사항 처리)에<br>만족하십니까? 에 대한 답변 통계",
    title_x=0.5,
    title_y=0.97,
    yaxis_title="답변항목명",
    xaxis_title="응답자 수",
    font=dict(
        family="Noto Sans KR",
        size=12,
    ),    
    coloraxis_showscale = False,
    showlegend=False,
)

img_3_6.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_3_6.png")

img_3_6_json = img_3_6.to_json()

img_3_6_json_obj = json.loads(img_3_6_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_3_6.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_3_6_json_obj, make_file, indent="\t", ensure_ascii=False)

img_3_6.show()

In [None]:
img_3_9 = px.histogram(
        정규과정설문_df[정규과정설문_df['질문명']==questions[3]]['답변항목명'], 
        y="답변항목명",
        color="답변항목명", 
        orientation='h'
)
    
img_3_9.update_layout(
    title_text="운영진에 의한 학습독려(메일;문자;전화독려)가<br>학습진행에 도움이 되었습니까?<br>에 대한 답변 통계",
    title_x=0.5,
    title_y=0.97,
    yaxis_title="답변항목명",
    xaxis_title="응답자 수",
    font=dict(
        family="Noto Sans KR",
        size=12,
    ),    
    coloraxis_showscale = False,
    showlegend=False,
)

img_3_9.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_3_9.png")

img_3_9_json = img_3_9.to_json()

img_3_9_json_obj = json.loads(img_3_9_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_3_9.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_3_9_json_obj, make_file, indent="\t", ensure_ascii=False)

img_3_9.show()

In [None]:
img_3_12 = px.histogram(
        정규과정설문_df[정규과정설문_df['질문명']==questions[6]]['답변항목명'], 
        y="답변항목명",
        color="답변항목명", 
        orientation='h'
)
    
img_3_12.update_layout(
    title_text="본 과정을 학습한 이후에 다른 온라인교육 과정도<br>꿈날개에서 다시 수정신청 하시겠습니까?<br>에 대한 답변 통계",
    title_x=0.5,
    title_y=0.97,
    yaxis_title="답변항목명",
    xaxis_title="응답자 수",
    font=dict(
        family="Noto Sans KR",
        size=12,
    ),    
    coloraxis_showscale = False,
    showlegend=False,
)

img_3_12.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_3_12.png")

img_3_12_json = img_3_12.to_json()

img_3_12_json_obj = json.loads(img_3_12_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_3_12.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_3_12_json_obj, make_file, indent="\t", ensure_ascii=False)

img_3_12.show()

### 진로코치; 진로교육 설문조사 분석 결과

In [None]:
진로_df['성별코드'].value_counts()

### 설문조사 남녀 참여비율

In [None]:
img_4_1 = px.pie(진로_df, 
                 values=진로_df['성별코드'].value_counts(), 
                 names=labels) 

img_4_1.update_traces(textposition='inside', textinfo='percent+label')

img_4_1.update_layout(
    title={
        'text': "진로코치;진로교육 설문조사 남녀 참여비율",
        'y':0.95,
        'x':0.5,
        'xanchor': 'center',
        'yanchor': 'top'},
        font=dict(
            family="Noto Sans KR",
            size=12
        ),
    showlegend=False
)
# png 추출

img_4_1.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_4_1.png")


# json 추출 

img_4_1_json = img_4_1.to_json()

img_4_1_json_obj = json.loads(img_4_1_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_4_1.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_4_1_json_obj, make_file, indent="\t", ensure_ascii=False)
    



img_4_1.show()

###  설문조사 참여 출생년도 분포

In [None]:
진로_df[진로_df['출생년도'] > 1980]

In [None]:
img_4_2 = px.histogram(
    진로_df[진로_df['출생년도'] > 1980], 
    y='출생년도', 
    color='출생년도', 
    orientation='h'
)

img_4_2.update_layout(
    coloraxis_showscale = False,
    showlegend=False,
    title_text="""진로코치; 진로교육 설문조사에 참여한 출생년도 분포""",
    title_x=0.5,
    xaxis_title="참여자 수",
    yaxis_title= "출생년도",
    font=dict(
        family="Noto Sans KR",
        size=12
    )
)

img_4_2.update_yaxes(categoryorder="trace")

# png 추출

img_4_2.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_4_2.png")


# json 추출 

img_4_2_json = img_4_2.to_json()

img_4_2_json_obj = json.loads(img_4_2_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_4_2.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_4_2_json_obj, make_file, indent="\t", ensure_ascii=False)

img_4_2.show()

In [None]:
category = [ "직업명", "가입목표명", "가입경로명"]
plot = ["참여 직업 분포", "가입목표 통계", "가입경로 통계"]

In [None]:
진로_df[진로_df['출생년도'] > 1980]['출생년도']

In [None]:
진로_df[진로_df['출생년도'] > 1980]['직업명']

In [None]:
for i, keyword in enumerate(category):
    img_4_3_to_5 = px.histogram(
        진로_df[keyword], 
        y=keyword, 
        color=keyword, 
        orientation='h'
    )
    
    img_4_3_to_5.update_layout(
        coloraxis_showscale = False,
        showlegend=False,
        title_text="""진로코치; 진로교육 설문조사에 참여한 """+ plot[i],
        title_x=0.5,
        xaxis_title="참여자 수",
        yaxis_title= keyword,
        font=dict(
            family="Noto Sans KR",
            size=12
        )
    )

    img_4_3_to_5.update_yaxes(categoryorder="trace")
    
    # png 추출

    img_4_3_to_5.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_4_%d.png" %(i+3))


    # json 추출 

    img_4_3_to_5_json = img_4_3_to_5.to_json()

    img_4_3_to_5_json_obj = json.loads(img_4_3_to_5_json, encoding="utf-8")

    with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_4_%d.json' %(i+3), 'w', encoding='utf-8') as make_file:
        json.dump(img_4_3_to_5_json_obj, make_file, indent="\t", ensure_ascii=False)
    
    img_4_3_to_5.show()


In [None]:
진로_df

In [None]:
list(진로_df['질문명'].unique())

In [None]:
for i, question in enumerate(list(진로_df['질문명'].unique())):
    img_4_6_to_10 = px.histogram(
        진로_df[진로_df['질문명']==question]['답변항목명'], 
        y="답변항목명",
        color="답변항목명", 
        orientation='h'
    )
    
    img_4_6_to_10.update_layout(
        title_text="%s<br>에 대한 답변 통계" %(question),
        title_x=0.5,
        yaxis_title="답변항목명",
        xaxis_title="응답자 수",
        font=dict(
            family="Noto Sans KR",
            size=12,
        ),    
        coloraxis_showscale = False,
        showlegend=False,
)
        # png 추출

    img_4_6_to_10.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_4_%d.png" %(i+6))


    # json 추출 

    img_4_6_to_10_json = img_4_6_to_10.to_json()

    img_4_6_to_10_json_obj = json.loads(img_4_6_to_10_json, encoding="utf-8")

    with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_4_%d.json' %(i+6), 'w', encoding='utf-8') as make_file:
        json.dump(img_4_6_to_10_json_obj, make_file, indent="\t", ensure_ascii=False)

    img_4_6_to_10.show()

### 농협대 설문조사 분석 결과

In [None]:
농협대_df['성별코드'].value_counts()

### 설문조사 남녀 참여비율

In [None]:
img_5_1 = px.pie(농협대_df, 
                 values=농협대_df['성별코드'].value_counts(), 
                 names=['남성','여성']) 

img_5_1.update_traces(textposition='inside', textinfo='percent+label')

img_5_1.update_layout(
    title={
        'text': "농협대 설문조사 남녀 참여비율",
        'y':0.95,
        'x':0.5,
        'xanchor': 'center',
        'yanchor': 'top'},
        font=dict(
            family="Noto Sans KR",
            size=12
        ),
    showlegend=False
)

# png 추출

img_5_1.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_5_1.png")


# json 추출 

img_5_1_json = img_5_1.to_json()

img_5_1_json_obj = json.loads(img_5_1_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_5_1.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_5_1_json_obj, make_file, indent="\t", ensure_ascii=False)
    


img_5_1.show()

### 설문조사 참여 출생년도 분포

In [None]:
농협대_df[농협대_df['출생년도'] > 1980]

In [None]:
img_5_2 = px.histogram(
    농협대_df[농협대_df['출생년도'] > 1980], 
    y='출생년도', 
    color='출생년도', 
    orientation='h'
)

img_5_2.update_layout(
    coloraxis_showscale = False,
    showlegend=False,
    title_text="""농협대 설문조사에 참여한 출생년도 분포""",
    title_x=0.5,
    xaxis_title="참여자 수",
    yaxis_title= keyword,
    font=dict(
        family="Noto Sans KR",
        size=12
    )
)

img_5_2.update_yaxes(categoryorder="trace")

# png 추출

img_5_2.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_5_2.png")


# json 추출 

img_5_2_json = img_5_2.to_json()

img_5_2_json_obj = json.loads(img_5_2_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_5_2.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_5_2_json_obj, make_file, indent="\t", ensure_ascii=False)

img_5_2.show()

In [None]:
category = [ "직업명", "가입목표명", "가입경로명"]
plot = ["참여 직업 분포", "가입목표 통계", "가입경로 통계"]

In [None]:
for i, keyword in enumerate(category):
    img_5_3_to_5 = px.histogram(
        농협대_df[keyword], 
        y=keyword, 
        color=keyword, 
        orientation='h'
    )
    
    img_5_3_to_5.update_layout(
        coloraxis_showscale = False,
        showlegend=False,
        title_text="""농협대 설문조사에 참여한 """+ plot[i],
        title_x=0.5,
        xaxis_title="참여자 수",
        yaxis_title= keyword,
        font=dict(
            family="Noto Sans KR",
            size=12
        )
    )

    img_5_3_to_5.update_yaxes(categoryorder="trace")
    
    # png 추출

    img_5_3_to_5.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_5_%d.png" %(i+3))


    # json 추출 

    img_5_3_to_5_json = img_5_3_to_5.to_json()

    img_5_3_to_5_json_obj = json.loads(img_5_3_to_5_json, encoding="utf-8")

    with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_5_%d.json' %(i+3), 'w', encoding='utf-8') as make_file:
        json.dump(img_5_3_to_5_json_obj, make_file, indent="\t", ensure_ascii=False)
    
    img_5_3_to_5.show()


In [None]:
농협대_df

In [None]:
list(농협대_df['질문명'].unique())

In [None]:
questions_농협대 = [
    '본 교육과정에 전반적으로 만족하셨습니까?',
    '본인의 수강목적에 적합한 학습내용이었습니까?',
    '평가(퀴즈; 최종 시험; 과제) 난이도는 적절하였습니까?',
    '운영진에 의한 학습독려(메일; 문자; 전화독려)가 학습진행에 도움이 되었습니까?',
    '사이트 게시판 및 학습지원센터 등을 통한 운영진의 응대(질의응답; 불편사항 처리)에 만족하십니까?',
    '꿈날개의 홈페이지 이용에 만족하십니까?',
    '본 교육과정이 여러분의 학습능력 향상 또는 경력개발에 도움이 되었습니까?',
    '다시 신청한다면; 그 이유는 무엇입니까? (복수응답 가능)',
    '다시 신청하지 않는다면; 그 이유는 무엇입니까? (복수응답 가능)'

]

In [None]:
for i, question in enumerate(questions_농협대):
    img_5_6_to_14 = px.histogram(
        농협대_df[농협대_df['질문명']==question]['답변항목명'], 
        y="답변항목명",
        color="답변항목명", 
        orientation='h'
    )
    
    img_5_6_to_14.update_layout(
        title_text="%s<br>에 대한 답변 통계" %(question),
        title_x=0.5,
        yaxis_title="답변항목명",
        xaxis_title="응답자 수",
        font=dict(
            family="Noto Sans KR",
            size=12,
        ),    
        coloraxis_showscale = False,
        showlegend=False,
)
    # png 추출

    img_5_6_to_14.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_5_%d.png" %(i+6))


    # json 추출 

    img_5_6_to_14_json = img_5_6_to_14.to_json()

    img_5_6_to_14_json_obj = json.loads(img_5_6_to_14_json, encoding="utf-8")

    with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_5_%d.json' %(i+6), 'w', encoding='utf-8') as make_file:
        json.dump(img_5_6_to_14_json_obj, make_file, indent="\t", ensure_ascii=False)

    img_5_6_to_14.show()

In [None]:
img_5_9 = px.histogram(
        농협대_df[농협대_df['질문명']==questions_농협대[3]]['답변항목명'], 
        y="답변항목명",
        color="답변항목명", 
        orientation='h'
)
    
img_5_9.update_layout(
    title_text="운영진에 의한 학습독려(메일;문자;전화독려)가<br>학습진행에 도움이 되었습니까?<br>에 대한 답변 통계",
    title_x=0.5,
    title_y=0.97,
    yaxis_title="답변항목명",
    xaxis_title="응답자 수",
    font=dict(
        family="Noto Sans KR",
        size=12,
    ),    
    coloraxis_showscale = False,
    showlegend=False,
)

img_5_9.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_5_9.png")

img_5_9_json = img_5_9.to_json()

img_5_9_json_obj = json.loads(img_5_9_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_5_9.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_5_9_json_obj, make_file, indent="\t", ensure_ascii=False)

img_5_9.show()

In [None]:
img_5_10 = px.histogram(
        농협대_df[농협대_df['질문명']==questions_농협대[4]]['답변항목명'], 
        y="답변항목명",
        color="답변항목명", 
        orientation='h'
)
    
img_5_10.update_layout(
    title_text="사이트 게시판 및 학습지원센터 등을 통한 운영진의 응대<br>(질의응답; 불편사항 처리)에 만족하십니까? 에 대한 답변 통계",
    title_x=0.5,
    yaxis_title="답변항목명",
    xaxis_title="응답자 수",
    font=dict(
        family="Noto Sans KR",
        size=12,
    ),    
    coloraxis_showscale = False,
    showlegend=False,
)

img_5_10.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_5_10.png")

img_5_10_json = img_5_10.to_json()

img_5_10_json_obj = json.loads(img_5_10_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_5_10.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_5_10_json_obj, make_file, indent="\t", ensure_ascii=False)

img_5_10.show()

In [None]:
img_5_12 = px.histogram(
        농협대_df[농협대_df['질문명']==questions_농협대[6]]['답변항목명'], 
        y="답변항목명",
        color="답변항목명", 
        orientation='h'
)
    
img_5_12.update_layout(
    title_text="본 교육과정이 여러분의 학습능력 향상 또는 경력개발에<br>도움이 되었습니까? 에 대한 답변 통계",
    title_x=0.5,
    yaxis_title="답변항목명",
    xaxis_title="응답자 수",
    font=dict(
        family="Noto Sans KR",
        size=12,
    ),    
    coloraxis_showscale = False,
    showlegend=False,
)

img_5_12.write_image("/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_5_12.png")

img_5_12_json = img_5_12.to_json()

img_5_12_json_obj = json.loads(img_5_12_json, encoding="utf-8")

with open('/home/datastory/05.경기도 일자리 설문조사 데이터 분석/05/img_5_12.json', 'w', encoding='utf-8') as make_file:
    json.dump(img_5_12_json_obj, make_file, indent="\t", ensure_ascii=False)

img_5_12.show()