In [23]:
import os
import pandas as pd
import plotly.express as px

# 1. 폴더 경로
folder_path = './데이터/중도탈락 학생 현황_학교별평균값/전처리 후'

# 2. 파일 리스트 가져오기
file_list = [file for file in os.listdir(folder_path) if file.endswith('.xlsx')]

# 3. 데이터프레임 합치기
df_list = []
for file_name in file_list:
    file_path = os.path.join(folder_path, file_name)
    df = pd.read_excel(file_path)
    df_list.append(df)

# 4. 하나의 데이터프레임으로 통합
df_total = pd.concat(df_list, ignore_index=True)

# 5. 필요한 컬럼만 추출
df_year = df_total[['기준연도', '자퇴학생비율']].copy()

# 6. 연도별 평균 자퇴학생비율 계산
df_grouped = df_year.groupby('기준연도').mean().reset_index()

# 7. 기준연도를 문자열(str)로 변환
df_grouped['기준연도'] = df_grouped['기준연도'].astype(str)

# 8. Plotly 시각화
fig = px.line(
    df_grouped, 
    x='기준연도', 
    y='자퇴학생비율', 
    markers=True,
    text=df_grouped['자퇴학생비율'].round(2),  # 여기에 추가
    title='연도별 대학 평균 자퇴율 변화',
    labels={
        '기준연도': '기준연도',
        '자퇴학생비율': '평균 자퇴학생비율 (%)'
    }
)

y_min = df_grouped['자퇴학생비율'].min() * 0.98
y_max = df_grouped['자퇴학생비율'].max() * 1.02

fig.update_layout(
    font_family="Malgun Gothic",
    font_size=16,
    yaxis=dict(range=[y_min, y_max])  # y축 범위 수동 설정
)

fig.update_traces(
    textposition="top center",
    textfont_size=14
)

fig.show()

In [27]:
import os
import pandas as pd
import plotly.express as px

# 1. 폴더 경로
folder_path = './데이터/중도탈락 학생 현황_학교별평균값/전처리 후'

# 2. 파일 리스트 가져오기
file_list = [file for file in os.listdir(folder_path) if file.endswith('.xlsx')]

# 3. 데이터프레임 합치기
df_list = []
for file_name in file_list:
    file_path = os.path.join(folder_path, file_name)
    df = pd.read_excel(file_path)
    df_list.append(df)

# 4. 하나의 데이터프레임으로 통합
df_total = pd.concat(df_list, ignore_index=True)

# 5. 필요한 컬럼만 추출
df_year = df_total[['기준연도', '자퇴학생']].copy()

# 6. 기준연도 정수로 변환
df_year['기준연도'] = df_year['기준연도'].round().astype(int)

# 7. 연도별 총 자퇴학생 수 계산
df_dropout_sum = df_year.groupby('기준연도').sum().reset_index()

# 8. 기준연도를 문자열로 변환
df_dropout_sum['기준연도'] = df_dropout_sum['기준연도'].astype(str)

# 9. Plotly 시각화
fig = px.bar(
    df_dropout_sum,
    x='기준연도',
    y='자퇴학생',
    text='자퇴학생',
    color='기준연도',  # 연도별 색깔 다르게
    color_discrete_sequence=px.colors.qualitative.Pastel,  # 파스텔톤
    title='연도별 총 자퇴학생 수',
    labels={
        '기준연도': '기준연도',
        '자퇴학생': '총 자퇴학생 수 (명)'
    }
)

# y축 최대값 설정
y_max = df_dropout_sum['자퇴학생'].max() * 1.1  # 10% 정도 여유

fig.update_layout(
    font_family="Malgun Gothic",
    font_size=16,
    bargap=0.4,
    showlegend=False,
    yaxis=dict(range=[0, y_max])  # y축 범위 직접 설정
)

# 막대 위에 수치 표시
fig.update_traces(
    textposition='outside',
    textfont_size=14
)

fig.show()