In [1]:
# 기본 라이브러리
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# 그래프 기본 테마 설정
# https://coldbrown.co.kr/2023/07/%ED%8C%8C%EC%9D%B4%EC%8D%AC-%EC%8B%A4%EC%A0%84%ED%8E%B8-08-seaborn-sns-set%EC%9D%84-%ED%86%B5%ED%95%B4-%EC%8A%A4%ED%83%80%EC%9D%BC-%EC%84%A4%EC%A0%95%ED%95%98%EA%B8%B0/
sns.set()

# 그래프 기본 설정
plt.rcParams['font.family'] = 'Malgun Gothic'
# plt.rcParams['font.family'] = 'AppleGothic'
plt.rcParams['figure.figsize'] = 10, 5
plt.rcParams['font.size'] = 12
plt.rcParams['axes.unicode_minus'] = False

# 복잡한 통계 처리를 위한 라이브러리
from scipy import stats

In [2]:
# 1. 엑셀 파일 경로
file_path = '연령별 경제활동 상태 (2).xlsx'

In [3]:
# 2. 엑셀 파일에서 '데이터' 시트 불러오기
df = pd.read_excel(file_path, sheet_name='데이터')

  warn("Workbook contains no default style, apply openpyxl's default")


In [4]:
# 3. '연령별'이 '* 15~29세'이고 '수학여부'가 '전체'인 행 필터링
df_target = df[(df['연령별'] == '* 15~29세') & (df['수학여부'] == '전체')].copy()

In [5]:
# 4. 분석 대상 연도
years = list(range(2017, 2025))

In [6]:
# 5. 실업률 계산
results = []
for year in years:
    try:
        econ_pop = pd.to_numeric(df_target[f'{year}.05.1'].values[0], errors='coerce')  # 경제활동인구
        unemployed = pd.to_numeric(df_target[f'{year}.05.3'].values[0], errors='coerce')  # 실업자

        if pd.isna(econ_pop) or econ_pop == 0 or pd.isna(unemployed):
            continue

        rate = round(unemployed / econ_pop * 100, 2)
        results.append({
            '연도': year,
            '경제활동인구': int(econ_pop),
            '실업자': int(unemployed),
            '실업률': rate
        })
    except:
        continue

In [7]:
# 6. 결과를 데이터프레임으로 저장 및 출력
df_result = pd.DataFrame(results)
df_result.to_excel('15_29세_전체_실업률_연도별.xlsx', index=False)
print(df_result)

     연도  경제활동인구  실업자    실업률
0  2017    4410  408   9.25
1  2018    4368  460  10.53
2  2019    4390  437   9.95
3  2020    4196  426  10.15
4  2021    4310  402   9.33
5  2022    4425  320   7.23
6  2023    4252  247   5.81
7  2024    4107  276   6.72
