In [1]:
pip install holidays

Collecting holidays
  Downloading holidays-0.82-py3-none-any.whl.metadata (49 kB)
Downloading holidays-0.82-py3-none-any.whl (1.3 MB)
   ---------------------------------------- 0.0/1.3 MB ? eta -:--:--
   ---------------------------------------- 1.3/1.3 MB 9.5 MB/s  0:00:00
Installing collected packages: holidays
Successfully installed holidays-0.82
Note: you may need to restart the kernel to use updated packages.


In [2]:
import pandas as pd
import holidays

In [3]:
# 2023년부터 2025년까지의 대한민국(KR) 공휴일을 holiday_list에 저장
holiday_list = []
for date in holidays.KR(years=[2023, 2024, 2025]).keys():
    holiday_list.append(date)

# 날짜 순으로 정렬
holiday_list.sort()

print("--- 2023년 ~ 2025년 공휴일 (일부) ---")
print(holiday_list[:10]) # 앞에서 10개만 출력

--- 2023년 ~ 2025년 공휴일 (일부) ---
[datetime.date(2023, 1, 1), datetime.date(2023, 1, 21), datetime.date(2023, 1, 22), datetime.date(2023, 1, 23), datetime.date(2023, 1, 24), datetime.date(2023, 3, 1), datetime.date(2023, 5, 5), datetime.date(2023, 5, 27), datetime.date(2023, 5, 29), datetime.date(2023, 6, 6)]


In [4]:
# 분석 시작일과 종료일 설정
start_date = '2023-01-01'
end_date = '2025-09-30'

# 전체 기간의 날짜를 생성
date_range = pd.date_range(start_date, end_date, freq='D')

# 날짜를 컬럼으로 하는 데이터프레임 생성
df_holidays = pd.DataFrame({'date': date_range})

print("--- 전체 날짜 데이터프레임 ---")
print(df_holidays.head())
print(df_holidays.tail())

--- 전체 날짜 데이터프레임 ---
        date
0 2023-01-01
1 2023-01-02
2 2023-01-03
3 2023-01-04
4 2023-01-05
           date
999  2025-09-26
1000 2025-09-27
1001 2025-09-28
1002 2025-09-29
1003 2025-09-30


In [5]:
# 'date' 컬럼의 날짜가 holiday_list에 포함되어 있는지 확인하여 1 또는 0으로 변환
# .isin() 메소드를 사용하면 간단하게 확인할 수 있습니다.
df_holidays['is_holiday'] = df_holidays['date'].isin(holiday_list).astype(int)

# 공휴일로 잘 표시되었는지 확인
print("\n--- 공휴일로 표시된 날짜 확인 ---")
print(df_holidays[df_holidays['is_holiday'] == 1].head())


--- 공휴일로 표시된 날짜 확인 ---
         date  is_holiday
0  2023-01-01           1
20 2023-01-21           1
21 2023-01-22           1
22 2023-01-23           1
23 2023-01-24           1


  df_holidays['is_holiday'] = df_holidays['date'].isin(holiday_list).astype(int)


In [10]:
event_days = [
    # 연말 시즌
    '2023-12-24', '2023-12-31',
    '2024-12-24', '2024-12-31',
    
    # 주요 명절 연휴
    '2023-01-20', # 2023년 설날 연휴
    '2023-01-25', # 2023년 설날 연휴
    
    '2023-09-27', # 2023년 추석 연휴
    '2023-10-04', # 2023년 추석 연휴

    '2024-02-08', # 2024년 설날 연휴
    '2024-02-13', # 2024년 설날 연휴

    '2024-09-12', # 2024년 추석 연휴 
    '2024-09-13', # 2024년 추석 연휴 
    '2024-09-19', # 2024년 추석 연휴 
    '2024-09-20', # 2024년 추석 연휴 

    '2025-01-24', # 2025년 설날 연휴
    '2025-01-31', # 2025년 설날 연휴
]
df_holidays['is_event'] = df_holidays['date'].dt.strftime('%Y-%m-%d').isin(event_days).astype(int)

print("\n--- 이벤트로 표시된 날짜 확인 ---")
print(df_holidays[df_holidays['is_event'] == 1])

print("\n--- 최종 데이터 확인 ---")
print(df_holidays.head(10))


--- 이벤트로 표시된 날짜 확인 ---
          date  is_holiday  is_event
19  2023-01-20           0         1
24  2023-01-25           0         1
269 2023-09-27           0         1
276 2023-10-04           0         1
357 2023-12-24           0         1
364 2023-12-31           0         1
403 2024-02-08           0         1
408 2024-02-13           0         1
620 2024-09-12           0         1
621 2024-09-13           0         1
627 2024-09-19           0         1
628 2024-09-20           0         1
723 2024-12-24           0         1
730 2024-12-31           0         1
754 2025-01-24           0         1
761 2025-01-31           0         1

--- 최종 데이터 확인 ---
        date  is_holiday  is_event
0 2023-01-01           1         0
1 2023-01-02           0         0
2 2023-01-03           0         0
3 2023-01-04           0         0
4 2023-01-05           0         0
5 2023-01-06           0         0
6 2023-01-07           0         0
7 2023-01-08           0         0
8 2023-01-09 

In [11]:
# 저장할 파일 경로와 이름 지정
output_path = r'C:\hanchon\data\processed\holidays_20230101-20250930.csv'

# CSV 파일로 저장
df_holidays.to_csv(output_path, index=False)

print(f"\n✅ 공휴일 데이터 생성 완료! 경로: {output_path}")


✅ 공휴일 데이터 생성 완료! 경로: C:\hanchon\data\processed\holidays_20230101-20250930.csv
