# 대한민국 공휴일 데이터
holiday = 신정, 설, 추석
anniversary = 위 제외한 대한민국 공휴일

In [1]:
pip install holidays

Note: you may need to restart the kernel to use updated packages.


In [30]:
from datetime import date
import holidays
import pandas as pd
import numpy as np

In [32]:
kr_holidays = holidays.KR()

In [34]:
tmp = []

for date, name in sorted(holidays.KR(years=[2018,2019,2020,2021,2022,2023]).items()):
    print(date, name)
    tmp.append([date, name])

2018-01-01 신정연휴
2018-02-15 설날 전날
2018-02-16 설날
2018-02-17 설날 다음날
2018-03-01 삼일절
2018-05-05 어린이날
2018-05-07 어린이날 대체 휴일
2018-05-22 부처님오신날
2018-06-06 현충일
2018-06-13 지방선거일
2018-08-15 광복절
2018-09-23 추석 전날
2018-09-24 추석
2018-09-25 추석 다음날
2018-09-26 추석 대체 휴일
2018-10-03 개천절
2018-10-09 한글날
2018-12-25 기독탄신일
2019-01-01 신정연휴
2019-02-04 설날 전날
2019-02-05 설날
2019-02-06 설날 다음날
2019-03-01 삼일절
2019-05-05 어린이날
2019-05-06 어린이날 대체 휴일
2019-05-12 부처님오신날
2019-06-06 현충일
2019-08-15 광복절
2019-09-12 추석 전날
2019-09-13 추석
2019-09-14 추석 다음날
2019-10-03 개천절
2019-10-09 한글날
2019-12-25 기독탄신일
2020-01-01 신정연휴
2020-01-24 설날 전날
2020-01-25 설날
2020-01-26 설날 다음날
2020-01-27 설날 대체 휴일
2020-03-01 삼일절
2020-04-15 국회의원 선거일
2020-04-30 부처님오신날
2020-05-05 어린이날
2020-06-06 현충일
2020-08-15 광복절
2020-08-17 임시공휴일
2020-09-30 추석 전날
2020-10-01 추석
2020-10-02 추석 다음날
2020-10-03 개천절
2020-10-09 한글날
2020-12-25 기독탄신일
2021-01-01 신정연휴
2021-02-11 설날 전날
2021-02-12 설날
2021-02-13 설날 다음날
2021-03-01 삼일절
2021-05-05 어린이날
2021-05-19 부처님오신날
2021-06-06 현충일
2021-08-15 광복

In [36]:
data = pd.DataFrame(data = tmp, columns=['배송년월일', '공휴일'])

In [38]:
data['배송년월일'] = pd.to_datetime(data['배송년월일']).dt.strftime('%Y%m%d')

In [40]:
data['공휴일'].value_counts()

공휴일
신정연휴            6
광복절             6
기독탄신일           6
한글날             6
개천절             6
설날 전날           6
추석              6
추석 전날           6
추석 다음날          6
설날              6
부처님오신날          6
어린이날            6
삼일절             6
설날 다음날          6
현충일             6
설날 대체 휴일        2
한글날 대체 휴일       2
임시공휴일           2
지방선거일           2
추석 대체 휴일        2
어린이날 대체 휴일      2
국회의원 선거일        1
광복절 대체 휴일       1
개천절 대체 휴일       1
대통령 선거일         1
부처님오신날 대체 휴일    1
Name: count, dtype: int64

In [42]:
dates = pd.date_range(start='2018-01-01', end='2023-12-31', freq='D')
dates_df = pd.DataFrame({'배송년월일': dates.strftime('%Y%m%d')})
dates_df

Unnamed: 0,배송년월일
0,20180101
1,20180102
2,20180103
3,20180104
4,20180105
...,...
2186,20231227
2187,20231228
2188,20231229
2189,20231230


In [44]:
holiday_df = pd.merge(dates_df, data, on='배송년월일', how='left')

In [47]:
def 명절(x):
    if '설날' in x or '추석' in x or '신정' in x:
        return 1
    else:
        return 0

def 기념일(x):
    if '설날' in x or '추석' in x or '신정' in x:
        return 0
    elif x:
        return 1
    else:
        return 0

holiday_df['공휴일'].fillna('', inplace=True)
holiday_df['holiday'] = holiday_df['공휴일'].apply(명절)
holiday_df['anniversary'] = holiday_df['공휴일'].apply(기념일)

In [49]:
holiday_df.tail(10)

Unnamed: 0,배송년월일,공휴일,holiday,anniversary
2181,20231222,,0,0
2182,20231223,,0,0
2183,20231224,,0,0
2184,20231225,기독탄신일,0,1
2185,20231226,,0,0
2186,20231227,,0,0
2187,20231228,,0,0
2188,20231229,,0,0
2189,20231230,,0,0
2190,20231231,,0,0


In [53]:
holiday_df = holiday_df[['배송년월일', 'holiday', 'anniversary']]
holiday_df.rename(columns={'배송년월일':'date'}, inplace=True)

In [57]:
holiday_df.to_csv("holiday.csv", index=False, encoding='euc-kr')