In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import datetime
from sklearn.preprocessing import MinMaxScaler

In [2]:
FOLDER_PATH = "graph_ver.3.0/"

# 폴더 있는지 확인하고 없으면 새로 만든다.
import os
try:
    if not os.path.exists(FOLDER_PATH):
        os.makedirs(FOLDER_PATH)
except:
    print(f"Error: Do not create foler. {FOLDER_PATH}")

# 원본데이터
---

In [None]:
#############################################################################
FILE_PATH_RAW = "/Users/sungjune/Downloads/PJ3/main_dataset(2015~2021).csv"
#############################################################################

raw_data = pd.read_csv(FILE_PATH_RAW)
raw_data.drop(columns="Unnamed: 0", inplace=True)

In [None]:
raw = raw_data.copy()
raw["DELNG_DE"] = pd.to_datetime(raw["DELNG_DE"], format="%Y%m%d")

raw_galac = \
    raw_data.loc[
        raw_data["PBLMNG_WHSAL_MRKT_NM"] == "서울가락도매",
        ["DELNG_DE", "PBLMNG_WHSAL_MRKT_NM", "PRICE"]
    ].copy()
raw_galac["DELNG_DE"] = \
    pd.to_datetime(raw_galac["DELNG_DE"], format="%Y%m%d")

In [None]:
# 연도 별 data 변수 생성
year_list = [2016, 2017, 2018, 2019, 2020, 2021]

# 전체
for year in year_list:
    temp_ds = raw.loc[raw["DELNG_DE"].dt.year == year].copy()
    temp_ds.sort_values("DELNG_DE", inplace=True)
    globals()["raw" + str(year)] = temp_ds

# 창원만
for year in year_list:
    temp_ds = raw_galac.loc[raw_galac["DELNG_DE"].dt.year == year].copy()
    temp_ds.sort_values("DELNG_DE", inplace=True)
    globals()["raw_galac" + str(year)] = temp_ds

In [None]:
# 전체 연도별 그래프
raw_list = [raw2016, raw2017, raw2018, raw2019, raw2020, raw2021]

for i, data in enumerate(raw_list):
    # datetime to str
    ds = data.copy()
    temp_m = ds["DELNG_DE"].dt.month.astype("str")
    temp_d = ds["DELNG_DE"].dt.day.astype("str")
    ds["DELNG_DE"] = \
        temp_m.apply(lambda x: format(x, '0>2')) \
        + '/' \
        + temp_d.apply(lambda x: format(x, '0>2'))

    # matplotlib.rcParams['axes.grid'] = True # 차트 내 격자선 표시 여부
    # matplotlib.rcParams['savefig.transparent'] = True # 차트 배경색 투명

    plt.figure(figsize=(30, 15))
    sns.set_theme(
        style="whitegrid",
        font="AppleGothic", 
        rc={"axes.unicode_minus": False},
    )
    sns.boxplot(
        x="DELNG_DE",
        y="PRICE",
        data=ds,
        whis=1.5, # IQR
        linewidth=0.5, # 라인 굵기
        # fliersize=0.5, # 이상치 사이즈
        showfliers=False, # 이상치 숨김
        # showcaps=False, # 꼬리 숨김
        medianprops=dict(color="white", alpha=0.9, linewidth=1), # 중앙값
        )

    plt.title(
        f"RAW {i+2016}년",
        pad=20,
        fontsize=40,
        fontweight="heavy",
        color="gray"
    )
    plt.yticks( # y축 값
        fontsize=20,
        color="gray",
    ) 
    plt.xticks( # x축 값
        rotation=90, 
        fontsize=6,
        color="gray",
    )
    plt.ylim(0, 10000) # y축 범위
    plt.ylabel(
        "PRICE(₩)",
        labelpad=10, # 축과 여백
        fontsize=30,
        fontweight="bold",
        color="gray"
        # loc="right" # 위치 ["top", "center", "bottom"]
    )
    plt.xlabel(
        "DATES",
        labelpad=10, # 축과 여백
        fontsize=30,
        fontweight="bold",
        color="gray"
    )
        
    plt.savefig(
        f"{FOLDER_PATH}raw_{i + 2016}.png",
        transparent = True, # 배경색 투명하게
        dpi=200, # 해상도
    )

In [None]:
# 가락도매시장 RAW 연도별 그래프
raw_galac_list = \
    [raw_galac2016, raw_galac2017, raw_galac2018, 
    raw_galac2019, raw_galac2020, raw_galac2021]

for i, data in enumerate(raw_galac_list):
    # datetime to str
    ds = data.copy()
    temp_m = ds["DELNG_DE"].dt.month.astype("str")
    temp_d = ds["DELNG_DE"].dt.day.astype("str")
    ds["DELNG_DE"] = \
        temp_m.apply(lambda x: format(x, '0>2')) \
        + '/' \
        + temp_d.apply(lambda x: format(x, '0>2'))

    # matplotlib.rcParams['axes.grid'] = True # 차트 내 격자선 표시 여부
    # matplotlib.rcParams['savefig.transparent'] = True # 차트 배경색 투명

    plt.figure(figsize=(30, 15))
    sns.set_theme(
        style="whitegrid",
        font="AppleGothic", 
        rc={"axes.unicode_minus": False},
    )
    sns.boxplot(
        x="DELNG_DE",
        y="PRICE",
        data=ds,
        whis=1.5, # IQR
        linewidth=0.5, # 라인 굵기
        # fliersize=0.5, # 이상치 사이즈
        showfliers=False, # 이상치 숨김
        # showcaps=False, # 꼬리 숨김
        medianprops=dict(color="white", alpha=0.9, linewidth=1), # 중앙값
        )

    plt.title(
        f"서울가락도매시장 RAW {i+2016}년",
        pad=20,
        fontsize=40,
        fontweight="heavy",
        color="gray"
    )
    plt.yticks( # y축 값
        fontsize=20,
        color="gray",
    ) 
    plt.xticks( # x축 값
        rotation=90, 
        fontsize=6,
        color="gray",
    )
    plt.ylim(0, 10000) # y축 범위
    plt.ylabel(
        "PRICE(₩)",
        labelpad=10, # 축과 여백
        fontsize=30,
        fontweight="bold",
        color="gray"
        # loc="right" # 위치 ["top", "center", "bottom"]
    )
    plt.xlabel(
        "DATES",
        labelpad=10, # 축과 여백
        fontsize=30,
        fontweight="bold",
        color="gray"
    )
        
    plt.savefig(
        f"{FOLDER_PATH}raw_galac_{i + 2016}.png",
        transparent = True, # 배경색 투명하게
        dpi=200, # 해상도
    )

# 지역 추출 전 데이터
---

In [None]:
#############################################################################
FILE_PATH_EDA = "도매_EDA_완료_new_v3.0.csv"
#############################################################################
raw_data_eda = pd.read_csv(FILE_PATH_EDA)
raw_data_eda.drop(columns="Unnamed: 0", inplace=True)

In [None]:
feature_list = ["DELNG_DE","PBLMNG_WHSAL_MRKT_NM","CPR_NM",
                "CPR_USE_SPCIES_NM","PRICE","DELNGBUNDLE_QY",
                "STNDRD","DELNG_QY","SANJI_NM"]

data_eda1 = raw_data_eda.copy()
data_eda2 = data_eda1[["DELNG_DE", "PBLMNG_WHSAL_MRKT_NM", "PRICE"]].copy()
data_eda2["DELNG_DE"] = pd.to_datetime(data_eda2["DELNG_DE"], format="%Y%m%d")

In [None]:
# 연도 별 data 변수 생성
START_YEAR = 2016
year_list = list(range(START_YEAR, datetime.date.today().year + 1))

for year in year_list:
    temp_ds = data_eda2.loc[data_eda2["DELNG_DE"].dt.year == year].copy()
    temp_ds.sort_values("DELNG_DE", inplace=True)
    globals()["data" + str(year)] = temp_ds

## 전체 시장 / 연도별 변동성
---

In [None]:
data_list = [data2016, data2017, data2018, data2019, data2020, data2021]
for i, data in enumerate(data_list):
    # datetime to str
    ds = data.copy()
    temp_m = ds["DELNG_DE"].dt.month.astype("str")
    temp_d = ds["DELNG_DE"].dt.day.astype("str")
    ds["DELNG_DE"] = \
        temp_m.apply(lambda x: format(x, '0>2')) \
        + '/' \
        + temp_d.apply(lambda x: format(x, '0>2'))

    # matplotlib.rcParams['axes.grid'] = True # 차트 내 격자선 표시 여부
    # matplotlib.rcParams['savefig.transparent'] = True # 차트 배경색 투명

    plt.figure(figsize=(30, 15))
    sns.set_theme(
        style="whitegrid",
        font="AppleGothic", 
        rc={"axes.unicode_minus": False},
    )
    sns.boxplot(
        x="DELNG_DE",
        y="PRICE",
        data=ds,
        whis=1.5, # IQR
        linewidth=0.5, # 라인 굵기
        # fliersize=0.5, # 이상치 사이즈
        showfliers=False, # 이상치 숨김
        # showcaps=False, # 꼬리 숨김
        medianprops=dict(color="white", alpha=0.9, linewidth=1), # 중앙값
        )

    plt.title(
        f"{i+2016}년",
        pad=20,
        fontsize=40,
        fontweight="heavy",
        color="gray"
    )
    plt.yticks( # y축 값
        fontsize=20,
        color="gray",
    ) 
    plt.xticks( # x축 값
        rotation=90, 
        fontsize=6,
        color="gray",
    )
    plt.ylim(0, 10000) # y축 범위
    plt.ylabel(
        "PRICE(₩)",
        labelpad=10, # 축과 여백
        fontsize=30,
        fontweight="bold",
        color="gray"
        # loc="right" # 위치 ["top", "center", "bottom"]
    )
    plt.xlabel(
        "DATES",
        labelpad=10, # 축과 여백
        fontsize=30,
        fontweight="bold",
        color="gray"
    )
        
    plt.savefig(
        f"{FOLDER_PATH}all_{i + 2016}.png",
        transparent = True, # 배경색 투명하게
        dpi=200, # 해상도
    )

## 전체 시장 가격과 거래량
---

### 일단위 데이터

In [None]:
# 일단위
agg_dict = {
    "PRICE": [
        ("P_STD", np.std),
        ("P_MEDIAN", np.median),
        ("P_MEAN", np.mean),
        ("P_MAX", np.max),
    ],
    "VOLUME": [("VOLUME", np.sum)],
}

data_eda3 = data_eda1[["DELNG_DE", "PRICE", "VOLUME"]].copy()
data_eda3["DELNG_DE"] = pd.to_datetime(data_eda3["DELNG_DE"], format="%Y%m%d")
data_eda3.sort_values(["DELNG_DE"], inplace=True)
data_pq = \
    data_eda3.groupby("DELNG_DE").agg(agg_dict)\
        .reset_index(col_level=1).droplevel(level=0, axis=1)
data_pq["DELNG_DE"] = data_pq["DELNG_DE"].astype("str")

# 지수이동평균 (Exponetial Moving Average)
data_pq["EWD7_P_STD"] = \
    data_pq["P_STD"].ewm(7, min_periods=1).mean()
data_pq["EWD7_P_MEAN"] = \
    data_pq["P_MEAN"].ewm(7, min_periods=1).mean()
data_pq["EWD7_P_MEDIAN"] = \
    data_pq["P_MEDIAN"].ewm(7, min_periods=1).mean()
data_pq["EWD7_V"] = \
    data_pq["VOLUME"].ewm(7, min_periods=1).mean()

In [None]:
# 스케일링
scaled_pq = \
    MinMaxScaler().fit_transform(data_pq.drop(columns="DELNG_DE"))
columns_list = data_pq.columns.drop("DELNG_DE")
scaled_pq = pd.DataFrame(scaled_pq, columns=columns_list).copy()
scaled_pq = \
    pd.concat([data_pq[["DELNG_DE"]], scaled_pq], axis=1)

In [None]:
# 일단위 데이터 상관관계
print(scaled_pq[["P_STD", "VOLUME"]].corr()["P_STD"][1])
print(scaled_pq[["P_MEDIAN", "VOLUME"]].corr()["P_MEDIAN"][1])
print(scaled_pq[["P_MEAN", "VOLUME"]].corr()["P_MEAN"][1])
print(scaled_pq[["P_MAX", "VOLUME"]].corr()["P_MAX"][1])

### 주단위 데이터

In [None]:
# 주 단위
agg_dict = {
    "PRICE": [
        ("P_STD", np.std),
        ("P_MEDIAN", np.median),
        ("P_MEAN", np.mean),
        ("P_MAX", np.max),
    ],
    "VOLUME": [("VOLUME", np.sum)],
}

data_eda4 = data_eda1[["DELNG_DE", "PRICE", "VOLUME"]].copy()
data_eda4["DELNG_DE"] = pd.to_datetime(data_eda4["DELNG_DE"], format="%Y%m%d")
data_eda4.sort_values(["DELNG_DE"], inplace=True)
data_eda4["YEAR"] = data_eda4["DELNG_DE"].dt.year
data_eda4["WEEK_N"] = data_eda4["DELNG_DE"].dt.strftime('%U')

data_pq_w = \
    data_eda4.groupby(["YEAR", "WEEK_N"]).agg(agg_dict)\
        .reset_index(col_level=1).droplevel(level=0, axis=1)
data_pq_w["DELNG_DE"] = \
    data_pq_w["YEAR"].apply(lambda x: str(x)) \
        + "-" \
        + data_pq_w["WEEK_N"].apply(lambda x: str(x))
data_pq_w.drop(columns=["YEAR", "WEEK_N"], inplace=True)

# 지수이동평균 (Exponetial Moving Average)
data_pq_w["EWD5_P_STD"] = \
    data_pq_w["P_STD"].ewm(5, min_periods=1).mean()
data_pq_w["EWD5_P_MEAN"] = \
    data_pq_w["P_MEAN"].ewm(5, min_periods=1).mean()
data_pq_w["EWD5_P_MEDIAN"] = \
    data_pq_w["P_MEDIAN"].ewm(5, min_periods=1).mean()
data_pq_w["EWD5_V"] = \
    data_pq_w["VOLUME"].ewm(5, min_periods=1).mean()

In [None]:
# 스케일링
scaled_pq_w = \
    MinMaxScaler().fit_transform(data_pq_w.drop(columns="DELNG_DE"))
columns_list = data_pq_w.columns.drop("DELNG_DE")
scaled_pq_w = pd.DataFrame(scaled_pq_w, columns=columns_list).copy()
scaled_pq_w = \
    pd.concat([data_pq_w[["DELNG_DE"]], scaled_pq_w], axis=1)

In [None]:
print(scaled_pq_w[["P_STD", "VOLUME"]].corr()["P_STD"][1])
print(scaled_pq_w[["P_MEDIAN", "VOLUME"]].corr()["P_MEDIAN"][1])
print(scaled_pq_w[["P_MEAN", "VOLUME"]].corr()["P_MEAN"][1])
print(scaled_pq_w[["P_MAX", "VOLUME"]].corr()["P_MAX"][1])

In [None]:
# mac에서 한글 설정
sns.set_theme(
    style="whitegrid",
    font="AppleGothic", 
    rc={"axes.unicode_minus": False},
)

In [None]:
# 스케일 하지 않고 y축을 2개로 나누어 표시함

# g1 = \
#     data_pq_w.plot(
#         "DELNG_DE", 
#         "PRICE_MEDIAN", 
#         figsize=(30, 15), 
#         color="navy",
#         alpha=0.6,
#         label="PRICE(MEDIAN)",
#     )
# data_pq_w.plot(
#     "DELNG_DE", 
#     "VOLUME", 
#     secondary_y=True, 
#     ax=g1,
#     color="darkgreen",
#     alpha=0.6,
#     label="VOLUME",
# )
# plt.title(
#     "주 단위 가격(MEDIAN)과 거래량 변동성",
#     pad=20,
#     fontsize=40,
#     fontweight="heavy",
#     color="grey",
# )

# plt.yticks( # y축 값
#     fontsize=20,
#     color="gray",
# ) 
# plt.xticks( # x축 값
#     rotation=90, 
#     fontsize=10,
#     color="gray",
# )

# plt.ylim(0, 11000000) # y축 범위
# g1.set_ylabel(
#     "PRICE(₩)",
#     labelpad=10, # 축과 여백
#     fontsize=30,
#     fontweight="bold",
#     color="navy",
#     alpha=0.6,
# )
# plt.ylabel(
#     "VOLUME",
#     labelpad=10, # 축과 여백
#     fontsize=30,
#     fontweight="bold",
#     color="darkgreen",
#     alpha=0.6,
# )

# g1.set_xlabel(
#     "DATES",
#     labelpad=10, # 축과 여백
#     fontsize=30,
#     fontweight="bold",
#     color="gray"
# )

# plt.legend(
#     loc="upper right",
#     fontsize=20,
#     labelcolor="darkgreen",
# )
# g1.legend(
#     loc="upper left",
#     fontsize=20,
#     labelcolor="navy",
# )

# plt.savefig(
#     f"{FOLDER_PATH}price(MEDIAN)_volume_volatility.png",
#     transparent = True, # 배경색 투명하게
#     dpi=200, # 해상도
# )

# plt.show()

# # https://yganalyst.github.io/etc/visual_2/#수평-수직선-그리기

In [None]:
# g1 = \
#     data_pq_w.plot(
#         "DELNG_DE", 
#         "PRICE_STD", 
#         figsize=(30, 15), 
#         color="navy",
#         alpha=0.6,
#         label="PRICE(STD)",
#     )

# data_pq_w.plot(
#     "DELNG_DE", 
#     "VOLUME", 
#     secondary_y=True, 
#     ax=g1,
#     color="darkgreen",
#     alpha=0.6,
#     label="VOLUME",
# )

# plt.title(
#     "주 단위 가격(STD)과 거래량 변동성",
#     pad=20,
#     fontsize=40,
#     fontweight="heavy",
#     color="grey",
# )

# plt.yticks( # y축 값
#     fontsize=20,
#     color="gray",
# ) 

# plt.xticks( # x축 값
#     rotation=90, 
#     fontsize=10,
#     color="gray",
# )

# # plt.ylim(0, 11000000) # y축 범위
# g1.set_ylabel(
#     "PRICE(₩)",
#     labelpad=10, # 축과 여백
#     fontsize=30,
#     fontweight="bold",
#     color="navy",
#     alpha=0.6,
# )
# plt.ylabel(
#     "VOLUME",
#     labelpad=10, # 축과 여백
#     fontsize=30,
#     fontweight="bold",
#     color="darkgreen",
#     alpha=0.6,
# )

# g1.set_xlabel(
#     "DATES",
#     labelpad=10, # 축과 여백
#     fontsize=30,
#     fontweight="bold",
#     color="gray"
# )

# plt.legend(
#     loc="upper right",
#     fontsize=20,
#     labelcolor="darkgreen",
# )
# g1.legend(
#     loc="upper left",
#     fontsize=20,
#     labelcolor="navy",
# )

# plt.axvline(x=170, c='r', linestyle=":", linewidth=3)

# # plt.savefig(
# #     f"{FOLDER_PATH}price(std)_volume_volatility.png",
# #     transparent = True, # 배경색 투명하게
# #     dpi=200, # 해상도
# # )

# plt.show()

In [None]:
# 변곡점 찾기
def find_point(ds, feature_a, feature_b, print_n):
    data = ds.copy()
    data["range"] = abs(data[feature_a] - data[feature_b])

    print("접하는 지점:")
    print(data["range"].sort_values(ascending=True).head(print_n).index)

    print("차이가 가장 큰 지점:")
    print(data["range"].sort_values(ascending=False).head(print_n).index)

In [None]:
def divided_corr(ds, y1, y2, dates):
    """
    만약 dates가 [10, 100, 200]이면, ds는 아래와 같이 4개로 나누어져야 함
    0 ~ 9
    10 ~ 99
    100 ~ 199
    200 ~
    """
    data = ds[[y1, y2]].copy()
    div_d_dict = {}
    
    # 마지막 값(개수) 추가
    dates.append(len(data) + 1)
    for i, end_date in enumerate(dates):
        # 처음 시작 값이면 시작값을 0으로 설정함
        if i == 0:
            start_date = 0

        # 해당 범위의 데이터를 임시로 저장해서 상관계수 도출함
        temp_d = data.iloc[start_date:end_date].copy()
        corr = temp_d[[y1, y2]].corr()[y1][1]
        corr = format(corr, ".3f")
        
        # return할 dict 만듦
        div_d_dict[end_date] = \
            [
                data.iloc[start_date:end_date], # 해당 범위에 해당하는 데이터셋
                corr, # 해당 범위의 상관계수
                np.mean([start_date, end_date]), # 텍스트를 입력할 중앙값
            ]
        print(f"{start_date} ~ {end_date}: {corr}")

        # start_date를 end_date로 재설정
        start_date = end_date
        
    return div_d_dict

In [None]:
# 그래프 그리기
def graph(ds, x, y1, y2, x_vline=None, 
          corr_dict=None, ewd_n=0, date_unit="week"):
    # mac에서 한글 설정
    sns.set_theme(
        style="whitegrid",
        font="AppleGothic", 
        rc={"axes.unicode_minus": False},
    )
    
    # 표제목/파일 이름 및 label 값 설정
    if date_unit == "week":
        du_k = "주"
    elif date_unit == "day":
        du_k = "일"
    else:
        du_k = ''

    p_text = y1[y1.rfind('_') + 1:]
    if ewd_n != 0:
        title_name = \
            f"{ewd_n}{du_k} 이동평균된 {du_k} 단위 가격({p_text})과 거래량 변동성"
        label_y1 = f"EWD{ewd_n} 가격({p_text})"
        label_y2 = f"EWD{ewd_n} 거래량"
    else:
        label_y1 = f"가격({p_text})"
        label_y2 = "거래량"
        title_name = f"{du_k} 단위 가격({p_text})과 거래량 변동성"
    

    plt.figure(figsize=(30, 15))

    plt.plot(
        x, 
        y1,
        data=ds,
        color="navy",
        alpha=0.6,
        label=label_y1,
    )

    plt.plot(
        x, 
        y2,
        data=ds,
        color="darkgreen",
        alpha=0.6,
        label=label_y2,
    )

    plt.title(
        title_name,
        pad=20,
        fontsize=40,
        fontweight="heavy",
        color="gray",
    )

    plt.yticks(
        fontsize=20,
        color="gray",
    ) 

    plt.xticks(
        rotation=90, 
        fontsize=10,
        color="gray",
    )

    # 축 숨기기
    plt.gca().axes.xaxis.set_visible(False)
    plt.gca().axes.yaxis.set_visible(False)

    plt.legend(
        loc="upper left",
        fontsize=20,
        framealpha=0, # 배경색 투명도
        ncol=2,
    )

    plt.grid(axis='x')

    # 세로 축 설정
    if x_vline !=None:
        for i in x_vline[:-1]:
            plt.axvline(
                x=i, 
                c="coral", 
                linestyle=":", 
                linewidth=3,
                alpha=0.5,
            )

    # 상관계수 텍스트 넣기
    for key in corr_dict.keys():
        plt.text(
            x=corr_dict[key][2],
            y=0.9,
            s=corr_dict[key][1], # 추가할 텍스트
            color="darkred",
            fontsize="xx-large",
            fontweight="heavy",
            horizontalalignment="center", # 정렬
        )
    
        
    plt.savefig(
        f"{FOLDER_PATH}{title_name}.png",
        transparent = True, # 배경색 투명하게
        dpi=200, # 해상도
    )

    plt.show()

In [None]:
# 일 단위는 차이를 보기 어려움
########################################################################
DATEUNIT = "week"
YFEATURE1 = "P_MEDIAN"
YFEATURE2 = "VOLUME"
EWDN = 5
XVLINE = [10, 167, 306]
########################################################################
XFEATURE = "DELNG_DE"
if DATEUNIT == "day":
    DATASET = scaled_pq.copy()
elif DATEUNIT == "week":
    DATASET = scaled_pq_w.copy()
if EWDN != 0:
    YFEATURE1 = f"EWD{EWDN}_{YFEATURE1}"
    YFEATURE2 = f"EWD{EWDN}_V"

# week
    # P_MEAN        = [33, 167, 290]
    # P_MEDIAN      = [33, 167, 294]
    # EWD5_P_MEDIAN = [10, 167, 306]
    # EWD5_P_MEAN   = [10, 167, 306]
    # EWD5_P_STD    = [177, 306]
# day
    # EWD7_P_MEDIAN = [130, 1008, 1780]
    # P_MEDIAN      = [130, 1008, 1592]
########################################################################
find_point(
    DATASET,
    YFEATURE1,
    YFEATURE2,
    20,
)

corr_dict = \
    divided_corr(
        ds=DATASET,
        y1=YFEATURE1,
        y2=YFEATURE2,
        dates=XVLINE,
    )

graph(
    ds=DATASET,
    x=XFEATURE,
    y1=YFEATURE1,
    y2=YFEATURE2,
    x_vline=XVLINE,
    corr_dict=corr_dict,
    ewd_n=EWDN,
    date_unit=DATEUNIT,
)


## 일 거래량 변동성
---

In [None]:
data_eda_v = data_eda1[["DELNG_DE", "VOLUME"]].copy()
data_eda_v = data_eda_v.groupby("DELNG_DE", as_index=False).sum()
data_eda_v["DELNG_DE"] = \
    pd.to_datetime(data_eda_v["DELNG_DE"], format="%Y%m%d")
data_eda_v["DELNG_DE"] = data_eda_v["DELNG_DE"].astype("str")

In [None]:
sns.set_theme(
    style="whitegrid",
    font="AppleGothic", 
    rc={"axes.unicode_minus": False},
)

data_eda_v.plot(
    "DELNG_DE", 
    "VOLUME", 
    figsize=(30, 15), 
    color="darkgreen",
    alpha=0.4,
    label="VOLUME(day)",
)

plt.title(
    "일 거래량",
    pad=20,
    fontsize=40,
    fontweight="heavy",
    color="gray"
)
plt.yticks( # y축 값
    fontsize=10,
    color="gray",
) 
plt.xticks( # x축 값
    # rotation=90, 
    fontsize=10,
    color="gray",
)
plt.ylabel(
    "VOLUME",
    labelpad=10, # 축과 여백
    fontsize=20,
    fontweight="bold",
    color="gray"
    # loc="right" # 위치 ["top", "center", "bottom"]
)
plt.xlabel(
    "DATES",
    labelpad=10, # 축과 여백
    fontsize=20,
    fontweight="bold",
    color="gray"
)

# 축 숨기기
# plt.gca().axes.xaxis.set_visible(False)
# plt.gca().axes.yaxis.set_visible(False)


plt.legend(
    loc="upper right",
    fontsize=20,
    framealpha=0, # 배경색 투명도
    # labelcolor="darkgreen",
)

plt.grid(axis='x')

plt.savefig(
    f"{FOLDER_PATH}일 거래량.png",
    transparent = True, # 배경색 투명하게
    dpi=200, # 해상도
)

### 주 단위 거래량
---

In [None]:
data_eda_vw = data_eda1[["DELNG_DE", "VOLUME"]].copy()
data_eda_vw["DELNG_DE"] = \
    pd.to_datetime(data_eda_vw["DELNG_DE"], format="%Y%m%d")
data_eda_vw["YEAR"] = data_eda_vw["DELNG_DE"].dt.year
data_eda_vw["WEEK_N"] = data_eda_vw["DELNG_DE"].dt.strftime('%U')
data_eda_vw = data_eda_vw.groupby(["YEAR", "WEEK_N"], as_index=False).sum()
data_eda_vw["DELNG_DE"] = \
    data_eda_vw["YEAR"].apply(lambda x: str(x)) \
        + "-" \
        + data_eda_vw["WEEK_N"].apply(lambda x: str(x))
data_eda_vw.drop(columns=["YEAR", "WEEK_N"])

In [None]:
sns.set_theme(
    style="whitegrid",
    font="AppleGothic", 
    rc={"axes.unicode_minus": False},
)

data_eda_vw.plot(
    "DELNG_DE", 
    "VOLUME", 
    figsize=(30, 15), 
    color="darkgreen",
    alpha=0.4,
    label="VOLUME(week)",
)

plt.title(
    "주 거래량",
    pad=20,
    fontsize=40,
    fontweight="heavy",
    color="gray"
)
plt.yticks( # y축 값
    fontsize=10,
    color="gray",
) 
plt.xticks( # x축 값
    # rotation=90, 
    fontsize=10,
    color="gray",
)
plt.ylabel(
    "VOLUME",
    labelpad=10, # 축과 여백
    fontsize=20,
    fontweight="bold",
    color="gray"
    # loc="right" # 위치 ["top", "center", "bottom"]
)
plt.xlabel(
    "DATES",
    labelpad=10, # 축과 여백
    fontsize=20,
    fontweight="bold",
    color="gray"
)

# 축 숨기기
# plt.gca().axes.xaxis.set_visible(False)
# plt.gca().axes.yaxis.set_visible(False)


plt.legend(
    loc="upper right",
    fontsize=20,
    framealpha=0, # 배경색 투명도
    # labelcolor="darkgreen",
)

plt.grid(axis='x')
    
plt.savefig(
    f"{FOLDER_PATH}주 거래량.png",
    transparent = True, # 배경색 투명하게
    dpi=200, # 해상도
)

## 요일 평균 거래량 
---

In [None]:
data_eda_vwd = data_eda1[["DELNG_DE", "VOLUME"]].copy()
data_eda_vwd["DELNG_DE"] = \
    pd.to_datetime(data_eda_vwd["DELNG_DE"], format="%Y%m%d")
data_eda_vwd = data_eda_vwd.groupby(["DELNG_DE"], as_index=False).sum()
data_eda_vwd["WEEKDAY"] = data_eda_vwd["DELNG_DE"].dt.day_name()
data_eda_vwd = data_eda_vwd.groupby(["WEEKDAY"]).mean()
# 요일 순서대로 정렬
data_eda_vwd = \
    data_eda_vwd.reindex(
        ["Sunday", "Monday", "Tuesday", "Wednesday", "Thursday", "Friday", "Saturday"]
    ).reset_index()

In [None]:
sns.set_theme(
    style="whitegrid",
    font="AppleGothic", 
    rc={"axes.unicode_minus": False},
)
data_eda_vwd.plot(
    x="WEEKDAY",
    y="VOLUME",
    kind="bar",
    figsize=(30, 15), 
    color="darkgreen",
    alpha=0.9,
    label="VOLUME(weekday)",
)

plt.title(
    "요일별 평균 거래량",
    pad=20,
    fontsize=40,
    fontweight="heavy",
    color="gray"
)
plt.yticks( # y축 값
    fontsize=10,
    color="gray",
) 
plt.xticks( # x축 값
    # rotation=90, 
    fontsize=10,
    color="gray",
)
plt.ylabel(
    "VOLUME",
    labelpad=10, # 축과 여백
    fontsize=20,
    fontweight="bold",
    color="gray"
    # loc="right" # 위치 ["top", "center", "bottom"]
)
plt.xlabel(
    "DATES",
    labelpad=10, # 축과 여백
    fontsize=20,
    fontweight="bold",
    color="gray"
)

# 축 숨기기
# plt.gca().axes.xaxis.set_visible(False)
# plt.gca().axes.yaxis.set_visible(False)


plt.legend(
    loc="upper right",
    fontsize=20,
    framealpha=0, # 배경색 투명도
    # labelcolor="darkgreen",
)

plt.grid(axis='x')   
plt.savefig(
    f"{FOLDER_PATH}요일별 평균 거래량.png",
    transparent = True, # 배경색 투명하게
    dpi=200, # 해상도
)