# 1. MEGRE 파일을 만들기 위해 NH_CONTEST_NW_FC_STK_IEM_IFO, NH_CONTEST_STK_DT_QUT, NH_CONTEST_NHDATA_STK_DD_IFO 3개의 파일을 업로드 한 후 각 파일별로 이름을 매칭함.
# 2. 첫번째파일에서는 종목별 상장주식총수량을 가져와서 시가총액을 시계열 데이터로 만들기 위해 종목종가와 곱해서 구하는 방법으로 사용하기 위해 해당 컬럼만 가져오도록 하였음.
# 3. 그리고 두번째, 세번째 파일은 첫번째 파일과 함께 세가지 CSV 파일에 공통으로 있는 tck_iem_cd를 기준으로 merge를 하였으며, 두번째, 세번째 파일은 bse_dt도 비교하여 가져오도록 하여 총 77794개의 시계열 데이터를 하나의 csv 파일로 모으는 코드

In [59]:
import pandas as pd
from google.colab import files

# CSV 파일 업로드
#uploaded = files.upload()
# 업로드된 파일 목록 확인
file_names = list(uploaded.keys())
print("업로드된 파일:", file_names)

# 파일 이름 설정
big_contest_file_1 = None
big_contest_file_2 = None
big_contest_file_3 = None

# 파일 이름 매칭
for file_name in file_names:
    if 'NH_CONTEST_NW_FC_STK_IEM_IFO.csv' in file_name:
        big_contest_file_1 = file_name
    elif 'NH_CONTEST_STK_DT_QUT.csv' in file_name:
        big_contest_file_2 = file_name
    elif 'NH_CONTEST_NHDATA_STK_DD_IFO.csv' in file_name:
        big_contest_file_3 = file_name

# 파일 이름 확인
print("1번 파일:", big_contest_file_1)
print("2번 파일:", big_contest_file_2)
print("3번 파일:", big_contest_file_3)

# CSV 파일 읽기 (인코딩 지정)
df1 = pd.read_csv(big_contest_file_1, encoding='ISO-8859-1')  # 첫 번째 파일 데이터프레임
df2 = pd.read_csv(big_contest_file_2, encoding='ISO-8859-1')  # 두 번째 파일 데이터프레임
df3 = pd.read_csv(big_contest_file_3, encoding='ISO-8859-1')  # 세 번째 파일 데이터프레임

# 공백 제거 및 대문자 변환
df1['tck_iem_cd'] = df1['tck_iem_cd'].astype(str).str.strip().str.upper()
df2['tck_iem_cd'] = df2['tck_iem_cd'].astype(str).str.strip().str.upper()
df3['tck_iem_cd'] = df3['tck_iem_cd'].astype(str).str.strip().str.upper()

# bse_dt 공백 제거
df2['bse_dt'] = df2['bse_dt'].astype(str).str.strip()
df3['bse_dt'] = df3['bse_dt'].astype(str).str.strip()

# df1에서 tck_iem_cd와 ltg_tot_stk_qty 가져오기
ltg_tot_stk_qty_df = df1[['tck_iem_cd', 'ltg_tot_stk_qty']]

# df2와 df3에서 공통 bse_dt와 tck_iem_cd 찾기
common_keys_df2_df3 = pd.merge(df2[['bse_dt', 'tck_iem_cd']], df3[['bse_dt', 'tck_iem_cd']], on=['bse_dt', 'tck_iem_cd'])
filtered_df2 = df2[df2.set_index(['bse_dt', 'tck_iem_cd']).index.isin(common_keys_df2_df3.set_index(['bse_dt', 'tck_iem_cd']).index)]
filtered_df3 = df3[df3.set_index(['bse_dt', 'tck_iem_cd']).index.isin(common_keys_df2_df3.set_index(['bse_dt', 'tck_iem_cd']).index)]

# df2에 ltg_tot_stk_qty를 tck_iem_cd 기준으로 결합
filtered_df2 = filtered_df2.merge(ltg_tot_stk_qty_df, on='tck_iem_cd', how='left')

# 새로운 컬럼 mkt_pr_tot_amt 생성 (ltg_tot_stk_qty와 IEM_END_PR 곱하기)
filtered_df2['mkt_pr_tot_amt'] = filtered_df2['ltg_tot_stk_qty'] * filtered_df2['iem_end_pr']

# ltg_tot_stk_qty 컬럼 삭제
filtered_df2.drop(columns=['ltg_tot_stk_qty'], inplace=True)

# 최종 병합: df2와 df3
merged_df = pd.merge(filtered_df2, filtered_df3, on=['bse_dt', 'tck_iem_cd'], suffixes=('_df2', '_df3'))

# 특정 조건에 맞는 값 업데이트
merged_df.loc[(merged_df['tck_iem_cd'] == 'ZVRA') & (merged_df['bse_dt'] == '20240802'),
               ['iem_ong_pr', 'iem_hi_pr', 'iem_low_pr', 'iem_end_pr']] = 6.3

# 결과를 새로운 CSV 파일로 저장
output_file = 'merge_output.csv'  # 결과 파일 이름
merged_df.to_csv(output_file, index=False)

# 결과 파일 다운로드
files.download(output_file)

print("파일이 성공적으로 저장되었습니다:", output_file)
print("df1 tck_iem_cd 유니크 값:", df1['tck_iem_cd'].unique())
print("filtered_df2 tck_iem_cd 유니크 값:", filtered_df2['tck_iem_cd'].unique())
print("filtered_df3 tck_iem_cd 유니크 값:", filtered_df3['tck_iem_cd'].unique())


업로드된 파일: ['NH_CONTEST_NHDATA_STK_DD_IFO (1).csv', 'NH_CONTEST_NW_FC_STK_IEM_IFO (1).csv', 'NH_CONTEST_STK_DT_QUT (1).csv']
1번 파일: NH_CONTEST_NW_FC_STK_IEM_IFO (1).csv
2번 파일: NH_CONTEST_STK_DT_QUT (1).csv
3번 파일: NH_CONTEST_NHDATA_STK_DD_IFO (1).csv


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

파일이 성공적으로 저장되었습니다: merge_output.csv
df1 tck_iem_cd 유니크 값: ['AA' 'AAL' 'AAN' ... 'ZWS' 'ZYME' 'ZYXI']
filtered_df2 tck_iem_cd 유니크 값: ['AAL' 'AAOI' 'AAPB' ... 'ZIM' 'ZM' 'ZS']
filtered_df3 tck_iem_cd 유니크 값: ['AAL' 'AAOI' 'AAPB' ... 'ZIM' 'ZM' 'ZS']


# 1. 파일 BIG_CONTEST_DATA_ETF_HOLDINGS.csv을 업로드한 후 SEC_TP가 ST인 개별종목에 대한 ETF 종목들을 가져오도록 하는 코드

In [31]:
# 필요한 라이브러리 임포트
import pandas as pd
from google.colab import files

# 파일 업로드
#uploaded = files.upload()

# 업로드된 파일 목록 확인
file_names = list(uploaded.keys())
print("업로드된 파일:", file_names)

# 파일 이름 설정
data_file = file_names[0]  # 데이터 파일

# CSV 파일 읽기 (인코딩 지정)
df = pd.read_csv(data_file, encoding='cp949')  # 데이터프레임

# sec_tp 컬럼의 값이 'ST'인 행만 남기기
df_filtered = df[df['sec_tp'] == 'ST']

# 결합 결과 확인
print(df_filtered.head())

# 결과를 새로운 CSV 파일로 저장
output_file = 'only_st_etf.csv'  # 결과 파일 이름
df_filtered.to_csv(output_file, index=False)

# 결과 파일 다운로드
files.download(output_file)

print("필터링된 파일이 성공적으로 저장되었습니다:", output_file)


업로드된 파일: ['NH_CONTEST_DATA_ETF_HOLDINGS.csv']
  etf_tck_cd tck_iem_cd   mkt_vlu            fc_sec_eng_nm fc_sec_krl_nm  \
0       AAPB       AAPL  36858666                     AAPL            애플   
3       AMDL        AMD   6530355                      AMD          에이엠디   
4       CLOU       TWLO  15400502           TWILIO INC - A          트윌리오   
5       CLOU       AKAM  15954631  AKAMAI TECHNOLOGIES INC          아카마이   
6       CLOU        BOX  16465312        BOX INC - CLASS A            박스   

   stk_qty  wht_pct sec_tp  
0   215737   66.778     ST  
3    36558   66.718     ST  
4   254933    4.266     ST  
5   157173    4.419     ST  
6   598521    4.561     ST  


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

필터링된 파일이 성공적으로 저장되었습니다: only_st_etf.csv


# 1. merge_output.csv 파일을 바탕으로 필요한 컬럼들을 가져오고, bse_dt를 기준으로 정렬하는데, 종목별로 그룹화해서 정렬하도록 코드 작성
# 2. bse_dt를 기준으로 정렬된 결과를 토대로 shift를 이용해서 비거래일을 제외하고 1일전, 5일전, 14일전, 1일후, 5일후, 14일후 대비 변화량을 기준일로 나누어서 기울기 데이터를 뽑아냄.
# 3. NATR의 경우 기준일로부터 N일치 TRUE RANGE를 뽑아서 평균가를 기준으로 정규화를 1차적으로 진행합니다.
# 4. 기울기값과 NATR값들을 최종적으로 0과 1사이로 MIN-MAX 정규화 진행합니다.
# 5. 거래대금 및 시가총액 데이터도 포함.

In [62]:
import pandas as pd
import matplotlib.pyplot as plt
# CSV 파일 불러오기
df = pd.read_csv('merge_output.csv')

# 데이터 정렬
df.sort_values(by=['tck_iem_cd', 'bse_dt'], inplace=True)

# TR 계산
def calculate_tr(group):
    group['Previous Close'] = group['iem_end_pr'].shift(1)
    group['TR'] = group[['iem_hi_pr', 'iem_low_pr', 'Previous Close']].apply(
        lambda x: max(x['iem_hi_pr'] - x['iem_low_pr'],
                      abs(x['iem_hi_pr'] - x['Previous Close']),
                      abs(x['iem_low_pr'] - x['Previous Close'])), axis=1)
    return group

# NATR 계산 (여러 기간)
def calculate_natr_multiple(group, periods=[7, 14, 30]):
    group = calculate_tr(group)  # TR 계산
    for period in periods:
        group[f'NATR_{period}'] = (group['TR'].rolling(window=period).mean() / group['iem_end_pr'])
    return group


# 반올림 함수
def round_values(group, columns):
    for column in columns:
        group[column] = group[column].round(4)  # 셋째 자리에서 반올림
    return group

# 그룹화 및 기울기 계산
def calculate_trends(group):
    # 인덱스를 bse_dt로 설정
    group.set_index('bse_dt', inplace=True)

    # 기울기 계산 (비거래일 고려)
    group['slope_tco_avg_eal_pls_1d'] = (group['tco_avg_eal_pls'].shift(1) - group['tco_avg_eal_pls']) / 1
    group['slope_tco_avg_eal_pls_5d'] = (group['tco_avg_eal_pls'].shift(5) - group['tco_avg_eal_pls']) / 5
    group['slope_tco_avg_eal_pls_14d'] = (group['tco_avg_eal_pls'].shift(14) - group['tco_avg_eal_pls']) / 14
    group['slope_tco_avg_pft_rt_1d'] = (group['tco_avg_pft_rt'].shift(1) - group['tco_avg_pft_rt']) / 1
    group['slope_tco_avg_pft_rt_5d'] = (group['tco_avg_pft_rt'].shift(5) - group['tco_avg_pft_rt']) / 5
    group['slope_tco_avg_pft_rt_14d'] = (group['tco_avg_pft_rt'].shift(14) - group['tco_avg_pft_rt']) / 14
    group['slope_lss_ivo_rt_1d'] = (group['lss_ivo_rt'].shift(1) - group['lss_ivo_rt']) / 1
    group['slope_lss_ivo_rt_5d'] = (group['lss_ivo_rt'].shift(5) - group['lss_ivo_rt']) / 5
    group['slope_lss_ivo_rt_14d'] = (group['lss_ivo_rt'].shift(14) - group['lss_ivo_rt']) / 14
    group['slope_ifw_act_cnt_1d'] = (group['ifw_act_cnt'].shift(1) - group['ifw_act_cnt']) / 1
    group['slope_ifw_act_cnt_5d'] = (group['ifw_act_cnt'].shift(5) - group['ifw_act_cnt']) / 5
    group['slope_ifw_act_cnt_14d'] = (group['ifw_act_cnt'].shift(14) - group['ifw_act_cnt']) / 14
    group['slope_ofw_act_cnt_1d'] = (group['ofw_act_cnt'].shift(1) - group['ofw_act_cnt']) / 1
    group['slope_ofw_act_cnt_5d'] = (group['ofw_act_cnt'].shift(5) - group['ofw_act_cnt']) / 5
    group['slope_ofw_act_cnt_14d'] = (group['ofw_act_cnt'].shift(14) - group['ofw_act_cnt']) / 14
    group['slope_vw_tgt_cnt_1d'] = (group['vw_tgt_cnt'].shift(1) - group['vw_tgt_cnt']) / 1
    group['slope_vw_tgt_cnt_5d'] = (group['vw_tgt_cnt'].shift(5) - group['vw_tgt_cnt']) / 5
    group['slope_vw_tgt_cnt_14d'] = (group['vw_tgt_cnt'].shift(14) - group['vw_tgt_cnt']) / 14
    group['slope_rgs_tgt_cnt_1d'] = (group['rgs_tgt_cnt'].shift(1) - group['rgs_tgt_cnt']) / 1
    group['slope_rgs_tgt_cnt_5d'] = (group['rgs_tgt_cnt'].shift(5) - group['rgs_tgt_cnt']) / 5
    group['slope_rgs_tgt_cnt_14d'] = (group['rgs_tgt_cnt'].shift(14) - group['rgs_tgt_cnt']) / 14
    group['slope_trd_cst_1d'] = (group['trd_cst'].shift(1) - group['trd_cst']) / 1
    group['slope_trd_cst_5d'] = (group['trd_cst'].shift(5) - group['trd_cst']) / 5
    group['slope_trd_cst_14d'] = (group['trd_cst'].shift(14) - group['trd_cst']) / 14
    # NaN 값을 -9999로 대체
    # NaN 값을 -99로 대체
 #   group[['slope_tco_avg_eal_pls_1d', 'slope_tco_avg_eal_pls_5d', 'slope_tco_avg_eal_pls_14d']] = group[['slope_tco_avg_eal_pls_1d', 'slope_tco_avg_eal_pls_5d', 'slope_tco_avg_eal_pls_14d']].fillna(-9999)
 #   group[['slope_tco_avg_pft_rt_1d', 'slope_tco_avg_pft_rt_5d', 'slope_tco_avg_pft_rt_14d']] = group[['slope_tco_avg_pft_rt_1d', 'slope_tco_avg_pft_rt_5d', 'slope_tco_avg_pft_rt_14d']].fillna(-9999)
 #   group[['slope_lss_ivo_rt_1d', 'slope_lss_ivo_rt_5d', 'slope_lss_ivo_rt_14d']] = group[['slope_lss_ivo_rt_1d', 'slope_lss_ivo_rt_5d', 'slope_lss_ivo_rt_14d']].fillna(-9999)
 #   group[['slope_ifw_act_cnt_1d', 'slope_ifw_act_cnt_5d', 'slope_ifw_act_cnt_14d']] = group[['slope_ifw_act_cnt_1d', 'slope_ifw_act_cnt_5d', 'slope_ifw_act_cnt_14d']].fillna(-9999)
 #   group[['slope_ofw_act_cnt_1d', 'slope_ofw_act_cnt_5d', 'slope_ofw_act_cnt_14d']] = group[['slope_ofw_act_cnt_1d', 'slope_ofw_act_cnt_5d', 'slope_ofw_act_cnt_14d']].fillna(-9999)
 #   group[['slope_vw_tgt_cnt_1d', 'slope_vw_tgt_cnt_5d', 'slope_vw_tgt_cnt_14d']] = group[['slope_vw_tgt_cnt_1d', 'slope_vw_tgt_cnt_5d', 'slope_vw_tgt_cnt_14d']].fillna(-9999)
 #   group[['slope_rgs_tgt_cnt_1d', 'slope_rgs_tgt_cnt_5d', 'slope_rgs_tgt_cnt_14d']] = group[['slope_rgs_tgt_cnt_1d', 'slope_rgs_tgt_cnt_5d', 'slope_rgs_tgt_cnt_14d']].fillna(-9999)
 #   group[['slope_trd_cst_1d', 'slope_trd_cst_5d', 'slope_trd_cst_14d']] = group[['slope_trd_cst_1d', 'slope_trd_cst_5d', 'slope_trd_cst_14d']].fillna(-9999)

    # 미래 기울기 계산
    group['future_slope_tco_avg_eal_pls_1d'] = (group['tco_avg_eal_pls'].shift(-1) - group['tco_avg_eal_pls']) / 1
    group['future_slope_tco_avg_eal_pls_5d'] = (group['tco_avg_eal_pls'].shift(-5) - group['tco_avg_eal_pls']) / 5
    group['future_slope_tco_avg_eal_pls_14d'] = (group['tco_avg_eal_pls'].shift(-14) - group['tco_avg_eal_pls']) / 14
    group['future_slope_tco_avg_pft_rt_1d'] = (group['tco_avg_pft_rt'].shift(-1) - group['tco_avg_pft_rt']) / 1
    group['future_slope_tco_avg_pft_rt_5d'] = (group['tco_avg_pft_rt'].shift(-5) - group['tco_avg_pft_rt']) / 5
    group['future_slope_tco_avg_pft_rt_14d'] = (group['tco_avg_pft_rt'].shift(-14) - group['tco_avg_pft_rt']) / 14
    group['future_slope_lss_ivo_rt_1d'] = (group['lss_ivo_rt'].shift(-1) - group['lss_ivo_rt']) / 1
    group['future_slope_lss_ivo_rt_5d'] = (group['lss_ivo_rt'].shift(-5) - group['lss_ivo_rt']) / 5
    group['future_slope_lss_ivo_rt_14d'] = (group['lss_ivo_rt'].shift(-14) - group['lss_ivo_rt']) / 14
    group['future_slope_ifw_act_cnt_1d'] = (group['ifw_act_cnt'].shift(-1) - group['ifw_act_cnt']) / 1
    group['future_slope_ifw_act_cnt_5d'] = (group['ifw_act_cnt'].shift(-5) - group['ifw_act_cnt']) / 5
    group['future_slope_ifw_act_cnt_14d'] = (group['ifw_act_cnt'].shift(-14) - group['ifw_act_cnt']) / 14
    group['future_slope_ofw_act_cnt_1d'] = (group['ofw_act_cnt'].shift(-1) - group['ofw_act_cnt']) / 1
    group['future_slope_ofw_act_cnt_5d'] = (group['ofw_act_cnt'].shift(-5) - group['ofw_act_cnt']) / 5
    group['future_slope_ofw_act_cnt_14d'] = (group['ofw_act_cnt'].shift(-14) - group['ofw_act_cnt']) / 14
    group['future_slope_vw_tgt_cnt_1d'] = (group['vw_tgt_cnt'].shift(-1) - group['vw_tgt_cnt']) / 1
    group['future_slope_vw_tgt_cnt_5d'] = (group['vw_tgt_cnt'].shift(-5) - group['vw_tgt_cnt']) / 5
    group['future_slope_vw_tgt_cnt_14d'] = (group['vw_tgt_cnt'].shift(-14) - group['vw_tgt_cnt']) / 14
    group['future_slope_rgs_tgt_cnt_1d'] = (group['rgs_tgt_cnt'].shift(-1) - group['rgs_tgt_cnt']) / 1
    group['future_slope_rgs_tgt_cnt_5d'] = (group['rgs_tgt_cnt'].shift(-5) - group['rgs_tgt_cnt']) / 5
    group['future_slope_rgs_tgt_cnt_14d'] = (group['rgs_tgt_cnt'].shift(-14) - group['rgs_tgt_cnt']) / 14
    group['future_slope_trd_cst_1d'] = (group['trd_cst'].shift(-1) - group['trd_cst']) / 1
    group['future_slope_trd_cst_5d'] = (group['trd_cst'].shift(-5) - group['trd_cst']) / 5
    group['future_slope_trd_cst_14d'] = (group['trd_cst'].shift(-14) - group['trd_cst']) / 14
    # 미래 슬로프 관련 NaN 값을 -99로 대체
#    group[['future_slope_tco_avg_eal_pls_1d', 'future_slope_tco_avg_eal_pls_5d', 'future_slope_tco_avg_eal_pls_14d']] = group[['future_slope_tco_avg_eal_pls_1d', 'future_slope_tco_avg_eal_pls_5d', 'future_slope_tco_avg_eal_pls_14d']].fillna(-9999)
#    group[['future_slope_tco_avg_pft_rt_1d', 'future_slope_tco_avg_pft_rt_5d', 'future_slope_tco_avg_pft_rt_14d']] = group[['future_slope_tco_avg_pft_rt_1d', 'future_slope_tco_avg_pft_rt_5d', 'future_slope_tco_avg_pft_rt_14d']].fillna(-9999)
#    group[['future_slope_lss_ivo_rt_1d', 'future_slope_lss_ivo_rt_5d', 'future_slope_lss_ivo_rt_14d']] = group[['future_slope_lss_ivo_rt_1d', 'future_slope_lss_ivo_rt_5d', 'future_slope_lss_ivo_rt_14d']].fillna(-9999)
#    group[['future_slope_ifw_act_cnt_1d', 'future_slope_ifw_act_cnt_5d', 'future_slope_ifw_act_cnt_14d']] = group[['future_slope_ifw_act_cnt_1d', 'future_slope_ifw_act_cnt_5d', 'future_slope_ifw_act_cnt_14d']].fillna(-9999)
#    group[['future_slope_ofw_act_cnt_1d', 'future_slope_ofw_act_cnt_5d', 'future_slope_ofw_act_cnt_14d']] = group[['future_slope_ofw_act_cnt_1d', 'future_slope_ofw_act_cnt_5d', 'future_slope_ofw_act_cnt_14d']].fillna(-9999)
#    group[['future_slope_vw_tgt_cnt_1d', 'future_slope_vw_tgt_cnt_5d', 'future_slope_vw_tgt_cnt_14d']] = group[['future_slope_vw_tgt_cnt_1d', 'future_slope_vw_tgt_cnt_5d', 'future_slope_vw_tgt_cnt_14d']].fillna(-9999)
#    group[['future_slope_rgs_tgt_cnt_1d', 'future_slope_rgs_tgt_cnt_5d', 'future_slope_rgs_tgt_cnt_14d']] = group[['future_slope_rgs_tgt_cnt_1d', 'future_slope_rgs_tgt_cnt_5d', 'future_slope_rgs_tgt_cnt_14d']].fillna(-9999)
#    group[['future_slope_trd_cst_1d', 'future_slope_trd_cst_5d', 'future_slope_trd_cst_14d']] = group[['future_slope_trd_cst_1d', 'future_slope_trd_cst_5d', 'future_slope_trd_cst_14d']].fillna(-9999)

    # NATR 계산 추가 (7일, 14일, 30일)
    group = calculate_natr_multiple(group)  # NATR 계산

    return group.reset_index()  # 인덱스 초기화 및 bse_dt 컬럼 유지

# 그룹화 적용
result = df.groupby('tck_iem_cd').apply(calculate_trends).reset_index(drop=True)

# 필요한 컬럼만 선택
final_result = result[['tck_iem_cd', 'bse_dt', 'mkt_pr_tot_amt', 'trd_cst',
    'slope_tco_avg_eal_pls_1d', 'slope_tco_avg_eal_pls_5d', 'slope_tco_avg_eal_pls_14d',
    'future_slope_tco_avg_eal_pls_1d', 'future_slope_tco_avg_eal_pls_5d', 'future_slope_tco_avg_eal_pls_14d',
    'slope_tco_avg_pft_rt_1d', 'slope_tco_avg_pft_rt_5d', 'slope_tco_avg_pft_rt_14d',
    'future_slope_tco_avg_pft_rt_1d', 'future_slope_tco_avg_pft_rt_5d', 'future_slope_tco_avg_pft_rt_14d',
    'slope_lss_ivo_rt_1d', 'slope_lss_ivo_rt_5d', 'slope_lss_ivo_rt_14d',
    'future_slope_lss_ivo_rt_1d', 'future_slope_lss_ivo_rt_5d', 'future_slope_lss_ivo_rt_14d',
    'slope_ifw_act_cnt_1d', 'slope_ifw_act_cnt_5d', 'slope_ifw_act_cnt_14d',
    'future_slope_ifw_act_cnt_1d', 'future_slope_ifw_act_cnt_5d', 'future_slope_ifw_act_cnt_14d',
    'slope_ofw_act_cnt_1d', 'slope_ofw_act_cnt_5d', 'slope_ofw_act_cnt_14d',
    'future_slope_ofw_act_cnt_1d', 'future_slope_ofw_act_cnt_5d', 'future_slope_ofw_act_cnt_14d',
    'slope_vw_tgt_cnt_1d', 'slope_vw_tgt_cnt_5d', 'slope_vw_tgt_cnt_14d',
    'future_slope_vw_tgt_cnt_1d', 'future_slope_vw_tgt_cnt_5d', 'future_slope_vw_tgt_cnt_14d',
    'slope_rgs_tgt_cnt_1d', 'slope_rgs_tgt_cnt_5d', 'slope_rgs_tgt_cnt_14d',
    'future_slope_rgs_tgt_cnt_1d', 'future_slope_rgs_tgt_cnt_5d', 'future_slope_rgs_tgt_cnt_14d',
    'slope_trd_cst_1d', 'slope_trd_cst_5d', 'slope_trd_cst_14d',
    'future_slope_trd_cst_1d', 'future_slope_trd_cst_5d', 'future_slope_trd_cst_14d', 'NATR_7', 'NATR_14', 'NATR_30'
]]

# 정규화 함수
def min_max_normalize(df, columns):
    normalized_df = df.copy()
    for column in columns:
        # NaN 값 제외
        filtered_column = normalized_df[column][normalized_df[column].notna()]

        if not filtered_column.empty:
            min_val = filtered_column.min()
            max_val = filtered_column.max()
            normalized_df[column] = normalized_df[column].apply(
                lambda x: (x - min_val) / (max_val - min_val) if max_val != min_val and pd.notna(x) else x
            )

    return normalized_df

# 정규화할 열 리스트
columns_to_normalize = ['mkt_pr_tot_amt', 'trd_cst',
    'slope_tco_avg_eal_pls_1d', 'slope_tco_avg_eal_pls_5d', 'slope_tco_avg_eal_pls_14d',
    'future_slope_tco_avg_eal_pls_1d', 'future_slope_tco_avg_eal_pls_5d', 'future_slope_tco_avg_eal_pls_14d',
    'slope_tco_avg_pft_rt_1d', 'slope_tco_avg_pft_rt_5d', 'slope_tco_avg_pft_rt_14d',
    'future_slope_tco_avg_pft_rt_1d', 'future_slope_tco_avg_pft_rt_5d', 'future_slope_tco_avg_pft_rt_14d',
    'slope_lss_ivo_rt_1d', 'slope_lss_ivo_rt_5d', 'slope_lss_ivo_rt_14d',
    'future_slope_lss_ivo_rt_1d', 'future_slope_lss_ivo_rt_5d', 'future_slope_lss_ivo_rt_14d',
    'slope_ifw_act_cnt_1d', 'slope_ifw_act_cnt_5d', 'slope_ifw_act_cnt_14d',
    'future_slope_ifw_act_cnt_1d', 'future_slope_ifw_act_cnt_5d', 'future_slope_ifw_act_cnt_14d',
    'slope_ofw_act_cnt_1d', 'slope_ofw_act_cnt_5d', 'slope_ofw_act_cnt_14d',
    'future_slope_ofw_act_cnt_1d', 'future_slope_ofw_act_cnt_5d', 'future_slope_ofw_act_cnt_14d',
    'slope_vw_tgt_cnt_1d', 'slope_vw_tgt_cnt_5d', 'slope_vw_tgt_cnt_14d',
    'future_slope_vw_tgt_cnt_1d', 'future_slope_vw_tgt_cnt_5d', 'future_slope_vw_tgt_cnt_14d',
    'slope_rgs_tgt_cnt_1d', 'slope_rgs_tgt_cnt_5d', 'slope_rgs_tgt_cnt_14d',
    'future_slope_rgs_tgt_cnt_1d', 'future_slope_rgs_tgt_cnt_5d', 'future_slope_rgs_tgt_cnt_14d',
    'slope_trd_cst_1d', 'slope_trd_cst_5d', 'slope_trd_cst_14d',
    'future_slope_trd_cst_1d', 'future_slope_trd_cst_5d', 'future_slope_trd_cst_14d', 'NATR_7', 'NATR_14', 'NATR_30'
]

# 정규화 수행
final_result_normalized = min_max_normalize(final_result, columns_to_normalize)

# CSV 파일로 저장
output_file = 'slopes_about_normalized.csv'  # 정규화된 결과 파일 이름
final_result_normalized.to_csv(output_file, index=False)

# 파일 다운로드
#files.download(output_file)  # 파일 다운로드 기능은 환경에 따라 다를 수 있습니다.
print("정규화된 CSV 파일로 저장되었습니다.")




  result = df.groupby('tck_iem_cd').apply(calculate_trends).reset_index(drop=True)


정규화된 CSV 파일로 저장되었습니다.
