# 파일 업로드 NH_CONTEST_STK_DT_QUT

In [None]:
from google.colab import files
import pandas as pd

# CSV 파일 업로드
uploaded = files.upload()

# 3개월치 NATR 계산

In [None]:
# CSV 파일 읽기
for file_name in uploaded.keys():
    df = pd.read_csv(file_name)
    print(f'{file_name} 데이터:')
    print(df.head())

    # 날짜 기준으로 종목별 정렬 (문자열로 된 날짜 정렬)
    df = df.sort_values(by=['tck_iem_cd', 'bse_dt'])

    # True Range(TR) 계산: 이전 종가와 고가, 저가 사용
    df['Previous Close'] = df.groupby('tck_iem_cd')['iem_end_pr'].shift(1)  # 이전 종가
    df['TR'] = df[['iem_hi_pr', 'iem_low_pr', 'Previous Close']].apply(
        lambda x: max(x['iem_hi_pr'] - x['iem_low_pr'],
                      abs(x['iem_hi_pr'] - x['Previous Close']),
                      abs(x['iem_low_pr'] - x['Previous Close'])), axis=1)

    # ATR 계산 (3개월치 기준, 즉 62일 기준)
    df['ATR'] = df.groupby('tck_iem_cd')['TR'].rolling(window=62).mean().reset_index(level=0, drop=True)

    # NATR 계산: ATR을 종가 평균으로 나누기
    df['NATR'] = df['ATR'] / df.groupby('tck_iem_cd')['iem_end_pr'].rolling(window=63).mean().reset_index(level=0, drop=True)

    # NATR NaN 처리: NaN을 0으로 대체
    df['NATR'] = df['NATR'].fillna(0)

    # 각 종목(tck_iem_cd)별 마지막 날짜의 데이터만 선택
    last_day_df = df.groupby('tck_iem_cd').tail(1)

    # NATR 기준 오름차순 정렬
    last_day_df = last_day_df.sort_values(by='NATR')

    # 필요한 컬럼만 선택하여 출력
    result_df = last_day_df[['bse_dt', 'tck_iem_cd', 'iem_hi_pr', 'iem_low_pr', 'iem_end_pr', 'TR', 'NATR']]

    # 결과 확인
    print(f'{file_name}에서 마지막 날짜의 선택된 결과 데이터 (NATR 기준 오름차순):')
    print(result_df)

    # 선택된 데이터를 새로운 CSV 파일로 저장
    output_file = 'last_day_natr_sorted_by_natr.csv'
    result_df.to_csv(output_file, index=False)

    # 파일 다운로드
    files.download(output_file)

    print(f'NATR 기준 오름차순 정렬된 새로운 CSV 파일이 생성되었습니다: {output_file}')


# 추가적으로 hi, low, end 데이터가 63개가 아닌 컬럼은 따로 추가적으로 선택하여 개수를 맞춰서 출력

In [None]:
import pandas as pd

# CSV 파일 읽기
for file_name in uploaded.keys():
    df = pd.read_csv(file_name)
    print(f'{file_name} 데이터:')
    print(df.head())

    # 날짜 기준으로 종목별 정렬
    df = df.sort_values(by=['tck_iem_cd', 'bse_dt'])

    # 관심 종목 리스트
    target_stocks = ['BDL         ']

    # 관심 종목만 필터링
    filtered_df = df[df['tck_iem_cd'].isin(target_stocks)].copy()

    # 필터링한 종목 출력
    unique_stocks = filtered_df['tck_iem_cd'].unique()
    print(f'필터링된 종목: {unique_stocks}')

    # True Range(TR) 계산: 이전 종가와 고가, 저가 사용
    filtered_df.loc[:, 'Previous Close'] = filtered_df.groupby('tck_iem_cd')['iem_end_pr'].shift(1)  # 이전 종가
    filtered_df.loc[:, 'TR'] = filtered_df[['iem_hi_pr', 'iem_low_pr', 'Previous Close']].apply(
        lambda x: max(x['iem_hi_pr'] - x['iem_low_pr'],
                      abs(x['iem_hi_pr'] - x['Previous Close']),
                      abs(x['iem_low_pr'] - x['Previous Close'])), axis=1)

    # ATR 계산 (62일 기준)
    filtered_df.loc[:, 'ATR'] = filtered_df.groupby('tck_iem_cd')['TR'].rolling(window=52).mean().reset_index(level=0, drop=True)

    # NATR 계산: ATR을 종가 평균으로 나누기
    filtered_df.loc[:, 'NATR'] = filtered_df['ATR'] / filtered_df.groupby('tck_iem_cd')['iem_end_pr'].rolling(window=52).mean().reset_index(level=0, drop=True)

    # NATR NaN 처리: NaN을 0으로 대체
    filtered_df.loc[:, 'NATR'] = filtered_df['NATR'].fillna(0)

    # TR 및 NATR 데이터 추출
    result_df = filtered_df[['bse_dt', 'tck_iem_cd', 'TR', 'NATR']]

    # 결과 확인
    print(f'{file_name}에서 선택된 종목의 TR 및 NATR 데이터:')
    print(result_df)

    # TR 및 NATR 데이터를 새로운 CSV 파일로 저장
    output_file = 'target_stocks_tr_natr_data.csv'
    result_df.to_csv(output_file, index=False)

    # 파일 다운로드
    files.download(output_file)

    print(f'선택된 종목의 TR 및 NATR 데이터가 포함된 새로운 CSV 파일이 생성되었습니다: {output_file}')


In [None]:
from google.colab import files
import pandas as pd

# CSV 파일 업로드
uploaded = files.upload()

# 종목별 수익 투자자 비율 평균

In [None]:
import pandas as pd

# CSV 파일 읽기
for file_name in uploaded.keys():
    df = pd.read_csv(file_name)
    print(f'{file_name} 데이터:')
    print(df.head())

    # 원하는 컬럼만 추출
    result_df = df[['tck_iem_cd', 'pft_ivo_rt']]

    # 종목별 pft_ivo_rt 평균값 계산
    avg_pft_ivo_rt = result_df.groupby('tck_iem_cd')['pft_ivo_rt'].mean().reset_index()
    avg_pft_ivo_rt.rename(columns={'pft_ivo_rt': 'avg_pft_ivo_rt'}, inplace=True)

    # 평균값 기준 오름차순 정렬
    avg_pft_ivo_rt = avg_pft_ivo_rt.sort_values(by='avg_pft_ivo_rt')

    # 결과 확인
    print(f'{file_name}에서 종목별 평균 pft_ivo_rt:')
    print(avg_pft_ivo_rt)

    # 데이터를 새로운 CSV 파일로 저장
    output_file = 'sorted_avg_pft_ivo_rt.csv'
    avg_pft_ivo_rt.to_csv(output_file, index=False)

    # 파일 다운로드
    files.download(output_file)

    print(f'종목별 평균 pft_ivo_rt가 포함된 새로운 CSV 파일이 생성되었습니다: {output_file}')

In [None]:
from google.colab import files
import pandas as pd

# CSV 파일 업로드
uploaded = files.upload()

# 차후에 사용할 etf 추천 시 특정 종목을 가지는 비율 percentage가 높은 순으로 정렬한 excel 추출

In [None]:
import pandas as pd
from google.colab import files

# CSV 파일 읽기
df = pd.read_csv('NH_CONTEST_DATA_ETF_HOLDINGS.csv', encoding='ISO-8859-1')  # 인코딩은 필요에 따라 조정하세요

# 특정 종목 코드 리스트
specific_tck_iem_cd = ['NVDA', 'AAPL']

# 필터링: tck_iem_cd가 specific_tck_iem_cd에 포함된 데이터만 선택
filtered_df = df[df['tck_iem_cd'].isin(specific_tck_iem_cd)]

# tck_iem_cd별로 wht_pct의 내림차순으로 정렬
sorted_df = filtered_df.sort_values(by=['tck_iem_cd', 'wht_pct'], ascending=[True, False])

# 최종 결과 확인
print(sorted_df)

# 파일 저장
sorted_df.to_csv('sorted_data.csv', index=False)

# 파일 다운로드
files.download('sorted_data.csv')


In [None]:
print(df['tck_iem_cd'].unique())  # 종목 코드 목록 확인
print(specific_tck_iem_cd)