In [8]:

import pandas as pd
import numpy as np
import multiprocessing as mp
from pykrx import stock

## ETF 종목 가져오기
- 목표 : 최하위 ETF 종목 선택하기

In [9]:
# 날짜 설정 
start_date = '20220101'
end_date = '20241231'

# 모든 ETF 티커 리스트 가져오기
etf_list = stock.get_etf_ticker_list()
etf_name = [stock.get_etf_ticker_name(etf) for etf in etf_list]

In [None]:
# GPT 버젼 답변
# ETF 종가 데이터 가져오기
def fetch_etf_data(etf_number):
    try:
        data = stock.get_etf_ohlcv_by_date(start_date, end_date, etf_number)
        
        # 데이터 구조 확인 (디버깅)
        if not isinstance(data, pd.DataFrame):
            print(f"Warning: ETF {etf_number} 데이터가 DataFrame이 아닙니다. 반환된 데이터: {data}")
            return etf_number, None
        
        if '종가' not in data.columns:
            print(f"Warning: ETF {etf_number} 데이터에 '종가' 컬럼이 없습니다. 반환된 컬럼: {data.columns}")
            return etf_number, None

        return etf_number, data['종가']
    
    except Exception as e:
        print(f"Error fetching data for ETF {etf_number}: {e}")  # 오류 로그 출력
        return etf_number, None  # 오류 발생 시 항상 (etf_number, None) 반환

if __name__ == "__main__":  # Windows 환경에서는 필요
    with mp.Pool(processes=12) as pool:
        results = pool.map(fetch_etf_data, etf_list)

    # None 값이 포함된 경우 제외
    filtered_results = [(etf, data) for etf, data in results if isinstance(data, pd.Series)]

    # 데이터프레임 변환
    df_etf = pd.DataFrame({etf: data for etf, data in filtered_results})

    print(df_etf.head())  # 결과 확인


            495710  466810  457930  487750  445690  465780  442260  0001P0  \
날짜                                                                           
2022-01-03     NaN     NaN     NaN     NaN     NaN     NaN     NaN     NaN   
2022-01-04     NaN     NaN     NaN     NaN     NaN     NaN     NaN     NaN   
2022-01-05     NaN     NaN     NaN     NaN     NaN     NaN     NaN     NaN   
2022-01-06     NaN     NaN     NaN     NaN     NaN     NaN     NaN     NaN   
2022-01-07     NaN     NaN     NaN     NaN     NaN     NaN     NaN     NaN   

            159800  472840  ...  195980  433250  494220  470310  476000  \
날짜                          ...                                           
2022-01-03   30305     NaN  ...   11875     NaN     NaN     NaN     NaN   
2022-01-04   30520     NaN  ...   11875     NaN     NaN     NaN     NaN   
2022-01-05   29820     NaN  ...   11735     NaN     NaN     NaN     NaN   
2022-01-06   29910     NaN  ...   11635     NaN     NaN     NaN     NaN   
20

In [11]:
df_etf

Unnamed: 0_level_0,495710,466810,457930,487750,445690,465780,442260,0001P0,159800,472840,...,195980,433250,494220,470310,476000,491700,0000Y0,215620,391670,472920
날짜,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
2022-01-03,,,,,,,,,30305,,...,11875,,,,,,,12245,9710,
2022-01-04,,,,,,,,,30520,,...,11875,,,,,,,12160,9715,
2022-01-05,,,,,,,,,29820,,...,11735,,,,,,,12200,9635,
2022-01-06,,,,,,,,,29910,,...,11635,,,,,,,12135,9475,
2022-01-07,,,,,,,,,29910,,...,11705,,,,,,,12245,9580,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2024-12-23,50080.0,5145.0,10080.0,7000.0,13245.0,107490.0,11510.0,,25080,32380.0,...,9780,10630.0,8620.0,7130.0,6145.0,32405.0,,12935,8150,109145.0
2024-12-24,50085.0,5095.0,10060.0,6995.0,13280.0,107485.0,11540.0,9710.0,25120,32430.0,...,9800,10615.0,8520.0,7055.0,6205.0,32405.0,100020.0,12960,8170,108960.0
2024-12-26,50080.0,4965.0,10015.0,6880.0,13235.0,107470.0,11505.0,9715.0,24970,32240.0,...,9820,10555.0,8550.0,7060.0,6160.0,32240.0,100035.0,12920,8145,108750.0
2024-12-27,50090.0,4890.0,9920.0,6890.0,13005.0,104220.0,11430.0,9625.0,24930,32140.0,...,9770,10525.0,8710.0,7080.0,6030.0,31905.0,100060.0,12710,8145,108805.0


In [22]:
# 각 ETF 종목의 평균 종가 계산
etf_avg_prices = df_etf.mean()

# 평균 종가가 가장 낮은 1 개의 종목 찾기
lowest_etfs = etf_avg_prices.nsmallest(10) 

# 결과 출력
print("최하위 ETF 종목:")
print(lowest_etfs)

최하위 ETF 종목:
204450    2118.390476
228790    2501.755102
252420    2597.757823
252670    2604.336054
253230    2606.462585
252710    2743.278912
139220    2970.183673
412560    3135.634014
217770    3148.639456
117700    3182.972789
dtype: float64


In [24]:

# 최하위 ETF 종목 (예: '204450')
lowest_etf_ticker = '228790'

# ETF 구성 종목과 비중 가져오기
portfolio = stock.get_etf_portfolio_deposit_file(lowest_etf_ticker, date='20241010')  # 현재 날짜 기준

# 결과 확인
print("ETF 구성 종목과 비중:")
print(portfolio)

# 데이터프레임 구조 확인 (종목 코드, 종목명, 비중 등 포함)
print(portfolio.columns)

ETF 구성 종목과 비중:
          계약수       금액     비중
티커                           
214450   48.0  9984000  11.37
051900   27.0  9544500  10.77
257720  208.0  8673600   9.98
161890  125.0  8637500   9.97
278470   32.0  8544000   9.70
090430   62.0  7762400   8.99
192820   52.0  7212400   8.23
018290  162.0  5224500   6.50
002790  206.0  5098500   5.59
241710   51.0  3993300   4.51
352480   26.0  2251600   2.44
114840   74.0  1687200   1.96
200130  107.0  1539730   1.72
237880   50.0  1390000   1.56
251970   35.0  1172500   1.40
950140   88.0  1115840   1.26
439090   52.0  1047800   1.18
024720  140.0  1047200   1.15
214420   88.0   801680   0.90
226320   33.0   386430   0.44
010010    0.0        0   0.39
Index(['계약수', '금액', '비중'], dtype='object')


In [21]:
import matplotlib.pyplot as plt

# 최하위 ETF 종목
lowest_etf_ticker = "228790"

# ETF 구성 종목과 비중 가져오기
date = "20241010"  # 필요 시 최신 날짜로 변경
portfolio = stock.get_etf_portfolio_deposit_file(lowest_etf_ticker, date)

# 데이터 확인
print("ETF 구성 종목과 비중 (원본):")
print(portfolio)

# 컬럼 확인
print("데이터프레임 컬럼:", portfolio.columns.tolist())

# 비중이 0이면 금액으로 비중 계산
if portfolio["비중"].sum() == 0 and "금액" in portfolio.columns and portfolio["금액"].sum() > 0:
    portfolio["비중"] = portfolio["금액"] / portfolio["금액"].sum() * 100

# 유효한 데이터 필터링 (6자리 주식 코드와 비중 > 0)
valid_portfolio = portfolio[portfolio.index.str.match(r"^\d{6}$") & (portfolio["비중"] > 0)].copy()

if valid_portfolio.empty:
    print(f"경고: {lowest_etf_ticker}의 유효한 비중 데이터가 없습니다. 날짜({date}) 또는 데이터를 확인하세요.")
else:
    # 비중 기준 내림차순 정렬
    valid_portfolio = valid_portfolio.sort_values(by="비중", ascending=False)

    # 결과 출력
    print("\n비중 기준 내림차순 정렬된 구성 종목:")
    print(valid_portfolio[["종목명", "비중"]])

    # 파이 차트 시각화
    plt.figure(figsize=(10, 10))
    plt.pie(valid_portfolio["비중"], labels=valid_portfolio["종목명"], autopct="%1.1f%%", startangle=90)
    plt.title(f"{lowest_etf_ticker} ETF 구성 종목 비중 (날짜: {date})")
    plt.axis("equal")
    plt.show()

# 디버깅 메시지
if portfolio["비중"].sum() == 0:
    print(f"디버깅 필요: {lowest_etf_ticker}의 비중 합계가 0입니다. 날짜나 데이터 소스를 점검하세요.")

ETF 구성 종목과 비중 (원본):
          계약수       금액     비중
티커                           
214450   48.0  9984000  11.37
051900   27.0  9544500  10.77
257720  208.0  8673600   9.98
161890  125.0  8637500   9.97
278470   32.0  8544000   9.70
090430   62.0  7762400   8.99
192820   52.0  7212400   8.23
018290  162.0  5224500   6.50
002790  206.0  5098500   5.59
241710   51.0  3993300   4.51
352480   26.0  2251600   2.44
114840   74.0  1687200   1.96
200130  107.0  1539730   1.72
237880   50.0  1390000   1.56
251970   35.0  1172500   1.40
950140   88.0  1115840   1.26
439090   52.0  1047800   1.18
024720  140.0  1047200   1.15
214420   88.0   801680   0.90
226320   33.0   386430   0.44
010010    0.0        0   0.39
데이터프레임 컬럼: ['계약수', '금액', '비중']

비중 기준 내림차순 정렬된 구성 종목:


KeyError: "['종목명'] not in index"

In [None]:
# xAI 답변 
import pandas as pd
import numpy as np
from pykrx import stock
import multiprocessing as mp

# 날짜 설정
start_date = "20220101"
end_date = "20241231"

# ETF 데이터 가져오기 함수
def fetch_etf_data(etf_ticker):
    try:
        data = stock.get_etf_ohlcv_by_date(start_date, end_date, etf_ticker)
        if not data.empty and "종가" in data.columns:
            return etf_ticker, data["종가"]
        return etf_ticker, None
    except Exception as e:
        print(f"Error fetching {etf_ticker}: {e}")
        return etf_ticker, None

# 포트폴리오 데이터 확인 함수
def check_portfolio_data(etf_ticker, date="20241010"):
    try:
        portfolio = stock.get_etf_portfolio_deposit_file(etf_ticker, date)
        if not portfolio.empty and "비중" in portfolio.columns and portfolio["비중"].sum() > 0:
            valid_stocks = portfolio[portfolio.index.str.match(r"^\d{6}$") & (portfolio["비중"] > 0)]
            if not valid_stocks.empty:
                return etf_ticker, True, valid_stocks
        return etf_ticker, False, None
    except Exception as e:
        print(f"Error checking portfolio for {etf_ticker}: {e}")
        return etf_ticker, False, None

if __name__ == "__main__":
    # 모든 ETF 티커 가져오기
    etf_list = stock.get_etf_ticker_list()

    # 종가 데이터 가져오기
    with mp.Pool(processes=12) as pool:
        results = pool.map(fetch_etf_data, etf_list)

    # 유효한 데이터만 필터링
    etf_prices = {ticker: data for ticker, data in results if isinstance(data, pd.Series) and not data.empty}
    df_etf = pd.DataFrame(etf_prices)

    # 평균 종가 기준 최하위 10개 ETF 찾기
    etf_avg_prices = df_etf.mean()
    lowest_etfs = etf_avg_prices.nsmallest(10)
    print("최하위 10개 ETF (평균 종가 기준):")
    for ticker in lowest_etfs.index:
        name = stock.get_etf_ticker_name(ticker)
        print(f"{ticker}: {name} - 평균 종가: {lowest_etfs[ticker]:.2f}")

    # 포트폴리오 데이터 체크
    print("\n포트폴리오 데이터가 유효한 ETF 확인:")
    with mp.Pool(processes=12) as pool:
        portfolio_results = pool.starmap(check_portfolio_data, [(ticker, "20241010") for ticker in lowest_etfs.index])

    # 결과 분석
    valid_etfs = [(ticker, portfolio) for ticker, valid, portfolio in portfolio_results if valid]
    if not valid_etfs:
        print("최하위 10개 ETF 중 유효한 비중 데이터를 제공하는 ETF가 없습니다.")
    else:
        print("유효한 비중 데이터를 제공하는 최하위 ETF:")
        for ticker, portfolio in valid_etfs:
            name = stock.get_etf_ticker_name(ticker)
            print(f"\n{ticker}: {name}")
            print(portfolio[["종목명", "비중"]].head())

최하위 10개 ETF (평균 종가 기준):
204450: KODEX 차이나H레버리지(H) - 평균 종가: 2118.39
228790: TIGER 화장품 - 평균 종가: 2501.76
252420: RISE 200선물인버스2X - 평균 종가: 2597.76
252670: KODEX 200선물인버스2X - 평균 종가: 2604.34
253230: KIWOOM 200선물인버스2X - 평균 종가: 2606.46
252710: TIGER 200선물인버스2X - 평균 종가: 2743.28
139220: TIGER 200 건설 - 평균 종가: 2970.18
412560: TIGER BBIG레버리지 - 평균 종가: 3135.63
217770: TIGER 원유선물인버스(H) - 평균 종가: 3148.64
117700: KODEX 건설 - 평균 종가: 3182.97

포트폴리오 데이터가 유효한 ETF 확인:
유효한 비중 데이터를 제공하는 최하위 ETF:

228790: TIGER 화장품


KeyError: "['종목명'] not in index"

In [14]:
# 구성 종목의 종가 데이터 가져오기
constituents_prices = {}
start_date = '20220101'
end_date = '20241231'

for ticker in portfolio.index:  # 종목 코드는 인덱스에 있음
    try:
        data = stock.get_market_ohlcv_by_date(start_date, end_date, ticker)
        constituents_prices[ticker] = data['종가']
    except Exception as e:
        print(f"Error fetching {ticker}: {e}")

# 데이터프레임으로 변환
df_constituents = pd.DataFrame(constituents_prices)
print(df_constituents.head())

Error fetching 100000: '종가'
Error fetching 017191: '종가'
Error fetching 040111: '종가'
Error fetching 070341: '종가'
Error fetching 100000: '종가'
Error fetching 100000: '종가'
Error fetching 100000: '종가'
Error fetching 100000: '종가'
Error fetching 100000: '종가'
Error fetching 941009: '종가'
Error fetching 100000: '종가'
Error fetching 100000: '종가'
Error fetching 883013: '종가'
Error fetching 000330: '종가'
Error fetching 093012: '종가'
Error fetching 210961: '종가'
Error fetching 688002: '종가'
Error fetching 291001: '종가'
Error fetching 2108Y1: '종가'
Error fetching 267001: '종가'
Error fetching 3066L1: '종가'
Error fetching 3777B1: '종가'
Error fetching 4290A1: '종가'
Error fetching 100004: '종가'
Error fetching 4INDEX: '종가'
Error fetching 100000: '종가'
Error fetching 5074A1: '종가'
Error fetching 5074S1: '종가'
Error fetching 8208B1: '종가'
Error fetching 532631: '종가'
Error fetching 5479M1: '종가'
Error fetching 5635P1: '종가'
Error fetching 992009: '종가'
Error fetching 5496K1: '종가'
Error fetching 596691: '종가'
Error fetching 6427A