In [3]:
import yfinance as yf
import pandas as pd
import os

def calculate_moving_average(data, window):
    """
    이동 평균을 계산하는 함수.
    """
    return data.rolling(window=window, min_periods=1).mean()

def get_stock_data(ticker, start_date, end_date, interval='1d'):
    """
    주어진 주식 코드와 기간에 해당하는 주식 데이터를 받아오는 함수.
    """
    data = yf.download(ticker, start=start_date, end=end_date, interval=interval)
    data = data[['Close', 'Volume']]
    data = data.reset_index()
    data.columns = ['Date', 'Close', 'Volume']

    # 이동 평균선 계산
    ma_columns = {}
    for ma in [5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60] + list(range(70, 710, 10)):
        ma_columns[f'SMA_{ma}'] = calculate_moving_average(data['Close'], ma)
        ma_columns[f'VMA_{ma}'] = calculate_moving_average(data['Volume'], ma)
    
    ma_df = pd.DataFrame(ma_columns)
    data = pd.concat([data[['Date']], ma_df], axis=1)

    # ✅ 초기 NaN 값 제거 (이동평균선이 모두 계산된 시점부터 데이터 사용)
    data.dropna(inplace=True)

    return data

def save_data_to_csv(data, filename):
    """
    데이터를 CSV 파일로 저장하는 함수.
    """
    data.to_csv(filename, index=False)
    print(f'Data saved to {filename}')

# 저장할 폴더 설정
project_dir = 'csv'
os.makedirs(project_dir, exist_ok=True)

# S&P 500 학습 및 테스트 데이터 분리
ticker = '^GSPC'
start_date = '1988-01-01'
train_end_date = '2023-03-01'
test_start_date = '2023-03-02'
end_date = '2025-02-12'

# 📂 학습 데이터
filename = os.path.join(project_dir, 'sp500_training_data.csv')
train_data = get_stock_data(ticker, start_date, train_end_date, interval='1d')
save_data_to_csv(train_data, filename)

# 📂 테스트 데이터
filename = os.path.join(project_dir, 'sp500_test_data.csv')
test_data = get_stock_data(ticker, test_start_date, end_date, interval='1d')
save_data_to_csv(test_data, filename)

# # 📌 저장할 주식 리스트
# tickers = ['AAPL', 'TSLA', 'GOOGL', 'MSFT', 'AMZN']

# for ticker in tickers:
#     # 📂 학습 데이터 저장
#     filename = os.path.join(project_dir, f"{ticker}_training_data.csv")
#     print(f"📥 Downloading {ticker} training data...")
#     train_data = get_stock_data(ticker, start_date, train_end_date, interval='1d')
#     save_data_to_csv(train_data, filename)
    
#     # 📂 테스트 데이터 저장
#     filename = os.path.join(project_dir, f"{ticker}_test_data.csv")
#     print(f"📥 Downloading {ticker} test data...")
#     test_data = get_stock_data(ticker, test_start_date, end_date, interval='1d')
#     save_data_to_csv(test_data, filename)


[*********************100%***********************]  1 of 1 completed

1 Failed download:
['^GSPC']: YFRateLimitError('Too Many Requests. Rate limited. Try after a while.')


Data saved to csv\sp500_training_data.csv


[*********************100%***********************]  1 of 1 completed

1 Failed download:
['^GSPC']: YFRateLimitError('Too Many Requests. Rate limited. Try after a while.')


Data saved to csv\sp500_test_data.csv
