Получим таблицы с ценами индексов

In [1]:
import yfinance as yf
import pandas as pd
import os
from yahooquery import Ticker

In [5]:
# Определяем соответствие категорий фондов и тикеров индексов
category_to_index = {
    "Large Growth": "^GSPC",
    "Mid-Cap Growth": "^SP500TR",  # Russell Mid Cap Growth
    "Large Value": "^RLV",  # Russell 1000 Value
    "Mid-Cap Blend": "^SP500TR",  # Russell Mid Cap
    "Short-Term Bond": "^SHY",
    "Small Blend": "^RUT",  # Russell 2000
    "Small Growth": "^RUO",  # Russell 2000 Growth
    "Small Value": "^RUJ",  # Russell 2000 Value
    "Equity Energy": "^SP1500ENRG",  # S&P 1500 Energy TR
    "High Yield Bond": "^HYG",
    "Intermediate Government": "^IEI",
    "Corporate Bond": "^LQD",
    "Large Blend": "^SPX",  # S&P 500
    "Health": "^SP500-35",  # S&P 500 Health Care
    "Real Estate": "^SP500-60",  # S&P 500 Real Estate
    "Energy Limited Partnership": "^SP500-10",  # S&P 500 Energy
    "Preferred Stock": "^PFF",
    "Technology": "^SP500-45",  # S&P 500 Technology
    "Utilities": "^SP500-55",  # S&P 500 Utilities
    "Long Government": "^TLT",
    "Financial": "^SP500-40",  # S&P 500 Financials
    "Consumer Cyclical": "^SP500-25",  # S&P 500 Consumer Discretionary
    "Industrials": "^SP500-20",  # S&P 500 Industrials
    "Consumer Defensive": "^SP500-30"  # S&P 500 Consumer Staples
}

# Директория для сохранения
output_dir = "D:\\Python_and_Jupyter_notebooks\\finance_pet_project\\csv\\indeces"
os.makedirs(output_dir, exist_ok=True)

# Даты загрузки данных
start_date = "2017-01-01"
end_date = "2019-12-31"

# Перебираем индексы и загружаем данные
for category, ticker in category_to_index.items():
    print(f"Скачиваем данные для {category} ({ticker})...")

    # Загружаем данные с Yahoo Finance
    df = yf.download(ticker, start=start_date, end=end_date, interval="1d")

    # Проверяем, получили ли данные
    if df.empty:
        print(f"❌ Ошибка: Нет данных для {ticker} ({category})")
        continue

    # Сбрасываем индекс, чтобы дата стала отдельным столбцом
    df.reset_index(inplace=True)

    # Путь для сохранения
    output_path = os.path.join(output_dir, f"{ticker.replace('^', '')}.csv")

    # Сохранение в CSV
    df.to_csv(output_path, index=False)

    print(f"✅ Данные сохранены: {output_path}")

    # Выводим первые 4 строки для проверки
    print(df.head(4))

[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed

Скачиваем данные для Large Growth (^GSPC)...
✅ Данные сохранены: D:\Python_and_Jupyter_notebooks\finance_pet_project\csv\indeces\GSPC.csv
Price        Date        Close         High          Low         Open  \
Ticker                   ^GSPC        ^GSPC        ^GSPC        ^GSPC   
0      2017-01-03  2257.830078  2263.879883  2245.129883  2251.570068   
1      2017-01-04  2270.750000  2272.820068  2261.600098  2261.600098   
2      2017-01-05  2269.000000  2271.500000  2260.449951  2268.179932   
3      2017-01-06  2276.979980  2282.100098  2264.060059  2271.139893   

Price       Volume  
Ticker       ^GSPC  
0       3773010000  
1       3768890000  
2       3785080000  
3       3342080000  
Скачиваем данные для Mid-Cap Growth (^SP500TR)...
✅ Данные сохранены: D:\Python_and_Jupyter_notebooks\finance_pet_project\csv\indeces\SP500TR.csv
Price        Date        Close         High          Low         Open   Volume
Ticker                ^SP500TR     ^SP500TR     ^SP500TR     ^SP500TR ^S


[*********************100%***********************]  1 of 1 completed

1 Failed download:
['^SHY']: YFPricesMissingError('possibly delisted; no price data found  (1d 2017-01-01 -> 2019-12-31)')
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed

1 Failed download:
['^SP1500ENRG']: YFTzMissingError('possibly delisted; no timezone found')
[*********************100%***********************]  1 of 1 completed

✅ Данные сохранены: D:\Python_and_Jupyter_notebooks\finance_pet_project\csv\indeces\SP500TR.csv
Price        Date        Close         High          Low         Open   Volume
Ticker                ^SP500TR     ^SP500TR     ^SP500TR     ^SP500TR ^SP500TR
0      2017-01-03  4315.080078  4326.529785  4290.850098  4303.120117        0
1      2017-01-04  4340.750000  4344.689941  4323.259766  4323.259766        0
2      2017-01-05  4337.450195  4342.240234  4321.149902  4335.890137        0
3      2017-01-06  4354.049805  4363.830078  4329.350098  4342.879883        0
Скачиваем данные для Short-Term Bond (^SHY)...
❌ Ошибка: Нет данных для ^SHY (Short-Term Bond)
Скачиваем данные для Small Blend (^RUT)...
✅ Данные сохранены: D:\Python_and_Jupyter_notebooks\finance_pet_project\csv\indeces\RUT.csv
Price        Date        Close         High          Low         Open  \
Ticker                    ^RUT         ^RUT         ^RUT         ^RUT   
0      2017-01-03  1365.489990  1375.089966  1355.3900



1 Failed download:
['^HYG']: YFPricesMissingError('possibly delisted; no price data found  (1d 2017-01-01 -> 2019-12-31)')
[*********************100%***********************]  1 of 1 completed

1 Failed download:
['^IEI']: YFPricesMissingError('possibly delisted; no price data found  (1d 2017-01-01 -> 2019-12-31)')
[*********************100%***********************]  1 of 1 completed

1 Failed download:
['^LQD']: YFPricesMissingError('possibly delisted; no price data found  (1d 2017-01-01 -> 2019-12-31)')
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


❌ Ошибка: Нет данных для ^HYG (High Yield Bond)
Скачиваем данные для Intermediate Government (^IEI)...
❌ Ошибка: Нет данных для ^IEI (Intermediate Government)
Скачиваем данные для Corporate Bond (^LQD)...
❌ Ошибка: Нет данных для ^LQD (Corporate Bond)
Скачиваем данные для Large Blend (^SPX)...
✅ Данные сохранены: D:\Python_and_Jupyter_notebooks\finance_pet_project\csv\indeces\SPX.csv
Price        Date        Close         High          Low         Open  \
Ticker                    ^SPX         ^SPX         ^SPX         ^SPX   
0      2017-01-03  2257.830078  2263.879883  2245.129883  2251.570068   
1      2017-01-04  2270.750000  2272.820068  2261.600098  2261.600098   
2      2017-01-05  2269.000000  2271.500000  2260.449951  2268.179932   
3      2017-01-06  2276.979980  2282.100098  2264.060059  2271.139893   

Price       Volume  
Ticker        ^SPX  
0       3773010000  
1       3768890000  
2       3785080000  
3       3342080000  
Скачиваем данные для Health (^SP500-35)...
✅ Дан

[*********************100%***********************]  1 of 1 completed

1 Failed download:
['^SP500-10']: YFTzMissingError('possibly delisted; no timezone found')
[*********************100%***********************]  1 of 1 completed

1 Failed download:
['^PFF']: YFPricesMissingError('possibly delisted; no price data found  (1d 2017-01-01 -> 2019-12-31)')
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed

1 Failed download:
['^TLT']: YFPricesMissingError('possibly delisted; no price data found  (1d 2017-01-01 -> 2019-12-31)')


❌ Ошибка: Нет данных для ^SP500-10 (Energy Limited Partnership)
Скачиваем данные для Preferred Stock (^PFF)...
❌ Ошибка: Нет данных для ^PFF (Preferred Stock)
Скачиваем данные для Technology (^SP500-45)...
✅ Данные сохранены: D:\Python_and_Jupyter_notebooks\finance_pet_project\csv\indeces\SP500-45.csv
Price        Date       Close        High         Low        Open    Volume
Ticker              ^SP500-45   ^SP500-45   ^SP500-45   ^SP500-45 ^SP500-45
0      2017-01-03  815.119995  818.950012  807.950012  807.950012         0
1      2017-01-04  818.010010  819.580017  815.119995  815.119995         0
2      2017-01-05  819.770020  822.190002  816.619995  818.010010         0
3      2017-01-06  827.599976  829.520020  818.260010  819.770020         0
Скачиваем данные для Utilities (^SP500-55)...
✅ Данные сохранены: D:\Python_and_Jupyter_notebooks\finance_pet_project\csv\indeces\SP500-55.csv
Price        Date       Close        High         Low        Open    Volume
Ticker              ^S

[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


✅ Данные сохранены: D:\Python_and_Jupyter_notebooks\finance_pet_project\csv\indeces\SP500-40.csv
Price        Date       Close        High         Low        Open    Volume
Ticker              ^SP500-40   ^SP500-40   ^SP500-40   ^SP500-40 ^SP500-40
0      2017-01-03  390.309998  393.269989  386.529999  386.529999         0
1      2017-01-04  393.660004  394.070007  390.309998  390.309998         0
2      2017-01-05  389.660004  393.660004  386.109985  393.660004         0
3      2017-01-06  391.149994  392.549988  389.089996  389.660004         0
Скачиваем данные для Consumer Cyclical (^SP500-25)...
✅ Данные сохранены: D:\Python_and_Jupyter_notebooks\finance_pet_project\csv\indeces\SP500-25.csv
Price        Date       Close        High         Low        Open    Volume
Ticker              ^SP500-25   ^SP500-25   ^SP500-25   ^SP500-25 ^SP500-25
0      2017-01-03  651.809998  655.549988  648.000000  653.130005         0
1      2017-01-04  660.479980  661.250000  654.099976  654.239990   

Удалим первую строку в каждой таблице

In [6]:
# Директория, где сохранены CSV-файлы индексов
input_dir = "D:\\Python_and_Jupyter_notebooks\\finance_pet_project\\csv\\indeces"

# Получаем список всех файлов в директории
files = [f for f in os.listdir(input_dir) if f.endswith('.csv')]

# Обрабатываем каждый файл
for file in files:
    file_path = os.path.join(input_dir, file)

    # Читаем CSV-файл
    df = pd.read_csv(file_path)

    # Удаляем первые две строки
    df = df.iloc[1:].reset_index(drop=True)

    # Перезаписываем файл с обновленными данными
    df.to_csv(file_path, index=False)

    # Выводим первые три строки для проверки
    print(f"\nПервые три строки после обработки {file}:")
    print(df.head(3))


Первые три строки после обработки GSPC.csv:
         Date           Close               High                Low  \
0  2017-01-03  2257.830078125    2263.8798828125    2245.1298828125   
1  2017-01-04         2270.75  2272.820068359375   2261.60009765625   
2  2017-01-05          2269.0             2271.5  2260.449951171875   

                Open      Volume  
0  2251.570068359375  3773010000  
1   2261.60009765625  3768890000  
2  2268.179931640625  3785080000  

Первые три строки после обработки RLV.csv:
         Date               Close                High                 Low  \
0  2017-01-03             1111.75             1114.75   1104.300048828125   
1  2017-01-04    1118.43994140625  1119.3399658203125              1112.0   
2  2017-01-05  1114.3699951171875  1118.3399658203125  1109.9200439453125   

                 Open Volume  
0   1104.300048828125      0  
1              1112.0      0  
2  1118.3399658203125      0  

Первые три строки после обработки RUJ.csv:
         

Добавим столбец с названием тикера

In [7]:
# Директория с загруженными файлами
input_dir = "D:\\Python_and_Jupyter_notebooks\\finance_pet_project\\csv\\indeces"

# Получаем список файлов в директории
files = [f for f in os.listdir(input_dir) if f.endswith('.csv')]

# Обрабатываем каждый файл
for file in files:
    file_path = os.path.join(input_dir, file)
    
    # Загружаем данные
    df = pd.read_csv(file_path)

    # Добавляем новый столбец Index_ticker, используя имя файла без расширения
    df["Index_ticker"] = file.replace(".csv", "")

    # Сохраняем обновленный файл
    df.to_csv(file_path, index=False)

    print(f"✅ Файл обновлён: {file_path}")

✅ Файл обновлён: D:\Python_and_Jupyter_notebooks\finance_pet_project\csv\indeces\GSPC.csv
✅ Файл обновлён: D:\Python_and_Jupyter_notebooks\finance_pet_project\csv\indeces\RLV.csv
✅ Файл обновлён: D:\Python_and_Jupyter_notebooks\finance_pet_project\csv\indeces\RUJ.csv
✅ Файл обновлён: D:\Python_and_Jupyter_notebooks\finance_pet_project\csv\indeces\RUO.csv
✅ Файл обновлён: D:\Python_and_Jupyter_notebooks\finance_pet_project\csv\indeces\RUT.csv
✅ Файл обновлён: D:\Python_and_Jupyter_notebooks\finance_pet_project\csv\indeces\SP500-20.csv
✅ Файл обновлён: D:\Python_and_Jupyter_notebooks\finance_pet_project\csv\indeces\SP500-25.csv
✅ Файл обновлён: D:\Python_and_Jupyter_notebooks\finance_pet_project\csv\indeces\SP500-30.csv
✅ Файл обновлён: D:\Python_and_Jupyter_notebooks\finance_pet_project\csv\indeces\SP500-35.csv
✅ Файл обновлён: D:\Python_and_Jupyter_notebooks\finance_pet_project\csv\indeces\SP500-40.csv
✅ Файл обновлён: D:\Python_and_Jupyter_notebooks\finance_pet_project\csv\indeces\SP5

### Итого

Вот список категорий, для которых нам удалось успешно скачать данные по индексам, согласно твоей информации:

1. Large Growth — тикер: ^GSPC
2. Mid-Cap Growth — тикер: ^SP500TR
3. Large Value — тикер: ^RLV
4. Mid-Cap Blend — тикер: ^SP500TR
5. Small Blend — тикер: ^RUT
6. Small Growth — тикер: ^RUO
7. Small Value — тикер: ^RUJ
8. Large Blend — тикер: ^SPX
9. Health — тикер: ^SP500-35
10. Real Estate — тикер: ^SP500-60
11. Technology — тикер: ^SP500-45
12. Utilities — тикер: ^SP500-55
13. Financial — тикер: ^SP500-40
14. Industrials — тикер: ^SP500-20
15. Consumer Cyclical — тикер: ^SP500-25
16. Consumer Defensive — тикер: ^SP500-30
