In [1]:
## database imports
from database.market import Market
from database.adatabase import ADatabase
from database.sec import SEC

## data processor import
from processor.processor import Processor as p

## modeler import
from modeler_strats.universal_modeler import UniversalModeler

## strategy impors
from strategy.financial import Financial as financials
from strategy.earnings import Earnings as earnings
from strategy.dividends import Dividends as dividends

## miscellaneous
import numpy as np
import matplotlib.pyplot as plt
import pickle
import math
from statistics import variance
from datetime import datetime, timedelta
import pytz
import pandas as pd
from tqdm import tqdm

In [2]:
start_date = datetime(2023,1,1)
end_date = datetime.now()

In [3]:
market = Market()
sec = SEC()
umod = UniversalModeler()

In [4]:
market.connect()
sp500 = market.retrieve("sp500")
sp500 = sp500.rename(columns={"Symbol":"ticker"})
market.disconnect()

In [5]:
financial_factors = financials.factors()

In [6]:
dividend_factors = dividends.factors()

In [7]:
included_columns=[
    "year",
    "quarter",
    "week",
    "ticker",
    "adjclose"
]
included_columns.extend(financial_factors)
included_columns.extend(dividend_factors)
included_columns = list(set(included_columns))

In [12]:
strategies = {"financial":financial_factors,"earnings":financial_factors,"dividends":dividend_factors}

In [13]:
training_sets = []
sec.connect()
market.connect()
for ticker in tqdm(sp500["ticker"].unique()):
    try:
        cik = int(sp500[sp500["ticker"]==ticker]["CIK"])
        prices = market.retrieve_ticker_prices("prices",ticker)
        prices = p.column_date_processing(prices)
        filing = sec.retrieve_filing_data(cik)
        filing = p.column_date_processing(filing)
        ticker_data = financials.transform(prices,filing)
        ticker_data = ticker_data[included_columns]
        training_sets.append(ticker_data)
    except Exception as e:
        print(str(e))
        continue
sec.disconnect()
market.disconnect()
data = pd.concat(training_sets)

  1%|█▉                                                                                                                                                        | 6/490 [00:01<01:57,  4.11it/s]

"['entitycommonstocksharesoutstanding'] not in index"


  2%|██▌                                                                                                                                                       | 8/490 [00:02<02:20,  3.42it/s]

"['stockholdersequity'] not in index"


  4%|█████▉                                                                                                                                                   | 19/490 [00:06<02:40,  2.93it/s]

"['incometaxexpensebenefit'] not in index"


  5%|███████▏                                                                                                                                                 | 23/490 [00:07<02:36,  2.99it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


  5%|███████▍                                                                                                                                                 | 24/490 [00:07<02:26,  3.18it/s]

"['weightedaveragenumberofsharesoutstandingbasic', 'weightedaveragenumberofdilutedsharesoutstanding'] not in index"


  7%|█████████▉                                                                                                                                               | 32/490 [00:10<03:15,  2.35it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


  7%|██████████▎                                                                                                                                              | 33/490 [00:11<03:57,  1.92it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 10%|███████████████▎                                                                                                                                         | 49/490 [00:16<02:16,  3.24it/s]

"['weightedaveragenumberofdilutedsharesoutstanding'] not in index"


 10%|███████████████▉                                                                                                                                         | 51/490 [00:17<02:42,  2.71it/s]

"['stockholdersequity'] not in index"


 11%|█████████████████▏                                                                                                                                       | 55/490 [00:18<02:17,  3.17it/s]

"['propertyplantandequipmentnet'] not in index"


 12%|█████████████████▊                                                                                                                                       | 57/490 [00:19<02:06,  3.43it/s]

"['weightedaveragenumberofsharesoutstandingbasic'] not in index"


 13%|████████████████████▎                                                                                                                                    | 65/490 [00:22<02:21,  3.00it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 15%|██████████████████████▊                                                                                                                                  | 73/490 [00:25<02:42,  2.57it/s]

"['propertyplantandequipmentnet', 'incometaxexpensebenefit'] not in index"


 15%|███████████████████████                                                                                                                                  | 74/490 [00:26<02:52,  2.41it/s]

"['stockholdersequity'] not in index"


 17%|█████████████████████████▌                                                                                                                               | 82/490 [00:28<02:08,  3.17it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet', 'incometaxexpensebenefit'] not in index"


 17%|██████████████████████████▏                                                                                                                              | 84/490 [00:30<03:29,  1.94it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 18%|██████████████████████████▊                                                                                                                              | 86/490 [00:30<02:35,  2.59it/s]

"['stockholdersequity'] not in index"


 18%|████████████████████████████                                                                                                                             | 90/490 [00:31<02:09,  3.10it/s]

"['stockholdersequity'] not in index"


 22%|████████████████████████████████▉                                                                                                                       | 106/490 [00:37<02:02,  3.13it/s]

"['weightedaveragenumberofsharesoutstandingbasic'] not in index"


 22%|██████████████████████████████████                                                                                                                      | 110/490 [00:38<02:47,  2.26it/s]

"['propertyplantandequipmentnet'] not in index"


 23%|███████████████████████████████████                                                                                                                     | 113/490 [00:39<02:20,  2.69it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 24%|████████████████████████████████████▌                                                                                                                   | 118/490 [00:41<02:06,  2.94it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 24%|████████████████████████████████████▉                                                                                                                   | 119/490 [00:41<02:21,  2.62it/s]

"['stockholdersequity'] not in index"


 25%|██████████████████████████████████████▍                                                                                                                 | 124/490 [00:43<02:04,  2.94it/s]

"['entitycommonstocksharesoutstanding', 'weightedaveragenumberofsharesoutstandingbasic', 'earningspersharebasic', 'earningspersharediluted', 'weightedaveragenumberofdilutedsharesoutstanding'] not in index"


 27%|████████████████████████████████████████▉                                                                                                               | 132/490 [00:46<01:33,  3.84it/s]

"['stockholdersequity'] not in index"


 30%|████████████████████████████████████████████▉                                                                                                           | 145/490 [00:50<02:03,  2.79it/s]

"['propertyplantandequipmentnet'] not in index"


 30%|█████████████████████████████████████████████▌                                                                                                          | 147/490 [00:51<01:58,  2.90it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 35%|█████████████████████████████████████████████████████                                                                                                   | 171/490 [01:00<02:05,  2.55it/s]

"['retainedearningsaccumulateddeficit'] not in index"


 36%|█████████████████████████████████████████████████████▉                                                                                                  | 174/490 [01:01<02:18,  2.28it/s]

"['propertyplantandequipmentnet'] not in index"


 36%|██████████████████████████████████████████████████████▎                                                                                                 | 175/490 [01:02<02:10,  2.41it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 36%|██████████████████████████████████████████████████████▉                                                                                                 | 177/490 [01:02<01:43,  3.04it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 37%|███████████████████████████████████████████████████████▌                                                                                                | 179/490 [01:03<01:31,  3.39it/s]

"['propertyplantandequipmentnet'] not in index"


 37%|███████████████████████████████████████████████████████▊                                                                                                | 180/490 [01:03<01:45,  2.94it/s]

"['propertyplantandequipmentnet'] not in index"


 37%|████████████████████████████████████████████████████████▊                                                                                               | 183/490 [01:05<02:25,  2.12it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 38%|█████████████████████████████████████████████████████████▋                                                                                              | 186/490 [01:06<01:44,  2.90it/s]

"['stockholdersequity'] not in index"


 39%|██████████████████████████████████████████████████████████▋                                                                                             | 189/490 [01:07<01:22,  3.65it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet', 'incometaxexpensebenefit'] not in index"


 39%|███████████████████████████████████████████████████████████▏                                                                                            | 191/490 [01:08<02:09,  2.31it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 40%|█████████████████████████████████████████████████████████████                                                                                           | 197/490 [01:10<01:42,  2.85it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 43%|█████████████████████████████████████████████████████████████████▊                                                                                      | 212/490 [01:16<01:59,  2.32it/s]

"['propertyplantandequipmentnet'] not in index"


 44%|███████████████████████████████████████████████████████████████████                                                                                     | 216/490 [01:18<02:25,  1.89it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 45%|███████████████████████████████████████████████████████████████████▉                                                                                    | 219/490 [01:19<01:58,  2.30it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 45%|████████████████████████████████████████████████████████████████████▌                                                                                   | 221/490 [01:20<01:47,  2.51it/s]

"['earningspersharebasic', 'earningspersharediluted'] not in index"


 47%|██████████████████████████████████████████████████████████████████████▋                                                                                 | 228/490 [01:22<01:23,  3.13it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 49%|█████████████████████████████████████████████████████████████████████████▊                                                                              | 238/490 [01:26<01:23,  3.01it/s]

"['stockholdersequity'] not in index"


 52%|██████████████████████████████████████████████████████████████████████████████▊                                                                         | 254/490 [01:31<01:01,  3.87it/s]

"['accumulatedothercomprehensiveincomelossnetoftax'] not in index"
"['accumulatedothercomprehensiveincomelossnetoftax'] not in index"


 52%|███████████████████████████████████████████████████████████████████████████████▍                                                                        | 256/490 [01:31<01:06,  3.50it/s]

"['stockholdersequity'] not in index"


 53%|████████████████████████████████████████████████████████████████████████████████▉                                                                       | 261/490 [01:34<01:56,  1.96it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 54%|█████████████████████████████████████████████████████████████████████████████████▉                                                                      | 264/490 [01:35<01:35,  2.36it/s]

"['propertyplantandequipmentnet'] not in index"


 56%|█████████████████████████████████████████████████████████████████████████████████████▎                                                                  | 275/490 [01:39<01:13,  2.92it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 56%|█████████████████████████████████████████████████████████████████████████████████████▌                                                                  | 276/490 [01:40<01:24,  2.52it/s]

"['propertyplantandequipmentnet'] not in index"


 57%|███████████████████████████████████████████████████████████████████████████████████████▏                                                                | 281/490 [01:42<01:29,  2.33it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 60%|██████████████████████████████████████████████████████████████████████████████████████████▉                                                             | 293/490 [01:46<01:10,  2.81it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 60%|███████████████████████████████████████████████████████████████████████████████████████████▊                                                            | 296/490 [01:47<00:58,  3.34it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 61%|█████████████████████████████████████████████████████████████████████████████████████████████                                                           | 300/490 [01:48<00:58,  3.25it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 61%|█████████████████████████████████████████████████████████████████████████████████████████████▎                                                          | 301/490 [01:49<01:31,  2.07it/s]

"['propertyplantandequipmentnet'] not in index"


 63%|███████████████████████████████████████████████████████████████████████████████████████████████▌                                                        | 308/490 [01:51<00:48,  3.76it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 63%|████████████████████████████████████████████████████████████████████████████████████████████████▍                                                       | 311/490 [01:52<01:00,  2.94it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 64%|█████████████████████████████████████████████████████████████████████████████████████████████████▍                                                      | 314/490 [01:53<00:50,  3.48it/s]

"['earningspersharebasic', 'earningspersharediluted'] not in index"


 66%|████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                   | 325/490 [01:57<00:59,  2.79it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 68%|██████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                 | 331/490 [01:59<00:59,  2.69it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 68%|███████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                | 335/490 [02:01<00:59,  2.62it/s]

"['stockholdersequity'] not in index"


 69%|████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                               | 338/490 [02:02<00:50,  3.00it/s]

"['accumulatedothercomprehensiveincomelossnetoftax', 'propertyplantandequipmentnet'] not in index"


 70%|██████████████████████████████████████████████████████████████████████████████████████████████████████████                                              | 342/490 [02:03<00:38,  3.80it/s]

"['accumulatedothercomprehensiveincomelossnetoftax'] not in index"


 71%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                           | 350/490 [02:05<00:41,  3.37it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 74%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                       | 363/490 [02:09<00:45,  2.82it/s]

"['accumulatedothercomprehensiveincomelossnetoftax'] not in index"


 74%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                      | 365/490 [02:10<00:47,  2.66it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 75%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                     | 369/490 [02:12<00:50,  2.40it/s]

"['stockholdersequity'] not in index"


 76%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                     | 370/490 [02:12<00:48,  2.46it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 76%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                    | 373/490 [02:14<00:57,  2.05it/s]

"['propertyplantandequipmentnet'] not in index"


 77%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                   | 375/490 [02:15<00:46,  2.48it/s]

"['propertyplantandequipmentnet'] not in index"


 78%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                 | 382/490 [02:17<00:36,  2.97it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                | 385/490 [02:18<00:43,  2.41it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                | 386/490 [02:19<00:41,  2.50it/s]

"['retainedearningsaccumulateddeficit'] not in index"


 83%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                          | 406/490 [02:26<00:34,  2.43it/s]

"['entitycommonstocksharesoutstanding', 'propertyplantandequipmentnet'] not in index"


 85%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                       | 415/490 [02:30<00:35,  2.09it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 85%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                      | 418/490 [02:31<00:21,  3.34it/s]

"['accumulatedothercomprehensiveincomelossnetoftax', 'propertyplantandequipmentnet'] not in index"


 86%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                     | 420/490 [02:31<00:19,  3.62it/s]

"['retainedearningsaccumulateddeficit'] not in index"


 86%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                     | 422/490 [02:32<00:19,  3.53it/s]

"['retainedearningsaccumulateddeficit'] not in index"


 89%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                | 438/490 [02:37<00:15,  3.28it/s]

"['cashandcashequivalentsatcarryingvalue', 'propertyplantandequipmentnet'] not in index"


 90%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍               | 440/490 [02:38<00:17,  2.86it/s]

"['stockholdersequity'] not in index"


 90%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍              | 443/490 [02:38<00:13,  3.57it/s]

"['entitycommonstocksharesoutstanding', 'weightedaveragenumberofsharesoutstandingbasic', 'earningspersharebasic'] not in index"


 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎             | 446/490 [02:40<00:15,  2.76it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋             | 447/490 [02:40<00:13,  3.11it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 92%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌            | 450/490 [02:41<00:13,  3.06it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 92%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌           | 453/490 [02:42<00:11,  3.23it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 93%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏          | 455/490 [02:42<00:11,  2.93it/s]

"['propertyplantandequipmentnet'] not in index"


 94%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌        | 463/490 [02:45<00:08,  3.23it/s]

"['entitycommonstocksharesoutstanding', 'weightedaveragenumberofsharesoutstandingbasic', 'earningspersharebasic', 'earningspersharediluted', 'weightedaveragenumberofdilutedsharesoutstanding', 'stockholdersequity'] not in index"


 95%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉        | 464/490 [02:46<00:08,  3.11it/s]

"['propertyplantandequipmentnet'] not in index"


 97%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋     | 473/490 [02:49<00:08,  1.96it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 97%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████     | 474/490 [02:50<00:07,  2.03it/s]

"['propertyplantandequipmentnet'] not in index"


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋| 489/490 [02:56<00:00,  1.89it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 490/490 [02:56<00:00,  2.78it/s]


In [14]:
prediction_slice = data[data["year"]>=start_date.year-2].copy().reset_index(drop=True)
prediction_slice_quarterly = prediction_slice.copy().groupby(["year","quarter","ticker"]).mean().reset_index()

In [18]:
for strat in strategies.keys():
    try:
        factors = strategies[strat]
        strat_db = ADatabase(strat)
        strat_db.connect()
        models = strat_db.retrieve("models")
        simulation = umod.recommend(models,prediction_slice_quarterly.copy(),factors)
        simulation[f"{strat}_prediction"] = (simulation["cat_prediction"] + simulation["xgb_prediction"]) / 2
        strat_db.drop("predictions")
        strat_db.store("predictions",simulation)
        strat_db.disconnect()
    except Exception as e:
        print(str(e))