In [1]:
from functional.backtester import Backtester as b
from modeler.modeler import Modeler as m
from processor.processor import Processor as p
from database.market import Market
from database.sec import SEC
from database.adatabase import ADatabase
from modeler_strats.universal_modeler import UniversalModeler
from transformer.adhoc_transforms import Adhoc as adhocs
from transformer.risk_transforms import Risk as risks
from transformer.analysis_transforms import Analysis as anas
from transformer.financial_transforms import Financial as financial

import numpy as np
import matplotlib.pyplot as plt
import pickle
import math
from statistics import variance
from datetime import datetime, timedelta
import pytz
import pandas as pd
from tqdm import tqdm

In [2]:
start_date = datetime(2023,1,1)
end_date = datetime.now()

In [3]:
market = Market()
sec = SEC()
fin_db = ADatabase("financial")
earnings_db = ADatabase("earnings")
dividends_db = ADatabase("dividends")
speculation_db = ADatabase("spec")
classification_db = ADatabase("spec_classification")
current_db = ADatabase("financial_current")
umod = UniversalModeler()

In [4]:
tyields = adhocs.tyields()
bench_returns = adhocs.spy_bench()

In [5]:
market.connect()
sp500 = market.retrieve("sp500")
sp500 = sp500.rename(columns={"Symbol":"ticker"})
market.disconnect()

In [6]:
financial_factors = ['assets',
 'liabilitiesandstockholdersequity',
 'incometaxexpensebenefit',
 'retainedearningsaccumulateddeficit',
 'accumulatedothercomprehensiveincomelossnetoftax',
 'earningspersharebasic',
 'earningspersharediluted',
 'propertyplantandequipmentnet',
 'cashandcashequivalentsatcarryingvalue',
 'entitycommonstocksharesoutstanding',
 'weightedaveragenumberofdilutedsharesoutstanding',
 'weightedaveragenumberofsharesoutstandingbasic',
 'stockholdersequity']

In [7]:
dividend_factors = ['assets',
 'liabilitiesandstockholdersequity',
 'incometaxexpensebenefit',
 'retainedearningsaccumulateddeficit',
 'accumulatedothercomprehensiveincomelossnetoftax',
 'earningspersharebasic',
 'earningspersharediluted',
 'propertyplantandequipmentnet',
 'cashandcashequivalentsatcarryingvalue',
 'entitycommonstocksharesoutstanding',
 'weightedaveragenumberofdilutedsharesoutstanding',
 'weightedaveragenumberofsharesoutstandingbasic',
 'stockholdersequity',
"commonstockdividendspersharecashpaid"]

In [8]:
included_columns=[
    "year",
    "quarter",
    "week",
    "ticker",
    "adjclose"
]
included_columns.extend(financial_factors)
included_columns.extend(dividend_factors)
included_columns = list(set(included_columns))

In [9]:
training_sets = []
sec.connect()
market.connect()
for ticker in tqdm(sp500["ticker"].unique()):
    try:
        cik = int(sp500[sp500["ticker"]==ticker]["CIK"])
        prices = market.retrieve_ticker_prices("prices",ticker)
        prices = p.column_date_processing(prices)
        filing = sec.retrieve_filing_data(cik)
        filing = p.column_date_processing(filing)
        ticker_data = financial.transform(prices,filing)
        ticker_data = ticker_data[included_columns]
        training_sets.append(ticker_data)
    except Exception as e:
        print(str(e))
        continue
sec.disconnect()
market.disconnect()
data = pd.concat(training_sets)

  1%|█▉                                                                                                                                                        | 6/490 [00:01<01:53,  4.25it/s]

"['entitycommonstocksharesoutstanding'] not in index"


  2%|██▌                                                                                                                                                       | 8/490 [00:02<02:16,  3.53it/s]

"['stockholdersequity'] not in index"


  4%|█████▉                                                                                                                                                   | 19/490 [00:05<02:36,  3.01it/s]

"['incometaxexpensebenefit'] not in index"


  5%|███████▏                                                                                                                                                 | 23/490 [00:07<02:33,  3.05it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


  5%|███████▍                                                                                                                                                 | 24/490 [00:07<02:23,  3.25it/s]

"['weightedaveragenumberofsharesoutstandingbasic', 'weightedaveragenumberofdilutedsharesoutstanding'] not in index"


  7%|█████████▉                                                                                                                                               | 32/490 [00:10<03:11,  2.40it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


  7%|██████████▎                                                                                                                                              | 33/490 [00:11<03:53,  1.96it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 10%|███████████████▎                                                                                                                                         | 49/490 [00:16<02:13,  3.31it/s]

"['weightedaveragenumberofdilutedsharesoutstanding'] not in index"


 10%|███████████████▉                                                                                                                                         | 51/490 [00:17<02:38,  2.77it/s]

"['stockholdersequity'] not in index"


 11%|█████████████████▏                                                                                                                                       | 55/490 [00:18<02:14,  3.24it/s]

"['propertyplantandequipmentnet'] not in index"


 12%|█████████████████▊                                                                                                                                       | 57/490 [00:19<02:03,  3.51it/s]

"['weightedaveragenumberofsharesoutstandingbasic'] not in index"


 13%|████████████████████▎                                                                                                                                    | 65/490 [00:22<02:18,  3.07it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 15%|██████████████████████▊                                                                                                                                  | 73/490 [00:25<02:38,  2.62it/s]

"['incometaxexpensebenefit', 'propertyplantandequipmentnet'] not in index"


 15%|███████████████████████                                                                                                                                  | 74/490 [00:25<02:48,  2.47it/s]

"['stockholdersequity'] not in index"


 17%|█████████████████████████▌                                                                                                                               | 82/490 [00:28<02:07,  3.21it/s]

"['incometaxexpensebenefit', 'retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 17%|██████████████████████████▏                                                                                                                              | 84/490 [00:29<03:26,  1.97it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 18%|██████████████████████████▊                                                                                                                              | 86/490 [00:29<02:34,  2.62it/s]

"['stockholdersequity'] not in index"


 18%|████████████████████████████                                                                                                                             | 90/490 [00:30<02:08,  3.12it/s]

"['stockholdersequity'] not in index"


 22%|████████████████████████████████▉                                                                                                                       | 106/490 [00:36<02:00,  3.19it/s]

"['weightedaveragenumberofsharesoutstandingbasic'] not in index"


 22%|██████████████████████████████████                                                                                                                      | 110/490 [00:37<02:43,  2.32it/s]

"['propertyplantandequipmentnet'] not in index"


 23%|███████████████████████████████████                                                                                                                     | 113/490 [00:38<02:16,  2.75it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 24%|████████████████████████████████████▌                                                                                                                   | 118/490 [00:40<02:02,  3.03it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 24%|████████████████████████████████████▉                                                                                                                   | 119/490 [00:41<02:16,  2.71it/s]

"['stockholdersequity'] not in index"


 25%|██████████████████████████████████████▍                                                                                                                 | 124/490 [00:42<02:00,  3.03it/s]

"['earningspersharediluted', 'weightedaveragenumberofsharesoutstandingbasic', 'weightedaveragenumberofdilutedsharesoutstanding', 'entitycommonstocksharesoutstanding', 'earningspersharebasic'] not in index"


 27%|████████████████████████████████████████▉                                                                                                               | 132/490 [00:45<01:30,  3.95it/s]

"['stockholdersequity'] not in index"


 30%|████████████████████████████████████████████▉                                                                                                           | 145/490 [00:49<02:00,  2.87it/s]

"['propertyplantandequipmentnet'] not in index"


 30%|█████████████████████████████████████████████▌                                                                                                          | 147/490 [00:50<01:55,  2.98it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 35%|█████████████████████████████████████████████████████                                                                                                   | 171/490 [00:59<02:03,  2.59it/s]

"['retainedearningsaccumulateddeficit'] not in index"


 36%|█████████████████████████████████████████████████████▉                                                                                                  | 174/490 [01:00<02:15,  2.33it/s]

"['propertyplantandequipmentnet'] not in index"


 36%|██████████████████████████████████████████████████████▎                                                                                                 | 175/490 [01:00<02:08,  2.45it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 36%|██████████████████████████████████████████████████████▉                                                                                                 | 177/490 [01:01<01:41,  3.09it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 37%|███████████████████████████████████████████████████████▌                                                                                                | 179/490 [01:01<01:29,  3.47it/s]

"['propertyplantandequipmentnet'] not in index"


 37%|███████████████████████████████████████████████████████▊                                                                                                | 180/490 [01:02<01:43,  2.99it/s]

"['propertyplantandequipmentnet'] not in index"


 37%|████████████████████████████████████████████████████████▊                                                                                               | 183/490 [01:04<02:21,  2.17it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 38%|█████████████████████████████████████████████████████████▋                                                                                              | 186/490 [01:05<01:42,  2.98it/s]

"['stockholdersequity'] not in index"


 39%|██████████████████████████████████████████████████████████▋                                                                                             | 189/490 [01:05<01:20,  3.76it/s]

"['incometaxexpensebenefit', 'retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 39%|███████████████████████████████████████████████████████████▏                                                                                            | 191/490 [01:06<02:06,  2.37it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 40%|█████████████████████████████████████████████████████████████                                                                                           | 197/490 [01:08<01:41,  2.89it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 43%|█████████████████████████████████████████████████████████████████▊                                                                                      | 212/490 [01:14<01:57,  2.36it/s]

"['propertyplantandequipmentnet'] not in index"


 44%|███████████████████████████████████████████████████████████████████                                                                                     | 216/490 [01:16<02:22,  1.92it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 45%|███████████████████████████████████████████████████████████████████▉                                                                                    | 219/490 [01:17<01:56,  2.34it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 45%|████████████████████████████████████████████████████████████████████▌                                                                                   | 221/490 [01:18<01:44,  2.58it/s]

"['earningspersharediluted', 'earningspersharebasic'] not in index"


 47%|██████████████████████████████████████████████████████████████████████▋                                                                                 | 228/490 [01:20<01:22,  3.19it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 49%|█████████████████████████████████████████████████████████████████████████▊                                                                              | 238/490 [01:24<01:21,  3.08it/s]

"['stockholdersequity'] not in index"


 52%|██████████████████████████████████████████████████████████████████████████████▊                                                                         | 254/490 [01:29<00:59,  3.96it/s]

"['accumulatedothercomprehensiveincomelossnetoftax'] not in index"
"['accumulatedothercomprehensiveincomelossnetoftax'] not in index"


 52%|███████████████████████████████████████████████████████████████████████████████▍                                                                        | 256/490 [01:29<01:05,  3.56it/s]

"['stockholdersequity'] not in index"


 53%|████████████████████████████████████████████████████████████████████████████████▉                                                                       | 261/490 [01:32<01:53,  2.02it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 54%|█████████████████████████████████████████████████████████████████████████████████▉                                                                      | 264/490 [01:33<01:33,  2.42it/s]

"['propertyplantandequipmentnet'] not in index"


 56%|█████████████████████████████████████████████████████████████████████████████████████▎                                                                  | 275/490 [01:37<01:12,  2.97it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 56%|█████████████████████████████████████████████████████████████████████████████████████▌                                                                  | 276/490 [01:37<01:22,  2.58it/s]

"['propertyplantandequipmentnet'] not in index"


 57%|███████████████████████████████████████████████████████████████████████████████████████▏                                                                | 281/490 [01:39<01:27,  2.38it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 60%|██████████████████████████████████████████████████████████████████████████████████████████▉                                                             | 293/490 [01:44<01:08,  2.87it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 60%|███████████████████████████████████████████████████████████████████████████████████████████▊                                                            | 296/490 [01:44<00:57,  3.39it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 61%|█████████████████████████████████████████████████████████████████████████████████████████████                                                           | 300/490 [01:46<00:57,  3.30it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 61%|█████████████████████████████████████████████████████████████████████████████████████████████▎                                                          | 301/490 [01:47<01:29,  2.11it/s]

"['propertyplantandequipmentnet'] not in index"


 63%|███████████████████████████████████████████████████████████████████████████████████████████████▌                                                        | 308/490 [01:49<00:47,  3.86it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 63%|████████████████████████████████████████████████████████████████████████████████████████████████▍                                                       | 311/490 [01:50<00:59,  2.99it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 64%|█████████████████████████████████████████████████████████████████████████████████████████████████▍                                                      | 314/490 [01:50<00:49,  3.56it/s]

"['earningspersharediluted', 'earningspersharebasic'] not in index"


 66%|████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                   | 325/490 [01:55<00:57,  2.85it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 68%|██████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                 | 331/490 [01:57<00:57,  2.76it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 68%|███████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                | 335/490 [01:58<00:57,  2.69it/s]

"['stockholdersequity'] not in index"


 69%|████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                               | 338/490 [01:59<00:49,  3.07it/s]

"['propertyplantandequipmentnet', 'accumulatedothercomprehensiveincomelossnetoftax'] not in index"


 70%|██████████████████████████████████████████████████████████████████████████████████████████████████████████                                              | 342/490 [02:00<00:38,  3.89it/s]

"['accumulatedothercomprehensiveincomelossnetoftax'] not in index"


 71%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                           | 350/490 [02:02<00:40,  3.45it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 74%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                       | 363/490 [02:06<00:44,  2.88it/s]

"['accumulatedothercomprehensiveincomelossnetoftax'] not in index"


 74%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                      | 365/490 [02:07<00:45,  2.73it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 75%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                     | 369/490 [02:09<00:49,  2.45it/s]

"['stockholdersequity'] not in index"


 76%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                     | 370/490 [02:09<00:47,  2.50it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 76%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                    | 373/490 [02:11<00:56,  2.08it/s]

"['propertyplantandequipmentnet'] not in index"


 77%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                   | 375/490 [02:12<00:45,  2.52it/s]

"['propertyplantandequipmentnet'] not in index"


 78%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                 | 382/490 [02:14<00:35,  3.04it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                | 385/490 [02:15<00:42,  2.47it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                | 386/490 [02:16<00:40,  2.56it/s]

"['retainedearningsaccumulateddeficit'] not in index"


 83%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                          | 406/490 [02:23<00:33,  2.49it/s]

"['propertyplantandequipmentnet', 'entitycommonstocksharesoutstanding'] not in index"


 85%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                       | 415/490 [02:27<00:34,  2.15it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 85%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                      | 418/490 [02:27<00:21,  3.39it/s]

"['propertyplantandequipmentnet', 'accumulatedothercomprehensiveincomelossnetoftax'] not in index"


 86%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                     | 420/490 [02:28<00:18,  3.69it/s]

"['retainedearningsaccumulateddeficit'] not in index"


 86%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                     | 422/490 [02:28<00:18,  3.60it/s]

"['retainedearningsaccumulateddeficit'] not in index"


 89%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                | 438/490 [02:33<00:15,  3.35it/s]

"['propertyplantandequipmentnet', 'cashandcashequivalentsatcarryingvalue'] not in index"


 90%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍               | 440/490 [02:34<00:17,  2.91it/s]

"['stockholdersequity'] not in index"


 90%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍              | 443/490 [02:35<00:12,  3.66it/s]

"['weightedaveragenumberofsharesoutstandingbasic', 'entitycommonstocksharesoutstanding', 'earningspersharebasic'] not in index"


 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎             | 446/490 [02:36<00:15,  2.84it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋             | 447/490 [02:36<00:13,  3.19it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 92%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌            | 450/490 [02:37<00:12,  3.15it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 92%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌           | 453/490 [02:38<00:11,  3.34it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 93%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏          | 455/490 [02:39<00:11,  3.05it/s]

"['propertyplantandequipmentnet'] not in index"


 94%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌        | 463/490 [02:41<00:08,  3.32it/s]

"['earningspersharediluted', 'weightedaveragenumberofsharesoutstandingbasic', 'weightedaveragenumberofdilutedsharesoutstanding', 'entitycommonstocksharesoutstanding', 'stockholdersequity', 'earningspersharebasic'] not in index"


 95%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉        | 464/490 [02:42<00:08,  3.19it/s]

"['propertyplantandequipmentnet'] not in index"


 97%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋     | 473/490 [02:45<00:08,  2.01it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 97%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████     | 474/490 [02:46<00:07,  2.09it/s]

"['propertyplantandequipmentnet'] not in index"


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋| 489/490 [02:52<00:00,  1.90it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 490/490 [02:52<00:00,  2.84it/s]


In [10]:
prediction_slice = data[data["year"]>=start_date.year-2].copy().reset_index(drop=True)
prediction_slice_quarterly = prediction_slice.copy().groupby(["year","quarter","ticker"]).mean().reset_index()

In [11]:
data.sort_values(["year","quarter","week"])[["year","quarter","week"]]

Unnamed: 0,year,quarter,week
0,2000,1,7.047619
0,2000,1,7.047619
0,2000,1,7.047619
0,2000,1,7.047619
0,2000,1,7.047619
...,...,...,...
46,2023,2,17.589744
93,2023,2,17.589744
93,2023,2,17.589744
87,2023,2,17.589744


In [12]:
fin_db.connect()
financial_models = fin_db.retrieve("models")
fin_db.disconnect()

In [13]:
earnings_db.connect()
earnings_models = earnings_db.retrieve("models")
earnings_db.disconnect()

In [14]:
dividends_db.connect()
dividends_models = dividends_db.retrieve("models")
dividends_db.disconnect()

In [15]:
financial_simulation = umod.recommend(financial_models,prediction_slice_quarterly.copy(),financial_factors)
financial_simulation["financial_prediction"] = (financial_simulation["cat_prediction"] + financial_simulation["xgb_prediction"]) / 2
fin_db.connect()
fin_db.drop("predictions")
fin_db.store("predictions",financial_simulation)
fin_db.disconnect()

In [18]:
earnings_simulation = umod.recommend(earnings_models,prediction_slice_quarterly.copy(),financial_factors)
earnings_simulation["earnings_prediction"] = (earnings_simulation["cat_prediction"] + earnings_simulation["xgb_prediction"]) / 2
earnings_db.connect()
earnings_db.drop("predictions")
earnings_db.store("predictions",earnings_simulation)
earnings_db.disconnect()

In [19]:
dividends_simulation = umod.recommend(dividends_models,prediction_slice_quarterly.copy(),dividend_factors)
dividends_simulation["dividends_prediction"] = (dividends_simulation["cat_prediction"] + dividends_simulation["xgb_prediction"]) / 2
dividends_db.connect()
dividends_db.drop("predictions")
dividends_db.store("predictions",dividends_simulation)
dividends_db.disconnect()