In [18]:
import pandas as pd
from pricer.pricer import Pricer
from pricer.pricer_factory import PricerFactory
from database.market import Market
from database.sec import SEC
from database.adatabase import ADatabase
from processor.processor import Processor as p
from datetime import datetime, timedelta
from tqdm import tqdm
import numpy as np
from modeler_strats.universal_modeler import UniversalModeler

In [2]:
## initializing pricer_class
pricer_class = PricerFactory.build(Pricer.QUARTERLY_STOCK_FINANCIAL)

In [16]:
backtest_start_date = datetime(2016,1,1)
backtest_end_date = datetime(2023,1,1)

In [29]:
## creating database objects
market = Market()
sec = SEC()
modeler_strat = UniversalModeler()

In [4]:
market.connect()
sp500 = market.retrieve("sp500")
market.disconnect()
sp500 = sp500.rename(columns={"Symbol":"ticker"})

In [20]:
market.connect()
sec.connect()
training_sets = []
for ticker in tqdm(sp500["ticker"].unique()):
    try:
        cik = int(sp500[sp500["ticker"]==ticker]["CIK"])
        prices = market.retrieve_ticker_prices(pricer_class.asset_class.value,ticker)
        prices = p.column_date_processing(prices)
        filing = sec.retrieve_filing_data(cik)
        filing = p.column_date_processing(filing)
        ticker_data = pricer_class.training_set(ticker,prices,filing)
        training_sets.append(ticker_data)
    except Exception as e:
        print(str(e))
        continue
market.disconnect()
sec.disconnect()

  1%|█▉                                                                                                                                                        | 6/490 [00:01<01:53,  4.26it/s]

"['entitycommonstocksharesoutstanding'] not in index"


  2%|██▌                                                                                                                                                       | 8/490 [00:02<02:17,  3.51it/s]

"['stockholdersequity'] not in index"


  4%|█████▉                                                                                                                                                   | 19/490 [00:06<02:37,  2.98it/s]

"['incometaxexpensebenefit'] not in index"


  5%|███████▏                                                                                                                                                 | 23/490 [00:07<02:32,  3.07it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


  5%|███████▍                                                                                                                                                 | 24/490 [00:07<02:23,  3.24it/s]

"['weightedaveragenumberofdilutedsharesoutstanding', 'weightedaveragenumberofsharesoutstandingbasic'] not in index"


  7%|█████████▉                                                                                                                                               | 32/490 [00:10<03:10,  2.40it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


  7%|██████████▎                                                                                                                                              | 33/490 [00:11<03:52,  1.96it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 10%|███████████████▎                                                                                                                                         | 49/490 [00:16<02:12,  3.32it/s]

"['weightedaveragenumberofdilutedsharesoutstanding'] not in index"


 10%|███████████████▉                                                                                                                                         | 51/490 [00:17<02:39,  2.74it/s]

"['stockholdersequity'] not in index"


 11%|█████████████████▏                                                                                                                                       | 55/490 [00:18<02:14,  3.24it/s]

"['propertyplantandequipmentnet'] not in index"


 12%|█████████████████▊                                                                                                                                       | 57/490 [00:19<02:03,  3.50it/s]

"['weightedaveragenumberofsharesoutstandingbasic'] not in index"


 13%|████████████████████▎                                                                                                                                    | 65/490 [00:22<02:18,  3.06it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 15%|██████████████████████▊                                                                                                                                  | 73/490 [00:25<02:38,  2.63it/s]

"['incometaxexpensebenefit', 'propertyplantandequipmentnet'] not in index"


 15%|███████████████████████                                                                                                                                  | 74/490 [00:25<02:48,  2.47it/s]

"['stockholdersequity'] not in index"


 17%|█████████████████████████▌                                                                                                                               | 82/490 [00:28<02:05,  3.25it/s]

"['incometaxexpensebenefit', 'retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 17%|██████████████████████████▏                                                                                                                              | 84/490 [00:29<03:22,  2.01it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 18%|██████████████████████████▊                                                                                                                              | 86/490 [00:29<02:31,  2.66it/s]

"['stockholdersequity'] not in index"


 18%|████████████████████████████                                                                                                                             | 90/490 [00:30<02:05,  3.18it/s]

"['stockholdersequity'] not in index"


 22%|████████████████████████████████▉                                                                                                                       | 106/490 [00:36<01:59,  3.20it/s]

"['weightedaveragenumberofsharesoutstandingbasic'] not in index"


 22%|██████████████████████████████████                                                                                                                      | 110/490 [00:37<02:43,  2.32it/s]

"['propertyplantandequipmentnet'] not in index"


 23%|███████████████████████████████████                                                                                                                     | 113/490 [00:38<02:17,  2.74it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 24%|████████████████████████████████████▌                                                                                                                   | 118/490 [00:40<02:04,  2.98it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 24%|████████████████████████████████████▉                                                                                                                   | 119/490 [00:41<02:18,  2.67it/s]

"['stockholdersequity'] not in index"


 25%|██████████████████████████████████████▍                                                                                                                 | 124/490 [00:42<01:57,  3.11it/s]

"['earningspersharebasic', 'earningspersharediluted', 'entitycommonstocksharesoutstanding', 'weightedaveragenumberofdilutedsharesoutstanding', 'weightedaveragenumberofsharesoutstandingbasic'] not in index"


 27%|████████████████████████████████████████▉                                                                                                               | 132/490 [00:44<01:30,  3.96it/s]

"['stockholdersequity'] not in index"


 30%|████████████████████████████████████████████▉                                                                                                           | 145/490 [00:49<01:59,  2.88it/s]

"['propertyplantandequipmentnet'] not in index"


 30%|█████████████████████████████████████████████▌                                                                                                          | 147/490 [00:50<01:54,  2.98it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 35%|█████████████████████████████████████████████████████                                                                                                   | 171/490 [00:58<02:01,  2.62it/s]

"['retainedearningsaccumulateddeficit'] not in index"


 36%|█████████████████████████████████████████████████████▉                                                                                                  | 174/490 [01:00<02:14,  2.35it/s]

"['propertyplantandequipmentnet'] not in index"


 36%|██████████████████████████████████████████████████████▎                                                                                                 | 175/490 [01:00<02:08,  2.46it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 36%|██████████████████████████████████████████████████████▉                                                                                                 | 177/490 [01:01<01:40,  3.10it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 37%|███████████████████████████████████████████████████████▌                                                                                                | 179/490 [01:01<01:29,  3.48it/s]

"['propertyplantandequipmentnet'] not in index"


 37%|███████████████████████████████████████████████████████▊                                                                                                | 180/490 [01:01<01:42,  3.02it/s]

"['propertyplantandequipmentnet'] not in index"


 37%|████████████████████████████████████████████████████████▊                                                                                               | 183/490 [01:04<02:20,  2.19it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 38%|█████████████████████████████████████████████████████████▋                                                                                              | 186/490 [01:04<01:41,  3.00it/s]

"['stockholdersequity'] not in index"


 39%|██████████████████████████████████████████████████████████▋                                                                                             | 189/490 [01:05<01:19,  3.78it/s]

"['incometaxexpensebenefit', 'retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 39%|███████████████████████████████████████████████████████████▏                                                                                            | 191/490 [01:06<02:04,  2.41it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 40%|█████████████████████████████████████████████████████████████                                                                                           | 197/490 [01:08<01:39,  2.95it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 43%|█████████████████████████████████████████████████████████████████▊                                                                                      | 212/490 [01:14<01:56,  2.38it/s]

"['propertyplantandequipmentnet'] not in index"


 44%|███████████████████████████████████████████████████████████████████                                                                                     | 216/490 [01:16<02:22,  1.93it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 45%|███████████████████████████████████████████████████████████████████▉                                                                                    | 219/490 [01:17<01:55,  2.35it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 45%|████████████████████████████████████████████████████████████████████▌                                                                                   | 221/490 [01:17<01:44,  2.59it/s]

"['earningspersharebasic', 'earningspersharediluted'] not in index"


 47%|██████████████████████████████████████████████████████████████████████▋                                                                                 | 228/490 [01:20<01:22,  3.19it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 49%|█████████████████████████████████████████████████████████████████████████▊                                                                              | 238/490 [01:24<01:21,  3.07it/s]

"['stockholdersequity'] not in index"


 52%|██████████████████████████████████████████████████████████████████████████████▊                                                                         | 254/490 [01:28<01:00,  3.93it/s]

"['accumulatedothercomprehensiveincomelossnetoftax'] not in index"
"['accumulatedothercomprehensiveincomelossnetoftax'] not in index"


 52%|███████████████████████████████████████████████████████████████████████████████▍                                                                        | 256/490 [01:29<01:05,  3.60it/s]

"['stockholdersequity'] not in index"


 53%|████████████████████████████████████████████████████████████████████████████████▉                                                                       | 261/490 [01:32<01:52,  2.04it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 54%|█████████████████████████████████████████████████████████████████████████████████▉                                                                      | 264/490 [01:33<01:32,  2.45it/s]

"['propertyplantandequipmentnet'] not in index"


 56%|█████████████████████████████████████████████████████████████████████████████████████▎                                                                  | 275/490 [01:37<01:11,  3.00it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 56%|█████████████████████████████████████████████████████████████████████████████████████▌                                                                  | 276/490 [01:37<01:22,  2.59it/s]

"['propertyplantandequipmentnet'] not in index"


 57%|███████████████████████████████████████████████████████████████████████████████████████▏                                                                | 281/490 [01:39<01:27,  2.39it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 60%|██████████████████████████████████████████████████████████████████████████████████████████▉                                                             | 293/490 [01:43<01:07,  2.90it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 60%|███████████████████████████████████████████████████████████████████████████████████████████▊                                                            | 296/490 [01:44<00:56,  3.42it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 61%|█████████████████████████████████████████████████████████████████████████████████████████████                                                           | 300/490 [01:45<00:56,  3.33it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 61%|█████████████████████████████████████████████████████████████████████████████████████████████▎                                                          | 301/490 [01:46<01:28,  2.14it/s]

"['propertyplantandequipmentnet'] not in index"


 63%|███████████████████████████████████████████████████████████████████████████████████████████████▌                                                        | 308/490 [01:48<00:47,  3.87it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 63%|████████████████████████████████████████████████████████████████████████████████████████████████▍                                                       | 311/490 [01:49<00:58,  3.04it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 64%|█████████████████████████████████████████████████████████████████████████████████████████████████▍                                                      | 314/490 [01:50<00:48,  3.60it/s]

"['earningspersharebasic', 'earningspersharediluted'] not in index"


 66%|████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                   | 325/490 [01:54<00:58,  2.84it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 68%|██████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                 | 331/490 [01:56<00:57,  2.78it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 68%|███████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                | 335/490 [01:58<00:57,  2.71it/s]

"['stockholdersequity'] not in index"


 69%|████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                               | 338/490 [01:59<00:49,  3.09it/s]

"['accumulatedothercomprehensiveincomelossnetoftax', 'propertyplantandequipmentnet'] not in index"


 70%|██████████████████████████████████████████████████████████████████████████████████████████████████████████                                              | 342/490 [02:00<00:38,  3.86it/s]

"['accumulatedothercomprehensiveincomelossnetoftax'] not in index"


 71%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                           | 350/490 [02:02<00:40,  3.47it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 74%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                       | 363/490 [02:06<00:43,  2.94it/s]

"['accumulatedothercomprehensiveincomelossnetoftax'] not in index"


 74%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                      | 365/490 [02:07<00:45,  2.73it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 75%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                     | 369/490 [02:08<00:48,  2.48it/s]

"['stockholdersequity'] not in index"


 76%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                     | 370/490 [02:09<00:47,  2.54it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 76%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                    | 373/490 [02:10<00:55,  2.11it/s]

"['propertyplantandequipmentnet'] not in index"


 77%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                   | 375/490 [02:11<00:45,  2.55it/s]

"['propertyplantandequipmentnet'] not in index"


 78%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                 | 382/490 [02:13<00:35,  3.06it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                | 385/490 [02:15<00:41,  2.50it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                | 386/490 [02:15<00:40,  2.60it/s]

"['retainedearningsaccumulateddeficit'] not in index"


 83%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                          | 406/490 [02:22<00:33,  2.51it/s]

"['propertyplantandequipmentnet', 'entitycommonstocksharesoutstanding'] not in index"


 85%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                       | 415/490 [02:26<00:34,  2.17it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 85%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                      | 418/490 [02:27<00:21,  3.42it/s]

"['accumulatedothercomprehensiveincomelossnetoftax', 'propertyplantandequipmentnet'] not in index"


 86%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                     | 420/490 [02:27<00:18,  3.69it/s]

"['retainedearningsaccumulateddeficit'] not in index"


 86%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                     | 422/490 [02:28<00:18,  3.60it/s]

"['retainedearningsaccumulateddeficit'] not in index"


 89%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                | 438/490 [02:33<00:15,  3.32it/s]

"['propertyplantandequipmentnet', 'cashandcashequivalentsatcarryingvalue'] not in index"


 90%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍               | 440/490 [02:33<00:17,  2.90it/s]

"['stockholdersequity'] not in index"


 90%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍              | 443/490 [02:34<00:12,  3.65it/s]

"['earningspersharebasic', 'entitycommonstocksharesoutstanding', 'weightedaveragenumberofsharesoutstandingbasic'] not in index"


 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎             | 446/490 [02:35<00:15,  2.81it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋             | 447/490 [02:36<00:13,  3.17it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 92%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌            | 450/490 [02:37<00:12,  3.14it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 92%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌           | 453/490 [02:37<00:11,  3.32it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 93%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏          | 455/490 [02:38<00:11,  3.03it/s]

"['propertyplantandequipmentnet'] not in index"


 94%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌        | 463/490 [02:41<00:08,  3.31it/s]

"['earningspersharebasic', 'earningspersharediluted', 'entitycommonstocksharesoutstanding', 'weightedaveragenumberofdilutedsharesoutstanding', 'weightedaveragenumberofsharesoutstandingbasic', 'stockholdersequity'] not in index"


 95%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉        | 464/490 [02:41<00:08,  3.20it/s]

"['propertyplantandequipmentnet'] not in index"


 97%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋     | 473/490 [02:45<00:08,  2.03it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 97%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████     | 474/490 [02:45<00:07,  2.11it/s]

"['propertyplantandequipmentnet'] not in index"


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋| 489/490 [02:51<00:00,  1.95it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 490/490 [02:51<00:00,  2.86it/s]


In [21]:
data = pd.concat(training_sets)

In [25]:
training_data = data.dropna().copy().sort_values(["year","quarter"])

In [26]:
training_data

Unnamed: 0,assets,liabilitiesandstockholdersequity,incometaxexpensebenefit,retainedearningsaccumulateddeficit,accumulatedothercomprehensiveincomelossnetoftax,earningspersharebasic,earningspersharediluted,propertyplantandequipmentnet,cashandcashequivalentsatcarryingvalue,entitycommonstocksharesoutstanding,weightedaveragenumberofdilutedsharesoutstanding,weightedaveragenumberofsharesoutstandingbasic,stockholdersequity,year,quarter,ticker,adjclose,y
48,2.967400e+10,3.088600e+10,1.551333e+09,2.717150e+10,-4.284000e+09,2.555455,2.519091,7.472500e+09,2.621250e+09,6.945438e+08,7.170667e+08,7.075667e+08,1.554150e+10,2012,1,MMM,62.705929,75.359447
48,5.781079e+10,5.781079e+10,1.001597e+09,1.915527e+10,-1.036652e+09,1.295333,1.286000,7.821467e+09,5.845638e+09,1.572357e+09,1.559512e+09,1.550342e+09,2.342031e+10,2012,1,ABT,21.876468,27.886848
48,1.361070e+08,1.361070e+08,4.665000e+05,-2.753060e+08,-1.145500e+06,-0.060000,-0.062500,6.343000e+06,4.976000e+06,3.899407e+07,3.820800e+07,3.776500e+07,1.112605e+08,2012,1,ABMD,20.784597,14.939677
48,8.814056e+09,8.814056e+09,1.484770e+08,6.383864e+09,3.101900e+07,0.530909,0.525227,5.135792e+08,8.832672e+08,4.949645e+08,5.129899e+08,5.063682e+08,5.476906e+09,2012,1,ADBE,32.043629,39.490917
48,3.336135e+10,3.336135e+10,2.682250e+08,1.195825e+10,3.533000e+08,0.997500,0.987500,7.120500e+08,1.417425e+09,4.905759e+08,4.945000e+08,4.894250e+08,6.096400e+09,2012,1,ADP,37.387025,42.938299
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
41,8.245333e+09,8.513000e+09,4.333333e+07,2.042000e+09,-3.920000e+08,2.003333,1.986667,6.505000e+08,1.061000e+09,1.799011e+08,1.812737e+08,1.801167e+08,3.093000e+09,2022,1,XYL,94.415087,104.252934
88,5.795000e+09,5.795000e+09,8.033333e+07,3.154500e+09,-4.900000e+07,11.723333,11.613333,2.730000e+08,1.766667e+08,5.307974e+07,5.413670e+07,5.362634e+07,2.075500e+09,2022,1,ZBRA,459.417581,302.155806
82,2.393705e+10,2.393705e+10,-1.154667e+08,1.018955e+10,-2.647000e+08,2.260000,2.236667,2.032100e+09,6.403000e+08,2.091774e+08,2.080333e+08,2.069000e+08,1.242745e+10,2022,1,ZBH,119.336857,125.327806
89,7.604651e+09,7.604651e+09,4.597550e+07,4.760722e+09,2.521667e+06,1.610000,1.600000,1.520187e+09,8.111307e+08,1.118816e+08,1.153655e+08,1.143420e+08,1.892206e+09,2022,2,TSCO,199.983109,232.826575


In [36]:
pricer_class.db.connect()
model_start_date = backtest_start_date - timedelta(pricer_class.time_horizon_class.model_date_offset)
model_end_date = backtest_end_date - timedelta(pricer_class.time_horizon_class.model_date_offset)
for year in range(model_start_date.year,model_end_date.year):
    training_slice = training_data[(training_data["year"]<year) & (training_data["year"] >= year - 4)].reset_index(drop=True)
    prediction_set = training_data[training_data["year"]==year].reset_index(drop=True)
    stuff = modeler_strat.model(training_slice,prediction_set,pricer_class.factors,False)
    stuff = stuff.rename(columns={"prediction":f"price_prediction"})
    relevant_columns = list(set(list(stuff.columns)) - set(pricer_class.factors))
    stuff = pricer_class.sim_processor(stuff)
    pricer_class.db.store("sim",stuff[relevant_columns])
pricer_class.db.disconnect()

2015 3237 1142
2016 4379 1151
2017 4493 1178
2018 4599 1188
2019 4659 1185
2020 4702 1113
2021 4664 1064
