In [15]:
import pandas as pd
from database.market import Market
from database.sec import SEC
from database.adatabase import ADatabase
from processor.processor import Processor as p
from datetime import datetime
from tqdm import tqdm
import numpy as np
from modeler_strats.universal_modeler import UniversalModeler
import pickle

In [16]:
current_year = 2023

In [17]:
market = Market()
fin = ADatabase("financial")
umod = UniversalModeler()
sec = SEC()

In [18]:
market.connect()
sp500 = market.retrieve("sp500")
market.disconnect()
sp500 = sp500.rename(columns={"Symbol":"ticker"})

In [19]:
factors = ['assets',
 'liabilitiesandstockholdersequity',
 'incometaxexpensebenefit',
 'retainedearningsaccumulateddeficit',
 'accumulatedothercomprehensiveincomelossnetoftax',
 'earningspersharebasic',
 'earningspersharediluted',
 'propertyplantandequipmentnet',
 'cashandcashequivalentsatcarryingvalue',
 'entitycommonstocksharesoutstanding',
 'weightedaveragenumberofdilutedsharesoutstanding',
 'weightedaveragenumberofsharesoutstandingbasic',
 'stockholdersequity']

In [20]:
included_columns=[
    "year",
    "week",
    "ticker",
    "adjclose",
    "y"
]

In [21]:
included_columns.extend(factors)

In [22]:
training_sets = []

In [23]:
market.connect()
sec.connect()
training_sets = []
for ticker in tqdm(sp500["ticker"].unique()):
    try:
        cik = int(sp500[sp500["ticker"]==ticker]["CIK"])
        prices = market.retrieve_ticker_prices("prices",ticker)
        prices = p.column_date_processing(prices)
        prices["year"] = [x.year for x in prices["date"]]
        prices["quarter"] = [x.quarter for x in prices["date"]]
        filing = sec.retrieve_filing_data(cik)
        filing = p.column_date_processing(filing)
        filing = filing.groupby(["year","quarter"]).mean().reset_index()
        ticker_data = prices.copy()
        ticker_data.sort_values("date",ascending=True,inplace=True)
        ticker_data["adjclose"] = [float(x) for x in ticker_data["adjclose"]]
        ticker_data = ticker_data.groupby(["year","quarter"]).mean().reset_index()
        ticker_data.dropna(inplace=True)
        ticker_data["ticker"] = ticker
        ticker_data["y"] = ticker_data["adjclose"].shift(-4)
        ticker_data = ticker_data.merge(filing,on=["year","quarter"],how="left").reset_index()
        ticker_data = ticker_data[included_columns]
        training_sets.append(ticker_data)
    except Exception as e:
        print(str(e))
        continue
market.disconnect()
sec.disconnect()

  1%|██                                                                                                                                                                         | 6/490 [00:01<01:59,  4.06it/s]

"['entitycommonstocksharesoutstanding'] not in index"


  2%|██▊                                                                                                                                                                        | 8/490 [00:02<02:22,  3.38it/s]

"['stockholdersequity'] not in index"


  4%|██████▌                                                                                                                                                                   | 19/490 [00:06<02:45,  2.84it/s]

"['incometaxexpensebenefit'] not in index"


  5%|███████▉                                                                                                                                                                  | 23/490 [00:07<02:38,  2.95it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


  5%|████████▎                                                                                                                                                                 | 24/490 [00:07<02:28,  3.15it/s]

"['weightedaveragenumberofdilutedsharesoutstanding', 'weightedaveragenumberofsharesoutstandingbasic'] not in index"


  7%|███████████                                                                                                                                                               | 32/490 [00:10<03:14,  2.36it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


  7%|███████████▍                                                                                                                                                              | 33/490 [00:11<04:09,  1.83it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 10%|█████████████████                                                                                                                                                         | 49/490 [00:16<02:15,  3.26it/s]

"['weightedaveragenumberofdilutedsharesoutstanding'] not in index"


 10%|█████████████████▋                                                                                                                                                        | 51/490 [00:17<02:41,  2.72it/s]

"['stockholdersequity'] not in index"


 11%|███████████████████                                                                                                                                                       | 55/490 [00:19<02:17,  3.16it/s]

"['propertyplantandequipmentnet'] not in index"


 12%|███████████████████▊                                                                                                                                                      | 57/490 [00:19<02:06,  3.43it/s]

"['weightedaveragenumberofsharesoutstandingbasic'] not in index"


 13%|██████████████████████▌                                                                                                                                                   | 65/490 [00:23<02:23,  2.96it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 15%|█████████████████████████▎                                                                                                                                                | 73/490 [00:26<02:43,  2.56it/s]

"['incometaxexpensebenefit', 'propertyplantandequipmentnet'] not in index"


 15%|█████████████████████████▋                                                                                                                                                | 74/490 [00:26<02:53,  2.40it/s]

"['stockholdersequity'] not in index"


 17%|████████████████████████████▍                                                                                                                                             | 82/490 [00:29<02:09,  3.15it/s]

"['incometaxexpensebenefit', 'retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 17%|█████████████████████████████▏                                                                                                                                            | 84/490 [00:30<03:39,  1.85it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 18%|█████████████████████████████▊                                                                                                                                            | 86/490 [00:31<02:42,  2.49it/s]

"['stockholdersequity'] not in index"


 18%|███████████████████████████████▏                                                                                                                                          | 90/490 [00:32<02:09,  3.08it/s]

"['stockholdersequity'] not in index"


 22%|████████████████████████████████████▌                                                                                                                                    | 106/490 [00:37<02:14,  2.86it/s]

"['weightedaveragenumberofsharesoutstandingbasic'] not in index"


 22%|█████████████████████████████████████▉                                                                                                                                   | 110/490 [00:39<02:50,  2.23it/s]

"['propertyplantandequipmentnet'] not in index"


 23%|██████████████████████████████████████▉                                                                                                                                  | 113/490 [00:40<02:21,  2.66it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 24%|████████████████████████████████████████▋                                                                                                                                | 118/490 [00:42<02:07,  2.93it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 24%|█████████████████████████████████████████                                                                                                                                | 119/490 [00:42<02:21,  2.62it/s]

"['stockholdersequity'] not in index"


 25%|██████████████████████████████████████████▊                                                                                                                              | 124/490 [00:44<02:03,  2.95it/s]

"['earningspersharebasic', 'earningspersharediluted', 'entitycommonstocksharesoutstanding', 'weightedaveragenumberofdilutedsharesoutstanding', 'weightedaveragenumberofsharesoutstandingbasic'] not in index"


 27%|█████████████████████████████████████████████▌                                                                                                                           | 132/490 [00:46<01:33,  3.81it/s]

"['stockholdersequity'] not in index"


 30%|██████████████████████████████████████████████████                                                                                                                       | 145/490 [00:51<02:13,  2.59it/s]

"['propertyplantandequipmentnet'] not in index"


 30%|██████████████████████████████████████████████████▋                                                                                                                      | 147/490 [00:51<02:02,  2.80it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 35%|██████████████████████████████████████████████████████████▉                                                                                                              | 171/490 [01:01<02:05,  2.55it/s]

"['retainedearningsaccumulateddeficit'] not in index"


 36%|████████████████████████████████████████████████████████████                                                                                                             | 174/490 [01:02<02:19,  2.27it/s]

"['propertyplantandequipmentnet'] not in index"


 36%|████████████████████████████████████████████████████████████▎                                                                                                            | 175/490 [01:02<02:10,  2.41it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 36%|█████████████████████████████████████████████████████████████                                                                                                            | 177/490 [01:03<01:49,  2.87it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 37%|█████████████████████████████████████████████████████████████▋                                                                                                           | 179/490 [01:04<01:34,  3.29it/s]

"['propertyplantandequipmentnet'] not in index"


 37%|██████████████████████████████████████████████████████████████                                                                                                           | 180/490 [01:04<01:47,  2.88it/s]

"['propertyplantandequipmentnet'] not in index"


 37%|███████████████████████████████████████████████████████████████                                                                                                          | 183/490 [01:06<02:24,  2.12it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 38%|████████████████████████████████████████████████████████████████▏                                                                                                        | 186/490 [01:07<01:44,  2.90it/s]

"['stockholdersequity'] not in index"


 39%|█████████████████████████████████████████████████████████████████▏                                                                                                       | 189/490 [01:08<01:22,  3.64it/s]

"['incometaxexpensebenefit', 'retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 39%|█████████████████████████████████████████████████████████████████▉                                                                                                       | 191/490 [01:09<02:08,  2.32it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 40%|███████████████████████████████████████████████████████████████████▉                                                                                                     | 197/490 [01:11<01:42,  2.85it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 43%|█████████████████████████████████████████████████████████████████████████                                                                                                | 212/490 [01:17<02:00,  2.30it/s]

"['propertyplantandequipmentnet'] not in index"


 44%|██████████████████████████████████████████████████████████████████████████▍                                                                                              | 216/490 [01:19<02:25,  1.88it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 45%|███████████████████████████████████████████████████████████████████████████▌                                                                                             | 219/490 [01:20<01:58,  2.29it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 45%|████████████████████████████████████████████████████████████████████████████▏                                                                                            | 221/490 [01:20<01:47,  2.51it/s]

"['earningspersharebasic', 'earningspersharediluted'] not in index"


 47%|██████████████████████████████████████████████████████████████████████████████▋                                                                                          | 228/490 [01:23<01:24,  3.10it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 49%|██████████████████████████████████████████████████████████████████████████████████                                                                                       | 238/490 [01:27<01:24,  2.98it/s]

"['stockholdersequity'] not in index"


 52%|███████████████████████████████████████████████████████████████████████████████████████▌                                                                                 | 254/490 [01:32<01:01,  3.83it/s]

"['accumulatedothercomprehensiveincomelossnetoftax'] not in index"
"['accumulatedothercomprehensiveincomelossnetoftax'] not in index"


 52%|████████████████████████████████████████████████████████████████████████████████████████▎                                                                                | 256/490 [01:32<01:06,  3.50it/s]

"['stockholdersequity'] not in index"


 53%|██████████████████████████████████████████████████████████████████████████████████████████                                                                               | 261/490 [01:35<01:58,  1.92it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 54%|███████████████████████████████████████████████████████████████████████████████████████████                                                                              | 264/490 [01:36<01:35,  2.36it/s]

"['propertyplantandequipmentnet'] not in index"


 56%|██████████████████████████████████████████████████████████████████████████████████████████████▊                                                                          | 275/490 [01:40<01:13,  2.92it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 56%|███████████████████████████████████████████████████████████████████████████████████████████████▏                                                                         | 276/490 [01:41<01:24,  2.53it/s]

"['propertyplantandequipmentnet'] not in index"


 57%|████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                        | 281/490 [01:43<01:29,  2.34it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 60%|█████████████████████████████████████████████████████████████████████████████████████████████████████                                                                    | 293/490 [01:47<01:10,  2.81it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 60%|██████████████████████████████████████████████████████████████████████████████████████████████████████                                                                   | 296/490 [01:48<00:58,  3.31it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 61%|███████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                 | 300/490 [01:49<00:58,  3.24it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 61%|███████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                 | 301/490 [01:50<01:31,  2.06it/s]

"['propertyplantandequipmentnet'] not in index"


 63%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                              | 308/490 [01:52<00:50,  3.62it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                             | 311/490 [01:53<01:01,  2.92it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 64%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                            | 314/490 [01:54<00:50,  3.45it/s]

"['earningspersharebasic', 'earningspersharediluted'] not in index"


 66%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                         | 325/490 [01:59<00:59,  2.79it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 68%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                      | 331/490 [02:01<01:01,  2.60it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 68%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                     | 335/490 [02:02<01:00,  2.58it/s]

"['stockholdersequity'] not in index"


 69%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                    | 338/490 [02:03<00:51,  2.96it/s]

"['accumulatedothercomprehensiveincomelossnetoftax', 'propertyplantandequipmentnet'] not in index"


 70%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                   | 342/490 [02:04<00:39,  3.72it/s]

"['accumulatedothercomprehensiveincomelossnetoftax'] not in index"


 71%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                | 350/490 [02:07<00:43,  3.25it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 74%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                           | 363/490 [02:11<00:45,  2.81it/s]

"['accumulatedothercomprehensiveincomelossnetoftax'] not in index"


 74%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                           | 365/490 [02:12<00:47,  2.64it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 75%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                         | 369/490 [02:14<00:50,  2.39it/s]

"['stockholdersequity'] not in index"


 76%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                         | 370/490 [02:14<00:49,  2.45it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 76%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                        | 373/490 [02:16<00:57,  2.04it/s]

"['propertyplantandequipmentnet'] not in index"


 77%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                       | 375/490 [02:16<00:46,  2.46it/s]

"['propertyplantandequipmentnet'] not in index"


 78%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                     | 382/490 [02:19<00:37,  2.85it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 79%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                    | 385/490 [02:20<00:43,  2.39it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 79%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                   | 386/490 [02:20<00:41,  2.49it/s]

"['retainedearningsaccumulateddeficit'] not in index"


 83%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                             | 406/490 [02:28<00:35,  2.38it/s]

"['propertyplantandequipmentnet', 'entitycommonstocksharesoutstanding'] not in index"


 85%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                         | 415/490 [02:32<00:35,  2.10it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 85%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                        | 418/490 [02:33<00:21,  3.31it/s]

"['accumulatedothercomprehensiveincomelossnetoftax', 'propertyplantandequipmentnet'] not in index"


 86%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                        | 420/490 [02:33<00:19,  3.59it/s]

"['retainedearningsaccumulateddeficit'] not in index"


 86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                       | 422/490 [02:34<00:19,  3.51it/s]

"['retainedearningsaccumulateddeficit'] not in index"


 89%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                  | 438/490 [02:39<00:16,  3.24it/s]

"['propertyplantandequipmentnet', 'cashandcashequivalentsatcarryingvalue'] not in index"


 90%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                 | 440/490 [02:40<00:17,  2.82it/s]

"['stockholdersequity'] not in index"


 90%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                | 443/490 [02:40<00:13,  3.56it/s]

"['earningspersharebasic', 'entitycommonstocksharesoutstanding', 'weightedaveragenumberofsharesoutstandingbasic'] not in index"


 91%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊               | 446/490 [02:42<00:15,  2.77it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏              | 447/490 [02:42<00:15,  2.86it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 92%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏             | 450/490 [02:43<00:13,  2.97it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 92%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏            | 453/490 [02:44<00:11,  3.19it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 93%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉            | 455/490 [02:45<00:11,  2.93it/s]

"['propertyplantandequipmentnet'] not in index"


 94%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋         | 463/490 [02:47<00:08,  3.23it/s]

"['earningspersharebasic', 'earningspersharediluted', 'entitycommonstocksharesoutstanding', 'weightedaveragenumberofdilutedsharesoutstanding', 'weightedaveragenumberofsharesoutstandingbasic', 'stockholdersequity'] not in index"


 95%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████         | 464/490 [02:48<00:08,  3.10it/s]

"['propertyplantandequipmentnet'] not in index"


 97%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏     | 473/490 [02:52<00:08,  1.91it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 97%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍     | 474/490 [02:52<00:08,  1.99it/s]

"['propertyplantandequipmentnet'] not in index"


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋| 489/490 [02:58<00:00,  1.89it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 490/490 [02:58<00:00,  2.74it/s]


In [24]:
data = pd.concat(training_sets)

In [25]:
data = data.dropna()

In [26]:
fin.connect()
for modeler in [umod]:
    for year in tqdm(range(current_year,current_year+1)):
        training_slice = data[(data["year"]<year) & (data["year"] >= year - 4)].reset_index(drop=True)
        set_name = "models"
        stuff = modeler.recommend_model(training_slice,factors,tf=False)
fin.disconnect()

100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:09<00:00,  9.96s/it]


In [27]:
stuff["model"] = [pickle.dumps(x) for x in stuff["model"]]

In [28]:
fin.connect()
models = fin.store("models",stuff)
fin.disconnect()