In [1]:
import pandas as pd
from database.market import Market
from database.sec import SEC
from database.adatabase import ADatabase
from processor.processor import Processor as p
from datetime import datetime
from tqdm import tqdm
import numpy as np
from modeler_strats.universal_modeler import UniversalModeler

In [2]:
market = Market()
sec = SEC()
fin = ADatabase("financial")
umod = UniversalModeler()

In [3]:
market.connect()
sp500 = market.retrieve("sp500")
market.disconnect()
sp500 = sp500.rename(columns={"Symbol":"ticker"})

In [4]:
factors = ['assets',
 'liabilitiesandstockholdersequity',
 'incometaxexpensebenefit',
 'retainedearningsaccumulateddeficit',
 'accumulatedothercomprehensiveincomelossnetoftax',
 'earningspersharebasic',
 'earningspersharediluted',
 'propertyplantandequipmentnet',
 'cashandcashequivalentsatcarryingvalue',
 'entitycommonstocksharesoutstanding',
 'weightedaveragenumberofdilutedsharesoutstanding',
 'weightedaveragenumberofsharesoutstandingbasic',
 'stockholdersequity']

In [5]:
included_columns=[
    "year",
    "quarter",
    "ticker",
    "adjclose",
    "y"
]

In [6]:
included_columns.extend(factors)

In [None]:
market.connect()
sec.connect()
training_sets = []
for ticker in tqdm(sp500["ticker"].unique()):
    try:
        cik = int(sp500[sp500["ticker"]==ticker]["CIK"])
        prices = market.retrieve_ticker_prices("prices",ticker)
        prices = p.column_date_processing(prices)
        prices["year"] = [x.year for x in prices["date"]]
        prices["quarter"] = [x.quarter for x in prices["date"]]
        filing = sec.retrieve_filing_data(cik)
        filing = p.column_date_processing(filing)
        filing = filing.groupby(["year","quarter"]).mean().reset_index()
        ticker_data = prices.copy()
        ticker_data.sort_values("date",ascending=True,inplace=True)
        ticker_data["adjclose"] = [float(x) for x in ticker_data["adjclose"]]
        ticker_data = ticker_data.groupby(["year","quarter"]).mean().reset_index()
        ticker_data.dropna(inplace=True)
        ticker_data["ticker"] = ticker
        ticker_data["y"] = ticker_data["adjclose"].shift(-4)
        ticker_data = ticker_data.merge(filing,on=["year","quarter"],how="left").reset_index()
        ticker_data = ticker_data[included_columns]
        training_sets.append(ticker_data)
    except Exception as e:
        print(str(e))
        continue
market.disconnect()
sec.disconnect()

  1%|██                                                                                                                                                                         | 6/490 [00:01<01:56,  4.16it/s]

"['entitycommonstocksharesoutstanding'] not in index"


  2%|██▊                                                                                                                                                                        | 8/490 [00:02<02:33,  3.14it/s]

"['stockholdersequity'] not in index"


  4%|██████▌                                                                                                                                                                   | 19/490 [00:06<02:43,  2.88it/s]

"['incometaxexpensebenefit'] not in index"


  5%|███████▉                                                                                                                                                                  | 23/490 [00:07<02:37,  2.96it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


  5%|████████▎                                                                                                                                                                 | 24/490 [00:07<02:28,  3.14it/s]

"['weightedaveragenumberofdilutedsharesoutstanding', 'weightedaveragenumberofsharesoutstandingbasic'] not in index"


  7%|███████████                                                                                                                                                               | 32/490 [00:11<03:24,  2.24it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


  7%|███████████▍                                                                                                                                                              | 33/490 [00:11<04:04,  1.87it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 10%|█████████████████                                                                                                                                                         | 49/490 [00:17<02:19,  3.16it/s]

"['weightedaveragenumberofdilutedsharesoutstanding'] not in index"


 10%|█████████████████▋                                                                                                                                                        | 51/490 [00:18<02:45,  2.65it/s]

"['stockholdersequity'] not in index"


 11%|███████████████████                                                                                                                                                       | 55/490 [00:19<02:19,  3.13it/s]

"['propertyplantandequipmentnet'] not in index"


 12%|███████████████████▊                                                                                                                                                      | 57/490 [00:19<02:07,  3.41it/s]

"['weightedaveragenumberofsharesoutstandingbasic'] not in index"


 13%|██████████████████████▌                                                                                                                                                   | 65/490 [00:23<02:24,  2.93it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 15%|█████████████████████████▎                                                                                                                                                | 73/490 [00:26<02:48,  2.47it/s]

"['incometaxexpensebenefit', 'propertyplantandequipmentnet'] not in index"


 15%|█████████████████████████▋                                                                                                                                                | 74/490 [00:26<02:57,  2.34it/s]

"['stockholdersequity'] not in index"


 17%|████████████████████████████▍                                                                                                                                             | 82/490 [00:29<02:11,  3.10it/s]

"['incometaxexpensebenefit', 'retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 17%|█████████████████████████████▏                                                                                                                                            | 84/490 [00:30<03:34,  1.90it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 18%|█████████████████████████████▊                                                                                                                                            | 86/490 [00:31<02:39,  2.53it/s]

"['stockholdersequity'] not in index"


 18%|███████████████████████████████▏                                                                                                                                          | 90/490 [00:32<02:10,  3.07it/s]

"['stockholdersequity'] not in index"


 22%|████████████████████████████████████▌                                                                                                                                    | 106/490 [00:37<02:04,  3.09it/s]

"['weightedaveragenumberofsharesoutstandingbasic'] not in index"


 22%|█████████████████████████████████████▉                                                                                                                                   | 110/490 [00:39<02:50,  2.23it/s]

"['propertyplantandequipmentnet'] not in index"


 23%|██████████████████████████████████████▉                                                                                                                                  | 113/490 [00:40<02:22,  2.65it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 24%|████████████████████████████████████████▋                                                                                                                                | 118/490 [00:42<02:07,  2.91it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 24%|█████████████████████████████████████████                                                                                                                                | 119/490 [00:42<02:22,  2.60it/s]

"['stockholdersequity'] not in index"


 25%|██████████████████████████████████████████▊                                                                                                                              | 124/490 [00:44<02:04,  2.94it/s]

"['earningspersharebasic', 'earningspersharediluted', 'entitycommonstocksharesoutstanding', 'weightedaveragenumberofdilutedsharesoutstanding', 'weightedaveragenumberofsharesoutstandingbasic'] not in index"


 27%|█████████████████████████████████████████████▌                                                                                                                           | 132/490 [00:47<01:33,  3.81it/s]

"['stockholdersequity'] not in index"


 30%|██████████████████████████████████████████████████                                                                                                                       | 145/490 [00:51<02:04,  2.77it/s]

"['propertyplantandequipmentnet'] not in index"


 30%|██████████████████████████████████████████████████▋                                                                                                                      | 147/490 [00:52<02:05,  2.74it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 35%|██████████████████████████████████████████████████████████▉                                                                                                              | 171/490 [01:01<02:07,  2.51it/s]

"['retainedearningsaccumulateddeficit'] not in index"


 36%|████████████████████████████████████████████████████████████                                                                                                             | 174/490 [01:03<02:19,  2.27it/s]

"['propertyplantandequipmentnet'] not in index"


 36%|████████████████████████████████████████████████████████████▎                                                                                                            | 175/490 [01:03<02:11,  2.40it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 36%|█████████████████████████████████████████████████████████████                                                                                                            | 177/490 [01:03<01:43,  3.03it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 37%|█████████████████████████████████████████████████████████████▋                                                                                                           | 179/490 [01:04<01:31,  3.39it/s]

"['propertyplantandequipmentnet'] not in index"


 37%|██████████████████████████████████████████████████████████████                                                                                                           | 180/490 [01:04<01:45,  2.94it/s]

"['propertyplantandequipmentnet'] not in index"


 37%|███████████████████████████████████████████████████████████████                                                                                                          | 183/490 [01:06<02:24,  2.13it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 38%|████████████████████████████████████████████████████████████████▏                                                                                                        | 186/490 [01:07<01:45,  2.89it/s]

"['stockholdersequity'] not in index"


 39%|█████████████████████████████████████████████████████████████████▏                                                                                                       | 189/490 [01:08<01:29,  3.36it/s]

"['incometaxexpensebenefit', 'retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 39%|█████████████████████████████████████████████████████████████████▉                                                                                                       | 191/490 [01:09<02:12,  2.25it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 40%|███████████████████████████████████████████████████████████████████▉                                                                                                     | 197/490 [01:11<01:44,  2.81it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 43%|█████████████████████████████████████████████████████████████████████████                                                                                                | 212/490 [01:17<02:01,  2.28it/s]

"['propertyplantandequipmentnet'] not in index"


 44%|██████████████████████████████████████████████████████████████████████████▍                                                                                              | 216/490 [01:19<02:26,  1.87it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 45%|███████████████████████████████████████████████████████████████████████████▌                                                                                             | 219/490 [01:20<01:59,  2.27it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 45%|████████████████████████████████████████████████████████████████████████████▏                                                                                            | 221/490 [01:21<01:55,  2.32it/s]

"['earningspersharebasic', 'earningspersharediluted'] not in index"


 47%|██████████████████████████████████████████████████████████████████████████████▋                                                                                          | 228/490 [01:24<01:25,  3.06it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 49%|██████████████████████████████████████████████████████████████████████████████████                                                                                       | 238/490 [01:27<01:25,  2.96it/s]

"['stockholdersequity'] not in index"


 52%|███████████████████████████████████████████████████████████████████████████████████████▌                                                                                 | 254/490 [01:32<01:03,  3.74it/s]

"['accumulatedothercomprehensiveincomelossnetoftax'] not in index"
"['accumulatedothercomprehensiveincomelossnetoftax'] not in index"


 52%|████████████████████████████████████████████████████████████████████████████████████████▎                                                                                | 256/490 [01:33<01:07,  3.45it/s]

"['stockholdersequity'] not in index"


 53%|██████████████████████████████████████████████████████████████████████████████████████████                                                                               | 261/490 [01:36<01:55,  1.98it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 54%|███████████████████████████████████████████████████████████████████████████████████████████                                                                              | 264/490 [01:37<01:41,  2.23it/s]

"['propertyplantandequipmentnet'] not in index"


 56%|██████████████████████████████████████████████████████████████████████████████████████████████▊                                                                          | 275/490 [01:41<01:14,  2.88it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 56%|███████████████████████████████████████████████████████████████████████████████████████████████▏                                                                         | 276/490 [01:42<01:25,  2.51it/s]

"['propertyplantandequipmentnet'] not in index"


 57%|████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                        | 281/490 [01:43<01:29,  2.32it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 60%|█████████████████████████████████████████████████████████████████████████████████████████████████████                                                                    | 293/490 [01:48<01:11,  2.77it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 60%|█████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                   | 295/490 [01:49<01:08,  2.85it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 61%|███████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                 | 300/490 [01:50<00:59,  3.22it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 61%|███████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                 | 301/490 [01:51<01:31,  2.06it/s]

"['propertyplantandequipmentnet'] not in index"


 63%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                              | 308/490 [01:53<00:50,  3.59it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                             | 311/490 [01:54<01:02,  2.88it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 64%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                            | 314/490 [01:55<00:51,  3.41it/s]

"['earningspersharebasic', 'earningspersharediluted'] not in index"


 66%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                         | 325/490 [01:59<00:59,  2.76it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 68%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                      | 331/490 [02:02<01:00,  2.64it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 68%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                     | 335/490 [02:03<00:59,  2.61it/s]

"['stockholdersequity'] not in index"


 69%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                    | 338/490 [02:04<00:50,  3.00it/s]

"['accumulatedothercomprehensiveincomelossnetoftax', 'propertyplantandequipmentnet'] not in index"


 70%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                   | 342/490 [02:05<00:39,  3.75it/s]

"['accumulatedothercomprehensiveincomelossnetoftax'] not in index"


 71%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                | 350/490 [02:07<00:42,  3.31it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 74%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                           | 363/490 [02:12<00:44,  2.83it/s]

"['accumulatedothercomprehensiveincomelossnetoftax'] not in index"


 74%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                           | 365/490 [02:12<00:46,  2.66it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 75%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                         | 369/490 [02:14<00:50,  2.40it/s]

"['stockholdersequity'] not in index"


 76%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                         | 370/490 [02:15<00:52,  2.29it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 76%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                        | 373/490 [02:16<00:58,  2.02it/s]

"['propertyplantandequipmentnet'] not in index"


 77%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                       | 375/490 [02:17<00:46,  2.45it/s]

"['propertyplantandequipmentnet'] not in index"


 78%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                     | 382/490 [02:19<00:36,  2.94it/s]

"['entitycommonstocksharesoutstanding'] not in index"


 79%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                    | 385/490 [02:21<00:43,  2.40it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 79%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                   | 386/490 [02:21<00:41,  2.49it/s]

"['retainedearningsaccumulateddeficit'] not in index"


 83%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                             | 406/490 [02:29<00:34,  2.41it/s]

"['propertyplantandequipmentnet', 'entitycommonstocksharesoutstanding'] not in index"


 85%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                         | 415/490 [02:33<00:36,  2.07it/s]

"['cashandcashequivalentsatcarryingvalue'] not in index"


 85%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                        | 418/490 [02:33<00:21,  3.30it/s]

"['accumulatedothercomprehensiveincomelossnetoftax', 'propertyplantandequipmentnet'] not in index"


 86%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                        | 420/490 [02:34<00:19,  3.58it/s]

"['retainedearningsaccumulateddeficit'] not in index"


 86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                       | 422/490 [02:35<00:19,  3.49it/s]

"['retainedearningsaccumulateddeficit'] not in index"


 89%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                  | 438/490 [02:40<00:15,  3.26it/s]

"['propertyplantandequipmentnet', 'cashandcashequivalentsatcarryingvalue'] not in index"


 90%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                 | 440/490 [02:40<00:17,  2.85it/s]

"['stockholdersequity'] not in index"


 90%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                | 443/490 [02:41<00:13,  3.58it/s]

"['earningspersharebasic', 'entitycommonstocksharesoutstanding', 'weightedaveragenumberofsharesoutstandingbasic'] not in index"


 91%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊               | 446/490 [02:43<00:15,  2.77it/s]

"['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


In [None]:
data = pd.concat(training_sets)

In [None]:
data = data.dropna()

In [None]:
data

In [None]:
fin.connect()
years = 4
for modeler in [umod]:
    for year in tqdm(range(2016,2023)):
        training_slice = data[(data["year"]<year) & (data["year"] >= year - years)].reset_index(drop=True)
        prediction_set = data[data["year"]==year].reset_index(drop=True)
        set_name = "sim"
        stuff = modeler.model(training_slice,prediction_set,factors,tf=False)
        stuff["training_years"] = years
        fin.store(set_name,stuff)
fin.disconnect()

In [None]:
stuff