In [3]:
from datetime import datetime, timedelta
import pytz
from tqdm import tqdm
import matplotlib.pyplot as plt
import numpy as np
from statistics import stdev
import pandas as pd
from database.market import Market
from database.sec import SEC
from database.adatabase import ADatabase
from processor.processor import Processor as p
from tqdm import tqdm
import numpy as np
from modeler_strats.universal_modeler import UniversalModeler
pd.options.mode.chained_assignment = None

In [4]:
market = Market()
sec = SEC()
fin = ADatabase("growth")
umod = UniversalModeler()

In [5]:
market.connect()
sp5 = market.retrieve("sp500")
market.disconnect()

In [6]:
factors = ['assets',
 'liabilitiesandstockholdersequity',
 'incometaxexpensebenefit',
 'retainedearningsaccumulateddeficit',
 'accumulatedothercomprehensiveincomelossnetoftax',
 'earningspersharebasic',
 'earningspersharediluted',
 'propertyplantandequipmentnet',
 'cashandcashequivalentsatcarryingvalue',
 'entitycommonstocksharesoutstanding',
 'weightedaveragenumberofdilutedsharesoutstanding',
 'weightedaveragenumberofsharesoutstandingbasic',
 'stockholdersequity']

In [7]:
included_columns = ["year","quarter","ticker","adjclose","y","cash_return_on_equity"]

In [8]:
included_columns.extend(factors)

In [9]:
cfo_col = "netcashprovidedbyusedinoperatingactivities"

In [10]:
training_sets = []
sec.connect()
market.connect()
column_database = {}
for i in tqdm(range(sp5.index.size)):
    try:
        row = sp5.iloc[i]
        ticker = row["Symbol"]
        cik = int(row["CIK"])
        prices = market.retrieve_ticker_prices("prices",ticker)
        prices = p.column_date_processing(prices)
        prices = prices.groupby(["year","quarter","ticker"]).mean().reset_index()
        financials = sec.retrieve_filing_data(int(cik))
        financials = p.column_date_processing(financials)
        financials["date"] = [datetime.strptime(str(x),"%Y%m%d") for x in financials["filed"]]
        financials["year"] = [x.year for x in financials["date"]]
        financials["quarter"] = [x.quarter for x in financials["date"]]
        financials = financials[financials["form"]=="10-K"]
        financials["cash_return_on_equity"] = financials[cfo_col] / financials["stockholdersequity"]
        ticker_data = prices.copy()
        ticker_data = ticker_data.merge(financials,on=["year","quarter"],how="left").reset_index()
        ticker_data.sort_values("date",ascending=True,inplace=True)
        ticker_data["adjclose"] = [float(x) for x in ticker_data["adjclose"]]
        ticker_data = ticker_data.groupby(["year","quarter"]).mean().reset_index()
        ticker_data["ticker"] = ticker
        ticker_data["y"] = ticker_data["cash_return_on_equity"].shift(-4)
        ticker_data = ticker_data[included_columns]
        training_sets.append(ticker_data)
    except Exception as e:
        print(ticker,str(e))
        continue
sec.disconnect()
market.disconnect()

  1%|██                                                                                                                                                                         | 6/490 [00:01<01:55,  4.18it/s]

ACN "['entitycommonstocksharesoutstanding'] not in index"


  2%|██▊                                                                                                                                                                        | 8/490 [00:02<02:17,  3.50it/s]

ADM 'stockholdersequity'


  4%|██████▌                                                                                                                                                                   | 19/490 [00:06<02:39,  2.95it/s]

ARE "['incometaxexpensebenefit'] not in index"


  5%|███████▉                                                                                                                                                                  | 23/490 [00:07<02:34,  3.02it/s]

ALL "['cashandcashequivalentsatcarryingvalue'] not in index"


  5%|████████▎                                                                                                                                                                 | 24/490 [00:07<02:25,  3.20it/s]

GOOGL "['weightedaveragenumberofdilutedsharesoutstanding', 'weightedaveragenumberofsharesoutstandingbasic'] not in index"


  7%|███████████                                                                                                                                                               | 32/490 [00:10<03:11,  2.39it/s]

AXP "['cashandcashequivalentsatcarryingvalue'] not in index"


  7%|███████████▍                                                                                                                                                              | 33/490 [00:11<03:53,  1.96it/s]

AIG "['cashandcashequivalentsatcarryingvalue'] not in index"


 10%|█████████████████                                                                                                                                                         | 49/490 [00:16<02:21,  3.11it/s]

AJG "['weightedaveragenumberofdilutedsharesoutstanding'] not in index"


 10%|█████████████████▋                                                                                                                                                        | 51/490 [00:17<02:42,  2.71it/s]

T 'stockholdersequity'


 11%|███████████████████                                                                                                                                                       | 55/490 [00:18<02:16,  3.19it/s]

AVB "['propertyplantandequipmentnet'] not in index"


 12%|███████████████████▊                                                                                                                                                      | 57/490 [00:19<02:05,  3.46it/s]

BKR "['weightedaveragenumberofsharesoutstandingbasic'] not in index"


 13%|██████████████████████▌                                                                                                                                                   | 65/490 [00:22<02:21,  3.01it/s]

BIO "['entitycommonstocksharesoutstanding'] not in index"


 15%|█████████████████████████▎                                                                                                                                                | 73/490 [00:25<02:40,  2.60it/s]

BXP "['incometaxexpensebenefit', 'propertyplantandequipmentnet'] not in index"


 15%|█████████████████████████▋                                                                                                                                                | 74/490 [00:26<02:48,  2.48it/s]

BSX 'stockholdersequity'


 17%|████████████████████████████▍                                                                                                                                             | 82/490 [00:28<02:07,  3.19it/s]

CPT "['incometaxexpensebenefit', 'retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 17%|█████████████████████████████▏                                                                                                                                            | 84/490 [00:29<03:26,  1.97it/s]

COF "['cashandcashequivalentsatcarryingvalue'] not in index"


 18%|█████████████████████████████▊                                                                                                                                            | 86/490 [00:30<02:33,  2.63it/s]

KMX 'stockholdersequity'


 18%|███████████████████████████████▏                                                                                                                                          | 90/490 [00:31<02:06,  3.16it/s]

CAT 'stockholdersequity'


 22%|████████████████████████████████████▌                                                                                                                                    | 106/490 [00:36<02:01,  3.16it/s]

CI "['weightedaveragenumberofsharesoutstandingbasic'] not in index"


 22%|█████████████████████████████████████▉                                                                                                                                   | 110/490 [00:38<02:46,  2.29it/s]

C "['propertyplantandequipmentnet'] not in index"


 23%|██████████████████████████████████████▉                                                                                                                                  | 113/490 [00:39<02:19,  2.70it/s]

CME "['entitycommonstocksharesoutstanding'] not in index"


 24%|████████████████████████████████████████▋                                                                                                                                | 118/490 [00:41<02:05,  2.97it/s]

CMCSA "['entitycommonstocksharesoutstanding'] not in index"


 24%|█████████████████████████████████████████                                                                                                                                | 119/490 [00:41<02:18,  2.67it/s]

CMA 'stockholdersequity'


 25%|██████████████████████████████████████████▊                                                                                                                              | 124/490 [00:43<01:59,  3.06it/s]

STZ "['earningspersharebasic', 'earningspersharediluted', 'entitycommonstocksharesoutstanding', 'weightedaveragenumberofdilutedsharesoutstanding', 'weightedaveragenumberofsharesoutstandingbasic'] not in index"


 27%|█████████████████████████████████████████████▌                                                                                                                           | 132/490 [00:45<01:30,  3.96it/s]

CSX 'stockholdersequity'


 28%|███████████████████████████████████████████████▎                                                                                                                         | 137/490 [00:47<01:44,  3.38it/s]

DRI 'netcashprovidedbyusedinoperatingactivities'


 30%|██████████████████████████████████████████████████                                                                                                                       | 145/490 [00:50<02:02,  2.82it/s]

DLR "['propertyplantandequipmentnet'] not in index"


 30%|██████████████████████████████████████████████████▋                                                                                                                      | 147/490 [00:50<01:57,  2.93it/s]

DISH "['entitycommonstocksharesoutstanding'] not in index"


 35%|██████████████████████████████████████████████████████████▉                                                                                                              | 171/490 [00:59<02:04,  2.56it/s]

EPAM "['retainedearningsaccumulateddeficit'] not in index"


 36%|████████████████████████████████████████████████████████████                                                                                                             | 174/490 [01:01<02:17,  2.30it/s]

EQR "['propertyplantandequipmentnet'] not in index"


 36%|████████████████████████████████████████████████████████████▎                                                                                                            | 175/490 [01:01<02:09,  2.43it/s]

ESS "['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 36%|█████████████████████████████████████████████████████████████                                                                                                            | 177/490 [01:01<01:41,  3.08it/s]

EL "['entitycommonstocksharesoutstanding'] not in index"


 37%|█████████████████████████████████████████████████████████████▋                                                                                                           | 179/490 [01:02<01:30,  3.43it/s]

RE "['propertyplantandequipmentnet'] not in index"


 37%|██████████████████████████████████████████████████████████████                                                                                                           | 180/490 [01:02<01:44,  2.96it/s]

ES "['propertyplantandequipmentnet'] not in index"


 37%|███████████████████████████████████████████████████████████████                                                                                                          | 183/490 [01:05<02:23,  2.14it/s]

EXPE "['entitycommonstocksharesoutstanding'] not in index"


 38%|████████████████████████████████████████████████████████████████▏                                                                                                        | 186/490 [01:05<01:42,  2.98it/s]

FFIV 'stockholdersequity'


 39%|█████████████████████████████████████████████████████████████████▏                                                                                                       | 189/490 [01:06<01:20,  3.73it/s]

FRT "['incometaxexpensebenefit', 'retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 39%|█████████████████████████████████████████████████████████████████▉                                                                                                       | 191/490 [01:07<02:06,  2.37it/s]

FITB "['cashandcashequivalentsatcarryingvalue'] not in index"


 40%|███████████████████████████████████████████████████████████████████▌                                                                                                     | 196/490 [01:09<01:44,  2.82it/s]

FMC 'netcashprovidedbyusedinoperatingactivities'


 40%|███████████████████████████████████████████████████████████████████▉                                                                                                     | 197/490 [01:09<01:40,  2.91it/s]

F "['entitycommonstocksharesoutstanding'] not in index"


 43%|█████████████████████████████████████████████████████████████████████████                                                                                                | 212/490 [01:15<01:58,  2.35it/s]

GL "['propertyplantandequipmentnet'] not in index"


 44%|██████████████████████████████████████████████████████████████████████████▍                                                                                              | 216/490 [01:17<02:23,  1.91it/s]

HIG "['cashandcashequivalentsatcarryingvalue'] not in index"


 45%|███████████████████████████████████████████████████████████████████████████▌                                                                                             | 219/490 [01:18<01:56,  2.32it/s]

PEAK "['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 45%|████████████████████████████████████████████████████████████████████████████▏                                                                                            | 221/490 [01:19<01:45,  2.55it/s]

HSY "['earningspersharebasic', 'earningspersharediluted'] not in index"


 47%|██████████████████████████████████████████████████████████████████████████████▋                                                                                          | 228/490 [01:21<01:23,  3.16it/s]

HRL "['entitycommonstocksharesoutstanding'] not in index"


 49%|██████████████████████████████████████████████████████████████████████████████████                                                                                       | 238/490 [01:25<01:21,  3.08it/s]

ITW 'stockholdersequity'


 52%|███████████████████████████████████████████████████████████████████████████████████████▌                                                                                 | 254/490 [01:30<01:01,  3.87it/s]

JBHT "['accumulatedothercomprehensiveincomelossnetoftax'] not in index"
JKHY "['accumulatedothercomprehensiveincomelossnetoftax'] not in index"


 52%|████████████████████████████████████████████████████████████████████████████████████████▎                                                                                | 256/490 [01:30<01:05,  3.58it/s]

JNJ 'stockholdersequity'


 53%|██████████████████████████████████████████████████████████████████████████████████████████                                                                               | 261/490 [01:33<01:53,  2.02it/s]

KEY "['cashandcashequivalentsatcarryingvalue'] not in index"


 54%|███████████████████████████████████████████████████████████████████████████████████████████                                                                              | 264/490 [01:34<01:33,  2.43it/s]

KIM "['propertyplantandequipmentnet'] not in index"


 56%|██████████████████████████████████████████████████████████████████████████████████████████████▊                                                                          | 275/490 [01:38<01:12,  2.99it/s]

LEN "['entitycommonstocksharesoutstanding'] not in index"


 56%|███████████████████████████████████████████████████████████████████████████████████████████████▏                                                                         | 276/490 [01:38<01:22,  2.58it/s]

LNC "['propertyplantandequipmentnet'] not in index"


 57%|████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                        | 281/490 [01:40<01:27,  2.38it/s]

L "['cashandcashequivalentsatcarryingvalue'] not in index"


 60%|█████████████████████████████████████████████████████████████████████████████████████████████████████                                                                    | 293/490 [01:45<01:08,  2.86it/s]

MA "['entitycommonstocksharesoutstanding'] not in index"


 60%|██████████████████████████████████████████████████████████████████████████████████████████████████████                                                                   | 296/490 [01:45<00:57,  3.38it/s]

MKC "['entitycommonstocksharesoutstanding'] not in index"


 61%|███████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                 | 300/490 [01:47<00:57,  3.28it/s]

META "['entitycommonstocksharesoutstanding'] not in index"


 61%|███████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                 | 301/490 [01:48<01:29,  2.10it/s]

MET "['propertyplantandequipmentnet'] not in index"


 63%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                              | 308/490 [01:50<00:47,  3.80it/s]

MAA "['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                             | 311/490 [01:51<00:59,  3.00it/s]

TAP "['entitycommonstocksharesoutstanding'] not in index"


 64%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                            | 314/490 [01:51<00:49,  3.54it/s]

MNST "['earningspersharebasic', 'earningspersharediluted'] not in index"


 66%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                         | 325/490 [01:56<00:58,  2.83it/s]

NWSA "['entitycommonstocksharesoutstanding'] not in index"


 68%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                      | 331/490 [01:58<00:57,  2.75it/s]

NTRS "['cashandcashequivalentsatcarryingvalue'] not in index"


 68%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                     | 335/490 [01:59<00:57,  2.70it/s]

NRG 'stockholdersequity'


 69%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                    | 338/490 [02:00<00:49,  3.07it/s]

NVR "['accumulatedothercomprehensiveincomelossnetoftax', 'propertyplantandequipmentnet'] not in index"


 70%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                   | 342/490 [02:01<00:38,  3.85it/s]

ODFL "['accumulatedothercomprehensiveincomelossnetoftax'] not in index"


 71%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                 | 347/490 [02:02<00:29,  4.77it/s]

OGN 'netcashprovidedbyusedinoperatingactivities'


 71%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                | 350/490 [02:03<00:41,  3.41it/s]

PARA "['entitycommonstocksharesoutstanding'] not in index"


 74%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                           | 363/490 [02:07<00:43,  2.89it/s]

PXD "['accumulatedothercomprehensiveincomelossnetoftax'] not in index"


 74%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                           | 365/490 [02:08<00:46,  2.71it/s]

PNC "['cashandcashequivalentsatcarryingvalue'] not in index"


 75%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                         | 369/490 [02:10<00:49,  2.45it/s]

PG 'stockholdersequity'


 76%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                         | 370/490 [02:11<00:47,  2.51it/s]

PGR "['cashandcashequivalentsatcarryingvalue'] not in index"


 76%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                        | 373/490 [02:12<00:55,  2.10it/s]

PEG "['propertyplantandequipmentnet'] not in index"


 77%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                       | 375/490 [02:13<00:45,  2.52it/s]

PSA "['propertyplantandequipmentnet'] not in index"


 78%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                     | 382/490 [02:15<00:35,  3.02it/s]

RL "['entitycommonstocksharesoutstanding'] not in index"


 79%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                    | 385/490 [02:16<00:42,  2.48it/s]

O "['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 79%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                   | 386/490 [02:17<00:40,  2.56it/s]

REG "['retainedearningsaccumulateddeficit'] not in index"


 83%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                             | 406/490 [02:24<00:33,  2.48it/s]

SPG "['propertyplantandequipmentnet', 'entitycommonstocksharesoutstanding'] not in index"


 85%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                         | 415/490 [02:28<00:35,  2.14it/s]

STT "['cashandcashequivalentsatcarryingvalue'] not in index"


 85%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                        | 418/490 [02:28<00:21,  3.38it/s]

SYF "['accumulatedothercomprehensiveincomelossnetoftax', 'propertyplantandequipmentnet'] not in index"


 86%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                        | 420/490 [02:29<00:19,  3.63it/s]

SYY "['retainedearningsaccumulateddeficit'] not in index"


 86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                       | 422/490 [02:30<00:19,  3.54it/s]

TROW "['retainedearningsaccumulateddeficit'] not in index"


 87%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                     | 428/490 [02:31<00:19,  3.19it/s]

TFX 'netcashprovidedbyusedinoperatingactivities'


 89%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                  | 438/490 [02:35<00:15,  3.30it/s]

TRV "['propertyplantandequipmentnet', 'cashandcashequivalentsatcarryingvalue'] not in index"


 90%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                 | 440/490 [02:35<00:17,  2.91it/s]

TFC 'stockholdersequity'


 90%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                | 443/490 [02:36<00:12,  3.62it/s]

TSN "['earningspersharebasic', 'entitycommonstocksharesoutstanding', 'weightedaveragenumberofsharesoutstandingbasic'] not in index"


 91%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊               | 446/490 [02:37<00:15,  2.80it/s]

UDR "['retainedearningsaccumulateddeficit', 'propertyplantandequipmentnet'] not in index"


 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏              | 447/490 [02:38<00:13,  3.13it/s]

UAA "['entitycommonstocksharesoutstanding'] not in index"


 92%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏             | 450/490 [02:39<00:13,  3.08it/s]

UPS "['entitycommonstocksharesoutstanding'] not in index"


 92%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏            | 453/490 [02:39<00:11,  3.26it/s]

UHS "['entitycommonstocksharesoutstanding'] not in index"


 93%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉            | 455/490 [02:40<00:11,  2.96it/s]

VTR "['propertyplantandequipmentnet'] not in index"


 94%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋         | 463/490 [02:43<00:08,  3.31it/s]

V 'stockholdersequity'


 95%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████         | 464/490 [02:43<00:08,  3.17it/s]

VNO "['propertyplantandequipmentnet'] not in index"


 97%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏     | 473/490 [02:47<00:08,  1.98it/s]

WFC "['cashandcashequivalentsatcarryingvalue'] not in index"


 97%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍     | 474/490 [02:47<00:07,  2.05it/s]

WELL "['propertyplantandequipmentnet'] not in index"


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋| 489/490 [02:53<00:00,  1.92it/s]

ZION "['cashandcashequivalentsatcarryingvalue'] not in index"


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 490/490 [02:53<00:00,  2.82it/s]


In [11]:
data = pd.concat(training_sets)

In [12]:
data = data.dropna().sort_values("year")

In [15]:
data.dropna()

Unnamed: 0,year,quarter,ticker,adjclose,y,cash_return_on_equity,assets,liabilitiesandstockholdersequity,incometaxexpensebenefit,retainedearningsaccumulateddeficit,accumulatedothercomprehensiveincomelossnetoftax,earningspersharebasic,earningspersharediluted,propertyplantandequipmentnet,cashandcashequivalentsatcarryingvalue,entitycommonstocksharesoutstanding,weightedaveragenumberofdilutedsharesoutstanding,weightedaveragenumberofsharesoutstandingbasic,stockholdersequity
48,2012,1,EXC,18.491870,0.336992,0.410292,2.771812e+10,2.829633e+10,8.145000e+08,3.536333e+09,-3.683750e+08,0.953750,1.756364,1.560512e+10,6.609375e+08,3.202880e+08,6.635455e+08,6.619091e+08,6.607700e+09
22,2012,4,TEL,25.232642,0.214095,0.099986,8.277273e+09,7.405800e+09,3.062857e+08,6.400000e+08,3.285000e+08,1.210909,1.200909,3.110400e+09,1.579500e+09,4.225726e+08,4.384545e+08,4.341818e+08,7.722500e+09
3,2012,1,MPC,14.503505,0.315046,0.296771,2.448850e+10,2.448850e+10,6.553333e+08,8.980000e+08,-7.510000e+08,1.651818,1.641818,1.197600e+10,8.582500e+08,3.476141e+08,3.576667e+08,3.560000e+08,8.964250e+09
48,2012,1,D,32.590451,0.251419,0.258500,3.355925e+10,3.355925e+10,8.916667e+08,4.157750e+09,-2.242500e+08,1.511818,1.507273,2.332225e+10,4.562500e+07,2.849429e+08,5.861333e+08,5.851000e+08,9.024500e+09
26,2012,1,AAL,6.984756,-0.189360,-0.217468,2.446800e+10,2.446800e+10,-1.063333e+08,-6.596500e+09,-3.359500e+09,-1.784545,-1.788182,1.437550e+10,1.987500e+08,3.352716e+08,3.206667e+08,3.206667e+08,-4.370000e+09
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
88,2022,1,OKE,59.165639,0.395591,0.342791,2.283750e+10,2.335018e+10,3.488063e+08,0.000000e+00,-4.656000e+08,2.623333,2.613333,1.923740e+10,1.759550e+08,4.462133e+08,4.315430e+08,4.303560e+08,6.215764e+09
88,2022,1,TER,126.010322,0.390032,0.436792,3.416262e+09,3.730886e+09,1.071793e+08,5.619900e+08,1.378400e+07,4.536667,4.136667,3.910200e+08,1.018160e+09,1.624170e+08,1.820420e+08,1.671683e+08,1.942994e+09
33,2022,1,HLT,146.812722,-0.866008,-0.634934,1.609800e+10,1.609800e+10,1.023333e+08,-6.527000e+09,-8.195000e+08,0.653333,0.640000,3.255000e+08,2.322500e+09,2.791391e+08,2.826667e+08,2.810000e+08,-1.155500e+09
12,2022,1,DOW,57.008966,0.401920,0.430515,6.218925e+10,6.218925e+10,9.953333e+08,1.814300e+10,-9.982000e+09,2.746667,2.726667,2.051680e+10,3.486333e+09,3.678736e+08,7.446000e+08,7.422000e+08,1.498400e+10


In [14]:
fin.connect()
years = 4
for modeler in [umod]:
    for year in tqdm(range(2016,2023)):
        training_slice = data[(data["year"]<year) & (data["year"] >= year - years)].reset_index(drop=True)
        prediction_set = data[data["year"]==year].reset_index(drop=True)
        set_name = "sim"
        stuff = modeler.model(training_slice,prediction_set,factors,tf=False)
        stuff["training_years"] = years
        fin.store(set_name,stuff)
fin.disconnect()

  0%|                                                                                                                                                                                     | 0/7 [00:00<?, ?it/s]

Input contains NaN, infinity or a value too large for dtype('float64').


  0%|                                                                                                                                                                                     | 0/7 [00:09<?, ?it/s]

Input contains NaN, infinity or a value too large for dtype('float64').
'str' object has no attribute 'predict'
'str' object has no attribute 'predict'





KeyError: 'cat_prediction'