In [4]:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import xgboost as xgb
from xgboost import plot_importance, plot_tree,DMatrix
from sklearn.metrics import mean_squared_error, mean_absolute_error
plt.style.use('fivethirtyeight')

import yfinance as yf
import plotly.express as px
import plotly.graph_objects as go
import pandas as pd
import ta as ta
from ta import add_all_ta_features
from ta.utils import dropna
from datetime import datetime

from tsmoothie.utils_func import sim_randomwalk
from tsmoothie.smoother import *

from sklearn.preprocessing import MinMaxScaler

import pickle




def preparar_dados_para_treinamento(anteriores,base_treinamento_normalizada):

    previsores = []
    preco_real = []

    for i in range(anteriores,len(base_treinamento_normalizada)):

        previsores.append(base_treinamento_normalizada[i-anteriores:i,0])
        preco_real.append(base_treinamento_normalizada[i,0])

    previsores,preco_real = np.array(previsores),np.array(preco_real)
    previsores = previsores
    
    return previsores,preco_real

def GetTsi(base,gaussian_knots,gaussian_sigma,ewm_span=20):
    
    tsi_config=[25,13]

    resultados_tsi = ta.momentum.TSIIndicator(base["Close"],tsi_config[0],tsi_config[1],False)

    tsi_df = pd.DataFrame(resultados_tsi.tsi())
    
    tsi_df.dropna(inplace=True)
    
    #Suavizando TSI com médias móveis exponenciais
    tsi_df["ewm"] = tsi_df['tsi'].ewm(span = ewm_span).mean()*1.2
    #------------------------------------------
    
    #Suavizanto TSI com gaussian smoother
    tsi_np = tsi_df["tsi"].to_numpy()
    tsi_np.reshape(1,len(tsi_np))

    smoother = GaussianSmoother(n_knots=gaussian_knots, sigma=gaussian_sigma)
    smoother.smooth(tsi_np)

    tsi_df["gaussian"] = smoother.smooth_data[0]
    #------------------------------------------
    
    return tsi_df

def Normalizar(Oscilador,coluna):
    
    normalizador = MinMaxScaler(feature_range=(0,1))
    
    if coluna == "tsi":
        Oscilador_treinamento = Oscilador.iloc[:,0:1].values
        
    if coluna == "ewm":
        Oscilador_treinamento = Oscilador.iloc[:,1:2].values
        
    if coluna == "gaussian":
        Oscilador_treinamento = Oscilador.iloc[:,2:3].values
        
    Oscilador_normalizado = normalizador.fit_transform(Oscilador_treinamento)
    
    return Oscilador_normalizado


def Criar_modelo_XGBoost(base,anteriores_,filepath,knots_=60,sigma_=0.0003,n_estimators_=1000,max_depth_=6,subsample_=1,colsample_bytree_=1):

    #TSI
    tsi = GetTsi(base,knots,sigma)
    #--------------------------------

    #Normalizações
    normalizado = Normalizar(tsi,"gaussian")
    #--------------------------------

    X_train, y_train = preparar_dados_para_treinamento(anteriores,normalizado)


    reg = xgb.XGBRegressor(
        n_estimators=n_estimators_,
        max_depth=max_depth_,
        subsample=subsample_,
        colsample_bytree=colsample_bytree_
        
        )

    reg.fit(X_train, y_train,verbose=1)
    
    
    #a extensão para salvar os modelos é pkl 
    pickle.dump(reg, open(filepath, 'wb'))
    
    
    print("Modelo pronto ",filepath)
    
    return reg


In [5]:
ticker ="PETR3.SA"

base = yf.download(ticker)

#Atributos referentes a base
anteriores = 180
knots = 60
sigma = 0.0003
filepath = "Modelo_XGBoost_teste1.json"


#Atributos referente ao modelo
n_estimators=1000
max_depth=12
subsample=1
colsample_bytree=1

xgboost_model = Criar_modelo_XGBoost(
    base,
    anteriores,
    filepath,
    knots_=knots,
    sigma_=sigma,
    
    n_estimators_=n_estimators,
    max_depth_=max_depth,
    subsample_=subsample,
    colsample_bytree_=colsample_bytree)

[*********************100%***********************]  1 of 1 completed
Modelo pronto  Modelo_XGBoost_teste1.json
