# Bolsa de valores

Prevendo o volume de ações utilizando o modelo Random Forest Regressor

* Utilizaremos dados do Yahoo Finance da PETR4 num intervalo de tempo específico

* Dados serão obtido através da biblioteca Pandas DataReader

Importando bibliotecas

In [None]:
import datetime as dt
import pandas_datareader.data as web
import matplotlib.pyplot as plt
import numpy as np

Definindo janela de tempo

In [None]:
start = dt.datetime(2018,1,1)
end = dt.datetime(2020,8,31)

Obtendo dados da PETR4

In [None]:
PETR4 = web.DataReader('PETR4.SA',"yahoo",start,end)

Exibindo as cinco primeiras linhas

In [None]:
PETR4.head()

Exibindo as cinco últimas linhas

In [None]:
PETR4.tail()

Graficando valores de abertura, fechamento, mínimo e máximo

In [None]:
plt.subplot(2,2,1)
PETR4['Open'].plot(label='Open')
plt.xlabel('Data')
plt.ylabel('Open')
plt.subplot(2,2,2)
PETR4['Close'].plot(label='Close')
plt.xlabel('Data')
plt.ylabel('Close')
plt.subplot(2,2,3)
PETR4['Low'].plot(label='Low')
plt.xlabel('Data')
plt.ylabel('Low')
plt.subplot(2,2,4)
PETR4['High'].plot(label='High')
plt.xlabel('Data')
plt.ylabel('High')
plt.tight_layout()

Definindo variáveis X e Y

In [None]:
X = PETR4.drop(['Volume','Adj Close'],axis=1)
Y = PETR4['Volume']

* Criando amostra de treino e teste

In [None]:
X_treino = X[X.index<'2020-01-01'].values
X_teste = X[X.index>='2020-01-01'].values

Y_treino = Y[X.index<'2020-01-01'].values
Y_teste = Y[X.index>='2020-01-01'].values

* Prevendo volume utilizando modelo Random Forest Regressor

In [None]:
from sklearn.ensemble import RandomForestRegressor

In [None]:
rfr = RandomForestRegressor()

In [None]:
rfr.fit(X_treino,Y_treino)

In [None]:
Y_previsto = rfr.predict(X_teste)

* Graficando Y_previsto em função de Y_teste

In [None]:
plt.scatter(Y_teste,Y_previsto)
plt.xlabel('Y_teste')
plt.ylabel('Y_previsto')
plt.tight_layout()

Calculando métricas de erro

In [None]:
from sklearn.metrics import mean_absolute_error, mean_squared_error

In [None]:
def mean_absolute_percentage_error(y_true, y_pred): 
    y_true, y_pred = np.array(y_true), np.array(y_pred)
    return np.mean(np.abs((y_true - y_pred) / y_true)) * 100

In [None]:
MAE = mean_absolute_error(Y_teste,Y_previsto)
MAPE = mean_absolute_percentage_error(Y_teste,Y_previsto)
MSE = mean_squared_error(Y_teste,Y_previsto)
RMSE = np.sqrt(MSE)

In [None]:
print("MAE = {:0.2e}".format(MAE))
print("MAPE = {:0.2f}%".format(MAPE))
print("MSE = {:0.2e}".format(MSE))
print("RMSE = {:0.2e}".format(RMSE))

Podemos prever o valor com uma incerteza de 28.78%

Melhorias podem ser obtidas adicionando-se indicores da bolsa na amostra