# Parte 1: Previsão de Preços

In [1]:
from keras.models import Sequential
from keras.layers import Dense, Dropout, LSTM
from sklearn.preprocessing import MinMaxScaler
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.metrics import confusion_matrix, accuracy_score, classification_report
from sklearn import svm

Using TensorFlow backend.


### Criando a base de dados de treinamento

In [92]:
base_petr4 = pd.read_csv('/home/giovana/Área de Trabalho/Dados/PETR4.SA_treinamento.csv')
base_petr4 = base_petr4.dropna()
base_usim5 = pd.read_csv('/home/giovana/Área de Trabalho/Dados/USIM5.SA_treinamento.csv')
base_usim5 = base_usim5.dropna()
base_bbas3 = pd.read_csv('/home/giovana/Área de Trabalho/Dados/BBAS3.SA_treinamento.csv')
base_bbas3 = base_bbas3.dropna()

In [94]:
base_petr4.shape, base_usim5.shape, base_bbas3.shape

((222, 7), (222, 7), (222, 7))

### Separando a coluna utilizada na previsão (Open)

In [95]:
base_treinamento_petr4 = base_petr4.iloc[:, 1:2].values
base_treinamento_usim5 = base_usim5.iloc[:, 1:2].values
base_treinamento_bbas3 = base_bbas3.iloc[:, 1:2].values

In [120]:
len(base_treinamento_petr4), len(base_treinamento_usim5), len(base_treinamento_bbas3)

(222, 222, 222)

### Criando o normalizador e normalizando os dados

In [96]:
normalizador = MinMaxScaler(feature_range=(0,1))
base_treinamento_petr4_normalizada = normalizador.fit_transform(base_treinamento_petr4)
base_treinamento_usim5_normalizada = normalizador.fit_transform(base_treinamento_usim5)
base_treinamento_bbas3_normalizada = normalizador.fit_transform(base_treinamento_bbas3)

In [121]:
len(base_treinamento_petr4_normalizada), len(base_treinamento_usim5_normalizada), len(base_treinamento_bbas3_normalizada)

(222, 222, 222)

### Criando os previsores utilizados para a previsão de cada preço de abertura 

Para trabalhar com séries temporais é preciso definir o intervalo de tempo utizado para a previsão de cada dado. Por exemplo, para prever o dado 4, serão utilizados os dados 1, 2 e 3.

In [97]:
# PETR4
previsores_petr4 = []
preco_real_petr4 = []
for i in range(90, 222):
    previsores_petr4.append(base_treinamento_petr4_normalizada[i-90:i, 0])
    preco_real_petr4.append(base_treinamento_petr4_normalizada[i, 0])
    
# USIM5
previsores_usim5 = []
preco_real_usim5 = []
for j in range(90, 222):
    previsores_usim5.append(base_treinamento_usim5_normalizada[j-90:j, 0])
    preco_real_usim5.append(base_treinamento_usim5_normalizada[j, 0])
    
# BBAS3
previsores_bbas3 = []
preco_real_bbas3 = []
for k in range(90, 222):
    previsores_bbas3.append(base_treinamento_bbas3_normalizada[k-90:k, 0])
    preco_real_bbas3.append(base_treinamento_bbas3_normalizada[k, 0])

In [124]:
previsores_petr4.shape, previsores_usim5.shape, previsores_bbas3.shape

((132, 90, 1), (132, 90, 1), (132, 90, 1))

### Transformando da lista de previsores em um array, assim como os preços reais

In [125]:
previsores_petr4, preco_real_petr4 = np.array(previsores_petr4), np.array(preco_real_petr4)
previsores_usim5, preco_real_usim5 = np.array(previsores_usim5), np.array(preco_real_usim5)
previsores_bbas3, preco_real_bbas3 = np.array(previsores_bbas3), np.array(preco_real_bbas3)

### Colocar a base de previsores no formato de entrada exigido pelo Keras

__argumentos__: 
- batch_size: nº de registros

- time_steps: nº de dias de previsão

- input_dim: nº de atributos previstos
                     

In [99]:
previsores_petr4 = np.reshape(previsores_petr4, (previsores_petr4.shape[0], previsores_petr4.shape[1], 1))
previsores_usim5 = np.reshape(previsores_usim5, (previsores_usim5.shape[0], previsores_usim5.shape[1], 1))
previsores_bbas3 = np.reshape(previsores_bbas3, (previsores_bbas3.shape[0], previsores_bbas3.shape[1], 1))

### Criando a estrutura de uma rede com 4 camadas:

- __units__: nº de células de memória (quanto maior o número, melhor capturada a tendência ao longo do tempo

- __return_sequences = True__: indica a existência de mais uma camada LSTM, o que também indica que o neurônio se "autoalimenta" com as informações, não apenas passando-as adiante

- __input_shape__: dimensão do conjunto de entrada

In [183]:
# PETR4
regressor_petr4 = Sequential()
regressor_petr4.add(LSTM(units = 100, return_sequences = True, input_shape = (previsores_petr4.shape[1], 1)))
regressor_petr4.add(Dropout(0.3))

regressor_petr4.add(LSTM(units = 50, return_sequences = True))
regressor_petr4.add(Dropout(0.3))

regressor_petr4.add(LSTM(units = 50, return_sequences = True))
regressor_petr4.add(Dropout(0.3))

regressor_petr4.add(LSTM(units = 50))
regressor_petr4.add(Dropout(0.3))

regressor_petr4.add(Dense(units = 1, activation = 'linear'))

regressor_petr4.compile(optimizer = 'rmsprop', loss = 'mean_squared_error',
                  metrics = ['mean_absolute_error'])
regressor_petr4.fit(previsores_usim5, preco_real_usim5, epochs = 100, batch_size = 100)

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

<keras.callbacks.callbacks.History at 0x7f67a3bedf40>

In [127]:
#USIM5
regressor_usim5 = Sequential()
regressor_usim5.add(LSTM(units = 100, return_sequences = True, input_shape = (previsores_usim5.shape[1], 1)))
regressor_usim5.add(Dropout(0.3))

regressor_usim5.add(LSTM(units = 50, return_sequences = True))
regressor_usim5.add(Dropout(0.3))

regressor_usim5.add(LSTM(units = 50, return_sequences = True))
regressor_usim5.add(Dropout(0.3))

regressor_usim5.add(LSTM(units = 50))
regressor_usim5.add(Dropout(0.3))

regressor_usim5.add(Dense(units = 1, activation = 'linear'))

regressor_usim5.compile(optimizer = 'rmsprop', loss = 'mean_squared_error',
                  metrics = ['mean_absolute_error'])
regressor_usim5.fit(previsores_usim5, preco_real_usim5, epochs = 100, batch_size = 100)

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

<keras.callbacks.callbacks.History at 0x7f67a6e73f10>

In [128]:
# BBAS3
regressor_bbas3 = Sequential()
regressor_bbas3.add(LSTM(units = 100, return_sequences = True, input_shape = (previsores_bbas3.shape[1], 1)))
regressor_bbas3.add(Dropout(0.3))

regressor_bbas3.add(LSTM(units = 50, return_sequences = True))
regressor_bbas3.add(Dropout(0.3))

regressor_bbas3.add(LSTM(units = 50, return_sequences = True))
regressor_bbas3.add(Dropout(0.3))

regressor_bbas3.add(LSTM(units = 50))
regressor_bbas3.add(Dropout(0.3))

regressor_bbas3.add(Dense(units = 1, activation = 'linear'))

regressor_bbas3.compile(optimizer = 'rmsprop', loss = 'mean_squared_error',
                  metrics = ['mean_absolute_error'])
regressor_bbas3.fit(previsores_bbas3, preco_real_bbas3, epochs = 100, batch_size = 100)


Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

<keras.callbacks.callbacks.History at 0x7f67a6f8e550>

### Criando a base de teste:

In [184]:
base_petr4_teste = pd.read_csv('/home/giovana/Área de Trabalho/Dados/PETR4.SA_teste.csv')
preco_real_petr4_teste = base_petr4_teste.iloc[:, 1:2].values

base_usim5_teste = pd.read_csv('/home/giovana/Área de Trabalho/Dados/USIM5.SA_teste.csv')
preco_real_usim5_teste = base_usim5_teste.iloc[:, 1:2].values

base_bbas3_teste = pd.read_csv('/home/giovana/Área de Trabalho/Dados/BBAS3.SA_teste.csv')
preco_real_bbas3_teste = base_bbas3_teste.iloc[:, 1:2].values

In [185]:
base_petr4_teste.shape, base_usim5_teste.shape, base_bbas3_teste.shape

((20, 7), (20, 7), (20, 7))

### Construindo uma base com os  dados relevantes na previsão 

Nossa rede foi treinada utilizando os 90 dias anteriores a previsão, já a nossa base possui apenas 20 dados. Para solucionar esse problema, precisamos rodar um código que adicione os 90 dias anteriores aos meus 20 dados.

In [186]:
base_petr4_completa = pd.concat((base_petr4['Open'], base_petr4_teste['Open']), axis = 0)
entradas_petr4 = base_petr4_completa[len(base_petr4_completa) - len(base_petr4_teste) - 90:].values
entradas_petr4 = entradas_petr4.reshape(-1, 1)

base_usim5_completa = pd.concat((base_usim5['Open'], base_usim5_teste['Open']), axis = 0)
entradas_usim5 = base_usim5_completa[len(base_usim5_completa) - len(base_usim5_teste) - 90:].values
entradas_usim5 = entradas_usim5.reshape(-1, 1)

base_bbas3_completa = pd.concat((base_bbas3['Open'], base_bbas3_teste['Open']), axis = 0)
entradas_bbas3 = base_bbas3_completa[len(base_bbas3_completa) - len(base_bbas3_teste) - 90:].values
entradas_bbas3 = entradas_bbas3.reshape(-1, 1)

In [187]:
base_petr4_completa

0     9.14
1     8.71
2     8.56
3     8.79
4     9.20
      ... 
15    7.35
16    7.02
17    7.06
18    6.76
19    6.91
Name: Open, Length: 242, dtype: float64

In [188]:
base_usim5_completa

0     4.75
1     4.51
2     4.85
3     5.10
4     4.69
      ... 
15    1.62
16    1.49
17    1.47
18    1.57
19    1.53
Name: Open, Length: 242, dtype: float64

In [189]:
base_bbas3_completa

0     22.580000
1     22.230000
2     22.940001
3     23.770000
4     23.500000
        ...    
15    17.120001
16    15.900000
17    16.000000
18    15.140000
19    15.270000
Name: Open, Length: 242, dtype: float64

### Normalizando as entradas

In [190]:
entradas_petr4 = normalizador.transform(entradas_petr4)
entradas_usim5 = normalizador.transform(entradas_usim5)
entradas_bbas3 = normalizador.transform(entradas_bbas3)

In [191]:
len(entradas_petr4)

110

### Criando os previsores utilizados no teste

In [192]:
# PETR4
X_teste_petr4 = []
for i in range(90, 110):
    X_teste_petr4.append(entradas_petr4[i-90:i, 0])

# USIM5
X_teste_usim5 = []
for j in range(90, 110):
    X_teste_usim5.append(entradas_usim5[j-90:j, 0])
    
# BBAS3
X_teste_bbas3 = []
for k in range(90, 110):
    X_teste_bbas3.append(entradas_bbas3[k-90:k, 0])

### Transformando os dados em uma array  e redimensionando para o formato exigido pelo Keras

In [193]:
X_teste_petr4 = np.array(X_teste_petr4)
X_teste_petr4 = np.reshape(X_teste_petr4, (X_teste_petr4.shape[0], X_teste_petr4.shape[1], 1))

X_teste_usim5 = np.array(X_teste_usim5)
X_teste_usim5 = np.reshape(X_teste_usim5, (X_teste_usim5.shape[0], X_teste_usim5.shape[1], 1))

X_teste_bbas3 = np.array(X_teste_bbas3)
X_teste_bbas3 = np.reshape(X_teste_bbas3, (X_teste_bbas3.shape[0], X_teste_bbas3.shape[1], 1))

In [194]:
X_teste_petr4

array([[[-0.19970413],
        [-0.22633134],
        [-0.26701181],
        ...,
        [-0.48964493],
        [-0.47855026],
        [-0.46153843]],

       [[-0.22633134],
        [-0.26701181],
        [-0.28920116],
        ...,
        [-0.47855026],
        [-0.46153843],
        [-0.48594671]],

       [[-0.26701181],
        [-0.28920116],
        [-0.31804731],
        ...,
        [-0.46153843],
        [-0.48594671],
        [-0.49630174]],

       ...,

       [[-0.34985205],
        [-0.3491124 ],
        [-0.34097631],
        ...,
        [-0.53550292],
        [-0.5303254 ],
        [-0.55473369]],

       [[-0.3491124 ],
        [-0.34097631],
        [-0.36316565],
        ...,
        [-0.5303254 ],
        [-0.55473369],
        [-0.55177511]],

       [[-0.34097631],
        [-0.36316565],
        [-0.3934911 ],
        ...,
        [-0.55473369],
        [-0.55177511],
        [-0.57396445]]])

### Testando...

In [195]:
previsoes_petr4 = regressor_petr4.predict(X_teste_petr4)
previsoes_petr4 = normalizador.inverse_transform(previsoes_petr4)
previsoes_petr4.mean(), preco_real_petr4_teste.mean()

(11.569476, 7.412499999999999)

In [196]:
previsoes_usim5 = regressor_usim5.predict(X_teste_usim5)
previsoes_usim5 = normalizador.inverse_transform(previsoes_usim5)
previsoes_usim5.mean(), preco_real_usim5_teste.mean()

(8.687563, 1.9200000000000004)

In [197]:
previsoes_bbas3 = regressor_bbas3.predict(X_teste_bbas3)
previsoes_bbas3 = normalizador.inverse_transform(previsoes_bbas3)
previsoes_bbas3.mean(), preco_real_bbas3_teste.mean()

(17.805838, 16.961500199999996)

# Parte 2: Prever a tendência

In [198]:
previsoes_petr4 = pd.DataFrame(previsoes_petr4)
previsoes_usim5 = pd.DataFrame(previsoes_usim5)
previsoes_bbas3 = pd.DataFrame(previsoes_bbas3)

base_petr4_teste_comp = pd.concat((previsoes_petr4, base_petr4_teste['Open'], base_petr4_teste['Close']), axis = 1)
base_petr4_teste_comp.columns = ['Prevision', 'Open', 'Close']
base_usim5_teste_comp = pd.concat((previsoes_usim5, base_usim5_teste['Open'], base_usim5_teste['Close']), axis = 1)
base_usim5_teste_comp.columns = ['Prevision', 'Open', 'Close']
base_bbas3_teste_comp = pd.concat((previsoes_bbas3, base_bbas3_teste['Open'], base_bbas3_teste['Close']), axis = 1)
base_bbas3_teste_comp.columns = ['Prevision', 'Open', 'Close']

dif_real_petr4 = base_petr4_teste_comp.Close - base_petr4_teste_comp.Open
dif_prevista_petr4 = base_petr4_teste_comp.Close - base_petr4_teste_comp.Prevision
dif_real_usim5 = base_usim5_teste_comp.Close - base_usim5_teste_comp.Open
dif_prevista_usim5 = base_usim5_teste_comp.Close - base_usim5_teste_comp.Prevision
dif_real_bbas3 = base_bbas3_teste_comp.Close - base_bbas3_teste_comp.Open
dif_prevista_bbas3 = base_bbas3_teste_comp.Close - base_bbas3_teste_comp.Prevision

def ClassY(dif):
    ClasseY=[]
    for element in dif:
        if element>0:
            element = 1
            ClasseY.append(element)
        else:
            element = 0
            ClasseY.append(element)
    return ClasseY

x_petr4 = ClassY(dif_prevista_petr4)
y_petr4 = ClassY(dif_real_petr4)
x_usim5 = ClassY(dif_prevista_usim5)
y_usim5 = ClassY(dif_real_usim5)
x_bbas3 = ClassY(dif_prevista_bbas3)
y_bbas3 = ClassY(dif_real_bbas3)


matriz_petr4 = confusion_matrix(x_petr4,y_petr4)
matriz_usim5 = confusion_matrix(x_usim5,y_usim5)
matriz_bbas3 = confusion_matrix(x_bbas3,y_bbas3)

In [199]:
matriz_petr4

array([[13,  7],
       [ 0,  0]])

In [200]:
matriz_usim5

array([[16,  4],
       [ 0,  0]])

In [201]:
matriz_bbas3

array([[14,  3],
       [ 1,  2]])

In [202]:
print("Relatório de classificação PETR4: \n", classification_report(x_petr4, y_petr4))

Relatório de classificação PETR4: 
               precision    recall  f1-score   support

           0       1.00      0.65      0.79        20
           1       0.00      0.00      0.00         0

    accuracy                           0.65        20
   macro avg       0.50      0.33      0.39        20
weighted avg       1.00      0.65      0.79        20



  _warn_prf(average, modifier, msg_start, len(result))


In [203]:
print("Relatório de classificação USIM5: \n", classification_report(x_usim5, y_usim5))

Relatório de classificação USIM5: 
               precision    recall  f1-score   support

           0       1.00      0.80      0.89        20
           1       0.00      0.00      0.00         0

    accuracy                           0.80        20
   macro avg       0.50      0.40      0.44        20
weighted avg       1.00      0.80      0.89        20



In [204]:
print("Relatório de classificação BBAS3: \n", classification_report(x_bbas3, y_bbas3))

Relatório de classificação BBAS3: 
               precision    recall  f1-score   support

           0       0.93      0.82      0.87        17
           1       0.40      0.67      0.50         3

    accuracy                           0.80        20
   macro avg       0.67      0.75      0.69        20
weighted avg       0.85      0.80      0.82        20

