In [None]:
import pandas as pd
import pandas_datareader as pdr
import datetime
import numpy as np
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import confusion_matrix, accuracy_score, classification_report

In [None]:
# Importando a base de dados:
petr4 = pdr.get_data_yahoo('PETR4.SA', start = datetime.datetime(2015,1, 5), end = datetime.datetime(2015, 12, 31))
usim5 = pdr.get_data_yahoo('USIM5.SA', start = datetime.datetime(2015,1, 5), end = datetime.datetime(2015, 12, 31))
bbas3 = pdr.get_data_yahoo('BBAS3.SA', start = datetime.datetime(2015,1, 5), end = datetime.datetime(2015, 12, 31))

In [None]:
# Excluindo dados faltantes:
petr4 = petr4.dropna()
usim5 = usim5.dropna()
bbas3 = bbas3.dropna()

In [None]:
# Calculando a Classe Y:
# Calculando a diferença:

dif_petr4 = petr4.Close - petr4.Open
dif_usim5 = usim5.Close - usim5.Open
dif_bbas3 = bbas3.Close - bbas3.Open

# Definindo a função Classe Y:

def ClassY(dif):
    ClasseY=[]
    for element in dif:
        if element>0:
            element = 1
            ClasseY.append(element)
        else:
            element = 0
            ClasseY.append(element)
    return ClasseY

x = ClassY(dif_petr4)
y = ClassY(dif_usim5)
z = ClassY(dif_bbas3)

# Transformar a Classe Y em um Array:
ClasseY_petr4 = np.array(x)
ClasseY_usim5 = np.array(y)
ClasseY_bbas3 = np.array(z)

In [None]:
# Verificando...
ClasseY_petr4

In [None]:
ClasseY_usim5

In [None]:
ClasseY_bbas3

In [None]:
# Fatiando o conjunto de dados para utilizar na previsão somente os preços de abertura e fechamento de mercado
previsores_petr4 = petr4.iloc[:, 2:4].values
previsores_usim5 = usim5.iloc[:, 2:4].values
previsores_bbas3 = bbas3.iloc[:, 2:4].values

In [None]:
# Verificando...
petr4.head(), previsores_petr4

In [None]:
usim5.head(), previsores_usim5

In [None]:
bbas3.head(), previsores_bbas3

In [None]:
# Padronizando os dados:
escala = StandardScaler()
previsao_petr4 = escala.fit_transform(previsores_petr4)
previsao_usim5 = escala.fit_transform(previsores_usim5)
previsao_bbas3 = escala.fit_transform(previsores_bbas3)

In [None]:
# Verificando...
previsao_petr4, previsao_usim5, previsao_bbas3

In [None]:
# Criando os conjuntos de teste e treinamento
previsores_petr4_treinamento, previsores_petr4_teste, ClasseY_petr4_treinamento, ClasseY_petr4_teste = train_test_split(previsores_petr4, ClasseY_petr4, test_size = 0.25, random_state = 0)
previsores_usim5_treinamento, previsores_usim5_teste, ClasseY_usim5_treinamento, ClasseY_usim5_teste = train_test_split(previsores_usim5, ClasseY_usim5, test_size = 0.25, random_state = 0)
previsores_bbas3_treinamento, previsores_bbas3_teste, ClasseY_bbas3_treinamento, ClasseY_bbas3_teste = train_test_split(previsores_bbas3, ClasseY_bbas3, test_size = 0.25, random_state = 0)

In [None]:
# Criando um classificador:
classificador_petr4 = KNeighborsClassifier(n_neighbors=5, metric='minkowski', p = 2)
classificador_petr4.fit(previsores_petr4_treinamento, ClasseY_petr4_treinamento)
previsoes_petr4 = classificador_petr4.predict(previsores_petr4_teste)

previsoes_petr4

In [None]:
classificador_usim5 = KNeighborsClassifier(n_neighbors=5, metric='minkowski', p = 2)
classificador_usim5.fit(previsores_usim5_treinamento, ClasseY_usim5_treinamento)
previsoes_usim5 = classificador_usim5.predict(previsores_usim5_teste)

previsoes_usim5

In [None]:
classificador_bbas3 = KNeighborsClassifier(n_neighbors=5, metric='minkowski', p = 2)
classificador_bbas3.fit(previsores_bbas3_treinamento, ClasseY_bbas3_treinamento)
previsoes_bbas3 = classificador_bbas3.predict(previsores_bbas3_teste)

previsoes_bbas3

In [None]:
# Calculando a precisão do algoritmo:
precisao_petr4 = accuracy_score(ClasseY_petr4_teste, previsoes_petr4)
precisao_usim5 = accuracy_score(ClasseY_usim5_teste, previsoes_usim5)
precisao_bbas3 = accuracy_score(ClasseY_bbas3_teste, previsoes_bbas3)

precisao_petr4, precisao_usim5, precisao_bbas3

In [None]:
matriz_petr4 = confusion_matrix(ClasseY_petr4_teste, previsoes_petr4)
matriz_usim5 = confusion_matrix(ClasseY_usim5_teste, previsoes_usim5)
matriz_bbas3 = confusion_matrix(ClasseY_bbas3_teste, previsoes_bbas3)

matriz_petr4, matriz_usim5, matriz_bbas3

In [None]:
print("Relatório de classificação PETR4: \n", classification_report(ClasseY_petr4_teste, previsoes_petr4))  
print("Relatório de classificação USIM5: \n", classification_report(ClasseY_usim5_teste, previsoes_usim5))  
print("Relatório de classificação BBAS3: \n", classification_report(ClasseY_bbas3_teste, previsoes_bbas3))  