# 2.3. Parte III – Validação Holdout em Problema Não-Linearmente Separável

In [1]:
import numpy as np

a = np.fromfile('dataHoldout.txt')
X = np.split(a, 800)
arr = np.array(X)

#Dividindo em treino e teste aleatóriamente
np.random.shuffle(arr)
training, test = arr[:560,:], arr[560:,:]
   

# Classe Perceptron - Treinamento

In [2]:
import numpy as np

class Perceptron(object):

    def __init__(self, no_of_inputs, threshold=100, learning_rate=0.01):
        self.threshold = threshold
        self.learning_rate = learning_rate
        self.weights = np.zeros(no_of_inputs + 1)
        
    def organiza(self, arr):
        valor = []
        labels = []
        for i  in arr:
            valor.append(i[0:2])
            labels.append(i[2])
        return valor, labels
           
    def predict(self, inputs):
        summation = np.dot(inputs, self.weights[1:]) + self.weights[0]
        if summation > 0:
          activation = 1.0
        else:
          activation = 0.0            
        return activation

    def train(self, data):
        for _ in range(self.threshold):
            #A cada iteração faz um embaralhamento do array
            np.random.shuffle(data)
            training_inputs, labels = self.organiza(data)
            for inputs, label in zip(training_inputs, labels):
                prediction = self.predict(inputs)
                self.weights[1:] += self.learning_rate * (label - prediction) * inputs
                self.weights[0] += self.learning_rate * (label - prediction)
                
    def get_confusion_matrix(self, reais, preditos, labels):
        # não implementado
        if len(labels) > 2:
            return None

        if len(reais) != len(preditos):
            return None

        # considerando a primeira classe como a positiva, e a segunda a negativa
        true_class = labels[0]
        negative_class = labels[1]

        # valores preditos corretamente
        tp = 0
        tn = 0

        # valores preditos incorretamente
        fp = 0
        fn = 0

        for (indice, v_real) in enumerate(reais):
            v_predito = preditos[indice]

            # se trata de um valor real da classe positiva
            if v_real == true_class:
                tp += 1 if v_predito == v_real else 0
                fp += 1 if v_predito != v_real else 0
            else:
                tn += 1 if v_predito == v_real else 0
                fn += 1 if v_predito != v_real else 0

        return np.array([
            # valores da classe positiva
            [ tp, fp ],
            # valores da classe negativa
            [ fn, tn ]
        ])



In [3]:
perceptron = Perceptron(2)

In [4]:
#Treinando os 70% do dataset
perceptron.train(training)

# Aferindo a classe test

In [5]:
inputs, valores_reais = perceptron.organiza(test)
#Saída esperada
print(valores_reais)

[0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 1.0, 0.0, 1.0, 0.0, 1.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 1.0, 0.0, 1.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 1.0, 0.0, 1.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 1.0, 1.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 1.0, 0.0, 1.0, 1.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 1.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 1.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 1.0, 0.0, 0.0, 0.0, 1.0,

In [6]:
valores_preditos = []
for i in inputs:
    valores_preditos.append(perceptron.predict(i))
#Saídas preditas pelo modelo
print (valores_preditos)

[0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 1.0, 0.0, 1.0, 0.0, 1.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 1.0, 0.0, 1.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 1.0, 0.0, 1.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 1.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 1.0, 1.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 1.0, 0.0, 1.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 1.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 1.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 1.0, 0.0, 0.0, 0.0, 1.0,

# 2.3.1 Matriz de confusão

In [7]:
confusao = perceptron.get_confusion_matrix(reais=valores_reais, preditos=valores_preditos, labels=[1.0, 0.0])
print(confusao)

[[ 48   3]
 [  3 186]]


# 2.3.2.1 Acurácia

In [8]:
acuracia = (confusao[0,0] + confusao[1,1]) / (confusao[0,0] + confusao[1,1] + confusao[0,1] + confusao[1,0])
print (acuracia)

0.975


# 2.3.2.2 Precisão

In [9]:
precisao = confusao[0,0] / (confusao[0,0] + confusao[0,1])
print(precisao)

0.9411764705882353


# 2.3.2.3 Revocação

In [10]:
revocacao = confusao[0,0] / (confusao[0,0] + confusao[1,0])
print (revocacao)

0.9411764705882353


# 2.3.2.4 F-score

In [11]:
print(2 * (precisao * revocacao / (precisao + revocacao)))

0.9411764705882353


# 2.3.4 A partir destas métricas, discorra acerca da qualidade desta solução perante o conjunto de testes 

Olhando os valores dos calculos do despenho do nosso modelo, acreditamos que a qualidade foi boa. De um modo geral o neurônio em questão foi bem assertivo, como podemos constatar olhando a acurária onde acertou mais de 96%.