<a href="https://colab.research.google.com/github/victor-soeiro/IntroPython-UERJ/blob/master/Projetos/Projeto2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Projeto 2**

##**Montagem de uma Rede Neural usando a arquitetura Perceptron**

**Autores** Gabriela Gonçalves, Úrsula Goulart e Victor Soeiro.

[Arquivo do Projeto](https://github.com/malbouis/Python_intro/blob/master/aulas/projetos/projeto2_perceptrons.ipynb)

---

Um Perceptron é uma arquitetura binária de Redes Neurais que utiliza apenas uma camada de processamento, ou melhor, apenas um neurônio. Esse neurônio utiliza uma função de ativação para o processamos do somatório dos inputs com seus pesos e retorna um output, também binário.

<img src="https://images.deepai.org/glossary-terms/perceptron-6168423.jpg" width=500 />

Para o projeto, vamos utilizar a função de ativação *Heaviside StepFunction*. Em linguagem Python, poderiamos escrevê-la como,

```
def heaviside(summation, b):
    return 1 if summation > b else 0
```

Onde, b nomeamos como bias. 

Essa desigualdade pode ser escrita em relação do somatório dos inputs com os pesos mais o bias, sendo agora maior ou menor que zero. 

Portanto,

$ \phi(x) = 
\begin{cases}
   1 & \text{se $\sum_{i}^{N} x_i \omega_i + b > 0$} \\
   0 & \text{se $\sum_{i}^{N} x_i \omega_i + b \leq 0$}
\end{cases}$

Para incorporar o bias no somatório, o chamaremos de peso zero, $\omega_0$, com um input, $x_0$, igual a 1. 

**Obs.:** O produto dos pesos com os inputs é um produto matricial devido serem arrays.

Para cada conjunto de inputs do Perceptron, que chamaremos de features, compararemos o output, chamado de y, com o valor do dataset, chamado de label. A partir dessas comparaçãos, ajustaremos os pesos até que tenha a menor diferença para uma melhor classificação do Perceptron. 

```
w = w + learning_rate * (label - y) * x
```

Onde, o *learning_rate* é a taxa de aprendizado do Perceptron.



Vamos começar a programação do Perceptron importando o módulo Numpy.

In [1]:
import numpy as np

Iremos criar uma classe para o Perceptron e definir duas funções essenciais, *predict* e *train*. Portanto,

In [2]:
class Perceptron:
    def __init__(self, n_of_inputs, threshold=100, learning_rate=.01):
        self.bias = 0
        self.weights = np.zeros(n_of_inputs)
        self.threshold = threshold
        self.learning_rate = learning_rate

    def predict(self, inputs):
        return np.heaviside(np.dot(inputs, self.weights) + self.bias, 0)

    def train(self, training_inputs, labels):
        for _ in range(self.threshold):
            for n in range(len(training_inputs)):
                prediction = self.predict(training_inputs[n])
                self.weights += self.learning_rate * (labels[n] - prediction) * training_inputs[n]
                self.bias += self.learning_rate * (labels[n] - prediction)


O módulo sklearn possui vários datasets para o teste de redes neurais e aprendizado de máquinas. Portanto, o usaremos para importar o dataset dos dados da flor iris e, também, a sua classe Perceptron para comparação com a classe criada acima.

In [3]:
from sklearn.datasets import load_iris
from sklearn.linear_model import Perceptron as sklearn_perceptron

iris = load_iris()

Vamos ver as features das flores iris.

In [4]:
print(iris.target_names)
print(iris.feature_names)

['setosa' 'versicolor' 'virginica']
['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']


Para o projeto usaremos apenas as features *petal length* e *petal width*. Vamos criar um variável *x* para carregar uma array com 150 conjunto de inputs com as features selecionadas e uma variável *y* para carregar os output esperados para uma Iris-Setosa, onde 0 é não e 1 é sim.

In [5]:
x = iris.data[:, (2, 3)]
y = (iris.target == 0).astype(int)

Rodando o nosso Perceptron para duas features.

In [6]:
perceptron = Perceptron(2)

train = perceptron.train(x, y)
predict = perceptron.predict([1, 0.5])

print(predict)

1.0


Rodando o Perceptron do módulo sklearn.

In [7]:
perceptron_clf = sklearn_perceptron()
perceptron_clf.fit(x, y)

y_pred = perceptron_clf.predict([[1, 0.5]])
print(y_pred)

[1]


Portanto, vemos que o nosso Perceptron resulta no mesmo valor do Perceptron do módulo sklearn. Por curiosidade, vamos realizar mais um teste, porém para a Iris-Virginica.

In [8]:
x = iris.data[:, (2, 3)]
y = (iris.target == 2).astype(int)

In [10]:
perceptron_virginica = Perceptron(2)

train = perceptron_virginica.train(x, y)
predict = perceptron_virginica.predict([1, 0.5])

print(predict)

0.0


In [11]:
perceptron_clf_virginica = sklearn_perceptron()
perceptron_clf_virginica.fit(x, y)

y_pred = perceptron_clf_virginica.predict([[1, 0.5]])
print(y_pred)

[0]


Como a predição foi usado o mesmo valor que retornou verdadeiro para a Iris-Setosa, retornou falso para a Iris-Virginica, como esperado.

O Perceptron torna-se uma arquitetura de redes neurais interessante ao trabalhar com classificações binárias e linearmente separáveis, como a o ajuste linear de uma reta.

O algoritmo do Perceptron começa a falhar quando o dataset para o seu aprendizado não é linearmente separável, tal que, não conseguirá classificar o dataset corretamente. Outra limitação é a classificação binária, na qual nem todos casos torna-se aplicável.