# Aula 10 - Treinamento do Perceptron

Lembrando do que vimos na matéria de _Machine Learning_ , quando desenvolvemos modelos preditivos temos 2 fases: 
- **treinamento** : construção do modelo
- **teste** : uso do modelo construído

Na última aula, nós usamos uma rede "pronta" para predizer se uma faculdade era uma boa escolha ou não (modelo de classificação) ou prever um score de cada faculdade para criar um ranking (modelo de regressão).

Note que os pesos já foram fornecidos, ou seja, o modelo já estava "treinado": 

```python
pesos = [ 0.10, 0.05, 0.05, 0.2, 0.25, 0.3, 0.05 ]
```

Mas e se os pesos não fossem dados? Como poderíamos encontrar os melhores pesos para o problema? Daí surge o **treinamento dos modelos**, ou seja, encontrar os pesos adequados para modelar o problema. 

## Treinamento do Perceptron 

Aprendendo os melhores pesos para modelar o problema. 


1. Conhecer os dados de entrada e saída (labels)
2. Inicializar os pesos (ex: valores aleatórios) 
3. Para todo dado de treinamento: 
    - Calcular as predições com os pesos correntes e as entradas e a função de ativação 
    - Calcular os erros das predições em relação às entradas 
    - Para cada peso: 
        - Atualizá-lo mediante o erro calculado (com a fórmula: pesos(n+1) = pesos(n) + (entrada * erro * taxaAprendizagem))
4. Repetir passos a partir do #3 enquanto “erro != zero”


In [1]:
import numpy as np
entradas = np.array([[0, 0],
                     [0, 1],
                     [1, 0],
                     [1, 1]])
saidas = np.array( [0, 0, 0, 1] )
pesos = np.array( [0.0, 0.0] )  # Experimente alterar os pesos iniciais 
taxaAprendizagem = 0.1          # Varie este valor e veja o reflexo na saída

In [2]:
def funcao_ativacao(soma):
    if soma>= 1:
        return 1
    return 0

def calcula_saida(registro):
    s = registro.dot(pesos)
    return funcao_ativacao(s)

def treinar():
    erroTotal = 1

    while erroTotal != 0:
        erroTotal = 0
        for i in range(len(saidas)):
            saidaCalculada = calcula_saida( np.asarray(entradas[i]) )
            erro = saidas[i] - saidaCalculada
            erroTotal += erro
            print(f"\tDado: {i}") 
            for j in range(len(pesos)):
                pesos[j] = pesos[j] + (taxaAprendizagem * entradas[i][j] * erro)
                print(f"\t\tPeso atualizado {j}: {pesos[j]}")
        print(f"---> Total de erros: {erroTotal}\n")

In [3]:
treinar()

	Dado: 0
		Peso atualizado 0: 0.0
		Peso atualizado 1: 0.0
	Dado: 1
		Peso atualizado 0: 0.0
		Peso atualizado 1: 0.0
	Dado: 2
		Peso atualizado 0: 0.0
		Peso atualizado 1: 0.0
	Dado: 3
		Peso atualizado 0: 0.1
		Peso atualizado 1: 0.1
---> Total de erros: 1

	Dado: 0
		Peso atualizado 0: 0.1
		Peso atualizado 1: 0.1
	Dado: 1
		Peso atualizado 0: 0.1
		Peso atualizado 1: 0.1
	Dado: 2
		Peso atualizado 0: 0.1
		Peso atualizado 1: 0.1
	Dado: 3
		Peso atualizado 0: 0.2
		Peso atualizado 1: 0.2
---> Total de erros: 1

	Dado: 0
		Peso atualizado 0: 0.2
		Peso atualizado 1: 0.2
	Dado: 1
		Peso atualizado 0: 0.2
		Peso atualizado 1: 0.2
	Dado: 2
		Peso atualizado 0: 0.2
		Peso atualizado 1: 0.2
	Dado: 3
		Peso atualizado 0: 0.30000000000000004
		Peso atualizado 1: 0.30000000000000004
---> Total de erros: 1

	Dado: 0
		Peso atualizado 0: 0.30000000000000004
		Peso atualizado 1: 0.30000000000000004
	Dado: 1
		Peso atualizado 0: 0.30000000000000004
		Peso atualizado 1: 0.30000000000000004
	Dado:

In [4]:
pesos

array([0.5, 0.5])

## Para casa

Altere os valores dos pesos iniciais e da taxa de aprendizagem e observe o impacto no treinamento da rede. 

Note que eventualmente você pode chegar em uma configuração que a rede não converge para os pesos adequados (ou seja, o laço `while` continua a rodar infinitamente. Se isso ocorrer, pare a execução no botão STOP (interrupt the kernel), ou vá em Kernel > Restart. 