# TP2_A - Classificação Portas Lógicas

Bem vindo!
Neste TP você implementará um algoritmo de classificação.

**Instruções:**
- Use a versão Python 3.
- Evite sempre usar usar laços `for` e `while`, fazer contas no formato vetorial é sempre mais rápido.
- Não apague os comentários que já existem nas células de código. Mas é claro que você pode adicionar outros comentários.

**Objetivos**
- Implementar perceptron de camada única para classificar "portas lógicas"
- Aplicar o algoritmo de aprendizado do perceptron
- Verificar na prática convergência do perceptron para problemas linearmente separáveis

## O Jupyter notebook

O Jupyter Notebook é um ambiente interativo de programação em uma página web. Nesse notebook você colocará o código entre os comentários `### SEU CÓDIGO COMEÇA AQUI ###` e `### FIM DO CÓDIGO ###`. Após escrever o código, você pode executar a célula com `Shift+Enter` ou no botão "Run" (com símbolo de "play") na barra de comandos acima.

Em alguns trechos será especificado "(≈ X linhas de código)" nos comentários para que você tenha uma ideia sobre o tamanho do código a ser desenvolvido naquele trecho. Lembrando que é só uma estimativa, o seu código pode ficar maior ou menor do que o especificado.

**Alguns atalhos úteis *no código*:**
- `Ctrl+Enter`: executa a célula e mantém o cursor na mesma célula
- `Shift+Enter`: executa a célula e move o cursor para a próxima célula
- `Ctrl+/`: comenta a linha de código
- `Shift+Tab`: quando o cursor estiver em uma função, mostra um HELP da função

**Alguns atalhos úteis *na célula*:**
- Cria nova célula `a`: acima, `b`: abaixo da céula selecionada
- `d` (2x): deleta célula selecionada
- `m`: define célula como texto (Markdown)
- `y`: define célula como código (Python)
- `l`: mostra numeração das linhas na célula de código
- `c`: copiar, `v`: colar, `x`: recortar célula selecionada
- `ctrl+shift+p`: mostra busca para todos comandos de célula

## Dados linearmente separáveis
O código abaixo gera um conjunto de dados com 100 amostras, $m=100$, de um problema de classificação. Primeiramente, você ajustará, manualmente, uma rede neural que consiga classificar os dados abaixo.

1. Rode o código abaixo e observe que as classes são linearmente separáveis na maioria das realizações (cada vez que o código é rodado, são sorteados novos dados)
1. O modelo classificador será o Perceptron de camada única, dado por: $\hat{y}^{(i)}= \textrm{sign}\left(w_1 x_1^{(i)} + w_2 x_2^{(i)} + b\right)$
1. Ajuste, manualmente, os valores dos pesos $w_1$, $w_2$ e $b$ de modo que o modelo consiga classificar os dados corretamente
1. Faça, no mesmo gráfico mostrado, uma reta representando o limiar de decisão do Perceptron

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# dados de treinamento
m = 100
x1_tr = np.random.randint(2, size=m)
x2_tr = np.random.randint(2, size=m)
y_tr = np.logical_and(x1_tr, x2_tr).astype(int)*2-1
x1_tr = x1_tr*2-1 + np.random.normal(0, .2, m) # adicionando ruído
x2_tr = x2_tr*2-1 + np.random.normal(0, .2, m) # adicionando ruído

plt.figure(figsize=(4,3), dpi=100)
plt.plot(x1_tr[y_tr<0], x2_tr[y_tr<0], 'o', c='blue')
plt.plot(x1_tr[y_tr>0], x2_tr[y_tr>0], 's', c='red')

### SEU CÓDIGO COMEÇA AQUI ### (≈ 5 linhas de código)


### FIM DO CÓDIGO ###

plt.legend(('$y=0$','$y=1$'))
plt.xlim((-2, 2.8))
plt.ylim((-2, 2.8))
plt.xlabel('$x_1$')
plt.ylabel('$x_2$')
plt.show()

**Saída esperada**

<img src="files/TP2_a_resultadoEsperado01.png">
___

## Perceptron de camada única

Crie agora a função `percep1()` que fará o papel da rede neural. Essa função calculará a saída do perceptron de camada única, baseado nos dados de entrada e nos valores dos pesos. A equação do perceptron de camada única é dada por:

$\hat{y}^{(i)}= \textrm{sign}\left(w_1 x_1^{(i)} + w_2 x_2^{(i)} + b\right)$


Lembre-se que $\hat{y}\in\{-1,1\}$. Assim, a saída da função só pode fornecer os valores $-1$ ou $+1$.

1. Nome da função:
  + `percep1(x1, x2, w1, w2, b)`
1. Entradas:
  + $x1$: valor da primeira entrada, escalar, no formato `type(x1)=float`
  + $x2$: valor da segunda entrada, escalar, no formato `type(x2)=float`
  + $w1$: primeiro valor de peso, escalar, no formato `type(w1)=float`
  + $w2$: segundo valor de peso, escalar, no formato `type(w2)=float`
  + $b$: valor do parâmetro bias, escalar, no formato `type(b)=float`
1. Saída:
  + $\hat{y}$: saída estimada pelo modelo, escalar, no formato `type(yh)=int`

A função deve fazer o seguinte:
   + calcular $\hat{y}$ a partir das entradas $x1$ e $x2$, e a partir dos parâmetros $w1$, $w2$ e $b$.

Ao final, teste a função usando os parâmetros $w1$, $w2$ e $b$ ajustados manualmente na etapa anterior para todos os $m=100$ dados gerados. Ao final, calcule e mostre (comando `print`) o erro quadrático médio (*mean squared error*, MSE) do resultado. Espera-se `MSE≈0`.

In [9]:
### SEU CÓDIGO COMEÇA AQUI ###

### FIM DO CÓDIGO ###

**Saída esperada**
MSE = 0.0
___

## Treinamento do Perceptron de camada única

Para ajustar os parâmetros $w1$, $w2$ e $b$ de forma automática, baseado nos dados de treinamento, a seguinte regra de aprendizado pode ser utilizada:

$w_i^{(k)} = w_i^{(k-1)} + \Delta w_i^{(k-1)},\,\,\,\,\,\,\,$    (1)

$b^{(k)} = b^{(k-1)} + \Delta b^{(k-1)},\,\,\,\,\,\,\,$    (2)

em que $w_i^{(k)}$ representa o $i$-ésimo peso da $k$-ésima iteração do algoritmo de aprendizado, e tem-se:

$\Delta w_i^{(k)}=\eta [y-\hat{y}]x_i^{(k)},\,\,\,\,\,\,\,$    (3)

$\Delta b^{(k)}=\eta [y-\hat{y}],\,\,\,\,\,\,\,$    (4)

sendo $\eta$ o hiperparâmetro que controla a *taxa de aprendizado* do algoritmo.

Implemente o algoritmo de aprendizado do perceptron de camada única, com as seguintes características:
1. Devem ser usados os mesmos dados de treinamento da primeira parte dessa atividade
1. A função `percep1()` desenvolvida anteriormente também deve ser utilizada
1. Seu código, antes de iniciar o laço de aprendizado propriamente, deve iniciar os valores dos pesos $w1$, $w2$ e $b$ de forma aleatória
1. O valor da taxa de aprendizado $\eta$ também deve ser iniciado antes do laço
1. O aprendizado deve ocorrer dentro de um laço `for` que passe por todos os dados de treinamento por, pelo menos, uma vez em cada dado (o algoritmo pode passar mais de uma vez pelo mesmo dado de treinamento!)
1. Dentro do laço, seu código deve fazer o seguinte:
   1. Passo de propagação (*forward step*): calcule a saída da rede $\hat{y}^{(i)}$ para as respectivas entradas $x_1^{(i)}$ e $x_2^{(i)}$
   1. Para o parâmetro $w_1$, calcule $\Delta w_1^{(i-1)}$, conforme equação (3) acima
   1. Para o parâmetro $w_2$, calcule $\Delta w_2^{(i-1)}$, conforme equação (3) acima
   1. Para o parâmetro $b$, calcule $\Delta b^{(i-1)}$, conforme equação (4) acima
   1. Calcule o novo valor $w_1^{(i)}$, baseado em $\Delta w_1^{(i-1)}$ e $\Delta w_1^{(i-1)}$, conforme equação (2) acima
   1. Calcule o novo valor $w_2^{(i)}$, baseado em $\Delta w_2^{(i-1)}$ e $\Delta w_2^{(i-1)}$, conforme equação (2) acima
   1. Calcule o novo valor $b^{(i)}$, baseado em $\Delta b^{(i-1)}$ e $\Delta b^{(i-1)}$, conforme equação (1) acima
   1. faça os passos anteriores para a próxima amostra
1. O laço descrito anteriormente deve percorrer os dados de treinamento de forma aleatória! Os dados não podem sers percorridos na ordem de apresentação dos dados. Para fazer isso, use a função `np.random.permutation`
1. Gere 50 amostras de validação (copie a forma de gerar dados da primeira parte) e faça um gráfico mostrando todos os dados de teste (como foi feito na primeira parte desta atividade) e dois limiares de separação: i) aquele referente aos pesos iniciais **antes** do treinamento obtido pelo treinamento; ii) o limiar de separação obtido **após** o treinamento

In [None]:
### SEU CÓDIGO COMEÇA AQUI ###

### FIM DO CÓDIGO ###

**Saída esperada**:
gráfico, similar ao da primeira parte desta atividade, mostrando dois limiares de separação: um **antes** e outro **após** o treinamento do perceptron.
___

## Desafio! (opcional, você não perderá nenhum ponto se deixar de fazer essa parte)

Se este trabalho foi fácil para você até aqui, você pode tentar um novo desafio: utilizar o algoritmo de aprendizado implementado nos dados da Iris. Esses dados podem ser obtidos no site https://archive.ics.uci.edu/ml/datasets/Iris, que contém também uma descrição mais completa do problema.

Implemente o algoritmo de aprendizado fazendo os ajustes necessários. Ao final, mostre o ressultado do algoritmo de aprendizado para os **dados de validação**. Não se esqueça de segregar o conjunto de dados em: treinamento (~80%) e validação (~20%). Mostre o percentual de acerto nesses dados.

Bom trabalho!

In [None]:
### SEU CÓDIGO COMEÇA AQUI ###

### FIM DO CÓDIGO ###

**Saída esperada**:
índice de acerto nos dados de validação.
___



# Conclusões

Escreva aqui, em linguagem `markdown`, suas considerações sobre o que foi aprendido nesse trabalho prático.

*### escreva aqui ###*