# Introdução às Redes Neurais

## Exercício: neurônios como portas lógicas
Neste exercício vamos experimentar com computações de neurônios. Mostraremos como representar funções lógicas básicas como AND, OR e XOR usando neurônios únicos (ou estruturas mais complicadas). Finalmente, ao final vamos percorrer como representar redes neurais como uma sequência de computações matriciais.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

### Função sigmoid:

$$
\sigma = \frac{1}{1 + e^{-x}}
$$

$\sigma$ varia de (0, 1). Quando a entrada $x$ é negativa, $\sigma$ está próximo de 0. Quando $x$ é positivo, $\sigma$ está próximo de 1. Em $x=0$, $\sigma=0.5$

In [None]:
## Definir rapidamente a função sigmoid
def sigmoid(x):
    """Função sigmoid"""
    return 1.0 / (1.0 + np.exp(-x))

In [None]:
# Plotar a função sigmoid
vals = np.linspace(-10, 10, num=100, dtype=np.float32)
activation = sigmoid(vals)
fig = plt.figure(figsize=(12,6))
plt.plot(vals, activation)
plt.grid(True, which='both')
plt.axhline(y=0, color='k')
plt.axvline(x=0, color='k')
plt.yticks()
plt.ylim([-0.5, 1.5]);

### Pensando em neurônios como portas lógicas booleanas

Uma porta lógica recebe duas entradas booleanas (verdadeiro/falso ou 1/0), e retorna 0 ou 1 dependendo de sua regra. A tabela verdade para uma porta lógica mostra as saídas para cada combinação de entradas, (0, 0), (0, 1), (1,0) e (1, 1). Por exemplo, vamos ver a tabela verdade para uma porta "OR":

### Porta OR

<table>

<tr>
<th colspan="3">Tabela verdade da porta OR</th>
</tr>

<tr>
<th colspan="2">Entrada</th>
<th>Saída</th>
</tr>

<tr>
<td>0</td>
<td>0</td>
<td>0</td>
</tr>

<tr>
<td>0</td>
<td>1</td>
<td>1</td>
</tr>

<tr>
<td>1</td>
<td>0</td>
<td>1</td>
</tr>

<tr>
<td>1</td>
<td>1</td>
<td>1</td>
</tr>

</table>

Um neurônio que usa a função de ativação sigmoid produz um valor entre (0, 1). Isso naturalmente nos leva a pensar sobre valores booleanos. Imagine um neurônio que recebe duas entradas, $x_1$ e $x_2$, e um termo de viés:

![](images/logic01.png)

Ao limitar as entradas de $x_1$ e $x_2$ para estar em $\left\{0, 1\right\}$, podemos simular o efeito de portas lógicas com nosso neurônio. O objetivo é encontrar os pesos (representados pelas marcas ? acima), de tal forma que retorne uma saída próxima de 0 ou 1 dependendo das entradas.

Que números para os pesos precisaríamos preencher para que esta porta produza lógica OR? Lembre-se: $\sigma(z)$ está próximo de 0 quando $z$ é amplamente negativo (cerca de -10 ou menos), e está próximo de 1 quando $z$ é amplamente positivo (cerca de +10 ou maior).

$$
z = w_1 x_1 + w_2 x_2 + b
$$

Vamos pensar sobre isso:

* Quando $x_1$ e $x_2$ são ambos 0, o único valor afetando $z$ é $b$. Como queremos que o resultado para (0, 0) seja próximo de zero, $b$ deve ser negativo (pelo menos -10)
* Se $x_1$ ou $x_2$ for 1, queremos que a saída seja próxima de 1. Isso significa que os pesos associados com $x_1$ e $x_2$ devem ser suficientes para compensar $b$ ao ponto de causar $z$ ser pelo menos 10.
* Vamos dar a $b$ um valor de -10. Quão grandes precisam ser $w_1$ e $w_2$? 
    * Pelo menos +20
* Então vamos tentar $w_1=20$, $w_2=20$ e $b=-10$!

![](images/logic02.png)

In [None]:
def logic_gate(w1, w2, b):
    # Auxiliar para criar funções de porta lógica
    # Conecte valores para peso_a, peso_b e viés
    return lambda x1, x2: sigmoid(w1 * x1 + w2 * x2 + b)

def test(gate):
    # Função auxiliar para testar nossas funções de peso.
    for a, b in (0, 0), (0, 1), (1, 0), (1, 1):
        print("{}, {}: {}".format(a, b, np.round(gate(a, b))))

In [None]:
or_gate = logic_gate(20, 20, -10)
test(or_gate)

<table>

<tr>
<th colspan="3">Tabela verdade da porta OR</th>
</tr>

<tr>
<th colspan="2">Entrada</th>
<th>Saída</th>
</tr>

<tr>
<td>0</td>
<td>0</td>
<td>0</td>
</tr>

<tr>
<td>0</td>
<td>1</td>
<td>1</td>
</tr>

<tr>
<td>1</td>
<td>0</td>
<td>1</td>
</tr>

<tr>
<td>1</td>
<td>1</td>
<td>1</td>
</tr>

</table>

Isso combina! Ótimo! Agora você tenta encontrar os valores de peso apropriados para cada tabela verdade. Tente não adivinhar e verificar - pense logicamente e tente derivar valores que funcionem.

### Porta AND

<table>

<tr>
<th colspan="3">Tabela verdade da porta AND</th>
</tr>

<tr>
<th colspan="2">Entrada</th>
<th>Saída</th>
</tr>

<tr>
<td>0</td>
<td>0</td>
<td>0</td>
</tr>

<tr>
<td>0</td>
<td>1</td>
<td>0</td>
</tr>

<tr>
<td>1</td>
<td>0</td>
<td>0</td>
</tr>

<tr>
<td>1</td>
<td>1</td>
<td>1</td>
</tr>

</table>

## Exercício
Tente descobrir que valores para os neurônios fariam esta função como uma porta AND.

In [None]:
# PARA FAZER: Preencha os parâmetros w1, w2 e b de tal forma que a tabela verdade corresponda
and_gate = logic_gate(0,0,0)

test(and_gate)

## Exercício
Faça o mesmo para a porta NOR e a porta NAND.

### Porta NOR (Não Ou)

<table>

<tr>
<th colspan="3">Tabela verdade da porta NOR</th>
</tr>

<tr>
<th colspan="2">Entrada</th>
<th>Saída</th>
</tr>

<tr>
<td>0</td>
<td>0</td>
<td>1</td>
</tr>

<tr>
<td>0</td>
<td>1</td>
<td>0</td>
</tr>

<tr>
<td>1</td>
<td>0</td>
<td>0</td>
</tr>

<tr>
<td>1</td>
<td>1</td>
<td>0</td>
</tr>

</table>

In [None]:
# PARA FAZER: Preencha os parâmetros w1, w2 e b de tal forma que a tabela verdade corresponda
nor_gate = logic_gate(0, 0, 0)

test(nor_gate)

### Porta NAND (Não E)

<table>

<tr>
<th colspan="3">Tabela verdade da porta NAND</th>
</tr>

<tr>
<th colspan="2">Entrada</th>
<th>Saída</th>
</tr>

<tr>
<td>0</td>
<td>0</td>
<td>1</td>
</tr>

<tr>
<td>0</td>
<td>1</td>
<td>1</td>
</tr>

<tr>
<td>1</td>
<td>0</td>
<td>1</td>
</tr>

<tr>
<td>1</td>
<td>1</td>
<td>0</td>
</tr>

</table>

In [None]:
# PARA FAZER: Preencha os parâmetros w1, w2 e b de tal forma que a tabela verdade corresponda
nand_gate = logic_gate(0, 0, 0)

test(nand_gate)

## Os limites de neurônios únicos

Se você fez cursos de ciência da computação, pode saber que as portas XOR são a base da computação. Elas podem ser usadas como chamados "meio-somadores", a fundação de ser capaz de somar números juntos. Aqui está a tabela verdade para XOR:

### Porta XOR (Ou Exclusivo)

<table>

<tr>
<th colspan="3">Tabela verdade da porta XOR</th>
</tr>

<tr>
<th colspan="2">Entrada</th>
<th>Saída</th>
</tr>

<tr>
<td>0</td>
<td>0</td>
<td>0</td>
</tr>

<tr>
<td>0</td>
<td>1</td>
<td>1</td>
</tr>

<tr>
<td>1</td>
<td>0</td>
<td>1</td>
</tr>

<tr>
<td>1</td>
<td>1</td>
<td>0</td>
</tr>

</table>

Agora a pergunta é, você pode criar um conjunto de pesos tal que um único neurônio possa produzir esta propriedade?

Acontece que você não pode. Neurônios únicos não podem correlacionar entradas, então ficam apenas confusos. Então neurônios individuais estão fora. Ainda podemos usar neurônios para de alguma forma formar uma porta XOR?

E se tentássemos algo mais complexo:

![](images/logic03.png)

Aqui, temos as entradas indo para duas portas separadas: o neurônio superior é uma porta OR, e o inferior é uma porta NAND. A saída dessas portas então é passada para outro neurônio, que é uma porta AND. Se você calcular as saídas em cada combinação de valores de entrada, verá que esta é uma porta XOR!

In [None]:
# Certifique-se de que você tem or_gate, nand_gate e and_gate funcionando do exercício acima!

def xor_gate(a, b):
    c = or_gate(a, b)
    d = nand_gate(a, b)
    return and_gate(c, d)
test(xor_gate)

## Redes Feedforward como Computações Matriciais

Discutimos anteriormente como a computação feed-forward de uma rede neural pode ser pensada como cálculos matriciais e funções de ativação. Faremos algumas computações reais com matrizes para ver isso em ação.

![](images/FF_NN.png)



## Exercício
Fornecidos abaixo estão os seguintes:

- Três matrizes de peso `W_1`, `W_2` e `W_3` representando os pesos em cada camada. A convenção para essas matrizes é que cada $W_{i,j}$ dá o peso do neurônio $i$ na camada anterior (esquerda) para o neurônio $j$ na próxima camada (direita).
- Um vetor `x_in` representando uma única entrada e uma matriz `x_mat_in` representando 7 entradas diferentes.
- Duas funções: `soft_max_vec` e `soft_max_mat` que aplicam a função soft_max a um único vetor, e linha por linha a uma matriz.

Os objetivos para este exercício são:
1. Para a entrada `x_in` calcular as entradas e saídas para cada camada (assumindo ativações sigmoid para as duas camadas do meio e saída soft_max para a camada final).
2. Escrever uma função que faça todo o cálculo da rede neural para uma única entrada
3. Escrever uma função que faça todo o cálculo da rede neural para uma matriz de entradas, onde cada linha é uma única entrada.
4. Testar suas funções em `x_in` e `x_mat_in`.

In [None]:
W_1 = np.array([[2,-1,1,4],[-1,2,-3,1],[3,-2,-1,5]])
W_1

In [None]:
W_2 = np.array([[3,1,-2,1],[-2,4,1,-4],[-1,-3,2,-5],[3,1,1,1]])
W_3 = np.array([[-1,3,-2],[1,-1,-3],[3,-2,2],[1,2,1]])

In [None]:
x_in = np.array([.5,.8,.2])
x_in

In [None]:
x_mat_in = np.array([[.5,.8,.2],[.1,.9,.6],[.2,.2,.3],[.6,.1,.9],[.5,.5,.4],[.9,.1,.9],[.1,.8,.7]])
x_mat_in

In [None]:
def soft_max_vec(vec):
    return np.exp(vec)/(np.sum(np.exp(vec)))

def soft_max_mat(mat):
    return np.exp(mat)/(np.sum(np.exp(mat),axis=1).reshape(-1,1))

In [None]:
## Estudante deve fazer os cálculos abaixo