# Rede Neural Rasa

No Modelo de Regressão Logística tinhamos o seguinte cenário:

![](dp_lr.png)

De modo analogo, em uma rede neural, teremos uma ___Layer___ para o calculo dos $z^i$ e $a^i$ resultando em uma saída $ŷ$

![](rn.png)

# Representação de uma Rede Neural

![](rn_repre.png)

* __Input Layer:__ Entrada dos dados ($a^{[0]}$)
* __Hidden Layer:__ Cama "oculta" onde ocorrem os calculos ($z^i$ e $a^i$) - ($a^{[1]}$)
    * Dentro de cada nó da layer poderemos ter: $a^{[1]}_1$, $a^{[0]}_2$, $a^{[0]}_3, ...$
* __Output Layer:__ Saída, previsão ($a^{[2]}$)

__Notação:__

* Sobreescrito com "[]" representa a profundidade da layer
* $a^{[0]}$ --> Valores na layer inicial, "ativados" para a próxima camada
    * $a$ ativação para a próxima camada
* Convercionou-se não contabilizar a layer de entrada ao falar da qtde de layer de um RN

# Calculando a saída de uma RN

Olhando para um nó da rede neural:

![](rn_node.png)

Quando temos varios nós, e estamos lidando com matrizes, teremos nas __hidden layers__ de uma RN que o calculo das previsões se dá ao calcular um vetor coluna $Z$

$Z = \begin{bmatrix}
        (w^{[1]}_1)^T \\
        (w^{[2]}_1)^T \\
        (w^{[3]}_1)^T \\
        (w^{[4]}_1)^T
        \end{bmatrix}$ * 
        $\begin{bmatrix}
            X_1 \\
            X_2 \\
            X_3
            \end{bmatrix}$ + 
        $\begin{bmatrix}
            b_1^{[1]} \\
            b_2^{[1]} \\
            b_3^{[1]} \\
            b_4^{[1]}
        \end{bmatrix}$ = 
        $\begin{bmatrix}
            (w^{[1]}_1)^TX + b_1^{[1]} \\
            (w^{[2]}_1)^TX + b_2^{[1]} \\
            (w^{[3]}_1)^TX + b_3^{[1]} \\
            (w^{[4]}_1)^TX + b_4^{[1]}
        \end{bmatrix}$ = 
        $\begin{bmatrix}
            Z_1^{[1]} \\
            Z_2^{[1]} \\
            Z_3^{[1]} \\
            Z_4^{[1]}
        \end{bmatrix}$

Onde a matriz $[...(w^{[1]}_1)^TX + b_1^{[1]}...] = W^{[1]}$ e $[...b_1^{[1]}...] = b^{[1]}$

Além disso, para cada $Z_1^{[1]}$ teremos os $\sigma(Z_1^{[1]}) = a_1^{[1]}$. Logo,

$a^{[1]} = $ 
$\begin{bmatrix}
    a_1^{[1]} \\
    a_2^{[1]} \\
    a_3^{[1]} \\
    a_4^{[1]}
\end{bmatrix}$ $= \sigma(Z^{[1]})$

Portanto, com todas as equações vetorizadas, temos que, dada um input $x$:

$z^{[1]} = W^{[1]}x + b^{[1]}$ <br>
$a^{[1]} = \sigma(z^{[1]})$ <br>
$z^{[2]} = W^{[2]}a^{[1]} + b^{[2]}$ <br>
$a^{[2]} = \sigma(z^{[2]})$

## Calculando a saída para dado "m" elementos de entrada

Temos ue vetoriar as equanções anteriores, portanto "empilhamos" os vetor coluna numa matriz, onde cada coluna era um vetor coluna diferente, desta maneira teremos a implementação das equanções vetorizadas.

$X = $ 
$\begin{bmatrix}
    x^{[1]} \\
    x^{[2]} \\
    x^{[3]} \\
    ... \\
    x^{[m]}
\end{bmatrix}$ 

$Z^{[1]} = $ 
$\begin{bmatrix}
    z^{[1](1)} \\
    z^{[1](2)} \\
    z^{[1](3)} \\
    ... \\
    z^{[1](m)}
\end{bmatrix}$ 

$A^{[1]} = $ 
$\begin{bmatrix}
    a^{[1](1)} \\
    a^{[1](2)} \\
    a^{[1](3)} \\
    ... \\
    a^{[1](m)}
\end{bmatrix}$ 

De modo analogo teremos $A^{[2]}$ e $Z^{[2]}$