# **Calculando Erro da Rede com Loss**

Para que possamos criar, moldar e implementar uma rede neural, devemos ter parâmetros que serão utilizados como um guia nesse aprendizado. Um desses parêmtros é a função Loss (perda, em inglês), que também é chamada de Cost Function (função custo, em inglês). Essas funções permitem que o algoritmo quantifique o quão errado está o modelo em uma aplicação. naturalmente, é importante nortar que queremos uma função erro igual a zero, apesar disso ser praticamente impossível na prática.

## **Categorical Cross-Entropy Loss**

O Categorical Cross-Entropy Loss é uma função utilizada para classificar multi classes. Quando estudávamos os problemas envolvendo regressões, utilizávamos o erro quadrático médio, contudo, quando os problemas passaram a ter um foco diferente, a abordagem para calcular o erro também teve de passar por modificações. 

Neste caso, faz sentido utilizar entropia cruzada, pois ela deriva de um ramo da teoria da informação onde, dada duas distribuições de probabilidade $p$ e $q$ sobre o mesmo conjunto subjacente de eventos, ela consegue medir o número médio de bits necessários para identificar um evento extraído do conjunto se um esquema de codificação usado para o conjunto for otimizado para um distribuição de probabilidade estimada $q$, em vez da distribuição verdadeira $p$. Em outras palavras, essa função compara uma probabilidade "real" com uma probabilidade "prevista". Como estamos lidando com probobilidades de classificação, esse método é muito usado em redes neurais onde a saida é dada por uma função Softmax. 

A fórmula para calcular a entropia cruzada categórica de $y$ (distribuição real/desejada) e
$y'$ (distribuição prevista) é:

$$L_{i} =  - \sum_{j}y_{ij} \log (y'_{ij})$$

Onde $L$ é o valor Loss, $i$ é a i-ésima amostra no conjunto, $j$ é o índice de rótulo/saída.

**Exemplo - 01**

Calcule o erro do modelo usando Categorical Cross-Entropy para um vetor estimado igual $[0.45, 0.23, 0.7, 0.12]$ sabendo que o seu alvo é igual a $[0.4, 0.2, 0.5, 1]$.

$$\begin{align*}L_{i} &= - \sum_{j}y_{ij} \log (y'_{ij}) \\ \, &= -(0.4\log(0.45) + 0.2 \log(0.23) + 0.5\log(0.7) + 1\log(0.12)) \\ \, &= 2.91193928066835 \end{align*}$$

**Exemplo - 02**

Sabendo-se que o valor estimado como output de uma rede neural com ativação Softmax é dado por $[0.7, 0.1, 0.2]$ e que o valor real é dado por $[1, 0, 0]$, calcule o erro com base na função Categorical Cross-Entropy.

$$\begin{align*}L_{i} &= - \sum_{j}y_{ij} \log (y'_{ij}) \\ \, &= -(1\log(0.7) + 0\log(0.1) + 0\log(0.2)) \\ \, &= 0.35667494393873  \end{align*}$$

In [1]:
# Exemplo em python 01:
import numpy as np

# O exemplo acima de categorical cross-Entropy - "rótulo" esperado pela rede neural
softmax_output = [0.7, 0.1, 0.2]

# "rótulo" verdadeiro
target_output = [1, 0, 0]

# Calcula o valor da função de custo
loss = -(np.log(softmax_output[0])*target_output[0] +
         np.log(softmax_output[1])*target_output[1] +
         np.log(softmax_output[2])*target_output[2])

# Printa o valor da função custo
print(loss)

0.35667494393873245
