# <font color = "red">REDES NEURAIS ARTIFICAIS

## Faremos 3 etapas de maneira individual, são elas:

- Desenvolvimento do FOWARD PROPAGATION

- Desenvolvimento da função de erro (LOSS)

- Desenvolvimento da BACKWARD PROPAGATION

## <font color = "green">Parte 1 - Implementando Uma Rede Neural Artifical Somente com Fórmulas Matemáticas (Sem Frameworks)

# Parte 1A - FOWARD PROPAGATION

____________________

### <font color = "red">Função Para Inicialização dos Pesos

In [1]:
import numpy as np

In [2]:
# Função para Inicialização randômmica dos parâmetros do modelo

def inicializa_parametros(dims_camada_entrada):

 # Dicionário para os parâmetros
 parameters = {}

 # Comprimento das dimensões das camadas
 comp = len(dims_camada_entrada)

 # Loop pelo comprimento
 for i in range(1,comp):

  # Inicialização da materiz de pesos
  parameters["W" + str(i)] = np.random.randn(dims_camada_entrada[i],
                                             dims_camada_entrada[i - 1]) * 0.01
  
  # Inicialização do bias
  parameters["b" + str(i)] = np.zeros((dims_camada_entrada[i], 1))

 return parameters   

### <font color = "green">Desenvolvendo a Função Sigmóide </font>

A principal razão pela qual usamos a função sigmóide é porque ela permite converter números para valores entre 0 e 1. 

Portanto, é especialmente usada para modelos em que temos que prever a probabilidade como uma saída. Como a probabilidade de qualquer coisa existir apenas entre o intervalo de 0 e 1, sigmoide é a escolha certa. Algumas caracterísiticas da função sigmóide:

- A função é diferenciável. Isso significa que podemos encontrar a inclinação da curva sigmóide em dois pontos.
- A função sigmóide logística pode fazer com que uma rede neural fique presa no momento do treinamento.
- A função softmax é uma função de ativação logística mais generalizada, utilizada para a classificação em várias classes.

**Afinal, O Que é Derivada?**


No Cálculo, a derivada em um ponto de uma função y = f(x) representa a taxa de variação instantânea de y em relação a x neste ponto. 

Um exemplo típico é a função velocidade que representa a taxa de variação (derivada) da função espaço. Do mesmo modo, a função aceleração é a derivada da função velocidade. Geometricamente, a derivada no ponto x = a de y = f(x) representa a inclinação da reta tangente ao gráfico desta função no ponto (a, f(a)).

A função que a cada ponto x associa a derivada neste ponto de f(x) é chamada de função derivada de f(x).

Em cada ponto, a derivada de f(x) é a tangente do ângulo que a reta tangente à curva faz em relação ao eixo das abscissas. A reta é sempre tangente à curva azul; a tangente do ângulo que ela faz com o eixo das abscissas é a derivada. Note-se que a derivada é positiva quando verde, negativa quando vermelha, e zero quando preta.

A derivada de uma função y = f(x) num ponto x = x0, é igual ao valor da tangente trigonométrica do ângulo formado pela tangente geométrica à curva representativa de y=f(x), no ponto x = x0, ou seja, a derivada é o coeficiente angular da reta tangente ao gráfico da função no ponto x0.

A função derivada é representada por f'(x).

In [6]:
# Função Sigmóide 

def sigmoide(Z):
 A = 1 / (1 + np.exp(-Z)) # exp é o calculo com número de euler
 return A, Z

# Essa função vai entregar resultado entre 0 e 1, 
# se for mais prox de 0, a saida sigmoide será 0, 
# se for mais próximo de 1, a saíde sigmoide será 1

### <font color = "green">Desenvolvendo a Função ReLu </font>

A principal razão pela qual usamos a função sigmóide é porque ela permite converter números para valores entre 0 e 1. 

Portanto, é especialmente usada para modelos em que temos que prever a probabilidade como uma saída. Como a probabilidade de qualquer coisa existir apenas entre o intervalo de 0 e 1, sigmoide é a escolha certa. Algumas caracterísiticas da função sigmóide:

- A função é diferenciável. Isso significa que podemos encontrar a inclinação da curva sigmóide em dois pontos.
- A função sigmóide logística pode fazer com que uma rede neural fique presa no momento do treinamento.
- A função softmax é uma função de ativação logística mais generalizada, utilizada para a classificação em várias classes.


In [12]:
# Função ReLu (Rectified Linear Unit) 

def relu(Z):
 A = abs(Z * (Z > 0)) # exp é o calculo com número de euler
 return A, Z

# Essa função vai entregar resultado entre 0 e 1, 
# se for mais prox de 0, a saida sigmoide será 0, 
# se for mais próximo de 1, a saíde sigmoide será 1

### Desenvolvendo a Ativação Linear da Rellu

In [7]:
# Operação de Ativação
# A é a matriz com os dados de entrada
# W é a matriz de pesos
# b é o bias

def linear_activation(A, W, b):
 Z = np.dot(W, A) + b
 cache = (A, W, b)
 return Z, cache

In [9]:
A = [1,2,3]
W = 0.02
b = 12

In [10]:
linear_activation(A, W, b)

(array([12.02, 12.04, 12.06]), ([1, 2, 3], 0.02, 12))

### <font color = "green">Construindo a Fowrward Propagation</font>

In [14]:
# Movimento para frente (fowrward)

def forward(A_prev, W, b, activation):

 # Se a função de ativação for sigmoid, entramos neste bloco
 if activation == "sigmoid":
  Z, linear_cache = linear_activation(A_prev, W, b)
  A, activation_cache = sigmoide(Z)

 # Se não, se for Relu, entramos nesse bloco
 elif activation == "relu":
  Z, linear_cache = linear_activation(A_prev, W, b)
  A, activation_cache = relu(Z)

 cache = (linear_cache, activation_cache)

 return A, cache 

## <font color = "green">Combinando Ativação e Propagação</font>

In [15]:
# Propagação para frente

# X = addos de entrada
def foward_propagation(X, parameters):

 # Lista de valores anteriores (cache)
 caches = []

 # Dados de entrada
 A = X

 # Comprimento dos parametros
 L = len(parameters) // 2 # divide // para que seja inteira

 # Loop nas camadas intermediarias - por isso se utiliza RELU
 for i in range(1, L):

  # Guarda o valor prévio de A
  A_prev = A

  # Executa o Foward
  A, cache = forward(A_prev, parameters["W" + str(i)], parameters["b" + str(i)], activation= "relu")

  # Grava o cache
  caches.append(cache)

 # Saída nna ultima camada
 A_last, cache = forward(A, parameters["W" + str(L)], parameters["b" + str(i)], activation="sigmoid")

 # Grava o cache

 return(A_last, caches)

## <font color = "green">Desenvolvendo a Função de Custo</font>

Onde comparamos os resultados do da passada para frente com os dados históricos