# Redes Neuronales
![McCulloch Pitts](images/mcculloch_pitts.JPG)
En 1943 McCulloch y Pitts propusieron el primer modelo matemático de una neurona.

Desde una perspectiva de alto nivel, las redes neuronales son codificadores o decodificadores o una combinación de ambos. Los codificadores encuentran patrones en los datos para formar una representación compacta y útil. Los decodificadores generar nuevos datos o información de alta resolución útil a partir de esas representaciones. Desde una perspectiva, Deep Learning descubre formas de representar el mundo para que sea posible razonar de él. 

Desde la perspectiva de sistemas, las redes neuronales artificiales son un sistema de software que modelan la anatomía y capacidad de procesamiento de información de las neuronas y sinapsis biológicas. 

![Biological neuron](images/biological-neuron.png)

**Dendrita**: recibe señales de otras neuronas.

**Soma**: Procesa la información.

**Axón**: Transmite la salida de la neurona.

**Sinapsis**: Punto de conexión con otras neuronas.

Una neurona toma una señal de entrada (dendrita), la procesa como un CPU (soma), pasa la salida por medio de una estructra similar a un cable a otras neuronas conectadas (axón a sinapisis a las dendritas de otras neuronas).



El primer modelo computacional de una neurona fue propuesto por Warren McCulloch y Walter Pitts (1943). El modelo está dividido en dos partes. En la primera $g$ toma una entrada (dendrida), lleva a cabo una agregación y de acuerdo en el valor agregado la segunda parte $f$ toma una decisión. 
![McCulloch-Pitts Neuron](images/mcculloch-pitts-neuron.png)


Las entradas pueden ser excitatorias o inhibitorias. Las entradas inhibitorias son aquellas que tienen un máximo efecto en la toma de decisiones, independientemente de otras entradas en cuyo caso la salida será 0. Las entradas excitatorias no ocasionan que la neurona dispare sola, sin embargo puede la disparar con una combinación de entradas excitatorias.

![Formal neural network](images/formal-nn.png)

$g(x)$ está haciendo una suma de entradas, una simple agregación. $_theta$ representa a un umbral que controla la salida de la neurona. 

![Neuron model](images/neuron-model.jpg)
Relación de la arquitectura biológica de la neurona con el modelo matemático. 

## Función de activación
La salida de una neurona se calcula al aplicar una transformación $f$ sobre una suma ponderada de las señales de entrada. Esta transformación $f$ se conoce como la función de activación que generalmente se selecciona como no lineal. Esto permite que la red neuronal aprenda transformaciones no lineales complejas sobre la señal de entrada.

Algunos ejemplos de funciones de activación:
- Función de identidad $f(x) = x$
- Función logística $f(x)=(1+e~(-x))^{-1}$
- Sigmoidal $\sigma(x)=1/(1+e^{-x})$
- Tangencial $tanh(x)$
- ReLU: rectified linear unit $y=max(0, ..., x)$

## Función de pérdida (loss function)
- La función de pérdida cuantifica la diferencia entre la predicción y el valor real.
- Para el caso de regresión usualmente se emplea Mean Squared Error.
$MSE = (1/N)\sum(t_i-s_i)^{2}$
- Para el caso de clasificación usualmente se emplea Cross Entropy Loss $CE = -\sum(t_i*log(s_i))$

## Backpropagation
Tiene como propósito actualizar los pesos y el bias para decrementar la función de pérdida.
![Forward propagation](images/forward-propagation.jpg)
![Backpropagation](images/backpropagation.jpg)
### Proceso backpropagation
1. Forward pass para calcular la salida de la red y el error.
2. Back propagation para calcular los gradientes.
3. Una fracción del gradiente del peso se substrae del peso.

## Tipos de redes neuronales
1. Feed Forward Neural Networks. Se trata de redes neuronales artificiales en donde las conexiones entre los nodos no forman ciclos. Se emplean para clasificación y regresión basada en características.
2. Convolutional Neural Networks. Redes neuronales profundas que generalmente se aplican en procesamiento de imágenes con aplicaciones en reconocimiento de imágenes y video, sistemas de recomendaciones, clasificación de imágenes y procesamiento de lenguaje natural. Se hace uso de la operación lineal conocida como convolución en vez de una multiplicación general de matrices en al menos una de sus capas.
3. Recurrent Neural Networks. También conocidas como redes auto asociativas o de retroalimentación, son redes neuronales en donde  las conexiones entre sus unidades forman un ciclo directo. Se emplean en modelado de lenguaje, reconocimiento y generación de lenguaje.
4. Encoder Decoder Architecture. Arquitectura para redes neuronales de tipo recurrente que actualmente representan el método estándar para traducción neuronal automatizada. 
5. Autoencoder. Redes neuronales que aprenden codificaciones eficientes de datos de forma no supervisada. Empleados en  reconocimiento facial y determinación del significado de palabras. Se emplean para reducción de dimensiones y para entrenar las redes a ignorar ruido.
6. Generative Adversarial Networks. Redes neuronales que compiten entre sí. La red productora crea candidatos, mientras que la red discriminatoria los evalua. El objetivo de la red productora es incrementar la tasa de error de la red discriminatoria. Empleadas para crear fotografías muy realistas de sujetos, incluyendo personas, paisajes y portadas de discos.
7. Deep Reinforcement Learning. Emplea los principios de deep learning y reinforcement learning para crear algoritmos eficientes que se apliquen en robótica, video juegos, finanzas y salud. Se aplica en juegos, simulaciones de robótica.

