# Arquitectura 

<img src="src/img/arquitectura.png" width="800px">

Aquí hay algunos elementos clave de la arquitectura de las redes neuronales:

1. **Neuronas y capas:** Las redes neuronales están compuestas por capas de neuronas. La capa de entrada recibe los datos de entrada y transmite la información a través de una o más capas ocultas hacia la capa de salida. Cada neurona en una capa se conecta con las neuronas de la capa siguiente a través de conexiones llamadas pesos.

2. **Pesos y funciones de activación:** Los pesos son valores asociados a las conexiones entre neuronas y representan la fuerza o importancia de la conexión. Cada neurona realiza una suma ponderada de las entradas que recibe y aplica una función de activación para determinar su salida. La función de activación introduce no linealidades en la red y permite que esta aprenda relaciones complejas entre los datos.

3. **Feedforward y retropropagación:** En una red neuronal de alimentación directa (feedforward), la información fluye en una dirección, desde la capa de entrada hasta la capa de salida. Durante el entrenamiento, se utiliza un algoritmo llamado retropropagación (backpropagation) para ajustar los pesos de las conexiones en función del error entre las salidas deseadas y las salidas reales de la red. La retropropagación calcula las derivadas parciales del error con respecto a los pesos, permitiendo que la red se adapte y mejore su rendimiento.

4. **Arquitecturas especializadas:** Además de las redes neuronales de alimentación directa, existen otras arquitecturas especializadas. Algunas de las más comunes son las redes neuronales recurrentes (RNN)


## Vectores

<img src="src/img/rn_vectorial.png" width="500px">

La forma de calcular es por producto punto 

<img src="src/img/rn_vectorial_calculo.png" width="500px">

Resultado

<img src="src/img/rn_vectorial_res.png" width="500px">

En las redes neuronales no se van a manejar vectores, sino matrices

<img src="src/img/rn_matrices.png" width="500px">

Para este caso las filas y las columnas tienen que tener una relacion con la otra matriz

<img src="src/img/rn_matrices_ejem.png" width="500px">

## Funciones de activaciones
Nose puede apilar sumatirias de funciones lineales en una arquitectura de red neuronal, porque el resultado seria una ecuacion lineal. Para ello se usan funciones de activacion, existen dos:

- Discretas
- Continuas

<img src="src/img/fun_act.png" width="700px">

La funcion AND utiliza una funcion de activacion discreta

<img src="src/img/fun_act_and_discreta.png" width="700px">

### Funcion escalon / escalonada / threshold
Es muy util para tener dos salidas

<img src="src/img/fun_act_escalon.png" width="700px">

### Funcion signo / signum

<img src="src/img/fun_act_signo.png" width="700px">

### Funcion sigmoidal / sigmoid

<img src="src/img/fun_act_sigmoid.png" width="700px">

### Funcion tangente hiperbolica/tahn

Es similar al sigmoidal pero va de -1 a 1

<img src="src/img/fun_act_tanh.png" width="700px">

### Funcion lineal rectificada / ReLu
Si es menor a 0 se mantiene en cero, si es mayor a cero crece al infinito

<img src="src/img/fun_act_relu.png" width="700px">


### Funcion Softmax

Da la probabilidad de cada una de las posibles salidas.
Se usa para hacer clasificacion binaria y multiple

La función toma como entrada un vector de valores reales y produce como salida un vector de la misma dimensión, donde cada elemento del vector de salida representa la probabilidad de que la entrada pertenezca a una de las clases posibles.

La función softmax se define matemáticamente de la siguiente manera:

$$softmax(x_i) = \frac{exp(x_i)}{sum(exp(x_j))}$$

Donde:

**x_i →** es el i-ésimo elemento del vector de entrada.

**exp(x_i) →** es la función exponencial de x_i, que calcula el valor e elevado a la potencia de x_i.

**sum(exp(x_j)) →** es la suma de las funciones exponenciales de todos los elementos del vector de entrada.

La función softmax realiza dos pasos principales:

1. Calcula la función exponencial de cada elemento del vector de entrada, lo que asegura que los valores resultantes sean siempre positivos.
2. Normaliza los valores exponenciales dividiéndolos por la suma de todos ellos, lo que garantiza que la suma de las probabilidades sea igual a 1.

Al aplicar la función softmax, los elementos más grandes del vector de entrada se vuelven aún más grandes en el vector de salida, mientras que los elementos más pequeños se vuelven aún más pequeños. Esto amplifica las diferencias entre los valores y resalta las probabilidades relativas de las diferentes clases.

<img src="src/img/fun_softmax.png" width="700px">