# <font style="color:rgb(50,120,229)"> Regresión </font>

Regresión es un tipo de problema de aprendizaje supervisado en el que se intenta predecir un valor numérico a partir de un conjunto de características. 

El objetivo es encontrar una función que se ajuste lo mejor posible a los datos de entrenamiento.

<center style="display: flex; justify-content: center; align-items: center; gap: 32px;">
<img src="./images/data_regresion.png" width=600>
<img src="./images/result_regresion.png" width=600>
</center>

Observa que los datos predecidos puede ser cualquier **valor continuo**

## <font style="color:rgb(50,120,229)"> Arquitectura de una red neuronal para regresión </font>

Para que una red neuronal pueda resolver un problema de regresión debe de cumplir con las siguientes características:

1. **Capa de entrada**: El número de neuronas en la capa de entrada debe ser igual al número de características en los datos de entrada.
2. **Capa de salida**: La capa de salida debe tener una sola neurona, ya que estamos prediciendo un solo valor.
3. **Función de activación**: La función de activación en la capa de salida debe ser una función lineal, ya que estamos prediciendo un valor continuo.

## <font style="color:rgb(50,120,229)"> Función de Costo utilizada en Regresión </font>

### <font style="color:rgb(50,120,229)"> Error Cuadrático Medio (MSE) </font>

La formula matemática para el error cuadrático medio es:

$$
MSE = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2
$$

Donde:

- $n$ es el número de ejemplos o muestras.
- $y_i$ es el valor real.
- $\hat{y}_i$ es el valor predicho por el modelo.

Aquí, tomamos la media de la diferencia al cuadrado entre el valor real y los valores predichos, por eso el nombre, Error Cuadrático Medio. 

Como esta es una función de error, nos gustaría que este valor fuera lo más pequeño posible. Un valor más pequeño indica que el valor real y los valores predichos están más cerca entre sí.

Sin embargo, hay algunas desventajas al usar MSE:

- Es sensible a los valores atípicos.

Un valor atípico es un valor que es significativamente diferente de los otros valores en el conjunto de datos.


<font style="color:rgb(8,133,37)">**MSE en Keras**</font>

En Keras, podemos utilizar la función de costo `mean_squared_error` para calcular el error cuadrático medio.

```python
from keras.losses import mean_squared_error
```

### <font style="color:rgb(50,120,229)"> Error Absoluto Medio (MAE) </font>

MAE es otra forma común de calcular el error entre los valores reales y los valores predichos. Aquí, en lugar de elevar al cuadrado el error, promediamos el error sobre el valor absoluto de la diferencia entre los valores reales y los valores predichos.

$$
MAE = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i|
$$

Donde:

- $n$ es el número de ejemplos o muestras.
- $y_i$ es el valor real.
- $\hat{y}_i$ es el valor predicho por el modelo.

Aquí también, un valor más bajo indica un modelo mejor.

Supera algunas de las desventajas del MSE:

- Menos sensible a los valores atípicos en comparación con el MSE.

<font style="color:rgb(8,133,37)">**MAE en Keras**</font>

En Keras, podemos utilizar la función de costo `mean_absolute_error` para calcular el error absoluto medio.

```python
from keras.losses import mean_absolute_error
```
