# Regresión Polinomial

## Fundamentos

La regresión polinomial es un tipo de regresión lineal en la que la relación entre la variable de entrada (x) y la variable de salida (y) se expresa como un polinomio. En términos simples, es como ajustar una línea curva en lugar de una línea recta a los puntos de datos. Esta curva representa cómo cambia y a medida que x se eleva a diferentes potencias...

## Mathematical Model

$$
y = \beta_0 + \beta_1 x + \beta_2 x^2 + \cdots + \beta_n x^n + \epsilon
$$

- **y** es la variable dependiente.  
- **x** es la variable independiente.  
- **β₀, β₁, …, βₙ** son los coeficientes del modelo.  
- **ε** es el término de error.

[Regresión Lineal](https://miro.medium.com/v2/resize:fit:1100/format:webp/0*01FAhpRBipr-reSK.gif)

![Regresión Polinomial](https://miro.medium.com/v2/format:webp/1*QKcwvXU0UZ9YtkmRNKBM3w.gif)`

# **Pipeline**

## **Importar librerías**



```python
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')
from sklearn.model_selection import GridSearchCV, train_test_split
from sklearn.pipeline import Pipeline
from sklearn.metrics import mean_squared_error, r2_score
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
```

## **Creación y visualización de datos**

```python
X = np.arange(0, 40)
y = [1, 4, 5, 7, 8, 6, 9, 10, 10, 23, 25, 44, 50, 63, 67, 64, 62, 70, 75, 88,
     90, 92, 95, 100, 108, 135, 151, 160, 169, 172, 173, 176, 175, 175, 176,
     178, 179, 180, 190, 201]

plt.scatter(X, y, color='blue', label='Datos reales')
plt.xlabel('X')
plt.ylabel('y')
plt.title('Dispersión de los datos originales')
plt.legend()
plt.show()
```

- X contiene los valores independientes (0–39).

- y son las observaciones dependientes.

- El gráfico permite observar una tendencia no lineal, lo que motiva el uso de un modelo polinomial.

## **División del conjunto de datos**

```python
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42
)
```
- 80% de los datos se usan para entrenamiento y 20% para pruebas.


## **Creación del Pipeline y Búsqueda del Mejor Grado**

```python
pipeline = Pipeline([
    ('poly', PolynomialFeatures()),
    ('linear', LinearRegression())
])

parameters = {'poly__degree': np.arange(1, 5)}

grid_search = GridSearchCV(
    pipeline, parameters, cv=4, scoring='neg_mean_squared_error'
)
grid_search.fit(X_train.reshape(-1, 1), y_train)

best_degree = grid_search.best_params_['poly__degree']
```
- Se crea un pipeline que encadena la generación de características polinomiales y el modelo lineal.


## **Entrenamiento**

```python
poly_best = PolynomialFeatures(degree=best_degree)
X_poly_train_best = poly_best.fit_transform(X_train.reshape(-1,1))
X_poly_test_best = poly_best.transform(X_test.reshape(-1,1))

model_best = LinearRegression()
model_best.fit(X_poly_train_best, y_train)
```
- Se transforman los datos a su versión polinomial con el grado óptimo.

- Se entrena el modelo de regresión lineal sobre estas nuevas características.


## **Predicciones**

```python
predictions_train = model_best.predict(X_poly_train_best)
predictions_test = model_best.predict(X_poly_test_best)
```

- predictions_train son las predicciones del modelo sobre los datos de entrenamiento.


- predictions_test son las predicciones sobre los datos de prueba.

### **Evaluación**

```python
train_error = mean_squared_error(y_train, predictions_train)
test_error = mean_squared_error(y_test, predictions_test)
train_r2 = r2_score(y_train, predictions_train)
test_r2 = r2_score(y_test, predictions_test)

print("Mejor grado:", best_degree)
print("Error cuadrático medio (Train):", train_error)
print("Error cuadrático medio (Test):", test_error)
print("R² (Train):", train_r2)
print("R² (Test):", test_r2)
```

## **Interpretación**

- MSE bajo → el modelo tiene buen ajuste.

- R² cercano a 1 → el modelo explica casi toda la variabilidad de los datos.


![Regresión Polinomial](https://miro.medium.com/v2/format:webp/1*JMhtz_mMDuKwWPHCk16Qdg.png)

## **Referencias**

- Skikri, H. (2024, February 3). Polynomial regression in machine learning: Understanding the process. Medium. [Medium](https://medium.com/@Hassane_01/polynomial-regression-in-machine-learning-understanding-the-process-6b10989b6c8c)

