<a href="https://colab.research.google.com/github/Nova3012k/Regression-Methods-Machine-Learning-/blob/main/Polynomial_Regression_A_Comprehensive_Guide.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Guía Completa de Regresión Polinomial**

## **Qué es la regresión polinomial**

La regresión polinomial es una extensión de la regresión lineal que permite modelar relaciones no lineales entre la variable dependiente
y y la variable independiente
x. En lugar de una línea recta, ajusta una curva polinómica de grado
n:



**y=β0 +β1 x1+β2 x2+β3 x3+ +βn xn+ϵ**


+ y - es lo que queremos predecir


+ x - es la variable de entrada


+ 0,1,...b0,b1,...bn - son los coeficientes del polinomio


+ n - es el grado del polinomio, que define la complejidad de la curva




n=1,  es una regresión lineal



n=2, es una curva cuadrática



n=3, es cúbica, etc

## **Para qué sirve**

Se utiliza cuando los datos muestran patrones curvos o no lineales que una línea recta no puede capturar. Algunos ejemplos:

+ Crecimiento poblacional.

+ Tendencias económicas o ventas.

+ Fenómenos naturales o biológicos.

+ Evolución de epidemias, como COVID-19

## **¿Por qué usar la regresión polinomial?**

**Relaciones no lineales:**
Permite capturar relaciones no lineales entre la variable dependiente y la variable independiente

**Flexibilidad:**
Proporciona un enfoque más flexible que la regresión lineal, al ajustar una mayor variedad de funciones

**Mejor ajuste:**
A menudo ofrece un mejor ajuste a los datos que un modelo lineal simple cuando la relación entre las variables es no lineal

## **Pasos en la Regresión Polinomial**

**Importar bibliotecas:**
Cargar las librerías necesarias para manejo de datos, gráficos y modelado.

**Cargar el conjunto de datos:**
Leer los datos que se van a usar para entrenar y evaluar el modelo.

**Dividir el conjunto de datos:**
Separar los datos en conjuntos de entrenamiento y prueba para evaluar el modelo de manera justa.

**Generar características polinomiales:**
Transformar los datos originales para incluir términos polinomiales (
𝑥
2
,
𝑥
3
, …).

**Entrenar el modelo de regresión polinomial:**
Ajustar los coeficientes del polinomio usando regresión lineal sobre las nuevas características.

**Realizar predicciones:**
Usar el modelo entrenado para predecir valores en el conjunto de prueba o en nuevos datos.

**Evaluar el modelo:**
Medir el desempeño del modelo con métricas como R² o error cuadrático medio (MSE).

## **Implementación en Python**

***Paso 1: Importar las bibliotecas necesarias***

In [10]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

***Paso 2: Cargar el conjunto de datos***

In [11]:

boston = fetch_california_housing()
X, y = boston.data, boston.target


***Paso 3: Dividir el conjunto de datos en entrenamiento y prueba***

In [12]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


***Paso 4: Generar características polinomiales***


In [13]:
poly = PolynomialFeatures(degree=2)
X_train_poly = poly.fit_transform(X_train)
X_test_poly = poly.transform(X_test)


***Paso 5: Entrenar el modelo de regresión polinomial***

In [14]:
model = LinearRegression()
model.fit(X_train_poly, y_train)


***Paso 6: Realizar predicciones***

In [15]:
y_pred = model.predict(X_test_poly)


***Paso 7: Evaluar el modelo***

In [16]:
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print("Error cuadrático medio:", mse)
print("Puntaje R^2:", r2)


Error cuadrático medio: 0.4643015261571134
Puntaje R^2: 0.6456819711504156


## **Interpretación de los resultados en regresión polinomial**

**Coeficientes (
𝛽
0
,
𝛽
1
,
…
,
𝛽
𝑛
β
0)**

Indican la contribución de cada término polinómico en el modelo. Cada coeficiente determina cómo afecta su correspondiente potencia de la variable independiente
𝑥
 a la predicción de
𝑦


**Error cuadrático medio (MSE)**

Mide la diferencia promedio al cuadrado entre los valores reales y los valores predichos. Un valor más bajo indica que el modelo se ajusta mejor a los datos

**Puntaje R² (R-cuadrado)**
Indica la proporción de la variabilidad de la variable dependiente que puede explicarse mediante las variables independientes. Un valor cercano a 1 significa que el modelo se ajusta muy bien a los datos

## **Conclusion**

La regresión polinomial es una extensión poderosa de la regresión lineal que permite modelar relaciones no lineales entre variables. Al transformar los datos originales en términos polinomiales, podemos ajustar curvas que capturan patrones complejos que una línea recta no podría

Esta técnica es especialmente útil cuando los datos muestran tendencias curvas o cambios de comportamiento. Además, al evaluar el modelo con métricas como R² o el error cuadrático medio, podemos determinar qué grado de polinomio ofrece el mejor ajuste
