<a href="https://colab.research.google.com/github/DanielDialektico/dialektico-machine-learning-practices/blob/main/notebooks/Machine%20Learning/Miscel%C3%A1nea/Sobreajuste_y_subajuste_de_modelos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<img src="https://dialektico.com/wp-content/uploads/2023/03/MiniLogoW4.png" alt="Dial√©ktico Logo" />

# **Sobreajuste y subajuste de modelos de machine learning üëï**

# **Introducci√≥n**

¬øC√≥mo se comportan las predicciones de modelos **sobreajustados** y **subajustados**? En esta breve pr√°ctica visualizaremos c√≥mo lucen los efectos de modelos de aprendizaje autom√°tico con ajustes deficientes, debido principalmente a la alta o poca dimensionalidad de sus mapeos, todo en concordancia con lo aprendido en el [recorrido en sobreajuste y subajuste de modelos](https://dialektico.com/subajuste-sobreajuste-teoria-programacion/).

<br>
<center><img src="https://dialektico.com/wp-content/uploads/2025/03/MSYS_Colab.png" width="300" /></center>

<br>

#**Objetivo**

La meta es visualizar en **gr√°ficas** c√≥mo lucen los resultados de funciones **sobreajustadas** y **subajustadas** despu√©s de calcular sus **par√°metros** mediante algoritmos de **aprendizaje autom√°tico**.

<br>
<center><img src="https://dialektico.com/wp-content/uploads/2025/03/MSYS_Colab_2.png" width="400" /></center>

<br>

#**Preparaci√≥n de datos y librer√≠as**

Comenzaremos por instalar e importar las librer√≠as correspondientes, con las versiones espec√≠ficas para procurar un correcto funcionamiento de la pr√°ctica:

In [None]:
# Se instalan las librer√≠as.
!pip install pandas==2.2.2
!pip install matplotlib==3.10.0
!pip install numpy==2.0.2
!pip install scikit-learn==1.6.1

# Se importan las librer√≠as.
import warnings
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.pipeline import make_pipeline
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

# Se filtran las advertencias.
warnings.filterwarnings('ignore')

# Se define el estilo de las gr√°ficas.
plt.style.use('seaborn-v0_8-whitegrid')

# Se define el despliegue de flotantes en dataframes.
pd.options.display.float_format = '{:.2f}'.format


Para esta pr√°ctica, nos es oportuno generar conjuntos de datos sint√©ticos (es decir, generados por nosotros, no recolectados), ya que buscamos simplificar la observaci√≥n de los fen√≥menos de sobreajuste y subajuste en gr√°ficas de dos dimensiones. Para esto, utilizaremos la librer√≠a [Numpy](https://numpy.org/):

In [None]:
# Se generan datos sint√©ticos con una relaci√≥n no lineal.
np.random.seed(42)
X = np.sort(5 * np.random.rand(30, 1), axis=0)
y = np.sin(X).ravel() + np.random.normal(0, 0.2, X.shape[0])

¬øQu√© hace este c√≥digo?, genera los datos sint√©ticos que utilizaremos para ajustar modelos de machine learning, esto es lo que se hizo:



* `np.random.seed(42)`: establece una semilla para el generador de n√∫meros aleatorios de NumPy. Esto significa que cada vez que ejecutes el c√≥digo, se obtendr√°n los mismos valores "aleatorios".
* `np.random.rand(30, 1)`: genera una matriz de 30 filas y 1 columna con valores aleatorios entre 0 y 1. Luego se multiplica por 5, as√≠ que los valores estar√°n entre 0 y 5.
* `np.sort(..., axis=0)`: ordena los valores de menor a mayor a lo largo del eje de las filas (eje 0).


Ahora imprimimos parte de la tabla con los datos:

In [None]:
# Se crea el DataFrame.
df = pd.DataFrame(X, columns=["Variable de entrada"])
df["Variable objetivo (salida)"] = y

# Se muestran los primeros 10 valores de la tabla.
df.head(10)

Estos datos que hemos creado, nos permiten imaginar cualquier escenario, ya que la informaci√≥n creada define una variable de **entrada** y una de **salida**, lo cual se puede ajustar a datos de diferentes fen√≥menos o situaciones.

Veamos c√≥mo lucen en una gr√°fica:

In [None]:
# Se genera la gr√°fica de dispersi√≥n de los puntos generados.
plt.scatter(df["Variable de entrada"], df["Variable objetivo (salida)"],
            color='blue', s=50, label='Datos')

# Configuraci√≥n del gr√°fico.
plt.title("Dispersi√≥n de los datos", fontsize=14, fontweight='bold')
plt.xlabel("Variable de entrada 1", fontsize=12, fontweight='bold')
plt.ylabel("Variable objetivo", fontsize=12, fontweight='bold')
plt.legend(loc='upper right', fontsize=11)
plt.grid(True)

plt.suptitle("Figura 1: Distribuci√≥n de los datos generados.",
             fontproperties={'family': 'DejaVu Sans', 'size': 11}, y=-0.001)

plt.show()

Ahora que tenemos los datos, buscaremos entrenar modelos que capturen su comportamiento.

<br>

# **Entrenando un modelo con subajuste**

Ahora que tenemos un **conjunto de datos**, lo que queremos es obtener una **funci√≥n** que describa su **tendencia**, para lo cual utilizaremos un algoritmo de aprendizaje supervisado, el cual ser√° una **regresi√≥n linea**l.

Para ilustrar c√≥mo luce un modelo subajustado, utilizaremos una regresi√≥n lineal simple (univariable).

<center><img src="https://dialektico.com/wp-content/uploads/2025/03/MSYS_K_1.jpg" width="430" /></center>

<center><img src="https://dialektico.com/wp-content/uploads/2025/03/MSYS_D_1.jpg" width="430" /></center>

Entrenamos un modelo utilizando la regresi√≥n lineal con Scikit-Learn, la cual generar√° una funci√≥n que trazar√° una l√≠nea recta que se intentar√° ajustar a los datos:

In [None]:
# Se dividen los datos en conjuntos de entrenamiento y prueba.
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Se entrena un modelo con regresi√≥n lineal.
lin_reg = LinearRegression()
lin_reg.fit(X_train, y_train)
y_pred_lin_train = lin_reg.predict(X_train)
y_pred_lin_test = lin_reg.predict(X_test)

# Se crea la gr√°fica.
plt.figure(figsize=(6, 6))

plt.plot(X, y, 'o', color='blue', markersize=6, label='Datos')

x_range = np.linspace(X.min(), X.max(), 100).reshape(-1, 1)
y_line = lin_reg.predict(x_range)
plt.plot(x_range, y_line, color='black', linewidth=2, label='Regresi√≥n lineal')

# Configuraci√≥n del gr√°fico
plt.title("Modelado de datos con regresi√≥n lineal", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 16
}, pad=15)
plt.xlabel("Variable de entrada", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 12
}, labelpad=15)
plt.ylabel("Variable de salida", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 12
}, labelpad=15)
plt.legend(loc='upper right', prop={
    'family': 'DejaVu Sans', 'weight': 'bold', 'size': 11
}, frameon=True, framealpha=1, facecolor='#dddddd', shadow=True)

plt.suptitle("Figura 2: L√≠nea de regresi√≥n ajustada a los datos.",
             fontproperties={'family': 'DejaVu Sans', 'size': 11}, y=-0.001)

plt.show()

Notar√°s que se ha obtenido un **modelo** (ecuaci√≥n de una recta) para la predicci√≥n de los datos.

Para evaluar que tan bien act√∫a la funci√≥n sobre los datos de prueba y entrenamiento, utilizaremos las m√©tricas $\text{MSE}$ (Error Cuadr√°tico Medio) y $\mathrm{R^2}$ (coeficiente de determinaci√≥n):

In [None]:
# Se calculan las m√©tricas
mse_lin_train = mean_squared_error(y_train, y_pred_lin_train)
mse_lin_test = mean_squared_error(y_test, y_pred_lin_test)

r2_train = lin_reg.score(X_train, y_train)
r2_test = lin_reg.score(X_test, y_test)

# Se imprimen.
print(f"MSE Entrenamiento: {mse_lin_train:.4f}\nMSE Prueba: {mse_lin_test:.4f}\n")
print(f"R¬≤ Entrenamiento: {r2_train:.4f}\nR¬≤ Prueba: {r2_test:.4f}")

¬øRecuerdas c√≥mo interpretarlas? Puedes echar un vistazo a esta exploraci√≥n: https://dialektico.com/metricas-de-evaluacion-de-modelos-de-regresion/


Es hora de hacer un poco de **an√°lisis de datos**; para interpretar el MSE necesitamos conocer los rangos de los datos de salida, para lo cual podemos utilizar la siguiente funci√≥n de Pandas:

In [None]:
df.describe()

Dado que los valores est√°n entre $-0.99$ y $1.10$, se puede considerar que el punto medio se encuentra alrededor de $0$, por lo que las mediciones de $0.1924$ y $0.1873$ de MSE en los conjuntos de datos de entrenamiento y prueba se pueden considerar relativamente **altos**. Esto se ve reforzado por los valores calculados para $\mathrm{R^2}$, los cuales est√°n apenas por encima de $0.5$, indicando cierta lejan√≠a del valor $1$, el cual ser√≠a el ideal para esta m√©trica.

Vemos, por lo tanto, un **desempe√±o deficiente** al ser evaluado tanto en el conjunto de datos de **entrenamiento** como en el de **prueba**, lo cual indica que se tiene un modelo subajustado (adem√°s, la gr√°fica nos muestra una funci√≥n claramente ineficiente para describir el **comportamiento** de las observaciones).



¬øC√≥mo podemos mejorar el **ajuste** del **modelo**? Una de las formas m√°s t√≠picas es aumentando la **complejidad** del mismo, es decir, a√±adiendo un mayor n√∫mero de **variables** regresoras parametrizadas del modelo final, como vimos en el ejemplo de modelos **subajustados** en nuestro recorrido.

Para hacer esto, realizaremos otra regresi√≥n lineal, pero a√±adiendo variables no lineales al modelo final, permitiendo capturar comportamientos menos lineales.

Esto se logra utilizando una **regresi√≥n polinomial** como se muestra a continuaci√≥n:

In [None]:
# Se genera un modelo con mejor ajuste (Polinomio grado 3).
poly_reg = make_pipeline(PolynomialFeatures(degree=3), LinearRegression())
poly_reg.fit(X_train, y_train)
X_plot = np.linspace(X.min(), X.max(), 100).reshape(-1, 1)  # Generar puntos ordenados para una mejor visualizaci√≥n
y_pred_poly_plot = poly_reg.predict(X_plot)

# Se grafica.
plt.figure(figsize=(6, 6))

plt.plot(X, y, 'o', color='blue', markersize=6, label='Datos')

plt.plot(X_plot, y_pred_poly_plot, color='black', linewidth=2, label='Regresi√≥n polinomial (grado 3)')

# Configuraci√≥n de la gr√°fica
plt.title("Modelado de datos con regresi√≥n polinomial", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 16
}, pad=15)
plt.xlabel("Variable de entrada", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 12
}, labelpad=15)
plt.ylabel("Variable de salida", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 12
}, labelpad=15)
plt.legend(loc='upper right', prop={
    'family': 'DejaVu Sans', 'weight': 'bold', 'size': 11
}, frameon=True, framealpha=1, facecolor='#dddddd', shadow=True)

plt.suptitle("Figura 3: Curva polinomial ajustada a los datos.",
             fontproperties={'family': 'DejaVu Sans', 'size': 11}, y=-0.001)

plt.show()

En esta segunda gr√°fica se observa un modelo mucho mejor ajustado a los datos. La diferencia es m√°s visible si comparamos las gr√°ficas directamente:

In [None]:
# Graficamos la comparaci√≥n entre el modelo subajustado y el mejor ajustado
fig, axs = plt.subplots(1, 2, figsize=(14, 6))

# ===== Subgr√°fico 1: Modelo subajustado =====
axs[0].plot(X, y, 'o', color='blue', markersize=6, label='Datos')
axs[0].plot(X_train, y_pred_lin_train, color='black', linewidth=2, label='Regresi√≥n lineal')
axs[0].set_title("Modelado de datos con regresi√≥n lineal", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 16
}, pad=15)
axs[0].set_xlabel("Variable de entrada", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 12
}, labelpad=15)
axs[0].set_ylabel("Variable de salida", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 12
}, labelpad=15)
axs[0].legend(loc='upper right', prop={
    'family': 'DejaVu Sans', 'weight': 'bold', 'size': 11
}, frameon=True, framealpha=1, facecolor='#dddddd', shadow=True)
axs[0].grid(True)

# ===== Subgr√°fico 2: Modelo con mejor ajuste =====
axs[1].plot(X, y, 'o', color='blue', markersize=6, label='Datos')
axs[1].plot(X_plot, y_pred_poly_plot, color='black', linewidth=2, label='Regresi√≥n polinomial (grado 3)')
axs[1].set_title("Modelado de datos con regresi√≥n polinomial", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 16
}, pad=15)
axs[1].set_xlabel("Variable de entrada", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 12
}, labelpad=15)
axs[1].set_ylabel("Variable de salida", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 12
}, labelpad=15)
axs[1].legend(loc='upper right', prop={
    'family': 'DejaVu Sans', 'weight': 'bold', 'size': 11
}, frameon=True, framealpha=1, facecolor='#dddddd', shadow=True)
axs[1].grid(True)

fig.suptitle("Figura 4: Comparaci√≥n entre regresi√≥n lineal (subajustada) y polinomial (mejor ajuste).",
             fontproperties={'family': 'DejaVu Sans', 'size': 11}, y=0.02)

plt.tight_layout(rect=[0, 0.04, 1, 1])  # Espacio para el subt√≠tulo
plt.show()

Para obtener una medida anal√≠tica de estas diferencias, recurrimos a las m√©tricas de desempe√±o:

In [None]:
# Se calculan errores para la nueva funci√≥n.
mse_poly_train = mean_squared_error(y_train, poly_reg.predict(X_train))
mse_poly_test = mean_squared_error(y_test, poly_reg.predict(X_test))

poly_r2_train = poly_reg.score(X_train, y_train)
poly_r2_test = poly_reg.score(X_test, y_test)

# Se imprimen.
print('M√©tricas de evaluaci√≥n del modelo polinomial con mejor ajuste:\n')
print(f"MSE Entrenamiento: {mse_poly_train:.4f}\nMSE Prueba: {mse_poly_test:.4f}\n")
print(f"R¬≤ Entrenamiento: {poly_r2_train:.4f}\nR¬≤ Prueba: {poly_r2_test:.4f}")

Es muy notoria la diferencia con las m√©tricas obtenidas para el modelo subajustad, la cual se puede discernir mejor en la siguiente tabla:

In [None]:
# Crear DataFrame comparativo
df_metrics = pd.DataFrame({
    "Modelo subajustado": [mse_lin_train, mse_lin_test, r2_train, r2_test],
    "Modelo con mejor ajuste": [mse_poly_train, mse_poly_test, poly_r2_train, poly_r2_test]
}, index=["MSE Entrenamiento", "MSE Prueba", "R¬≤ Entrenamiento", "R¬≤ Prueba"])

# Mostrar la tabla
df_metrics

Podemos observar c√≥mo el $\mathrm{R^2}$ se acerca casi al $1$ ideal en el modelo polinomial (con mejor ajuste), adem√°s de que el MSE es m√°s del doble del obtenido en el modelo **subajustado**. Las m√©tricas obtenidas para el modelo con mejor ajuste arrojan resultados parecidos para los conjuntos de entrenamiento y prueba, lo cual suele indicar un modelo "saludable" en sus predicciones, es decir, con una aceptable capacidad de generalizaci√≥n sobre datos nuevos.

<center><img src="https://dialektico.com/wp-content/uploads/2025/03/MSYS_M_1.jpg" width="500" /></center>

<br>

# **Entrenando un modelo sobreajustado**

Hemos visto c√≥mo lucen las predicciones de un modelo **subajustado**, por lo que sigue experimentar con un modelo **sobreajustado** a las observaciones.

Para esto, utilizaremos el mismo conjunto de datos, pero incrementando la complejidad del modelo con un polinomio de mayor grado (grado 15):

In [None]:
# Se genera modelo sobreajustado (Polinomio grado 15).
poly_reg_overfit = make_pipeline(PolynomialFeatures(degree=15), LinearRegression())
poly_reg_overfit.fit(X_train, y_train)

X_plot = np.linspace(X.min(), X.max(), 100).reshape(-1, 1)  # Generar puntos ordenados para una mejor visualizaci√≥n
y_pred_poly_plot = poly_reg_overfit.predict(X_plot)

# Se grafican los resultados.
plt.figure(figsize=(6, 6))

plt.plot(X, y, 'o', color='blue', markersize=6, label='Datos')

plt.plot(X_plot, y_pred_poly_plot, color='black', linewidth=2, label='Regresi√≥n polinomial (grado 15)')

# Configuraci√≥n de la gr√°fica
plt.title("Modelado de datos sobreajustado", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 16
}, pad=15)
plt.xlabel("Variable de entrada", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 12
}, labelpad=15)
plt.ylabel("Variable de salida", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 12
}, labelpad=15)
plt.legend(loc='lower left', prop={
    'family': 'DejaVu Sans', 'weight': 'bold', 'size': 11
}, frameon=True, framealpha=1, facecolor='#dddddd', shadow=True)

plt.suptitle("Figura 5: Curva polinomial ajustada a los datos.",
             fontproperties={'family': 'DejaVu Sans', 'size': 11}, y=-0.001)

plt.show()

Podemos observar al mismo conjunto de datos, pero con un modelo a√∫n m√°s ajustado que el anterior, adhiri√©ndose al comportamiento exacto de la muestra.

Este modelo se estar√≠a **sesgando** por su alta fidelidad a las **variaciones** de los datos, que no reflejan el **patr√≥n** que se ha supuesto que subyace a su tendencia.

Obtenemos las m√©tricas de evaluaci√≥n para medir su desempe√±o:

In [None]:
# Se calculan los errores.
mse_poly15_train = mean_squared_error(y_train, poly_reg_overfit.predict(X_train))
mse_poly15_test = mean_squared_error(y_test, poly_reg_overfit.predict(X_test))

poly15_r2_train = poly_reg_overfit.score(X_train, y_train)
poly15_r2_test = poly_reg_overfit.score(X_test, y_test)

# Se imprimen.
print(f"MSE Entrenamiento: {mse_poly15_train:.4f}\nMSE Prueba: {mse_poly15_test:.4f}\n")
print(f"R¬≤ Entrenamiento: {poly15_r2_train:.4f}\nR¬≤ Prueba: {poly15_r2_test:.4f}")

Se puede notar la diferencia entre los resultados sobre el conjunto de datos de entrenamiento y el de prueba.

La comparaci√≥n final lucir√≠a de la siguiente manera:

In [None]:
# Se crea DataFrame comparativo.
df_metrics = pd.DataFrame({
    "Modelo subajustado": [mse_lin_train, mse_lin_test, r2_train, r2_test],
    "Modelo con mejor ajuste": [mse_poly_train, mse_poly_test, poly_r2_train, poly_r2_test],
    "Modelo sobreajustado": [mse_poly15_train, mse_poly15_test, poly15_r2_train, poly15_r2_test]
}, index=["MSE Entrenamiento", "MSE Prueba", "R¬≤ Entrenamiento", "R¬≤ Prueba"])

# Se imprime.
df_metrics

El modelo con mejor ajuste muestra valores aceptables y parecidos para ambos conjuntos de datos.

El modelo **subajustado** mantiene m√©tricas deficientes para ambos conjuntos, mientras que el modelo **sobreajustado** difiere de forma significativa en las medidas entre ambos conjuntos.

Finalmente, mostramos c√≥mo lucen los tres modelos entrenados en esta sesi√≥n:

In [None]:
# Rrangos de valores para las predicciones de cada modelo
x_range = np.linspace(X.min(), X.max(), 100).reshape(-1, 1)  # Para el modelo lineal
X_plot_poly = np.linspace(X.min(), X.max(), 100).reshape(-1, 1)  # Para el polinomio grado 3
X_plot_overfit = np.linspace(X.min(), X.max(), 100).reshape(-1, 1)  # Para el polinomio grado 15

# Predicciones de cada modelo
y_line = lin_reg.predict(x_range)
y_pred_poly = poly_reg.predict(X_plot_poly)
y_pred_poly_overfit = poly_reg_overfit.predict(X_plot_overfit)

# Figura con tres subgr√°ficas
fig, axs = plt.subplots(1, 3, figsize=(21, 6))

# ----- Subgr√°fico 1: Modelo subajustado (Regresi√≥n lineal) -----
axs[0].plot(X, y, 'o', color='blue', markersize=6, label='Datos')
axs[0].plot(x_range, y_line, color='black', linewidth=2, label='Regresi√≥n lineal')
axs[0].set_title("Modelado de datos con regresi√≥n lineal (subajuste)", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 16
}, pad=15)
axs[0].set_xlabel("Variable de entrada", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 12
}, labelpad=15)
axs[0].set_ylabel("Variable de salida", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 12
}, labelpad=15)
axs[0].legend(loc='upper right', prop={
    'family': 'DejaVu Sans', 'weight': 'bold', 'size': 11
}, frameon=True, framealpha=1, facecolor='#dddddd', shadow=True)
axs[0].grid(True)

# ----- Subgr√°fico 2: Modelo con mejor ajuste (Polinomio grado 3) -----
axs[1].plot(X, y, 'o', color='blue', markersize=6, label='Datos')
axs[1].plot(X_plot_poly, y_pred_poly, color='black', linewidth=2, label='Regresi√≥n polinomial (grado 3)')
axs[1].set_title("Modelado de datos con regresi√≥n polinomial", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 16
}, pad=15)
axs[1].set_xlabel("Variable de entrada", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 12
}, labelpad=15)
axs[1].set_ylabel("Variable de salida", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 12
}, labelpad=15)
axs[1].legend(loc='upper right', prop={
    'family': 'DejaVu Sans', 'weight': 'bold', 'size': 11
}, frameon=True, framealpha=1, facecolor='#dddddd', shadow=True)
axs[1].grid(True)

# ----- Subgr√°fico 3: Modelo sobreajustado (Polinomio grado 15) -----
axs[2].plot(X, y, 'o', color='blue', markersize=6, label='Datos')
axs[2].plot(X_plot_overfit, y_pred_poly_overfit, color='black', linewidth=2, label='Regresi√≥n polinomial (grado 15)')
axs[2].set_title("Modelado de datos con regresi√≥n polinomial (sobreajuste)", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 16
}, pad=15)
axs[2].set_xlabel("Variable de entrada", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 12
}, labelpad=15)
axs[2].set_ylabel("Variable de salida", fontdict={
    'family': 'DejaVu Sans', 'color': 'black', 'weight': 'bold', 'size': 12
}, labelpad=15)
axs[2].legend(loc='lower left', prop={
    'family': 'DejaVu Sans', 'weight': 'bold', 'size': 11
}, frameon=True, framealpha=1, facecolor='#dddddd', shadow=True)
axs[2].grid(True)

fig.suptitle("Fig. 4 Comparaci√≥n entre regresi√≥n lineal (subajustada) y polinomial (mejor ajuste).",
             fontproperties={'family': 'DejaVu Sans', 'size': 11}, y=0.01)

plt.tight_layout(rect=[0, 0, 1, 0.95])
plt.show()


<br>

Hemos terminado nuestra pr√°ctica en modelos **sobreajustados** y **subajustados**. Hemos **entrenado** y **evaluado** diferentes modelos con deficiencias en el ajuste de sus par√°metros, y visualizado sus diferencias claves en gr√°ficas y m√©tricas de evaluaci√≥n.

‚ñ∂ [Regresar a la lecci√≥n](https://dialektico.com/subajuste-sobreajuste-teoria-programacion/) üßô

In [None]:
# Dialektico Machine learning practices ¬© 2025 by Daniel Antonio Garc√≠a Escobar
# is licensed under CC BY-NC 4.0. To view a copy of this license,
# visit https://creativecommons.org/licenses/by-nc/4.0/

# Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International
# Public License