# PREGUNTA 6

Implementa un modelo de regresión polinomial cuadrática para este conjunto de datos. Usa el 70% de los datos para el entrenamiento y el 30% para las pruebas.

a. ¿Qué rendimiento se alcanza con este modelo? (contesta en el cuadernillo)

b. ¿Cuál es la dimensión del vector de caracterı́sticas transformadas? (contesta en el cuadernillo)

c. ¿Cuál es el valor de la variable de salida si el vector de caracterı́sticas de entrada es [207.0, 5.0, 161.0, 28, 179.0, 736.0, 867.0, 132.0]? (contesta en el cuadernillo)

Deposita el código Python en Aula Virtual en el ﬁchero 'answer6.ipynb'.

---

# Configuración y Visualización del Entorno

## Configuración de las Rutas de Importación

Se añade el directorio padre (..) al path (sys.path), lo que permite al entorno de Python acceder a módulos o paquetes ubicados en directorios superiores al actual. Esto es útil para poder importar scripts o paquetes personalizados sin tener que mover ficheros o el directorio de trabajo.

In [1]:
import sys
sys.path.insert(0, '..')

## Verificación de las Versiones de los Paquetes

Se utiliza la función check_packages() para verificar que los paquetes y sus respectivas versiones indicadas en el diccionario 'd' estén instalados correctamente dentro del entorno. Este paso es importante para verificar la compatibilidad de cada paquete para poder evitar errores por diferencia de versión.

In [2]:
from python_environment_check import check_packages
d = {
    'numpy': '1.21.2',
    'scipy': '1.7.0',
    'mlxtend' : '0.19.0',
    'matplotlib': '3.4.3',
    'sklearn': '1.0',
    'pandas': '1.3.2'
}
check_packages(d)

[OK] Your Python version is 3.10.12 (main, Nov  6 2024, 20:22:13) [GCC 11.4.0]


[OK] numpy 1.24.3
[OK] scipy 1.8.0
[OK] mlxtend 0.23.1
[OK] matplotlib 3.5.1
[OK] sklearn 1.5.2
[OK] pandas 2.2.2


## Importación de Paquetes

Se importan los paquetes esenciales para analizar y visualizar datos: numpy para cálculos numéricos, pandas para manipular datos y matplotlib.pyplot para visualizar gráficos, entre otros.

In [3]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures

---

# Código Fuente

In [4]:
columns = ['Col1', 'Col2', 'Col3', 'Col4', 'Col5', 'Col6', 'Col7', 'Col8', 'Target']
df = pd.read_csv("dataset_regression.csv", 
                 sep=',',
                 usecols=columns)

In [5]:
X = df[['Col1', 'Col2', 'Col3', 'Col4', 'Col5', 'Col6', 'Col7', 'Col8']].values
y = df['Target'].values

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.30, random_state=1)

In [6]:
regr = LinearRegression()

quadratic = PolynomialFeatures(degree=2)
X_train_quadratic = quadratic.fit_transform(X_train)

regr_quadratic = regr.fit(X_train_quadratic, y_train)

print("Quadratic Model Coefficients:", regr_quadratic.coef_)
print("Quadratic Model Intercept:", regr_quadratic.intercept_)

new_data_quadratic = np.array([[207.0, 5.0, 161.0, 28, 179.0, 736.0, 867.0, 132.0]])

transformed_new_data_quadratic = quadratic.transform(new_data_quadratic)
print("Quadratic Transformed Data:", transformed_new_data_quadratic[0])

predicted_target_quadratic = regr_quadratic.predict(transformed_new_data_quadratic)
print("Predicted Target:", predicted_target_quadratic)

Quadratic Model Coefficients: [-2.56497950e+08  2.09433461e+00  3.13566150e+01  1.86314107e+00
  3.88415990e-01  1.43986333e+01  3.27766221e+00  2.15755914e+00
  2.11874833e+00 -2.75415912e-04 -1.03897062e-02 -5.20274978e-05
  4.33143498e-04 -4.10172456e-03 -6.97426108e-04 -4.99915067e-04
 -4.43515806e-04 -5.10738565e-02 -1.85649311e-02  1.16734781e-03
 -3.94818270e-02 -1.16090642e-02 -9.72380363e-03 -1.01537197e-02
  5.68917748e-05  7.62478112e-04 -4.89652158e-03 -5.98617432e-04
 -3.18255286e-04 -1.71917429e-04 -5.82952118e-04 -6.60493406e-04
  1.41343382e-04 -1.62817546e-04  1.36226387e-04 -9.83906014e-03
 -5.30113058e-03 -5.02303092e-03 -4.03407117e-03 -7.52420097e-04
 -7.92795227e-04 -7.59545900e-04 -1.96244575e-04 -4.21490127e-04
 -2.85317293e-04]
Quadratic Model Intercept: 256493804.8926074
Quadratic Transformed Data: [1.00000e+00 2.07000e+02 5.00000e+00 1.61000e+02 2.80000e+01 1.79000e+02
 7.36000e+02 8.67000e+02 1.32000e+02 4.28490e+04 1.03500e+03 3.33270e+04
 5.79600e+03 3.705

In [7]:
X_train_quadratic = quadratic.fit_transform(X_train)
X_test_quadratic = quadratic.fit_transform(X_test)

y_train_quadratic = regr.predict(X_train_quadratic)
y_test_quadratic = regr.predict(X_test_quadratic)

In [8]:
from sklearn.metrics import mean_squared_error
from sklearn.metrics import mean_absolute_error
from sklearn.metrics import r2_score

mae_train = mean_absolute_error(y_train, y_train_quadratic)
mae_test = mean_absolute_error(y_test, y_test_quadratic)

mse_train = mean_squared_error(y_train, y_train_quadratic)
mse_test = mean_squared_error(y_test, y_test_quadratic)

r2_train = r2_score(y_train, y_train_quadratic)
r2_test = r2_score(y_test, y_test_quadratic)

print(f'MSE train: {mse_train:.2f}')
print(f'MSE test: {mse_test:.2f}')

print(f'MAE train: {mae_train:.2f}')
print(f'MAE test: {mae_test:.2f}')

print(f'R² train: {r2_train:.2f}')
print(f'R² test: {r2_test:.2f}')

MSE train: 52.35
MSE test: 59.86
MAE train: 5.59
MAE test: 5.86
R² train: 0.81
R² test: 0.78


---

# Convertir Jupyter Notebook a Fichero Python

In [9]:
! python .convert_notebook_to_script.py --input answer6.ipynb --output answer6.py

[NbConvertApp] Converting notebook answer6.ipynb to script
[NbConvertApp] Writing 4369 bytes to answer6.py
