In [1]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
import numpy as np

# Cargar los datos

try:
    X = pd.read_csv('X_regression.csv')
    Y = pd.read_csv('Y_regression.csv')
except FileNotFoundError:
    print("Asegúrate de que los archivos 'X_regression.csv' y 'Y_regression.csv' estén cargados en Colab.")



# Dividir los datos en conjuntos de entrenamiento y prueba
# 80% para entrenamiento, 20% para prueba
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.2, random_state=42)

# Crear y entrenar el modelo de regresión lineal
model = LinearRegression()
model.fit(X_train, y_train)

# Realizar predicciones con el conjunto de prueba
y_pred = model.predict(X_test)

# Evaluar el rendimiento del modelo
mse = mean_squared_error(y_test, y_pred)
rmse = np.sqrt(mse)
r2 = r2_score(y_test, y_pred)

print("--- Evaluación del Modelo ---")
print(f"Error Cuadrático Medio (MSE): {mse:.4f}")
print(f"Raíz del Error Cuadrático Medio (RMSE): {rmse:.4f}")
print(f"Coeficiente de Determinación (R^2): {r2:.4f}")

# Mostrar los coeficientes e intercepto del modelo
print("\n--- Coeficientes del Modelo ---")
coeficientes = pd.DataFrame(model.coef_.reshape(-1, len(X.columns)), columns=X.columns, index=['Coeficiente'])
print(coeficientes)

print("\n--- Intercepto del Modelo ---")
print(f"Intercepto: {model.intercept_[0]:.4f}")

--- Evaluación del Modelo ---
Error Cuadrático Medio (MSE): 0.0964
Raíz del Error Cuadrático Medio (RMSE): 0.3104
Coeficiente de Determinación (R^2): 0.9926

--- Coeficientes del Modelo ---
              Nota_01   Nota_02   Nota_03
Coeficiente  0.302276  0.197508  0.500407

--- Intercepto del Modelo ---
Intercepto: 0.0037


In [3]:
import pandas as pd

# Creamos un nuevo DataFrame con las notas del estudiante

nuevas_notas = pd.DataFrame({
    'Nota_01': [16],
    'Nota_02': [1],
    'Nota_03': [9]
})

# Usamos el modelo ya entrenado para hacer la predicción
prediccion = model.predict(nuevas_notas)

# Imprimimos el resultado
print(f"Para las notas: \n{nuevas_notas}")
print(f"\nEl promedio predicho es: {prediccion[0][0]:.2f}")

Para las notas: 
   Nota_01  Nota_02  Nota_03
0       16        1        9

El promedio predicho es: 9.54


In [4]:
import joblib

joblib.dump(model, 'modelo_notas.joblib')

# Ahora, descarga este archivo a tu computadora.

from google.colab import files
files.download('modelo_notas.joblib')

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>