# Entrenamiento de modelo de Machine Learning: Regresión Logística

## Justificación del modelo

Para este problema, se busca **predecir si un estudiante reprobará Biología** a partir de variables como notas parciales y asistencia. Dado que la variable objetivo es **binaria** (`0 = Reprobado`, `1 = Aprobado`), un modelo adecuado y simple es la **Regresión Logística**.

Ventajas:
- Interpretable y eficiente con conjuntos de datos pequeños o medianos.
- Ideal para tareas de clasificación binaria.
- Permite ajustar su complejidad mediante parámetros como el valor de regularización `C`.

Parámetros seleccionados:
- `solver='liblinear'`: adecuado para pequeños conjuntos de datos.
- `C=1.0`: valor por defecto para el parámetro de regularización (inverso de la fuerza de penalización).

In [2]:
import pandas as pd

# Cargar datos procesados
df = pd.read_csv("1DATABASE1.csv", sep=';')

# Convertir columnas necesarias
df['Nota 1'] = df['Nota 1'].astype(str).str.replace(',', '.').astype(float)
df['Nota 2'] = df['Nota 2'].astype(str).str.replace(',', '.').astype(float)
df['APROBADO/REPROBADO'] = df['APROBADO/REPROBADO'].map({'APROBADO': 1, 'REPROBADO': 0})


In [3]:
from sklearn.model_selection import train_test_split

X = df[['Nota 1', 'Nota 2', 'Asistencia Clases (%)', 'Asistencia Laboratorio (%)']]
y = df['APROBADO/REPROBADO']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


In [4]:
from sklearn.linear_model import LogisticRegression

modelo = LogisticRegression(solver='liblinear', C=1.0, random_state=42)
modelo.fit(X_train, y_train)


In [5]:
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix

y_pred = modelo.predict(X_test)

print("Precisión del modelo:", accuracy_score(y_test, y_pred))
print("\nMatriz de Confusión:\n", confusion_matrix(y_test, y_pred))
print("\nReporte de Clasificación:\n", classification_report(y_test, y_pred))


Precisión del modelo: 0.8333333333333334

Matriz de Confusión:
 [[1 1]
 [0 4]]

Reporte de Clasificación:
               precision    recall  f1-score   support

           0       1.00      0.50      0.67         2
           1       0.80      1.00      0.89         4

    accuracy                           0.83         6
   macro avg       0.90      0.75      0.78         6
weighted avg       0.87      0.83      0.81         6

