# Modelo MLP con comentarios detallados
Este cuaderno entrena un modelo de red neuronal para detectar influencia en la conducción basándose en el acta de signos externos.

In [None]:
"""
Modelo MLP para la detección de la influencia en la conducción por consumo de drogas,
basado en el acta de signos externos. Este código forma parte del Trabajo Fin de Grado
del Grado en Ingeniería Informática, siguiendo los criterios de la UNIR.
"""

# Importamos las librerías necesarias para el tratamiento de datos, modelado y evaluación
import pandas as pd  # Para manejo de datos tabulares (CSV)
from sklearn.model_selection import train_test_split  # Para dividir los datos en entrenamiento y prueba
from sklearn.preprocessing import StandardScaler  # Para normalizar variables numéricas
from sklearn.neural_network import MLPClassifier  # Para construir el perceptrón multicapa (MLP)
from sklearn.metrics import classification_report, confusion_matrix  # Para evaluar el modelo

# === CARGA DE DATOS ===
# Cargamos el dataset generado a partir del acta de signos externos.
# Este archivo debe estar en la misma carpeta que este script.
df = pd.read_csv("dataset_acta_extendido_realista_1000.csv", sep=";")

# === SEPARACIÓN DE VARIABLES ===
# X contendrá las variables predictoras (signos clínicos y comportamentales)
# y contendrá la variable objetivo: influencia (1 = influenciado, 0 = no influenciado)
X = df.drop(columns=["influencia"])
y = df["influencia"]

# === PREPROCESAMIENTO ===
# Normalizamos únicamente la variable continua del diámetro pupilar,
# ya que las demás son binarias (0/1) y no requieren escalado.
scaler = StandardScaler()
X["G_diametro_pupilar_ambos_ojos_presentan"] = scaler.fit_transform(
    X[["G_diametro_pupilar_ambos_ojos_presentan"]]
)

# === DIVISIÓN DEL DATASET ===
# Estratificamos según la variable 'influencia' para mantener la proporción de clases
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, stratify=y, random_state=42
)

# === DEFINICIÓN Y ENTRENAMIENTO DEL MODELO MLP ===
# Creamos un perceptrón multicapa con dos capas ocultas:
# - 64 neuronas en la primera capa
# - 32 neuronas en la segunda capa
# La función de activación es ReLU y el entrenamiento se limita a 1000 iteraciones.
mlp = MLPClassifier(hidden_layer_sizes=(64, 32), activation='relu', max_iter=1000, random_state=42)
mlp.fit(X_train, y_train)  # Entrenamos el modelo con los datos de entrenamiento

# === EVALUACIÓN DEL MODELO ===
# Evaluamos el modelo con los datos de prueba.
y_pred = mlp.predict(X_test)

# Mostramos la matriz de confusión y un informe detallado de precisión, recall y F1-score
print("Matriz de confusión:")
print(confusion_matrix(y_test, y_pred))

print("\nInforme de clasificación:")
print(classification_report(y_test, y_pred))
