In [1]:
# cargar datos

In [2]:
import pandas as pd

In [3]:
df = pd.read_csv('datos_vark_entrenamiento.csv')

In [4]:
#df

# Preprcesar datos

In [5]:
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder

In [6]:
X = df[['visual', 'aural', 'read_write', 'kinesthetic']]
y = df['recurso']

In [7]:
le = LabelEncoder()
y_encoded = le.fit_transform(y)

In [8]:
X_train, X_test, y_train, y_test = train_test_split(X, y_encoded, test_size=0.2, random_state=42)

# Entrenar

In [9]:
from sklearn.tree import DecisionTreeClassifier

In [10]:
modelo = DecisionTreeClassifier(random_state=42)
modelo.fit(X_train, y_train)

# Evaluar el modelo

In [11]:
from sklearn.metrics import accuracy_score, classification_report

In [12]:
y_pred = modelo.predict(X_test)
print("Precisión:", accuracy_score(y_test, y_pred))
print("Reporte:\n", classification_report(y_test, y_pred, target_names=le.classes_))

Precisión: 0.9925
Reporte:
               precision    recall  f1-score   support

   actividad       1.00      1.00      1.00        76
       audio       0.98      1.00      0.99       116
       texto       1.00      0.99      0.99        90
       video       0.99      0.98      0.99       118

    accuracy                           0.99       400
   macro avg       0.99      0.99      0.99       400
weighted avg       0.99      0.99      0.99       400



# Probar con un nuevo estudiante

In [13]:
# Estudiante con:
# visual=4, aural=6, read_write=3, kinesthetic=3
nuevo_estudiante = pd.DataFrame([{
    'visual': 4,
    'aural': 6,
    'read_write': 3,
    'kinesthetic': 3
}])

prediccion = modelo.predict(nuevo_estudiante)
resultado = le.inverse_transform(prediccion)

In [14]:
print("Recurso recomendado:", resultado[0])

Recurso recomendado: audio


# Visualizar el árbol

In [16]:
from sklearn.tree import plot_tree
import matplotlib.pyplot as plt

In [None]:
plt.figure(figsize=(12, 8))
plot_tree(modelo, feature_names=X.columns, class_names=le.classes_, filled=True)
plt.show()

plt.savefig("grafico_seno.svg", format='svg', bbox_inches='tight')
plt.show()

# graficos

In [17]:
import seaborn as sns
import matplotlib.pyplot as plt

In [None]:
plt.figure(figsize=(10, 6))
df[['visual', 'aural', 'read_write', 'kinesthetic']].hist(bins=8)
plt.suptitle("Distribución de puntajes por estilo VARK")
plt.tight_layout()
plt.show()

In [None]:
plt.figure(figsize=(6, 4))
sns.countplot(data=df, x='recurso', hue='recurso', palette='Set2', legend=False)
plt.title("Cantidad de estudiantes por recurso recomendado")
plt.xlabel("Recurso")
plt.ylabel("Cantidad")
plt.show()


In [None]:
plt.figure(figsize=(10, 6))
promedios = df.groupby('recurso')[['visual', 'aural', 'read_write', 'kinesthetic']].mean()
promedios.plot(kind='bar')
plt.title("Promedio de estilos VARK según recurso recomendado")
plt.ylabel("Puntaje promedio")
plt.xticks(rotation=0)
plt.legend(title="Estilo")
plt.grid(axis='y')
plt.show()

In [None]:
from sklearn.tree import plot_tree

plt.figure(figsize=(16, 10))
plot_tree(modelo, feature_names=['visual', 'aural', 'read_write', 'kinesthetic'],
          class_names=le.classes_, filled=True, rounded=True)
plt.title("Árbol de Decisión para clasificación de estilo VARK")
plt.show()


In [None]:
from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay

# Predecimos los datos de prueba
y_pred = modelo.predict(X_test)

# Matriz de confusión
cm = confusion_matrix(y_test, y_pred)

# Mostrarla con etiquetas
disp = ConfusionMatrixDisplay(confusion_matrix=cm, display_labels=le.classes_)
disp.plot(cmap='Blues')
plt.title("Matriz de Confusión - Evaluación del Modelo VARK")
plt.show()


# Guardar el modelo entrenado

In [None]:
import joblib

In [None]:
joblib.dump(modelo, 'modelo_vark.pkl')
joblib.dump(le, 'label_encoder.pkl')