In [None]:

# Bloque 1: Importación de librerías y carga de datos

# Importamos las librerías necesarias
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier, plot_tree
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix
import matplotlib.pyplot as plt
import seaborn as sns

# Cargamos el dataset Iris
data = load_iris()
X = pd.DataFrame(data.data, columns=data.feature_names)
y = pd.DataFrame(data.target, columns=['target'])

# Dividimos los datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Visualización inicial de los datos
print("Vista previa de los datos:")
print(X.head())

# Bloque 2: Entrenamiento del modelo de árbol de decisión

# Creamos el modelo de Árbol de Decisión
clf = DecisionTreeClassifier(random_state=42)

# Entrenamos el modelo
clf.fit(X_train, y_train)

# Realizamos predicciones sobre el conjunto de prueba
y_pred = clf.predict(X_test)

# Bloque 3: Evaluación del rendimiento del modelo

# Calculamos y mostramos la precisión del modelo
accuracy = accuracy_score(y_test, y_pred)
print(f"Precisión del modelo: {accuracy * 100:.2f}%")

# Mostramos el reporte de clasificación
print("Reporte de clasificación:")
print(classification_report(y_test, y_pred))

# Mostramos la matriz de confusión
cm = confusion_matrix(y_test, y_pred)
plt.figure(figsize=(5,5))
sns.heatmap(cm, annot=True, fmt="d", cmap="Blues", xticklabels=data.target_names, yticklabels=data.target_names)
plt.xlabel('Predicción')
plt.ylabel('Realidad')
plt.title('Matriz de Confusión')
plt.show()

# Bloque 4: Visualización del árbol de decisión

# Visualizamos el árbol de decisión
plt.figure(figsize=(20,10))
plot_tree(clf, feature_names=data.feature_names, class_names=data.target_names, filled=True)
plt.title("Árbol de Decisión")
plt.show()