In [2]:
!pip install graphviz



#Arboles de decisión

In [14]:
# Importa las bibliotecas necesarias
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from sklearn.tree import export_text
from sklearn.metrics import matthews_corrcoef
from sklearn.tree import export_graphviz
import graphviz

# Carga el conjunto de datos Iris
iris = load_iris()
X = iris.data
y = iris.target

# Divide el conjunto de datos en un conjunto de entrenamiento y un conjunto de prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=17)

# Crea un clasificador de árbol de decisión
clf = DecisionTreeClassifier()

# Entrena el clasificador en el conjunto de entrenamiento
clf.fit(X_train, y_train)

# Realiza predicciones en el conjunto de prueba
y_pred = clf.predict(X_test)

# Calcula la precisión del modelo
accuracy = accuracy_score(y_test, y_pred)
mcc = matthews_corrcoef(y_test, y_pred)
print(f'Precisión del modelo: {accuracy:.5f}')
print(f'Coeficiente de Correlación de Matthews (MCC): {mcc:.5f}')
# Muestra la estructura del árbol de decisión
tree_rules = export_text(clf, feature_names=iris.feature_names)
print('Estructura del árbol de decisión:')
print(tree_rules)
# Visualiza el árbol de decisión
dot_data = export_graphviz(clf, out_file=None,
                         feature_names=iris.feature_names,
                         class_names=iris.target_names,
                         filled=True, rounded=True,
                         special_characters=True)
graph = graphviz.Source(dot_data)
graph.render("iris_decision_tree")
graph.view("iris_decision_tree")

Precisión del modelo: 1.00000
Coeficiente de Correlación de Matthews (MCC): 1.00000
Estructura del árbol de decisión:
|--- petal width (cm) <= 0.80
|   |--- class: 0
|--- petal width (cm) >  0.80
|   |--- petal width (cm) <= 1.75
|   |   |--- petal length (cm) <= 5.35
|   |   |   |--- petal width (cm) <= 1.65
|   |   |   |   |--- petal length (cm) <= 4.95
|   |   |   |   |   |--- class: 1
|   |   |   |   |--- petal length (cm) >  4.95
|   |   |   |   |   |--- petal width (cm) <= 1.55
|   |   |   |   |   |   |--- class: 2
|   |   |   |   |   |--- petal width (cm) >  1.55
|   |   |   |   |   |   |--- class: 1
|   |   |   |--- petal width (cm) >  1.65
|   |   |   |   |--- sepal length (cm) <= 5.80
|   |   |   |   |   |--- class: 2
|   |   |   |   |--- sepal length (cm) >  5.80
|   |   |   |   |   |--- class: 1
|   |   |--- petal length (cm) >  5.35
|   |   |   |--- class: 2
|   |--- petal width (cm) >  1.75
|   |   |--- petal length (cm) <= 4.85
|   |   |   |--- sepal width (cm) <= 3.10
|

'iris_decision_tree.pdf'

In [4]:
total_nodes = clf.tree_.node_count

num_branches = total_nodes // 2
num_leaves = (total_nodes + 1) // 2

print(f"Número total de nodos: {total_nodes}")
print(f"Número de ramas: {num_branches}")
print(f"Número de hojas: {num_leaves}")








Número total de nodos: 19
Número de ramas: 9
Número de hojas: 10


#RANDOM FOREST

In [9]:
from sklearn.ensemble import RandomForestClassifier
forest = RandomForestClassifier(n_estimators=1000, random_state=17)
forest.fit(X_train, y_train)
y_pred = forest.predict(X_test)

# Calcula la precisión del modelo
accuracy = accuracy_score(y_test, y_pred)
mcc = matthews_corrcoef(y_test, y_pred)
print(f'Precisión del modelo: {accuracy:.10f}')
print(f'Coeficiente de Correlación de Matthews (MCC): {mcc:.10f}')

Precisión del modelo: 0.9666666667
Coeficiente de Correlación de Matthews (MCC): 0.9505119454


#crosvalidación

In [15]:
from sklearn.model_selection import cross_val_score
scores_clf = cross_val_score(clf, X_train, y_train, cv=5)
scores_forest = cross_val_score(forest, X_train, y_train, cv=5)
# Imprimir los resultados de la validación cruzada
print(f'Precisión en cada fold clf: {scores_clf}')
print(f'Precisión media clf: {scores_clf.mean():.2f}')
print(f'Precisión en cada forest: {scores_forest}')
print(f'Precisión media forest: {scores_forest.mean():.2f}')

Precisión en cada fold clf: [1.         0.875      1.         0.91666667 0.91666667]
Precisión media clf: 0.94
Precisión en cada forest: [1.         0.875      1.         0.95833333 0.91666667]
Precisión media forest: 0.95
