In [None]:
#Importacion de las librerias
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report, confusion_matrix, accuracy_score
import seaborn as sns
import matplotlib.pyplot as plt


# Cargar el conjunto de datos Iris
from sklearn.datasets import load_iris
data = load_iris()

# Convertirlo a un DataFrame de pandas para facilitar el análisis
df = pd.DataFrame(data.data, columns=data.feature_names)
df['target'] = data.target

# Visualizar las primeras filas
print(df.head())


# Dividir los datos en entrenamiento y prueba
X = df.drop('target', axis=1)
y = df['target']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Comprobar las dimensiones de los conjuntos
print(f'Tamaño del conjunto de entrenamiento: {X_train.shape}')
print(f'Tamaño del conjunto de prueba: {X_test.shape}')


# Crear el clasificador Random Forest
rf_model = RandomForestClassifier(n_estimators=100, random_state=42)

# Entrenar el modelo con los datos de entrenamiento
rf_model.fit(X_train, y_train)


# Hacer predicciones con el conjunto de prueba
y_pred = rf_model.predict(X_test)

# Evaluar el rendimiento del modelo
accuracy = accuracy_score(y_test, y_pred)
print(f'Exactitud del modelo: {accuracy * 100:.2f}%')


# Matriz de confusión
conf_matrix = confusion_matrix(y_test, y_pred)

# Visualizar la matriz de confusión usando un heatmap
sns.heatmap(conf_matrix, annot=True, cmap="Blues", fmt='g')
plt.title("Matriz de Confusión")
plt.xlabel("Predicción")
plt.ylabel("Real")
plt.show()

# Reporte de clasificación
report = classification_report(y_test, y_pred, target_names=data.target_names)
print(report)


# Importancia de las características
importances = rf_model.feature_importances_
features = X.columns

# Crear un DataFrame para visualizar mejor
feature_importances = pd.DataFrame(importances, index=features, columns=['Importancia']).sort_values('Importancia', ascending=False)

# Visualización
sns.barplot(x=feature_importances['Importancia'], y=feature_importances.index)
plt.title('Importancia de las características')
plt.show()
