<a href="https://colab.research.google.com/github/RafaelGallo/plot_random_forest/blob/main/Plot_random_forest.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# Importando bibliotecas
import sklearn
import numpy as np
import matplotlib.pyplot as plt

In [None]:
## Base dados
from sklearn.datasets import load_iris

# Carregar conjunto de dados (exemplo com Iris dataset)
iris = load_iris()

In [None]:
# Divisão treino e teste
X = iris.data
y = iris.target

In [None]:
# Importando biblioteca
from sklearn.model_selection import train_test_split

# Dividir dados em conjuntos de treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [None]:
# Importando biblioteca
from sklearn import tree
from sklearn.ensemble import RandomForestClassifier

# Inicializar o modelo de Floresta Aleatória com 5 árvores
rf_model = RandomForestClassifier(n_estimators=5,
                                  random_state=42)

# Treinamento modelo
rf_model.fit(X_train, y_train)

In [None]:
# Score modelo
rf_model_score = rf_model.score(X_train, y_train)
rf_model_score

In [None]:
# Escolher uma árvore específica (por exemplo, a primeira árvore, índice 0)
tree_to_visualize = 0

# Extrair a árvore selecionada do modelo de Floresta Aleatória
single_tree = rf_model.estimators_[tree_to_visualize]

# Plotar a árvore
plt.figure(figsize=(25.5, 10))
tree.plot_tree(single_tree,
               filled=True,
               feature_names=iris.feature_names,
               class_names=iris.target_names)

# Adicionando títulos na imagem
plt.title(f"Árvore {tree_to_visualize + 2} da Floresta Aleatória")

# Visualizando imagem
plt.show()

In [None]:
# Fazer previsões no conjunto de teste
predictions = rf_model.predict(X_test)

In [None]:
# Fazer previsões das probabilidades no conjunto de teste
probs = rf_model.predict_proba(X_test)

In [None]:
# Importando biblioteca
from sklearn.metrics import confusion_matrix

# Criar a matriz de confusão
conf_matrix = confusion_matrix(y_test, predictions)

# Plotar a matriz de confusão
plt.figure(figsize=(8, 6))
plt.imshow(conf_matrix, cmap=plt.cm.Blues)
plt.title('Matriz de Confusão - Random Forest')
plt.colorbar()

classes = iris.target_names
tick_marks = range(len(classes))
plt.xticks(tick_marks, classes)
plt.yticks(tick_marks, classes)

for i in range(len(classes)):
    for j in range(len(classes)):
        plt.text(j,
                 i,
                 conf_matrix[i, j],
                 ha='center',
                 va='center')

plt.xlabel('Previsto')
plt.ylabel('Real')
plt.show()

In [None]:
from sklearn.metrics import roc_curve, auc

# Fazer previsões das probabilidades no conjunto de teste
probs = rf_model.predict_proba(X_test)

# Calcular a curva ROC e AUC-ROC para cada classe
plt.figure(figsize=(8, 6))
for i in range(len(iris.target_names)):

    # Binarizar as classes para a classe i versus todas as outras
    y_binary = np.where(y_test == i, 1, 0)

    # Calcular a curva ROC e AUC-ROC para a classe i
    fpr, tpr, thresholds = roc_curve(y_binary, probs[:, i])
    roc_auc = auc(fpr, tpr)

    # Plotar a curva ROC para a classe i
    plt.plot(fpr, tpr, label=f'Classe {i} (AUC = {roc_auc:.2f})')

# Plotar linha base (classificador aleatório)
plt.plot([0, 1], [0, 1], linestyle='--', color='red')
plt.xlabel('Taxa de Falsos Positivos (FPR)')
plt.ylabel('Taxa de Verdadeiros Positivos (TPR)')
plt.title('Curva ROC (Multiclasse)')
plt.legend()
plt.show()

In [None]:
from sklearn.metrics import precision_score
from sklearn.metrics import recall_score
from sklearn.metrics import f1_score

# Calcular métricas: precisão, recall e F1-score
precision = precision_score(y_test, predictions, average='weighted')
recall = recall_score(y_test, predictions, average='weighted')
f1 = f1_score(y_test, predictions, average='weighted')

print(f"Precision: {precision:.4f}")
print(f"Recall: {recall:.4f}")
print(f"F1-score: {f1:.4f}")

In [None]:
# Salvando modelo
# Importando biblioteca
import joblib

# Salvar o modelo treinado em um arquivo
joblib.dump(rf_model, 'modelo_floresta.pkl')

## **Deploy modelo**

In [None]:
## Deploy modelo
# Carregar o modelo salvo de volta para uso
loaded_model = joblib.load('modelo_floresta.pkl')

In [None]:
## Deploy modelo

# Agora você pode usar 'loaded_model' para fazer previsões, por exemplo:
model = loaded_model.predict(X_test)

In [None]:
# Dados de exemplo para previsão
# Exemplo 1 para 'setosa'
# Exemplo 2 para 'versicolor'
# Exemplo 3 para 'virginica'

novos_dados = np.array([
    [5.1, 3.5, 1.4, 0.2],
    [6.2, 2.9, 4.3, 1.3],
    [3.7, 3.2, 4.2, 2.3]])

# Fazer previsões nos novos dados
previsoes_novos_dados = loaded_model.predict(novos_dados)

In [None]:
# Mapear os valores previstos de volta para os nomes das classes
classes = ['setosa',
           'versicolor',
           'virginica']

# Previsões com os nomes
previsoes_nomes_classes = [classes[pred] for pred in previsoes_novos_dados]

# Exibir as previsões feitas para os novos dados
for i, pred in enumerate(previsoes_nomes_classes):
    print(f"Previsão flor {i + 1}: {pred}")