In [9]:
import seaborn
import pandas as pd
from sklearn.preprocessing import OrdinalEncoder
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report, accuracy_score

# --- Carregamento e Pré-processamento de Dados ---

# Carregar o conjunto de dados dos pinguins
dataframe = seaborn.load_dataset('penguins')

# Etapas de pré-processamento do README
# Transformar variáveis ​​categóricas em numéricas
model_ordinal = OrdinalEncoder()
object_cols = dataframe.select_dtypes(['object']).columns
tranf_values = model_ordinal.fit_transform(dataframe[object_cols])
dataframe[object_cols] = tranf_values

# Substitui valores nulos pela média
dataframe.fillna(dataframe.mean(), inplace=True)

# Remove quaisquer linhas restantes com valores nulos (se houver)
dataframe.dropna(inplace=True)

# --- Divisão de Dados ---

# Define variáveis ​​de entrada (x) e saída (y)
x = dataframe.drop(['species'], axis=1)
y = dataframe['species']

# Divide os dados em conjuntos de treinamento e teste
# Usando random_state para resultados reproduzíveis
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.20, random_state=42)

# --- 1. Modelo de Árvore de Decisão ---

print("--- 1. Resultados da Árvore de Decisão ---")
# Inicializar e treinar o modelo
decision_tree_model = DecisionTreeClassifier(random_state=42)
decision_tree_model.fit(x_train, y_train)

# Fazer previsões e avaliar
y_predict_dt = decision_tree_model.predict(x_test)
print(f"Precisão: {accuracy_score(y_test, y_predict_dt):.4f}")
print("Relatório de Classificação:")
print(classification_report(y_test, y_predict_dt))

# --- 2. Modelo de Floresta Aleatória ---

print("\n--- 2. Resultados da Floresta Aleatória ---")
# Inicializar e treinar o modelo
random_forest_model = RandomForestClassifier(random_state=42)
random_forest_model.fit(x_train, y_train)

# Fazer previsões e avaliar
y_predict_rf = random_forest_model.predict(x_test)
print(f"Precisão: {accuracy_score(y_test, y_predict_rf):.4f}")
print("Relatório de Classificação:")
print(classification_report(y_test, y_predict_rf))

--- 1. Resultados da Árvore de Decisão ---
Precisão: 0.9710
Relatório de Classificação:
              precision    recall  f1-score   support

         0.0       1.00      0.97      0.98        32
         1.0       0.94      1.00      0.97        16
         2.0       0.95      0.95      0.95        21

    accuracy                           0.97        69
   macro avg       0.96      0.97      0.97        69
weighted avg       0.97      0.97      0.97        69


--- 2. Resultados da Floresta Aleatória ---
Precisão: 1.0000
Relatório de Classificação:
              precision    recall  f1-score   support

         0.0       1.00      1.00      1.00        32
         1.0       1.00      1.00      1.00        16
         2.0       1.00      1.00      1.00        21

    accuracy                           1.00        69
   macro avg       1.00      1.00      1.00        69
weighted avg       1.00      1.00      1.00        69

