# Treinamento e Avalia√ß√£o de Modelo de Machine Learning üéìüìä

Este notebook demonstra o processo completo de treinamento e avalia√ß√£o de um modelo de classifica√ß√£o usando RandomForest. Exploraremos a prepara√ß√£o dos dados, o ajuste do modelo, a avalia√ß√£o das m√©tricas de desempenho e a visualiza√ß√£o dos resultados.


In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report
import seaborn as sns
import matplotlib.pyplot as plt

# Configura√ß√µes para visualiza√ß√µes
%matplotlib inline
sns.set(style="whitegrid")


In [None]:
# Carregar os dados
data = pd.read_csv("caminho_para_seus_dados.csv")  # Substitua pelo caminho correto
data.head()


In [None]:
data.info()


## Pr√©-processamento dos Dados

Nesta se√ß√£o, vamos realizar a limpeza e normaliza√ß√£o dos dados para melhorar o desempenho do modelo.


In [None]:
# Remover valores nulos
data = data.dropna()

# Normaliza√ß√£o das features num√©ricas
numeric_features = data.select_dtypes(include=['float64', 'int64']).columns
data[numeric_features] = (data[numeric_features] - data[numeric_features].mean()) / data[numeric_features].std()

# Visualizar correla√ß√£o entre vari√°veis
sns.heatmap(data.corr(), annot=True, cmap="coolwarm")
plt.show()


## Divis√£o dos Dados em Treino e Teste

Vamos dividir os dados para treino e teste.


In [None]:
X = data.drop("target", axis=1)  # Substitua 'target' pela coluna de destino no seu conjunto de dados
y = data["target"]

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


## Treinamento do Modelo

Aqui, vamos treinar um modelo RandomForest usando os dados de treino.


In [None]:
model = RandomForestClassifier(n_estimators=100, max_depth=5, random_state=42)
model.fit(X_train, y_train)


In [None]:
predictions = model.predict(X_test)
accuracy = accuracy_score(y_test, predictions)
print(f"Acur√°cia: {accuracy:.2f}")

# Matriz de confus√£o
cm = confusion_matrix(y_test, predictions)
sns.heatmap(cm, annot=True, fmt="d", cmap="Blues")
plt.xlabel("Previsto")
plt.ylabel("Real")
plt.show()

# Relat√≥rio de classifica√ß√£o
print(classification_report(y_test, predictions))


## Conclus√µes

Este notebook demonstrou como preparar dados, treinar um modelo e avaliar seu desempenho. Para melhorar o modelo, podemos explorar t√©cnicas como tuning de hiperpar√¢metros ou experimentar algoritmos adicionais.
