# Projeto: Predição de Vitória no League of Legends (10 min)

Neste projeto, usamos um dataset do Kaggle com estatísticas dos primeiros 10 minutos de partidas ranqueadas no LoL para prever a vitória do time azul.

In [None]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier, plot_tree
from sklearn.metrics import classification_report, confusion_matrix, accuracy_score
from sklearn.preprocessing import StandardScaler

### Carregar e visualizar o dataset

In [None]:
df = pd.read_csv("high_diamond_ranked_10min.csv")
df.head()

### Selecionar variáveis preditoras e alvo

In [None]:
X = df.drop(columns=["gameId", "blueWins"])
y = df["blueWins"]

### Dividir dados em treino e teste

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

### Padronizar os dados

In [None]:
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

### Treinar modelo de Árvore de Decisão

In [None]:
model = DecisionTreeClassifier(random_state=42, max_depth=5)
model.fit(X_train_scaled, y_train)

### Avaliar modelo

In [None]:
y_pred = model.predict(X_test_scaled)
print("Acurácia:", accuracy_score(y_test, y_pred))
print("Matriz de confusão:\n", confusion_matrix(y_test, y_pred))
print("Relatório:\n", classification_report(y_test, y_pred))

### Importância das variáveis

In [None]:
importances = pd.Series(model.feature_importances_, index=X.columns)
importances = importances.sort_values(ascending=False).head(10)
importances.plot(kind="barh", title="Top 10 - Importância das variáveis")
plt.show()

### Visualização da árvore de decisão

In [None]:
plt.figure(figsize=(20, 10))
plot_tree(model, feature_names=X.columns, class_names=["Red Wins", "Blue Wins"], filled=True, max_depth=3)
plt.title("Árvore de Decisão - Predição de Vitória Azul")
plt.show()