# ⚽ Previsão de Resultados da Premier League com Machine Learning
Este notebook usa dados históricos da Premier League para treinar um modelo de aprendizado de máquina capaz de prever resultados de jogos de futebol.

## 📌 O que você verá aqui:
- Download do dataset
- Análise e pré-processamento
- Treinamento de modelo Random Forest
- Avaliação do modelo
- Previsões de partidas futuras (hipotéticas)


In [None]:
# 📦 Instalar bibliotecas (se necessário no Google Colab)
# !pip install pandas scikit-learn matplotlib
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report
import matplotlib.pyplot as plt

In [None]:
# 📥 Baixar o dataset da Premier League 2022/2023 diretamente da web
url = "https://www.football-data.co.uk/mmz4281/2223/E0.csv"
df = pd.read_csv(url)
df.head()

In [None]:
# 📊 Selecionar e renomear colunas úteis
df = df[['HomeTeam', 'AwayTeam', 'FTHG', 'FTAG', 'FTR']]
df.columns = ['HomeTeam', 'AwayTeam', 'HomeGoals', 'AwayGoals', 'Result']
df['GoalDiff'] = df['HomeGoals'] - df['AwayGoals']
df.head()

In [None]:
# 🧠 Codificar os nomes dos times para números
teams = pd.concat([df['HomeTeam'], df['AwayTeam']]).unique()
team_map = {team: idx for idx, team in enumerate(teams)}
df['HomeTeam'] = df['HomeTeam'].map(team_map)
df['AwayTeam'] = df['AwayTeam'].map(team_map)
df.head()

In [None]:
# 📈 Separar dados para treino e teste
X = df[['HomeTeam', 'AwayTeam', 'GoalDiff']]
y = df['Result']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

predictions = model.predict(X_test)
accuracy = accuracy_score(y_test, predictions)
print(f"Acurácia do modelo: {accuracy * 100:.2f}%")

In [None]:
# 📄 Relatório de classificação
print(classification_report(y_test, predictions))