Imports e Configuração

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

# Configuração para os gráficos ficarem bonitos
sns.set_theme(style="whitegrid")
%matplotlib inline

Carregar Dados Reais (do GitHub)

In [None]:
# URL direto para o CSV limpo da época 2023-24 no GitHub do Vaastav
url = "https://raw.githubusercontent.com/vaastav/Fantasy-Premier-League/master/data/2023-24/cleaned_players.csv"

print("A carregar dados...")
df = pd.read_csv(url)

# Espreitar os dados
print(f"Dados carregados: {df.shape[0]} jogadores e {df.shape[1]} colunas.")
df.head()

Preparar os Dados (Feature Selection)

In [None]:
# Escolher as features (X) e o target (y)
features = ['now_cost', 'influence', 'creativity', 'threat', 'minutes']
target = 'total_points'

# Criar um novo dataframe apenas com estas colunas e remover linhas com dados em falta
data = df[features + [target]].dropna()

X = data[features]
y = data[target]

print("Features selecionadas:")
print(X.head())

Dividir em Treino e Teste

In [None]:
# Dividir: 80% para treinar, 20% para testar
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

print(f"Tamanho do Treino: {X_train.shape[0]} jogadores")
print(f"Tamanho do Teste: {X_test.shape[0]} jogadores")

Treinar o Modelo (Linear Regression)

In [None]:
# 1. Criar o modelo
model = LinearRegression()

# 2. Treinar o modelo com os dados de treino
model.fit(X_train, y_train)

print("Modelo treinado com sucesso!")
print(f"Intercept (b): {model.intercept_:.2f}")
print("Coeficientes (Pesos W):")
for feature, coef in zip(features, model.coef_):
    print(f"  {feature}: {coef:.4f}")

Avaliar e Visualizar

In [None]:
# Fazer previsões nos dados de teste
y_pred = model.predict(X_test)

# Calcular o erro
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print(f"Mean Squared Error (MSE): {mse:.2f}")
print(f"R2 Score (0 a 1): {r2:.2f}")

# Visualizar: Real vs Previsto
plt.figure(figsize=(10, 6))
plt.scatter(y_test, y_pred, alpha=0.5, color='blue')
plt.plot([0, 250], [0, 250], color='red', linestyle='--', label='Previsão Perfeita') # Linha ideal
plt.xlabel('Pontos Reais')
plt.ylabel('Pontos Previstos pelo Modelo')
plt.title('Regressão Linear: Pontos Reais vs Previstos (FPL 23/24)')
plt.legend()
plt.show()