In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from scipy.stats import genextreme
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression, LogisticRegression
from sklearn.metrics import confusion_matrix, roc_curve, auc
from pygam import PoissonGAM, LinearGAM

In [None]:
# Pré-processamento dos dados
def preprocess_data(df):
    df.dropna(inplace=True)  # Remover valores nulos
    return df


In [None]:
# RF1 - Modelagem de eventos extremos (Método de Gumbel)
def gumbel_analysis(df, column):
    params = genextreme.fit(df[column])
    x = np.linspace(min(df[column]), max(df[column]), 100)
    y = genextreme.pdf(x, *params)

    plt.figure(figsize=(8, 5))
    sns.histplot(df[column], kde=True, stat="density")
    plt.plot(x, y, 'r-', label="Distribuição de Gumbel")
    plt.legend()
    plt.title(f'Análise de Gumbel para {column}')
    plt.show()
    return params


In [None]:
# RF2 - Gráficos para visualização de extremos
def plot_gumbel_distribution(df, column):
    params = genextreme.fit(df[column])
    x = np.linspace(min(df[column]), max(df[column]), 100)
    y = genextreme.pdf(x, *params)

    plt.figure(figsize=(8, 5))
    sns.histplot(df[column], kde=True, stat="density")
    plt.plot(x, y, 'r-', label="Distribuição de Gumbel")
    plt.legend()
    plt.title(f'Visualização de Gumbel para {column}')
    plt.show()


In [None]:
# RF3 - Regressão Linear
def linear_regression(df, independent_vars, dependent_var):
    X = df[independent_vars]
    y = df[dependent_var]
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
    model = LinearRegression()
    model.fit(X_train, y_train)
    predictions = model.predict(X_test)

    plt.scatter(y_test, predictions)
    plt.xlabel("Valores Reais")
    plt.ylabel("Previsões")
    plt.title(f'Regressão Linear para {dependent_var}')
    plt.show()
    return model



In [None]:
# RF4 - Gráficos para regressão linear
def plot_regression_results(y_test, predictions):
    plt.scatter(y_test, predictions)
    plt.xlabel("Valores Reais")
    plt.ylabel("Previsões")
    plt.title("Gráfico de Regressão Linear")
    plt.show()


In [None]:
# RF5 - Regressão Logística
def logistic_regression(df, independent_vars, target):
    X = df[independent_vars]
    y = (df[target] > df[target].mean()).astype(int)  # Transformar em binário
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
    model = LogisticRegression()
    model.fit(X_train, y_train)
    y_pred = model.predict(X_test)
    cm = confusion_matrix(y_test, y_pred)

    sns.heatmap(cm, annot=True, fmt='d', cmap='Blues')
    plt.title(f'Matriz de Confusão - {target}')
    plt.show()
    return model



In [None]:
# RF6 - Gráficos para regressão logística
def plot_logistic_confusion_matrix(y_test, y_pred):
    cm = confusion_matrix(y_test, y_pred)
    sns.heatmap(cm, annot=True, fmt='d', cmap='Blues')
    plt.title("Matriz de Confusão")
    plt.show()



In [None]:
# RF7 - Modelos GAMLSS usando PyGAM
def gamlss_poisson(df, independent_vars, target):
    X = df[independent_vars]
    y = df[target]
    model = PoissonGAM()
    model.fit(X, y)
    return model



In [None]:
# RF8 - Visualizações para GAMLSS
def plot_gamlss_results(model, X, y):
    plt.figure(figsize=(8, 5))
    plt.scatter(y, model.predict(X), alpha=0.5)
    plt.xlabel("Valores Reais")
    plt.ylabel("Previsões")
    plt.title("Resultados do Modelo GAMLSS")
    plt.show()


In [None]:
# Exemplo de uso
data = pd.read_csv('nba_data.csv')
data = preprocess_data(data)
gumbel_analysis(data, 'pontos')
plot_gumbel_distribution(data, 'pontos')
linear_model = linear_regression(data, ['tempo_quadra', 'arremessos_tentados', 'turnovers'], 'pontos')
logistic_model = logistic_regression(data, ['tempo_quadra', 'arremessos_tentados', 'turnovers'], 'pontos')
poisson_gam = gamlss_poisson(data, ['tempo_quadra', 'arremessos_tentados', 'turnovers'], 'pontos')
