In [3]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

def analise_forca_ataque(dados, colunas_features, coluna_alvo):
    # Seleção de Features para Força de Ataque
    X_ataque = dados[colunas_features]

    # Variável Alvo para Força de Ataque
    y_ataque = dados[coluna_alvo]

    # Divisão do Conjunto de Dados
    X_ataque_train, X_ataque_test, y_ataque_train, y_ataque_test = train_test_split(X_ataque, y_ataque, test_size=0.2, random_state=42)

    # Verifique se a coluna alvo está presente no DataFrame
    if coluna_alvo not in dados.columns:
        dados[coluna_alvo] = 0  # Ou utilize um valor padrão para preenchimento

    # Escolha do Modelo e Treinamento para Força de Ataque
    modelo_ataque = LinearRegression()
    modelo_ataque.fit(X_ataque_train, y_ataque_train)

    # Avaliação do Modelo para Força de Ataque
    y_ataque_pred = modelo_ataque.predict(X_ataque_test)
    erro_medio_quadratico_ataque = mean_squared_error(y_ataque_test, y_ataque_pred)
    print(f'Erro Médio Quadrático para Força de Ataque: {erro_medio_quadratico_ataque}')

    # Aplicação do Modelo para Criar a Coluna FA
    dados[f'FA_{coluna_alvo}'] = modelo_ataque.predict(dados[colunas_features])
    return dados

def analise_forca_defesa(dados, colunas_features, coluna_alvo):
    # Pré-processamento para as colunas 'FTS' e 'CS'
    for coluna in colunas_features:
        if '%' in dados[coluna].values[0]:  # Verifica se a coluna contém percentuais
            dados[coluna] = dados[coluna].astype(str).str.rstrip('%').astype('float') / 100.0

    # Seleção de Features para Força de Defesa
    X_defesa = dados[colunas_features]

    # Variável Alvo para Força de Defesa
    y_defesa = dados[coluna_alvo]

    # Divisão do Conjunto de Dados
    X_defesa_train, X_defesa_test, y_defesa_train, y_defesa_test = train_test_split(X_defesa, y_defesa, test_size=0.2, random_state=42)

    # Verifique se a coluna alvo está presente no DataFrame
    if coluna_alvo not in dados.columns:
        dados[coluna_alvo] = 0  # Ou utilize um valor padrão para preenchimento

    # Escolha do Modelo e Treinamento para Força de Defesa
    modelo_defesa = LinearRegression()
    modelo_defesa.fit(X_defesa_train, y_defesa_train)

    # Avaliação do Modelo para Força de Defesa
    y_defesa_pred = modelo_defesa.predict(X_defesa_test)
    erro_medio_quadratico_defesa = mean_squared_error(y_defesa_test, y_defesa_pred)
    print(f'Erro Médio Quadrático para Força de Defesa: {erro_medio_quadratico_defesa}')

    # Aplicação do Modelo para Criar a Coluna FD
    dados[f'FD_{coluna_alvo}'] = modelo_defesa.predict(dados[colunas_features])
    return dados



In [None]:


# Exemplo de uso para análise de força de ataque
filen_name = '../dados/static_serie_a_13_11_2023.csv'
arquivo = pd.read_csv(filen_name)


# Exemplo de uso para análise de força de ataque
colunas_ataque = ['GF', 'GA']
coluna_alvo_ataque = 'Pts'
dados = analise_forca_ataque(arquivo = pd.read_csv(filen_name)
, colunas_ataque, coluna_alvo_ataque)

# Exemplo de uso para análise de força de defesa
colunas_defesa = ['FTS', 'CS']
coluna_alvo_defesa = 'Pts'
dados = analise_forca_defesa(arquivo = pd.read_csv(filen_name)
, colunas_defesa, coluna_alvo_defesa)
