In [None]:

from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.metrics import accuracy_score
from sklearn.naive_bayes import GaussianNB
from sklearn.preprocessing import MinMaxScaler
import pandas as pd
from google.colab import drive

In [None]:
drive.mount('/content/drive')
path = '/content/drive/MyDrive/Colab Notebooks/TFM/datosModelo.csv'

In [None]:
df = pd.read_csv(path,sep=";")
df

In [None]:
# Eliminar la columna id_partido
df.drop(['jornada','id_indicadores_equipo_prepartido'], axis=1, inplace=True)

In [None]:
# Separar las características (porcentajes) y la clase a predecir (resultado_partido)
X = df.drop(['resultado_partido','resultado_local','resultado_visitante'], axis=1)

In [None]:
y_resultado=df['resultado_partido']
y_resultado_local=df['resultado_local']
y_resultado_visitante=df['resultado_visitante']

In [None]:
scaler = MinMaxScaler()
X_scaled = scaler.fit_transform(X)

## Predicciones para el ganador del partido

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y_resultado, test_size=0.2, random_state=42)

In [None]:
model = GaussianNB()

In [None]:
param_grid = {
    'var_smoothing': [1e-9, 1e-8, 1e-7]  # Tres valores concretos para var_smoothing
}

In [None]:
# Realizar la búsqueda de hiperparámetros con validación cruzada
grid_search = GridSearchCV(model, param_grid, cv=5, scoring='accuracy', n_jobs=-1)
grid_search.fit(X_train, y_train)

In [None]:
# Obtener los mejores hiperparámetros
best_params = grid_search.best_params_

In [None]:
# Entrenar el modelo final con los mejores hiperparámetros
best_model = GaussianNB(**best_params)
best_model.fit(X_train, y_train)

In [None]:
# Evaluar el modelo en el conjunto de prueba
y_test_pred = best_model.predict(X_test)
test_accuracy = accuracy_score(y_test, y_test_pred)

In [None]:
print("Mejores hiperparámetros:", best_params)
print("Precisión en el conjunto de prueba:", test_accuracy)

## Predicciones para los goles del local

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y_resultado_local, test_size=0.2, random_state=42)

In [None]:
model = GaussianNB()

In [None]:
param_grid = {
    'var_smoothing': [1e-9, 1e-8, 1e-7]  # Tres valores concretos para var_smoothing
}

In [None]:
# Realizar la búsqueda de hiperparámetros con validación cruzada
grid_search = GridSearchCV(model, param_grid, cv=5, scoring='accuracy', n_jobs=-1)
grid_search.fit(X_train, y_train)

In [None]:
# Obtener los mejores hiperparámetros
best_params = grid_search.best_params_

In [None]:
# Entrenar el modelo final con los mejores hiperparámetros
best_model = GaussianNB(**best_params)
best_model.fit(X_train, y_train)

In [None]:
# Evaluar el modelo en el conjunto de prueba
y_test_pred = best_model.predict(X_test)
test_accuracy = accuracy_score(y_test, y_test_pred)

In [None]:
print("Mejores hiperparámetros:", best_params)
print("Precisión en el conjunto de prueba:", test_accuracy)

## Predicciones para los goles del visitante

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y_resultado_visitante, test_size=0.2, random_state=42)

In [None]:
model = GaussianNB()

In [None]:
param_grid = {
    'var_smoothing': [1e-9, 1e-8, 1e-7]  # Tres valores concretos para var_smoothing
}

In [None]:
# Realizar la búsqueda de hiperparámetros con validación cruzada
grid_search = GridSearchCV(model, param_grid, cv=5, scoring='accuracy', n_jobs=-1)
grid_search.fit(X_train, y_train)

In [None]:
# Obtener los mejores hiperparámetros
best_params = grid_search.best_params_

In [None]:
# Entrenar el modelo final con los mejores hiperparámetros
best_model = GaussianNB(**best_params)
best_model.fit(X_train, y_train)

In [None]:
# Evaluar el modelo en el conjunto de prueba
y_test_pred = best_model.predict(X_test)
test_accuracy = accuracy_score(y_test, y_test_pred)

In [None]:
print("Mejores hiperparámetros:", best_params)
print("Precisión en el conjunto de prueba:", test_accuracy)