In [None]:

from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.svm import SVC
import numpy as np
import pandas as pd
from google.colab import drive
from sklearn.preprocessing import MinMaxScaler
from sklearn.metrics import accuracy_score
from sklearn.metrics import confusion_matrix, precision_score, recall_score, f1_score
import matplotlib.pyplot as plt
import seaborn as sns

In [None]:
drive.mount('/content/drive')
path = '/content/drive/MyDrive/Colab Notebooks/TFM/datosModelo.csv'

In [None]:
df = pd.read_csv(path,sep=";")
df

In [None]:
# Eliminar la columna id_partido
df.drop(['jornada','id_indicadores_equipo_prepartido'], axis=1, inplace=True)

In [None]:
# Separar las características (porcentajes) y la clase a predecir (resultado_partido)
X = df.drop(['resultado_partido','resultado_local','resultado_visitante'], axis=1)


In [None]:
y_resultado=df['resultado_partido']
y_resultado_local=df['resultado_local']
y_resultado_visitante=df['resultado_visitante']

In [None]:
scaler = MinMaxScaler()
X_scaled = scaler.fit_transform(X)

## Predicciones para el ganador del partido

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y_resultado, test_size=0.2, random_state=42)

In [None]:
model = SVC(random_state=42)

In [None]:
param_grid = {
    'C': [0.1, 1, 10],  # Tres valores concretos para el parámetro de penalización C
    'kernel': ['linear', 'rbf'],  # Dos tipos de kernel: lineal y radial
    'gamma': [1e-3, 1e-4]  # Dos valores concretos para gamma (solo aplicable con kernel 'rbf')
}

In [None]:
# Realizar la búsqueda de hiperparámetros con validación cruzada
grid_search = GridSearchCV(model, param_grid, cv=5, scoring='accuracy', n_jobs=-1)
grid_search.fit(X_train, y_train)

In [None]:
# Obtener los mejores hiperparámetros
best_params = grid_search.best_params_

In [None]:
# Entrenar el modelo final con los mejores hiperparámetros
best_model = SVC(**best_params, random_state=42)
best_model.fit(X_train, y_train)

In [None]:
# Evaluar el modelo en el conjunto de prueba
y_test_pred = best_model.predict(X_test)
test_accuracy = accuracy_score(y_test, y_test_pred)

In [None]:
print("Mejores hiperparámetros:", best_params)
print("Precisión en el conjunto de prueba:", test_accuracy)

In [None]:
# Calcular la matriz de confusión
cm = confusion_matrix(y_test, y_test_pred)

# Mostrar la matriz de confusión de manera gráfica
plt.figure(figsize=(6,4))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', cbar=False, xticklabels=['Local', 'Empate', 'Visitante'], yticklabels=['Local', 'Empate', 'Visitante'])
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Matriz de Confusión')
plt.show()

# Calcular precisión, recall y F1 score
precision = precision_score(y_test, y_test_pred,average='weighted')
recall = recall_score(y_test, y_test_pred,average='weighted')
f1 = f1_score(y_test, y_test_pred,average='weighted')

print("\nMétricas:")
print(f"Precisión: {precision:.2f}")
print(f"Recall: {recall:.2f}")
print(f"F1 Score: {f1:.2f}")

## Predicciones para los goles del local

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y_resultado_local, test_size=0.2, random_state=42)

In [None]:
model = SVC()

In [None]:
param_grid = {
    'C': [0.1, 1, 10],  # Tres valores concretos para el parámetro de penalización C
    'kernel': ['linear', 'rbf'],  # Dos tipos de kernel: lineal y radial
    'gamma': [1e-3, 1e-4]  # Dos valores concretos para gamma (solo aplicable con kernel 'rbf')
}

In [None]:
# Realizar la búsqueda de hiperparámetros con validación cruzada
grid_search = GridSearchCV(model, param_grid, cv=5, scoring='accuracy', n_jobs=-1)
grid_search.fit(X_train, y_train)

In [None]:
# Obtener los mejores hiperparámetros
best_params = grid_search.best_params_

In [None]:
# Entrenar el modelo final con los mejores hiperparámetros
best_model = SVC(**best_params)
best_model.fit(X_train, y_train)

In [None]:
# Evaluar el modelo en el conjunto de prueba
y_test_pred = best_model.predict(X_test)
test_accuracy = accuracy_score(y_test, y_test_pred)

In [None]:
print("Mejores hiperparámetros:", best_params)
print("Precisión en el conjunto de prueba:", test_accuracy)

In [None]:
# Calcular la matriz de confusión
cm = confusion_matrix(y_test, y_test_pred)

# Mostrar la matriz de confusión de manera gráfica
plt.figure(figsize=(6,4))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', cbar=False, xticklabels=['0', '1', '2','3', '4', '5','6', '7'], yticklabels=['0', '1', '2','3', '4', '5','6', '7'])
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Matriz de Confusión')
plt.show()

# Calcular precisión, recall y F1 score
precision = precision_score(y_test, y_test_pred,average='weighted')
recall = recall_score(y_test, y_test_pred,average='weighted')
f1 = f1_score(y_test, y_test_pred,average='weighted')

print("\nMétricas:")
print(f"Precisión: {precision:.2f}")
print(f"Recall: {recall:.2f}")
print(f"F1 Score: {f1:.2f}")

## Predicciones para los goles del visitante

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y_resultado_visitante, test_size=0.2, random_state=42)

In [None]:
model = SVC()

In [None]:
param_grid = {
    'C': [0.1, 1, 10],  # Tres valores concretos para el parámetro de penalización C
    'kernel': ['linear', 'rbf'],  # Dos tipos de kernel: lineal y radial
    'gamma': [1e-3, 1e-4]  # Dos valores concretos para gamma (solo aplicable con kernel 'rbf')
}

In [None]:
# Realizar la búsqueda de hiperparámetros con validación cruzada
grid_search = GridSearchCV(model, param_grid, cv=5, scoring='accuracy', n_jobs=-1)
grid_search.fit(X_train, y_train)

In [None]:
# Obtener los mejores hiperparámetros
best_params = grid_search.best_params_

In [None]:
# Entrenar el modelo final con los mejores hiperparámetros
best_model = SVC(**best_params)
best_model.fit(X_train, y_train)

In [None]:
# Evaluar el modelo en el conjunto de prueba
y_test_pred = best_model.predict(X_test)
test_accuracy = accuracy_score(y_test, y_test_pred)

In [None]:
print("Mejores hiperparámetros:", best_params)
print("Precisión en el conjunto de prueba:", test_accuracy)

In [None]:
# Calcular la matriz de confusión
cm = confusion_matrix(y_test, y_test_pred)

# Mostrar la matriz de confusión de manera gráfica
plt.figure(figsize=(6,4))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', cbar=False, xticklabels=['0', '1', '2','3', '4', '5','6'], yticklabels=['0', '1', '2','3', '4', '5','6'])
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Matriz de Confusión')
plt.show()

# Calcular precisión, recall y F1 score
precision = precision_score(y_test, y_test_pred,average='weighted')
recall = recall_score(y_test, y_test_pred,average='weighted')
f1 = f1_score(y_test, y_test_pred,average='weighted')

print("\nMétricas:")
print(f"Precisión: {precision:.2f}")
print(f"Recall: {recall:.2f}")
print(f"F1 Score: {f1:.2f}")