# Predicción de Resultados - Liga MX

Este notebook analiza datos históricos de la Liga MX para predecir el resultado del partido (local gana, empata o pierde), usando modelos de clasificación.

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import confusion_matrix, classification_report

%matplotlib inline


In [None]:
df = pd.read_csv('../../datos/Liga_MX.csv')
df.head()


In [None]:
df.info()
df.isnull().sum()


In [None]:
df.rename(columns={
    'Home': 'Equipo_Local',
    'Away': 'Equipo_Visitante',
    'HG': 'Goles_Local',
    'AG': 'Goles_Visitante',
    'Res': 'Resultado'
}, inplace=True)

df = df[['Date', 'Season', 'Equipo_Local', 'Equipo_Visitante', 'Goles_Local', 'Goles_Visitante', 'Resultado']]
df.head()


In [None]:
sns.countplot(x='Resultado', data=df)
plt.title('Distribución de Resultados')
plt.show()


In [None]:
df['Diferencia_Goles'] = df['Goles_Local'] - df['Goles_Visitante']
X = df[['Diferencia_Goles']]
y = df['Resultado']


In [None]:
from sklearn.preprocessing import LabelEncoder

le = LabelEncoder()
y_encoded = le.fit_transform(y)  # H = 0, D = 1, A = 2
le.classes_


In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y_encoded, test_size=0.2, random_state=42)


In [None]:
modelo = LogisticRegression(multi_class='multinomial', max_iter=1000)
modelo.fit(X_train, y_train)


In [None]:
y_pred = modelo.predict(X_test)
print(classification_report(y_test, y_pred, target_names=le.classes_))

conf_matrix = confusion_matrix(y_test, y_pred)
sns.heatmap(conf_matrix, annot=True, fmt='d', xticklabels=le.classes_, yticklabels=le.classes_)
plt.title('Matriz de Confusión')
plt.xlabel('Predicción')
plt.ylabel('Real')
plt.show()
