# Importación de librerías

In [17]:
import pandas as pd  # Para manipulación y análisis de datos
from sklearn.model_selection import train_test_split  # Para dividir el conjunto de datos en entrenamiento y prueba
from sklearn.preprocessing import StandardScaler  # Para estandarizar características
from tensorflow.keras.models import Sequential  # Para inicializar modelos secuenciales
from tensorflow.keras.layers import Dense, Input  # Para definir capas densamente conectadas en la red neuronal
from sklearn.impute import SimpleImputer  # Para imputar valores faltantes
import numpy as np  # Para cálculos numéricos
from sklearn.metrics import mean_squared_error, r2_score  # Para calcular métricas de rendimiento del modelo

# Carga de datos

In [18]:
# Cargar datos
df = pd.read_csv("jugadores_fantasy_migate.csv")


# Imprimir las columnas existentes y la columna posicion 
print(df.columns)
print("\n")
df

Index(['Nombre', 'Precio', 'Media', 'Total_puntos', 'posicion', 'equipo',
       'Partidos', 'Minutos', 'Goles', 'Asistencias', 'Asistencias sin Gol',
       'Centros', 'Despejes', 'Remates', 'Tiros', 'Recuperaciones', 'Perdidas',
       'Penaltis fallados', 'Goles en contra', 'Rojas', 'Paradas',
       'Penaltis cometidos', 'Amarillas', 'Seguna Amarilla',
       'Penaltis provocados', 'Penaltis parados', 'Goles en PP'],
      dtype='object')




Unnamed: 0,Nombre,Precio,Media,Total_puntos,posicion,equipo,Partidos,Minutos,Goles,Asistencias,...,Penaltis fallados,Goles en contra,Rojas,Paradas,Penaltis cometidos,Amarillas,Seguna Amarilla,Penaltis provocados,Penaltis parados,Goles en PP
0,J. Bellingham,24262000,10.2,173,mediocentro,Real Madrid Club de Fútbol,13.0,1025.0,11.0,2.0,...,0.0,8.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0
1,T. Kubo,20904000,8.2,147,mediocentro,Real Sociedad de Fútbol,14.0,970.0,5.0,2.0,...,0.0,12.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
2,A. Griezmann,24384000,7.6,144,delantero,Club Atlético de Madrid,13.0,1071.0,9.0,1.0,...,0.0,11.0,0.0,0.0,0.0,3.0,0.0,0.0,0.0,0.0
3,I. Williams,18358000,7.7,139,delantero,Athletic Club,15.0,1233.0,6.0,3.0,...,0.0,16.0,0.0,0.0,0.0,2.0,0.0,0.0,0.0,0.0
4,B. Mayoral,16992000,7.3,138,delantero,Getafe Club de Fútbol,14.0,1170.0,0.0,0.0,...,0.0,17.0,0.0,46.0,0.0,2.0,0.0,0.0,1.0,0.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
501,P. Reina,160000,0.0,0,portero,Villarreal Club de Fútbol,0.0,0.0,0.0,0.0,...,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
502,T. Fuidias,160000,0.0,0,portero,Girona Fútbol Club,0.0,0.0,0.0,0.0,...,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
503,T. Villa,160000,0.0,0,mediocentro,Girona Fútbol Club,0.0,0.0,0.0,0.0,...,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
504,U. Ropero,160000,0.0,0,mediocentro,Deportivo Alavés,0.0,0.0,0.0,0.0,...,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0


# División de datos en conjuntos de entrenamiento y prueba
# Entrenamiento del modelo y ajuste de hiperparámetros 

In [19]:
# Dividir los datos en características (X) y el objetivo (y)
X_Todo = df[['Media', 'Partidos', 'Minutos', 'Goles', 'Asistencias', 'Asistencias sin Gol', 'Centros', 'Despejes', 'Remates', 'Tiros', 'Recuperaciones', 'Perdidas', 'Penaltis fallados', 'Goles en contra', 'Rojas', 'Paradas', 'Penaltis cometidos', 'Amarillas', 'Seguna Amarilla', 'Penaltis provocados', 'Penaltis parados', 'Goles en PP']]
y_puntos = df['Total_puntos']

# Dividir los datos en conjuntos de entrenamiento y prueba
X_train_puntos, X_test_puntos, y_puntos_train, y_puntos_test = train_test_split(X_Todo, y_puntos, test_size=0.2, random_state=42)


# Escalar las características
scaler = StandardScaler()
X_train_puntos_scaled = scaler.fit_transform(X_train_puntos)
X_test_puntos_scaled = scaler.transform(X_test_puntos)

In [20]:
# Crear el modelo para predecir puntos
model_puntos = Sequential([
    Input(shape=(X_train_puntos_scaled.shape[1],)),  
    Dense(32, activation='relu'),
    Dense(16, activation='relu'),
    Dense(1, activation='linear')
])

# Configuración del modelo para que utilice el algoritmo de optimización 
model_puntos.compile(optimizer='adam', loss='mean_squared_error')

# Entrenar el modelo para predecir puntos
model_puntos.fit(X_train_puntos_scaled, y_puntos_train, epochs=50, batch_size=32, verbose=0)


<keras.src.callbacks.history.History at 0x138ecf620>

In [21]:
# Hacer predicciones para puntos y precio
puntos_predictions = model_puntos.predict(X_test_puntos_scaled).flatten()

# Crear un DataFrame con las predicciones y el índice original
predictions_df = pd.DataFrame({
    'Predicted_Points': puntos_predictions,
}, index=X_test_puntos.index)

# Unir las predicciones con el DataFrame original usando el índice
df_with_predictions = df.join(predictions_df, how='inner')

# Ordenar el DataFrame de forma descendente por precio predicho y puntos predichos
df_sorted = df_with_predictions.sort_values(by=['Predicted_Points'], ascending=False)

# Impresión de la lista de jugadores ordenados por mayor precio y puntos predichos
print("Lista de jugadores ordenados por mayor precio y puntos predichos:")
print(df_sorted[['Nombre', 'Predicted_Points']])


[1m4/4[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 33ms/step
Lista de jugadores ordenados por mayor precio y puntos predichos:
            Nombre  Predicted_Points
0    J. Bellingham        177.415634
2     A. Griezmann        129.418854
9       A. Budimir        104.508087
72       V. Muriqi         88.599762
30       B. Méndez         87.978706
..             ...               ...
485     M. Pascual          1.251853
489       M. Tejón          1.251853
496       I. Grbić          1.251853
497    J. Doménech          1.251853
501       P. Reina          1.251853

[102 rows x 2 columns]


# Evaluación del modelo con datos de prueba y Interpretación de resultados y métricas de rendimiento 

In [22]:
# Calcular el Error Cuadrático Medio (MSE) para puntos y precio
mse_puntos = mean_squared_error(y_puntos_test, puntos_predictions)

# Calcular el coeficiente de determinación (R^2) para puntos y precio
r2_puntos = r2_score(y_puntos_test, puntos_predictions)

print("Calculo del error cuadratico y coeficiente de determinacion por puntos:")
print(f"MSE para puntos: {mse_puntos:.2f}")
print(f"R^2 para puntos: {r2_puntos:.2f}")

Calculo del error cuadratico y coeficiente de determinacion por puntos:
MSE para puntos: 301.56
R^2 para puntos: 0.79


# Despliegue del modelo en un entorno de producción

In [23]:
# Función para seleccionar y renombrar columnas
def prepare_dataframe(df):
    return df[['Nombre', 'Predicted_Points', 'posicion', 'Precio']].rename(columns={
        'Predicted_Points': 'Puntos',
        'posicion': 'Posicion'
    })

# Crear DataFrames para los top 10 jugadores por puntos predichos
top_10_puntos = prepare_dataframe(df_sorted.nlargest(10, 'Predicted_Points'))

# Filtrar jugadores por posición
posiciones = ['delantero', 'mediocentro', 'portero', 'defensa']
top_10_por_posicion = {}

for posicion in posiciones:
    jugadores_posicion = df_with_predictions[df_with_predictions['posicion'] == posicion]
    top_10_por_posicion[posicion] = prepare_dataframe(jugadores_posicion.nlargest(10, 'Predicted_Points'))

# Guardar los DataFrames en archivos CSV
top_10_puntos.to_csv('general_prediccion.csv', index=False)

for posicion, df in top_10_por_posicion.items():
    df.to_csv(f'{posicion}_prediccion.csv', index=False)

# Mostrar los DataFrames creados
print("Top 10 jugadores por puntos predichos:")
print(top_10_puntos[['Nombre', 'Puntos']])

for posicion in posiciones:
    print(f"\nTop 10 {posicion}s por puntos predichos:")
    print(top_10_por_posicion[posicion][['Nombre', 'Puntos']])

print("\nSe han guardado los archivos CSV con el formato deseado.")


Top 10 jugadores por puntos predichos:
            Nombre      Puntos
0    J. Bellingham  177.415634
2     A. Griezmann  129.418854
9       A. Budimir  104.508087
72       V. Muriqi   88.599762
30       B. Méndez   87.978706
77      R. De Paul   83.627571
18     F. Valverde   79.206505
137   Ó. De Marcos   79.131630
76      J. Cancelo   78.124855
68    V. Tsygankov   75.837074

Top 10 delanteros por puntos predichos:
              Nombre      Puntos
2       A. Griezmann  129.418854
9         A. Budimir  104.508087
72         V. Muriqi   88.599762
22         G. Moreno   71.413582
11             Sávio   63.734962
84       L. Ramazani   62.715252
90          J. Félix   55.188694
73         F. Torres   54.491856
173  J. Luis Morales   53.608608
75          M. Uzuni   49.843895

Top 10 mediocentros por puntos predichos:
            Nombre      Puntos
0    J. Bellingham  177.415634
30       B. Méndez   87.978706
77      R. De Paul   83.627571
18     F. Valverde   79.206505
68    V. Tsygankov

In [26]:
top_10_por_posicion

{'delantero':               Nombre      Puntos   Posicion    Precio
 2       A. Griezmann  129.418854  delantero  24384000
 9         A. Budimir  104.508087  delantero  15660000
 72         V. Muriqi   88.599762  delantero  12454000
 22         G. Moreno   71.413582  delantero  18341000
 11             Sávio   63.734962  delantero  18030000
 84       L. Ramazani   62.715252  delantero   3171000
 90          J. Félix   55.188694  delantero  14964000
 73         F. Torres   54.491856  delantero   8080000
 173  J. Luis Morales   53.608608  delantero   4457000
 75          M. Uzuni   49.843895  delantero   3324000,
 'mediocentro':             Nombre      Puntos     Posicion    Precio
 0    J. Bellingham  177.415634  mediocentro  24262000
 30       B. Méndez   87.978706  mediocentro  15078000
 77      R. De Paul   83.627571  mediocentro  11692000
 18     F. Valverde   79.206505  mediocentro  20115000
 68    V. Tsygankov   75.837074  mediocentro  14504000
 78       J. Guerra   73.455971  med