In [None]:
import pandas as pd
import matplotlib.pyplot as plt

# Se lee solo el archivo de transfermarkt_201718.csv, ya que, se encuentran las mismas columnas que en los demás.

file_path = './data/transfermarkt_fbref_201718.csv'
transfermarkt_df = pd.read_csv(file_path)
print(transfermarkt_df.columns)


In [None]:
def cargar_y_procesar_archivo(file_path, seleccion_columnas):
    df = pd.read_csv(file_path, sep=';', index_col=0, low_memory=False)     # Leer el archivo CSV
    subset_df = df[seleccion_columnas]     # Seleccionar solo las columnas deseadas
    return subset_df   # Retornar la carga y procesamiento del archivo


def aplicar_estilos_y_mostrar_df(df):    # Aplicar estilos al DataFrame
    styled_df = df.head(7).style \
        .apply(lambda x: ['background-color: #000000' if i % 2 == 0 else '' for i in range(len(x))]) \
        .apply(lambda x: ['font-weight: bold' if v == x.max() else '' for v in x], axis=0)
    
    display(styled_df)    # Mostrar el DataFrame

In [None]:
# Definir las columnas deseadas

seleccion_columnas = ['player', 'age', 'nationality', 'height', 'squad', 'league', 'value', 'position', 'minutes', 'goals', 'assists', 'shots_free_kicks', 'games']

# Cargar y procesar los archivos CSV de las temporadas 2017-2018


file_path_1 = './data/transfermarkt_fbref_201718.csv'    # Ruta del primer archivo CSV
df_1 = cargar_y_procesar_archivo(file_path_1, seleccion_columnas)                  # Cargar y procesar el primer archivo
print("                                               Jugadores 2017 - 2018")
aplicar_estilos_y_mostrar_df(df_1)


# Tomar el valor máximo de la columna 'value' y ordenar el DataFrame por la columna 'value' de forma ascendente


columna1_x= seleccion_columnas[0]
columna1_y = seleccion_columnas[6]

df_1_limited = df_1.head(7)
max_value_1 = df_1_limited[columna1_y].max()
df_1_limited = df_1_limited.sort_values(by=columna1_y, ascending=True)      # Ordenar por la columna 'value' de forma ascendente

In [None]:
# Cargar y procesar los archivos CSV de las temporadas 2018-2019


file_path_2 = './data/transfermarkt_fbref_201819.csv'       # Ruta del segundo archivo CSV
df_2 = cargar_y_procesar_archivo(file_path_2, seleccion_columnas)                     # Cargar y procesar el segundo archivo
print("                                                Jugadores 2018 - 2019")
aplicar_estilos_y_mostrar_df(df_2)


# Tomar el valor máximo de la columna 'value' y ordenar el DataFrame por la columna 'value' de forma ascendente


columna2_x = seleccion_columnas[0]
columna2_y = seleccion_columnas[6]

df_2_limited = df_2.head(7)
max_value_2 = df_2_limited[columna2_y].max()
df_2_limited = df_2_limited.sort_values(by=columna2_y, ascending=True)      # Ordenar por la columna 'value' de forma ascendente

In [None]:
# Cargar y procesar los archivos CSV de las temporadas 2019-2020


file_path_3 = './data/transfermarkt_fbref_201920.csv'       # Ruta del segundo archivo CSV
df_3 = cargar_y_procesar_archivo(file_path_3, seleccion_columnas)                     # Cargar y procesar el segundo archivo
print("                                                Jugadores 2019 - 2020")
aplicar_estilos_y_mostrar_df(df_3)


# Tomar el valor máximo de la columna 'value' y ordenar el DataFrame por la columna 'value' de seleccion_columnas

columna3_x = seleccion_columnas[0]
columna3_y = seleccion_columnas[6]

df_3_limited = df_3.head(7)
max_value_3 = df_3_limited[columna3_y].max()
df_3_limited = df_3_limited.sort_values(by=columna3_y, ascending=True)  # Ordenar por la columna 'value' de forma ascendente
    


In [None]:
def comparar_valores_entre_temporadas(df_temporada_1, df_temporada_2, df_temporada_3):
    # Renombrar las columnas de valor para que coincidan con el formato deseado

    df_temporada_1 = df_temporada_1.rename(columns={'value': 'Valor 2017-2018'})
    df_temporada_2 = df_temporada_2.rename(columns={'value': 'Valor 2018-2019'})
    df_temporada_3 = df_temporada_3.rename(columns={'value': 'Valor 2019-2020'})
    
    # Unir los DataFrames en base a la columna 'player' para comparar los valores de los jugadores en todas las temporadas

    merged_df = pd.merge(df_temporada_1, df_temporada_2, on='player', suffixes=('_temporada_1', '_temporada_2'))
    merged_df = pd.merge(merged_df, df_temporada_3, on='player', suffixes=('_temporada_2', '_temporada_3'))
    
    # Calcular la diferencia en los valores de los jugadores entre las temporadas

    merged_df['Diferencia'] = merged_df['Valor 2019-2020'] - merged_df['Valor 2017-2018']
    
    # Seleccionar las columnas relevantes para mostrar en la tabla

    columns_to_display = ['player', 'Valor 2017-2018', 'Valor 2018-2019', 'Valor 2019-2020', 'Diferencia']
    
    # Mostrar la tabla con la comparación de valores entre temporadas, limitada a 11 filas
    
    display(merged_df[columns_to_display].head(11))


comparar_valores_entre_temporadas(df_1, df_2, df_3)

In [None]:
# Trazar el diagrama de barras de los jugadores con más goles en la temporada 2017-2018


plt.figure(figsize=(12, 6))
plt.bar(df_1_limited[columna1_x], df_1_limited[columna1_y], color='skyblue')
plt.title('Valor de los jugadores en la temporada 2017-2018')
plt.xlabel(columna1_x)
plt.ylabel(columna1_y)
plt.xticks(rotation=90, ha='right')
plt.tight_layout()
plt.show()

# Trazar el diagrama de barras de los jugadores con más goles en la temporada 2018-2019


plt.figure(figsize=(12, 6))
plt.bar(df_2_limited[columna2_x], df_2_limited[columna2_y], color='skyblue')
plt.title('Valor de los jugadores en la temporada 2018-2019')
plt.xlabel(columna2_x)
plt.ylabel(columna2_y)
plt.xticks(rotation=90, ha='right')
plt.tight_layout()
plt.show()

# Trazar el diagrama de barras de los jugadores con más goles en la temporada 2019-2020


plt.figure(figsize=(12, 6))
plt.bar(df_3_limited[columna3_x], df_3_limited[columna3_y], color='skyblue')
plt.title('Valor de los jugadores en la temporada 2019-2020')
plt.xlabel(columna3_x)
plt.ylabel(columna3_y)
plt.xticks(rotation=90, ha='right')
plt.tight_layout()
plt.show()

___