**HIPÓTESIS: Los mejores jugadores juegan en la Premier League.**

*A continuación, se va a realizar un análisis a través de gráficas para demostrar que los mejores jugadores están jugando en la liga inglesa, que no jugadores ingleses. Para ello, se tendrán en cuenta los parámetros de la valoración (overall) y la liga (obtenida a través de los clubes).*

In [18]:
import pandas as pd
import matplotlib.pyplot as plt

In [None]:
df = pd.read_csv("/content/fifa_players.csv")
print(df)

In [None]:
df.columns


A continuación, comenzamos con un análisis de los mejores 50 jugadores. Para ello requerimos un desglose que nos muestre la valoración del jugador acompañado de a que club pertenece.

In [None]:
print(df[["short_name", "overall", "club"]].head(50))

En el próximo paso, veremos que equipos poseen algún jugador dentro de este top 50 de una manera más visual y sencilla.

In [None]:
pf = df.head(50)
mytable = pf.groupby(["club"]).size()
print(mytable)


In [None]:
pf["club"].value_counts().plot(kind="bar",
                               title="Donde juegan los mejores", color ='maroon')

Como se observa en el anterior gráfico, 8 jugadores de dentro del top 50 juegan en el Manchester City. El Real Madrid, con 7 jugadores, es el segundo equipo con más jugadores dentro de esta lista, seguido con 6 jugadores por el Fútbol Club Barcelona. En este listado, aparecen equipos de la Premier League, LaLiga, la Ligue1, la SerieA y la Bundesliga.

In [None]:
from tabulate import tabulate
pf = df.head(50)
mytable = pf.groupby("club")["short_name"].agg(list)
pd.set_option("display.max_colwidth", None)
print(tabulate(mytable.reset_index(), headers=["Club", "Nombres"], tablefmt="pretty"))


En el anterior análisis, observamos que jugadores juegan dentro de cada club de una manera mas sencilla y visual.

A raíz del anterior gráfico, observamos también que la hipotesis planteada es "relativamente" cierta, debido a que del top 50 de la fifa, 21 jugadores juegan en la premier league (Manchester City, Liverpool, Chelsea, Arsenal, Tottenham Hotspur y Manchester United) mientras que el resto juega en Laliga, Serie A, Ligue One y la Bundesliga.

In [None]:
clubes_premier = ["Manchester City", "Manchester United", "Tottenham Hotspur", "Arsenal", "Chelsea", "Liverpool"]
mejores_50_premier = df[df['club'].isin(clubes_premier)].head(50)
print(mejores_50_premier[["short_name", "overall"]])
mejores_50_otras_ligas = df[~df['club'].isin(clubes_premier)].head(50)
print("Mejores 50 jugadores de otras ligas:")
print(mejores_50_otras_ligas[["short_name", "overall"]])

Aquí vemos una comparativa entre los jugadores que poseen a esos clubes de la premier league y los jugadores del resto de ligas.

In [None]:
promedio_overall_premier = mejores_50_premier["overall"].mean()
promedio_overall_otras_ligas = mejores_50_otras_ligas["overall"].mean()
print("Promedio del overall en la Premier League (top 50):", promedio_overall_premier)
print("Promedio del overall en otras ligas (top 50):", promedio_overall_otras_ligas)

Promedio del overall en la Premier League (top 50): 85.84
Promedio del overall en otras ligas (top 50): 87.76


En el anterior código, observamos como la media de los jugadores de la premier es inferior al promedio del overall de las otras ligas, pero se estan incluyendo 4 ligas vs 1. Por lo tanto, si se analiza en su conjunto una a una, se demostraría que la Premier posee mejores jugadores como se va a demostrar a continuación.

In [None]:
clubes_premier = ["Manchester City", "Manchester United", "Tottenham Hotspur", "Arsenal", "Chelsea", "Liverpool"]
mejores_50_premier = df[df['club'].isin(clubes_premier)].head(50)
print(mejores_50_premier[["short_name", "overall"]])

clubes_LaLiga = ["FC Barcelona", "Real Madrid", "Atlético Madrid"]
mejores_50_LaLiga = df[df['club'].isin(clubes_LaLiga)].head(50)
print(mejores_50_LaLiga[["short_name", "overall"]])

In [None]:
promedio_overall_premier = mejores_50_premier["overall"].mean()
promedio_overall_LaLiga = mejores_50_LaLiga["overall"].mean()
print("Promedio del overall en la Premier League (top 50):", promedio_overall_premier)
print("Promedio del overall en LaLiga ligas (top 50):", promedio_overall_LaLiga)

Promedio del overall en la Premier League (top 50): 85.84
Promedio del overall en LaLiga ligas (top 50): 85.32


Aquí se demuestra como en comparación con LaLiga, la Premier sigue teniendo una mejor cantidad de jugadores que LaLiga, a pesar de que LaLiga, posee a uno de los tres mejores jugadores, mientras que los otros dos poseen a la Serie A y la Ligue 1. Por así decirlo, LaLiga posee a los 5

Si hacemos la comparativa con otra liga, por ejemplo la SerieA, que posee al segundo jugador de todo el DataFrame con mayor overall obtendriamos lo siguiente:

In [None]:
clubes_premier = ["Manchester City", "Manchester United", "Tottenham Hotspur", "Arsenal", "Chelsea", "Liverpool"]
mejores_50_premier = df[df['club'].isin(clubes_premier)].head(50)
print(mejores_50_premier[["short_name", "overall"]])

clubes_SerieA = ["Juventus", "Napoli", "Inter"]
mejores_50_SerieA = df[df['club'].isin(clubes_SerieA)].head(50)
print(mejores_50_SerieA[["short_name", "overall"]])

In [None]:
promedio_overall_premier = mejores_50_premier["overall"].mean()
promedio_overall_SerieA = mejores_50_SerieA["overall"].mean()
print("Promedio del overall en la Premier League (top 50):", promedio_overall_premier)
print("Promedio del overall en SerieA (top 50):", promedio_overall_SerieA)

Aquí podemos observar incluso una mayor diferencia con respeto a LaLiga. Esto indica que el nivel de la premier es mas de dos puntos superior al de la SerieA.

Si volvemos a comparar la Premier League, en esta ocasión, con la Ligue1, el resultado es el siguiente.

In [None]:
clubes_premier = ["Manchester City", "Manchester United", "Tottenham Hotspur", "Arsenal", "Chelsea", "Liverpool"]
mejores_50_premier = df[df['club'].isin(clubes_premier)].head(50)
print(mejores_50_premier[["short_name", "overall"]])

clubes_Ligue1 = ["Paris Saint-Germain", "AS Monaco", "Olympique Marsella"]
mejores_50_Ligue1 = df[df['club'].isin(clubes_Ligue1)].head(50)
print(mejores_50_Ligue1[["short_name", "overall"]])

In [None]:
promedio_overall_premier = mejores_50_premier["overall"].mean()
promedio_overall_Ligue1 = mejores_50_Ligue1["overall"].mean()
print("Promedio del overall en la Premier League (top 50):", promedio_overall_premier)
print("Promedio del overall en Ligue1 (top 50):", promedio_overall_Ligue1)

En esta ocasión observamos una mayor diferencia con respecto a las ligas anteriores debido al bajo overall de los jugadores pertenecientes a esta liga.

***Para concluir, cerrar con que la hipotésis de que el mayor nivel se encuentra en la premier league es cierta, pero eso no significa que posea a los mejores jugadores ya que en el dataframe, tenemos que bajar hasta la sexta posición para encontrar al primer jugador de dicha liga. Esta liga, por lo tanto, destaca más en su conjunto que LaLiga, la SerieA o la Ligue1, que las 3 poseen a un jugador dentro del top 3 con mayor overall pero tienen un nivel inferior de jugadores en conjunto.***