# Análisis de Datos en el Fútbol: Descubriendo el Rendimiento de Jugadores y Equipos

## Introducción

En el mundo del fútbol, el análisis de datos ha cobrado una gran relevancia en los últimos años. La información obtenida a través del análisis de diversas variables puede proporcionar insights valiosos sobre el desempeño de los jugadores y equipos. 

En este contexto, el presente conjunto de datos ofrece una amplia variedad de información que captura diferentes aspectos del juego. 

En este análisis, nos dirigimos a entrenadores, analistas y aficionados del fútbol interesados en comprender y utilizar estos datos para evaluar el rendimiento de los jugadores y equipos en diversos aspectos del juego.

## El Conjunto de Datos

El conjunto de datos que estamos analizando contiene una amplia variedad de variables que capturan diferentes aspectos del juego de fútbol. Estas variables incluyen goles marcados, precisión de pases, regates exitosos, habilidades defensivas, edad, posición en el campo, altura y más. Esta información es esencial para evaluar el rendimiento de los jugadores y equipos en diferentes aspectos del juego.

## Preguntas e Hipótesis

Antes de sumergirnos en el análisis, estableceremos algunas preguntas e hipótesis que podríamos responder a través de los datos:

1. ¿Cuáles son los jugadores más efectivos en términos de goles marcados? ¿Existen diferencias significativas entre los distintos equipos en cuanto a la producción de goles?

2. ¿Existe una relación entre la precisión de los pases de un jugador y su capacidad para crear oportunidades de gol para su equipo?

3. ¿Cuál es el porcentaje de éxito de los regates realizados por los jugadores? ¿Algunos jugadores destacan por su habilidad para eludir a los defensores?

4. ¿Qué jugadores tienen la mejor capacidad defensiva en términos de bloqueo de tiros y recuperación de balones?

5. ¿Existe alguna correlación entre la edad de los jugadores y su rendimiento en el campo?

6. ¿Hay diferencias significativas en el rendimiento de los jugadores en función de su posición en el campo (delantero, centrocampista, defensor, portero)?

7. ¿Existe alguna relación entre la altura de los jugadores y su capacidad para ganar duelos aéreos?

8. ¿Cuál es el equipo con el mejor desempeño general en términos de todas las variables analizadas?

Estas preguntas guiarán nuestro análisis y nos ayudarán a obtener información relevante sobre el rendimiento de jugadores y equipos en el fútbol.

## Objetivo

El objetivo de este análisis es utilizar técnicas de análisis de datos para examinar el rendimiento de jugadores y equipos de fútbol en función de diversas variables. Estas variables incluyen goles marcados, precisión de pases, regates exitosos, habilidades defensivas, edad, posición en el campo, altura y otras relevantes. Buscaremos identificar patrones y relaciones significativas que puedan proporcionar insights valiosos para la toma de decisiones estratégicas y operativas en la industria del fútbol.

## Contexto Comercial y Problema a Abordar

En el contexto comercial, nuestro objetivo es proporcionar información y análisis útiles para actores dentro de la industria del fútbol, como clubes, directores técnicos y agentes de jugadores. Abordamos el problema de comprender y evaluar el rendimiento de los jugadores y equipos de fútbol para facilitar la identificación de talentos, la selección de jugadores y la toma de decisiones estratégicas.

## Problema Comercial

El problema comercial que abordamos es la necesidad de comprender y evaluar el rendimiento de los jugadores y equipos de fútbol en función de diversas variables. Esta información es fundamental para tomar decisiones informadas en la industria del fútbol y puede tener un impacto significativo en la identificación de talentos, la formación de equipos competitivos y el desarrollo de estrategias ganadoras.

## Contexto Analítico

En el contexto analítico, utilizaremos técnicas de análisis de datos para explorar y comprender los patrones, tendencias y relaciones existentes en los datos recopilados. Utilizaremos herramientas y técnicas de programación en Python para realizar la exploración de datos (EDA) de manera detallada. Esto incluirá cálculos estadísticos, visualizaciones gráficas y otras técnicas exploratorias para comprender mejor el comportamiento de los jugadores y equipos en función de las variables analizadas.

A través de este análisis, buscamos brindar insights valiosos para los actores involucrados en la industria del fútbol y ayudarles a tomar decisiones más informadas y estratégicas.

¡Comencemos con la exploración de datos (EDA)! En el próximo paso, cargaremos el conjunto de datos y procederemos con el análisis detallado de las variables relevantes.

## Datos de Interes

In [6]:
# import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

ruta_archivo = '../DataSets/2022-2023FootballPlayerStatsCorr.csv'
#df = pd.read_csv(ruta_archivo, encoding='ISO-8859-1', delimiter=';')
# Leer el archivo CSV con el parámetro na_values
df = pd.read_csv(ruta_archivo, encoding='ISO-8859-1', delimiter=',', na_values='?')

# Ver las primeras filas del dataset
df.head()

Unnamed: 0,Rk,Player,Nation,Pos,Squad,Comp,Age,Born,MP,Starts,...,Off,Crs,TklW,PKwon,PKcon,OG,Recov,AerWon,AerLost,AerWon%
0,1,Brenden Aaronson,USA,MFFW,Leeds United,Premier League,22,2000,20,19,...,0.17,2.54,0.51,0.0,0.0,0.0,4.86,0.34,1.19,22.2
1,2,Yunis Abdelhamid,MAR,DF,Reims,Ligue 1,35,1987,22,22,...,0.05,0.18,1.59,0.0,0.0,0.0,6.64,2.18,1.23,64.0
2,3,Himad Abdelli,FRA,MFFW,Angers,Ligue 1,23,1999,14,8,...,0.0,1.05,1.4,0.0,0.0,0.0,8.14,0.93,1.05,47.1
3,4,Salis Abdul Samed,GHA,MF,Lens,Ligue 1,22,2000,20,20,...,0.0,0.35,0.8,0.0,0.0,0.05,6.6,0.5,0.5,50.0
4,5,Laurent Abergel,FRA,MF,Lorient,Ligue 1,30,1993,15,15,...,0.0,0.23,2.02,0.0,0.0,0.0,6.51,0.31,0.39,44.4


## Analisis Exploratorio de Datos (EDA)

In [7]:
# Obtener información sobre el conjunto de datos
df.info()

# Calcular estadísticas descriptivas
df.describe()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2689 entries, 0 to 2688
Columns: 124 entries, Rk to AerWon%
dtypes: float64(112), int64(7), object(5)
memory usage: 2.5+ MB


Unnamed: 0,Rk,Age,Born,MP,Starts,Min,90s,Goals,Shots,SoT,...,Off,Crs,TklW,PKwon,PKcon,OG,Recov,AerWon,AerLost,AerWon%
count,2689.0,2689.0,2689.0,2689.0,2689.0,2689.0,2689.0,2689.0,2689.0,2689.0,...,2689.0,2689.0,2689.0,2689.0,2689.0,2689.0,2689.0,2689.0,2689.0,2689.0
mean,1345.0,26.011157,1996.15582,11.833023,8.476013,760.451097,8.450465,1.02752,1.245787,0.411261,...,0.204697,1.661636,0.990569,0.009249,0.015173,0.003142,4.951967,1.312064,1.497356,43.5836
std,776.391761,4.446259,4.450108,6.864278,6.994383,591.09426,6.567484,2.013714,1.424619,0.754716,...,0.552376,2.319,1.235965,0.043781,0.077399,0.022607,2.901833,1.579539,1.830391,26.673092
min,1.0,15.0,1981.0,1.0,0.0,1.0,0.0,0.0,0.0,0.0,...,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
25%,673.0,23.0,1993.0,5.0,2.0,194.0,2.2,0.0,0.26,0.0,...,0.0,0.0,0.3,0.0,0.0,0.0,3.33,0.33,0.55,27.6
50%,1345.0,26.0,1996.0,13.0,7.0,684.0,7.6,0.0,0.86,0.18,...,0.0,0.76,0.83,0.0,0.0,0.0,5.0,0.93,1.1,46.4
75%,2017.0,29.0,2000.0,18.0,14.0,1245.0,13.8,1.0,1.85,0.59,...,0.21,2.5,1.32,0.0,0.0,0.0,6.27,1.79,1.83,60.0
max,2689.0,41.0,2007.0,23.0,23.0,2070.0,23.0,25.0,15.0,10.0,...,10.0,30.0,20.0,0.87,2.0,0.5,30.0,25.0,30.0,100.0
