# Análise de Dados Exploratória de Lionel Messi

![messi](img/messi.png "Lionel Messi comemorando título da Copa do Mundo com seus companheiros. Image By: fifa.com")

# 1. Introdução

Lionel Andrés Messi Cuccittini é um renomado jogador de futebol argentino, conhecido por suas habilidades excepcionais e conquistas no esporte. Desde sua estreia até o dia 03/04/2023, Messi se destacou marcando um número impressionante de gols ao longo de sua carreira.

Neste estudo, iremos explorar um conjunto de dados detalhando os gols marcados por Lionel Messi em partidas oficiais. Os dados abrangem desde o início de sua carreira até a data mencionada, proporcionando uma visão abrangente dos feitos do jogador ao longo do tempo. Essas informações são valiosas para entender a magnitude de suas conquistas e seu impacto no mundo do futebol.

O conjunto de dados foi compilado e atualizado por Azmine Toushik Wasi na plataforma [Kaggle](https://www.kaggle.com/datasets/azminetoushikwasi/-lionel-messi-all-club-goals), incluindo registros de jogos, relatórios esportivos e estatísticas oficiais. Ele apresenta detalhes sobre as partidas em que Messi marcou gols, incluindo a temporada, competição, jornada, data, local, clube pelo qual Messi marcou o gol, adversário, resultado da partida, posição que Messi jogou no campo, minuto, qual o placar a partir do gol de Lionel Messi, tipo de gol marcado e o jogador que deu a assistência para oa gol.

Ao analisar esses dados, poderemos descobrir padrões, tendências e marcos notáveis ​​associados ao desempenho de Messi, permitindo uma apreciação mais profunda de suas habilidades e realizações no mundo do futebol.

## 1.1. Objetivos

O objetivo deste estudo é realizar uma Análise Exploratória dos Dados (Exploratory Data Analysis - EDA) do conjunto de dados `messi`, adaptado pelo autor e disponível em [data/messi.csv](data/messi.csv); a fim de caracterizar quais tipos de gols Messi mais marcou, em qual período e faixa de tempo Messi mais marcou, principais assistentes, por qual clube ele mais marcou e quais clubes adversários sofreram mais gols de Lionel Messi. Especificamente serão respondidas as seguintes questões de pesquisa:

1. [Em quais clubes adversários Messi mais marcou em cada competição que ele disputou?](#3.1.-Qual-é-o-número-de-Sobreviventes?)
2. [Quais tipos de gols Messi mais marcou?](#3.2.-Homens-ou-mulheres-tiveram-mais-chances-de-sobreviver?)
3. [Quantos gols em cada período (primeiro ou segundo tempo) Messi marcou?](#3.3.-Qual-classe-social-teve-mais-sobreviventes?)
4. [Em quais faixas de minuto (divididos a cada 15 minutos) Messi mais marcou?](#3.4.-Qual-faixa-etária-teve-mais-chances-de-sobreviver?)
5. [Quais jogadores deram mais assistências para gols de Lionel Messi?](#3.5.-Qual-faixa-etária-teve-mais-chances-de-sobreviver?)


# 2. Metodologia

Nesta seção será apresentado todo o processo de preparação, organização e limpeza de dados feito no *dataset* que possui os seguintes dados:

| Coluna          | Descrição                                                                 |
|-----------------|---------------------------------------------------------------------------|
| id_gol          | Identficador único do gol marcado.                                        |
| temporada       | Época em que o gol foi marcado.                                           |
| competicao      | Qual era o campeonato que o gol foi marcado.                              |
| rodada_comp     | Em qual estágio estava a competição.                                      |
| data            |  Data que o gol foi marcado                                               |
| local           | Se Messi jogava no estádio do seu time (H) ou do adversário (A)           |
| clube           | Por qual clube Messi jogava quando marcou o gol.                          |
| adversario      | Clube adversário que Messi marcou o gol.                                  |
| placar          | Placar final da partida.                                                  |
| posicao_campo   | Em qual posição Messi jogava quando marcou o gol.                         |
| minuto          | Em qual minuto da partida Messi jogava quando marcou o gol.               |
| placar_pos_gol  | Qual foi o placar pós gol de Messi.                                       |
| tipo            | Tipo de gol marcado.                                                      |
| jogador_ast     | Jogador que deu o passe para o gol.                                       |

## OBSERVAÇÕES

- `temporada` está divida em em dois anos diferentes, representando o começo da temporada em um ano e o fim da temporada no outro;
- `local` é uma definição se o estádio em qual Messi jogava estava com mando de campo do clube em que atuava (H) ou do clube adversário (A);
- `minuto` está representada em faixas de números de 1 a 90, onde o fim do primeiro tempo se dá aos 45 e o fim do segundo aos 90, sendo possível conter acréscimos pós fim de cada tempo representados pelo símbolo "+" e um número que representa o acréscimo em minutos. Contém também minutos pós o período normal de 90 minutos, chamados de prorrogação, em casos de competições especiais que exigem um vencedor por diferença de gols;
- `tipo` se refere ao estilo de gol marcado por Messi, dividos em::
    - **Peito**: Gol marcado de peito;
    - **Gol em contra ataque**: Gol marcado em jogada de contra ataque;
    - **Chute com o pe esquedo**: Chute de pé esquerdo;
    - **Chute com o pe direito**:  Chute de pé direito;
    - **Arrancada**: Jogada partindo de um ponto inicial que contém mais toques na bola de Messi do que outro jogador;
    - **Cabecada**: Gol marcado de cabeça;
    - **Penalti**: Gol marcado em cobrança de penâlti;
    - **Cobranca de falta**: Gol marcado em cobrança de falta;
    - **Toque sutil**: Desvio leve para o gol;
    - **Gol em contra ataque**: Gol partindo de erro do adversário no campo de defesa do clube de Messi;
    - **Penalti**: Gol marcado em rebote de cobrança de penâlti;
    - **Desviando chute ao gol**: Desvio de Messi em finalização rumo ao gol de outro jogador;


# 3. Análise dos Dados


# 3.1 Em quais clubes adversários Messi mais marcou em cada competição que ele disputou?

In [None]:
pip install -r requirements.txt

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv("data/messi.csv")
competicoes= df['competicao'].unique()
for competicao in competicoes:
  df_competicao_desejada = df[df['competicao'] == competicao]
  exibir = df_competicao_desejada['adversario'].value_counts()
  exibir = exibir.head(5)
  exibir.plot(kind='bar')
  plt.xlabel('Adversário')
  plt.ylabel('Quantidade de Gols')
  plt.yticks(range(1, max(exibir.values) +1 ))
  plt.title((f"Exibindo os adversários que Messi mais marcou na competição {competicao}"))
  plt.show()

# 3.2 Quais tipos de gols Messi mais marcou?


In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# import mplcursors
df = pd.read_csv("data/messi.csv")
tipo_gols = df['tipo'].value_counts()
tipo_gol= tipo_gols.head(10) 
fig, ax = plt.subplots()
barras = ax.bar(tipo_gol.index, tipo_gol)

# Adicionar as quantidades sobre cada barra
for barra in barras:
    altura = barra.get_height()
    ax.annotate(f'{altura}', xy=(barra.get_x() + barra.get_width() / 2, altura),
                xytext=(0, 3), textcoords='offset points', ha='center', va='bottom')

plt.xlabel('Tipos de Gols')
plt.ylabel('Quantidade')
plt.title('Tipos de Gols mais Marcados Por Lionel Messi')
plt.xlim(-0.5, len(tipo_gol) - 0.5)
plt.xticks(rotation=45, ha='right')
plt.ylim(0, tipo_gol.max() * 1.1) 
plt.tight_layout()
plt.show()

# 3.3 Quantos gols em cada período (primeiro ou segundo tempo) Messi marcou?


In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

df = pd.read_csv('data/messi.csv')
df['minuto'] = pd.to_numeric(df['minuto'], errors='coerce')
intervals = [1, 45 , 91, 120]
labels = ['Primeiro Tempo', 'Segundo Tempo', 'Prorrogação']
df['faixa_minuto'] = pd.cut(df['minuto'], bins=intervals, labels=labels, right=False)
contador = df['faixa_minuto'].value_counts().sort_index()
matriz_contador = np.array(contador).reshape(1, -1)
fig, ax = plt.subplots()
im = ax.imshow(matriz_contador, cmap='YlOrRd')
for i in range(matriz_contador.shape[0]):
    for j in range(matriz_contador.shape[1]):
        text = ax.text(j, i, matriz_contador[i, j], ha='center', va='center', color='black')

ax.set_xticks(np.arange(len(labels)))
ax.set_yticks([0])
ax.set_xticklabels(labels)
ax.set_yticklabels(['Quantidade'])
ax.set_title('Quantidade de Gols de Lionel Messi em Etapas da Partida', fontsize=10)

plt.subplots_adjust(bottom=0.02)
cbar = ax.figure.colorbar(im, ax=ax, aspect=50)
plt.show()


# 3.4 Em quais faixas de minuto (divididos a cada 15 minutos) Messi mais marcou?

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

df = pd.read_csv('data/messi.csv')
df['minuto'] = pd.to_numeric(df['minuto'], errors='coerce')

intervals = [1, 15, 30, 45, 60, 75, 91, 105, 120]

labels = ['1-15', '16-30', '31-45', '46-60', '61-75', '76-90', '91-105', '105-120']

df['faixa_minuto'] = pd.cut(df['minuto'], bins=intervals, labels=labels, right=False)


contador = df['faixa_minuto'].value_counts().sort_index()

matriz_contador = np.array(contador).reshape(1, -1)
fig, ax = plt.subplots()
im = ax.imshow(matriz_contador, cmap='YlOrRd')

for i in range(matriz_contador.shape[0]):
    for j in range(matriz_contador.shape[1]):
        text = ax.text(j, i, matriz_contador[i, j], ha='center', va='center', color='black')


ax.set_xticks(np.arange(len(labels)))
ax.set_yticks([0])
ax.set_xticklabels(labels)
ax.set_yticklabels(['Quantidade'])

ax.set_title('Quantidade de Gols de Lionel Messi: Faixas de 15 Minutos', fontsize=10)


plt.subplots_adjust(bottom=0.02)

cbar = ax.figure.colorbar(im, ax=ax, aspect=50)

plt.show()

# 3.5 Quais jogadores deram mais assistências para gols de Lionel Messi?

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv("data/messi.csv")
maiores_assistentes = df['jogador_assistente'].value_counts()
maiores_assistentes= maiores_assistentes.head(10) 
fig, ax = plt.subplots()
barras = ax.bar(maiores_assistentes.index, maiores_assistentes)

# Adicionar as quantidades sobre cada barra
for barra in barras:
    altura = barra.get_height()
    ax.annotate(f'{altura}', xy=(barra.get_x() + barra.get_width() / 2, altura),
                xytext=(0, 3), textcoords='offset points', ha='center', va='bottom')

plt.xlabel('Jogador Assistente')
plt.ylabel('Quantidade')
plt.title('Maiores Assistentes de Lionel Messi')
plt.xlim(-0.5, len(maiores_assistentes) - 0.5)
plt.xticks(rotation=45, ha='right')
plt.ylim(0, maiores_assistentes.max() * 1.1) 
plt.tight_layout()
plt.show()