# Análise de dados dos jogos do Flamengo 2024

In [2]:
# Carregando algumas bibliotecas importantes
import numpy as np
import pandas as pd 
import csv
from datetime import datetime

In [3]:
# Importando os arquivos
jogos = pd.read_csv('../data/processed/matches_FLA2024_processed.csv', parse_dates=['kick-off'])
gols = pd.read_csv('../data/processed/goal_scorers_2024_processed.csv')

## Estatísticas 

In [5]:
# Calculando os gols pró, sofridos e saldo de gols
gols_pro = jogos.gols_casa.sum() + jogos.gols_fora.sum()
gols_contra = jogos.gols_sofridos_casa.sum() + jogos.gols_sofridos_fora.sum()
saldo_gols = gols_pro - gols_contra

In [6]:
# Obtendo o número de vitórias, derrotas, empates e total de jogos
vitorias = jogos['resultado'].value_counts().iloc[0]
derrotas = jogos['resultado'].value_counts().iloc[2]
empates = jogos['resultado'].value_counts().iloc[1]
total_jogos = vitorias + empates + derrotas

# Gols pro e sofridos por jogo
gols_per_jogo = round(gols_pro/total_jogos,2)
gols_sofrido_jogo = round(gols_contra/total_jogos,2)

# Calculando o aproveitamento
aproveitamento = round((3*vitorias + 1*empates + 0*derrotas)/(3*total_jogos)*100,2)
aproveitamento_pontos = (3*vitorias + 1*empates + 0*derrotas)

In [7]:
jogos

Unnamed: 0,id_match,home_team,away_team,home_score,away_score,tournament,kick-off,stadium,attendance,torneio,...,gols_casa,gols_sofridos_casa,gols_fora,gols_sofridos_fora,marcou_gol,sofreu_gol,jogos_cumulativos,year,month,weekday
0,CA1,Flamengo,Audax-RJ,4,0,Carioca - Round 1,2024-01-17 21:30:00,Arena da Amazônia-AM,44068,Carioca,...,4,0,0,0,Sim,Não,1,2024,Jan,Wed
1,AM1,Philadelphia Union-EUA,Flamengo,0,2,International Friendly Game,2024-01-21 16:00:00,AI Lang Stadium-EUA,7227,International Friendly Game,...,0,0,2,0,Sim,Não,2,2024,Jan,Sun
2,CA2,Nova Iguaçu-RJ,Flamengo,1,1,Carioca - Round 2,2024-01-21 18:10:00,Estádio Almeidão-PB,16428,Carioca,...,0,0,1,1,Sim,Sim,3,2024,Jan,Sun
3,AM2,Orlando City,Flamengo,1,1,International Friendly Game,2024-01-27 16:00:00,Inter&Co Stadium-EUA,22678,International Friendly Game,...,0,0,1,1,Sim,Sim,4,2024,Jan,Sat
4,CA3,Portuguesa-RJ,Flamengo,0,0,Carioca - Round 3,2024-01-27 18:10:00,Arena das Dunas-RN,25211,Carioca,...,0,0,0,0,Não,Não,5,2024,Jan,Sat
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
70,BR34,Cuiabá,Flamengo,1,2,Campeonato Brasileiro - Round 34,2024-11-20 19:00:00,Arena Pantanal-MT,12891,Campeonato Brasileiro,...,0,0,2,1,Sim,Sim,71,2024,Nov,Wed
71,BR35,Fortaleza,Flamengo,0,0,Campeonato Brasileiro - Round 35,2024-11-26 20:00:00,Arena Castelão-CE,56646,Campeonato Brasileiro,...,0,0,0,0,Não,Não,72,2024,Nov,Tue
72,BR36,Flamengo,Internacional,3,2,Campeonato Brasileiro - Round 36,2024-12-01 16:00:00,Maracanã-RJ,56571,Campeonato Brasileiro,...,3,2,0,0,Sim,Sim,73,2024,Dec,Sun
73,BR37,Criciúma,Flamengo,0,3,Campeonato Brasileiro - Round 37,2024-12-04 20:00:00,Heriberto Hülse-SC,18849,Campeonato Brasileiro,...,0,0,3,0,Sim,Não,74,2024,Dec,Wed


In [8]:
jogos_marcou = jogos.marcou_gol.value_counts().iloc[0]
jogos_nao_marcou = jogos.marcou_gol.value_counts().iloc[1]

jogos_sofreu = jogos.sofreu_gol.value_counts(ascending=True).iloc[0]
jogos_nao_sofreu = jogos.sofreu_gol.value_counts(ascending=True).iloc[1]

In [9]:
stats = pd.DataFrame(jogos[['id_match', 'marcou_gol', 'sofreu_gol', 'kick-off', 'resultado', 'locale', 'jogos_cumulativos']])

stats['gols_marcados'] = jogos.gols_casa + jogos.gols_fora
stats['gols_sofridos'] = jogos.gols_sofridos_casa + jogos.gols_sofridos_fora

stats['gols_marcados_acumulados'] = stats['gols_marcados'].cumsum()
stats['gols_sofridos_acumulados'] = stats['gols_sofridos'].cumsum()
stats['diferença_gols_acumulados'] = stats['gols_marcados_acumulados'] - stats['gols_sofridos_acumulados']

In [10]:
print(
"""
Jogos: {0}
Vitórias: {1}
Empates: {2}
Derrotas: {3} 
Gols pro: {4}
Gols contra: {5}
Saldo de gols: +{6}
Gols/jogo: {7}
Gols sofridos/jogo: {8}
Jogos em que marcou: {9}
Jogos em que sofreu gol: {10} 
Aproveitamento: {11}%
Aproveitamento pontos: {12}/{13}
""".format(total_jogos,vitorias,empates,derrotas,gols_pro,gols_contra,saldo_gols,gols_per_jogo,
           gols_sofrido_jogo,jogos_marcou,jogos_sofreu,aproveitamento,aproveitamento_pontos, 3*total_jogos))


Jogos: 75
Vitórias: 44
Empates: 18
Derrotas: 13 
Gols pro: 117
Gols contra: 52
Saldo de gols: +65
Gols/jogo: 1.56
Gols sofridos/jogo: 0.69
Jogos em que marcou: 60
Jogos em que sofreu gol: 37 
Aproveitamento: 66.67%
Aproveitamento pontos: 150/225



### Criando tabelas com o número de gols e assistências

In [12]:
# Fazendo o merge dos dataframes jogos e gols
df = pd.merge(jogos, gols, on = 'id_match')
df.head()

Unnamed: 0,id_match,home_team,away_team,home_score,away_score,tournament,kick-off,stadium,attendance,torneio,...,gols_fora,gols_sofridos_fora,marcou_gol,sofreu_gol,jogos_cumulativos,year,month,weekday,gols,assist
0,CA1,Flamengo,Audax-RJ,4,0,Carioca - Round 1,2024-01-17 21:30:00,Arena da Amazônia-AM,44068,Carioca,...,0,0,Sim,Não,1,2024,Jan,Wed,Léo Pereira,Arrascaeta
1,CA1,Flamengo,Audax-RJ,4,0,Carioca - Round 1,2024-01-17 21:30:00,Arena da Amazônia-AM,44068,Carioca,...,0,0,Sim,Não,1,2024,Jan,Wed,Pedro,Gerson
2,CA1,Flamengo,Audax-RJ,4,0,Carioca - Round 1,2024-01-17 21:30:00,Arena da Amazônia-AM,44068,Carioca,...,0,0,Sim,Não,1,2024,Jan,Wed,Everton Cebolinha,
3,CA1,Flamengo,Audax-RJ,4,0,Carioca - Round 1,2024-01-17 21:30:00,Arena da Amazônia-AM,44068,Carioca,...,0,0,Sim,Não,1,2024,Jan,Wed,Varela,Luiz Araújo
4,AM1,Philadelphia Union-EUA,Flamengo,0,2,International Friendly Game,2024-01-21 16:00:00,AI Lang Stadium-EUA,7227,International Friendly Game,...,2,0,Sim,Não,2,2024,Jan,Sun,Pedro,


In [19]:
# Quantidade de gols por jogador
df_gols_counts = pd.DataFrame(gols.gols.value_counts())
df_gols_counts = df_gols_counts.reset_index()
df_gols_counts.columns = ['Jogador', 'Gols'] 

# Quantidade de assistência por jogador

df_assist_counts = pd.DataFrame(gols.assist.value_counts())
df_assist_counts = df_assist_counts.reset_index()
df_assist_counts.columns = ['Jogador', 'Assistências'] 

new_df = pd.concat([df_assist_counts, df_gols_counts], axis=1)
print(new_df.to_markdown(index=False))

| Jogador           |   Assistências | Jogador           |   Gols |
|:------------------|---------------:|:------------------|-------:|
| Luiz Araújo       |             10 | Pedro             |     32 |
| Arrascaeta        |              9 | Arrascaeta        |     10 |
| Gerson            |              9 | Bruno Henrique    |      9 |
| Pedro             |              8 | Gabi              |      7 |
| Ayrton Lucas      |              6 | Luiz Araújo       |      7 |
| de la Cruz        |              5 | Everton Cebolinha |      6 |
| Bruno Henrique    |              4 | Ayrton Lucas      |      5 |
| Everton Cebolinha |              4 | Michael           |      4 |
| Pulgar            |              4 | Gerson            |      4 |
| Lorran            |              3 | David Luiz        |      3 |
| Wesley            |              2 | Léo Pereira       |      3 |
| Alcaraz           |              2 | Own Goal          |      3 |
| Léo Ortiz         |              2 | Matheus G

In [21]:
gols.assist.value_counts()df_assist_counts

assist
Luiz Araújo           10
Arrascaeta             9
Gerson                 9
Pedro                  8
Ayrton Lucas           6
de la Cruz             5
Bruno Henrique         4
Everton Cebolinha      4
Pulgar                 4
Lorran                 3
Wesley                 2
Alcaraz                2
Léo Ortiz              2
Viña                   2
Igor Jesus             2
 Everton Cebolinha     1
Gabi                   1
Varela                 1
Plata                  1
Michael                1
 de la Cruz            1
 Alex Sandro           1
Name: count, dtype: int64

In [None]:
# Unificando as tabelas gols e assistências
uni_df = pd.merge(df_gols_counts, df_assist_counts, on = 'Jogador', how ="left").fillna(0).head(15)

print(uni_df.to_markdown(index=False))

In [None]:
stats['year'] = stats['kick-off'].map(lambda x: datetime.strftime(x,"%Y"))
stats['month'] = stats['kick-off'].map(lambda x: datetime.strftime(x,"%b"))
stats['weekday'] = stats['kick-off'].map(lambda x: datetime.strftime(x,"%a"))

In [None]:
stats.to_csv('../data/processed/stats_FLA2024_processed.csv', index=False)

In [None]:
stats