# Análise de dados dos jogos do Flamengo 2024

In [10]:
# Carregando algumas bibliotecas importantes
import numpy as np
import pandas as pd 
import csv
from datetime import datetime

In [12]:
# Importando os arquivos
jogos = pd.read_csv('../data/processed/matches_FLA2025_processed.csv', parse_dates=['kick-off'])
gols = pd.read_csv('../data/processed/goal_scorers_2025_processed.csv')

## Estatísticas 

In [13]:
# Calculando os gols pró, sofridos e saldo de gols
gols_pro = jogos.gols_casa.sum() + jogos.gols_fora.sum()
gols_contra = jogos.gols_sofridos_casa.sum() + jogos.gols_sofridos_fora.sum()
saldo_gols = gols_pro - gols_contra

In [14]:
# Obtendo o número de vitórias, derrotas, empates e total de jogos
vitorias = jogos['resultado'].value_counts().iloc[0]
derrotas = jogos['resultado'].value_counts().iloc[2]
empates = jogos['resultado'].value_counts().iloc[1]
total_jogos = vitorias + empates + derrotas

# Gols pro e sofridos por jogo
gols_per_jogo = round(gols_pro/total_jogos,2)
gols_sofrido_jogo = round(gols_contra/total_jogos,2)

# Calculando o aproveitamento
aproveitamento = round((3*vitorias + 1*empates + 0*derrotas)/(3*total_jogos)*100,2)
aproveitamento_pontos = (3*vitorias + 1*empates + 0*derrotas)

In [15]:
jogos

Unnamed: 0,id_match,home_team,away_team,home_score,away_score,tournament,kick-off,stadium,attendance,notes,...,gols_casa,gols_sofridos_casa,gols_fora,gols_sofridos_fora,marcou_gol,sofreu_gol,jogos_cumulativos,year,month,weekday
0,CA1,Flamengo,Boa Vista-RJ,1,2,Carioca - Round 1,2025-01-12 16:00:00,Estádio Batistão-SE,3793,Time B,...,1,2,0,0,Sim,Sim,1,2025,Jan,Sun
1,CA2,Madureira-RJ,Flamengo,1,1,Carioca - Round 2,2025-01-16 18:30:00,Estádio Governador Ernani Sátyro-PB,3614,Time B,...,0,0,1,1,Sim,Sim,2,2025,Jan,Thu
2,AM1,São Paulo,Flamengo,0,0,International Friendly Game,2025-01-19 17:00:00,Chase Stadium-USA,21550,Time A - Amistoso,...,0,0,0,0,Não,Não,3,2025,Jan,Sun
3,CA3,Flamengo,Nova Iguaçu-RJ,1,2,Carioca - Round 3,2025-01-19 18:30:00,Estádio Governador Ernani Sátyro-PB,3614,Time B,...,1,2,0,0,Sim,Sim,4,2025,Jan,Sun
4,CA4,Bangu,Flamengo,0,5,Carioca - Round 4,2025-01-22 19:00:00,Estádio Governador João Castelo-MA,29820,Time B,...,0,0,5,0,Sim,Não,5,2025,Jan,Wed
5,CA5,Volta Redonda,Flamengo,0,2,Carioca - Round 5,2025-01-25 16:30:00,Estádio Nacional Mané Garrincha-DF,23872,Time A,...,0,0,2,0,Sim,Não,6,2025,Jan,Sat
6,CA6,Flamengo,Sampaio Correia-RJ,2,0,Carioca - Round 6,2025-01-30 21:30:00,Maracanã-RJ,18423,Time A,...,2,0,0,0,Sim,Não,7,2025,Jan,Thu
7,SC1,Botafogo,Flamengo,1,3,Supercopa do Brasil,2025-02-02 16:00:00,Estádio Olímpico do Pará-PA,44952,Time A,...,0,0,3,1,Sim,Sim,8,2025,Feb,Sun
8,CA8,Portuguesa-RJ,Flamengo,0,5,Carioca - Round 7,2025-02-05 19:00:00,Estádio Parque do Sabiá-MG,16396,Time A,...,0,0,5,0,Sim,Não,9,2025,Feb,Wed
9,CA9,Fluminense,Flamengo,0,0,Carioca - Round 8,2025-02-08 16:30:00,Maracanã-RJ,34617,Time A,...,0,0,0,0,Não,Não,10,2025,Feb,Sat


In [16]:
jogos_marcou = jogos.marcou_gol.value_counts().iloc[0]
jogos_nao_marcou = jogos.marcou_gol.value_counts().iloc[1]

jogos_sofreu = jogos.sofreu_gol.value_counts(ascending=True).iloc[0]
jogos_nao_sofreu = jogos.sofreu_gol.value_counts(ascending=True).iloc[1]

In [17]:
stats = pd.DataFrame(jogos[['id_match', 'marcou_gol', 'sofreu_gol', 'kick-off', 'resultado', 'locale', 'jogos_cumulativos']])

stats['gols_marcados'] = jogos.gols_casa + jogos.gols_fora
stats['gols_sofridos'] = jogos.gols_sofridos_casa + jogos.gols_sofridos_fora

stats['gols_marcados_acumulados'] = stats['gols_marcados'].cumsum()
stats['gols_sofridos_acumulados'] = stats['gols_sofridos'].cumsum()
stats['diferença_gols_acumulados'] = stats['gols_marcados_acumulados'] - stats['gols_sofridos_acumulados']

In [18]:
print(
"""
Jogos: {0}
Vitórias: {1}
Empates: {2}
Derrotas: {3} 
Gols pro: {4}
Gols contra: {5}
Saldo de gols: +{6}
Gols/jogo: {7}
Gols sofridos/jogo: {8}
Jogos em que marcou: {9}
Jogos em que sofreu gol: {10} 
Aproveitamento: {11}%
Aproveitamento pontos: {12}/{13}
""".format(total_jogos,vitorias,empates,derrotas,gols_pro,gols_contra,saldo_gols,gols_per_jogo,
           gols_sofrido_jogo,jogos_marcou,jogos_sofreu,aproveitamento,aproveitamento_pontos, 3*total_jogos))


Jogos: 16
Vitórias: 11
Empates: 3
Derrotas: 2 
Gols pro: 33
Gols contra: 8
Saldo de gols: +25
Gols/jogo: 2.06
Gols sofridos/jogo: 0.5
Jogos em que marcou: 14
Jogos em que sofreu gol: 6 
Aproveitamento: 75.0%
Aproveitamento pontos: 36/48



### Criando tabelas com o número de gols e assistências

In [19]:
# Fazendo o merge dos dataframes jogos e gols
df = pd.merge(jogos, gols, on = 'id_match')
df.head()

Unnamed: 0,id_match,home_team,away_team,home_score,away_score,tournament,kick-off,stadium,attendance,notes,...,gols_fora,gols_sofridos_fora,marcou_gol,sofreu_gol,jogos_cumulativos,year,month,weekday,gols,assist
0,CA1,Flamengo,Boa Vista-RJ,1,2,Carioca - Round 1,2025-01-12 16:00:00,Estádio Batistão-SE,3793,Time B,...,0,0,Sim,Sim,1,2025,Jan,Sun,Carlinhos,
1,CA2,Madureira-RJ,Flamengo,1,1,Carioca - Round 2,2025-01-16 18:30:00,Estádio Governador Ernani Sátyro-PB,3614,Time B,...,1,1,Sim,Sim,2,2025,Jan,Thu,Thiaguinho,
2,CA3,Flamengo,Nova Iguaçu-RJ,1,2,Carioca - Round 3,2025-01-19 18:30:00,Estádio Governador Ernani Sátyro-PB,3614,Time B,...,0,0,Sim,Sim,4,2025,Jan,Sun,Wallace,Guilherme
3,CA4,Bangu,Flamengo,0,5,Carioca - Round 4,2025-01-22 19:00:00,Estádio Governador João Castelo-MA,29820,Time B,...,5,0,Sim,Não,5,2025,Jan,Wed,Felipe Teresa,Wallace
4,CA4,Bangu,Flamengo,0,5,Carioca - Round 4,2025-01-22 19:00:00,Estádio Governador João Castelo-MA,29820,Time B,...,5,0,Sim,Não,5,2025,Jan,Wed,Wallace,Felipe Teresa


In [20]:
# Quantidade de gols por jogador

df_gols_counts = pd.DataFrame(gols.gols.value_counts())
df_gols_counts = df_gols_counts.reset_index()
df_gols_counts.columns = ['Jogador', 'Gols'] 

# Quantidade de assistência por jogador

df_assist_counts = pd.DataFrame(gols.assist.value_counts())
df_assist_counts = df_assist_counts.reset_index()
df_assist_counts.columns = ['Jogador', 'Assistências'] 

new_df = pd.concat([df_assist_counts, df_gols_counts], axis=1)#.dropna(how='all')
print(new_df.to_markdown(index=False))

| Jogador       |   Assistências | Jogador           |   Gols |
|:--------------|---------------:|:------------------|-------:|
| Guilherme     |              3 | Bruno Henrique    |      5 |
| Pênalti       |              3 | Luiz Araújo       |      4 |
| Plata         |              3 | Wallace           |      4 |
| Wallace       |              2 | Carlinhos         |      3 |
| Luiz Araújo   |              2 | Juninho           |      2 |
| Arrascaeta    |              2 | Arrascaeta        |      2 |
| Felipe Teresa |              1 | Matheus Gonçalves |      2 |
| Daniel Sales  |              1 | Léo Ortiz         |      2 |
| Michael       |              1 | Guilherme         |      1 |
| Danilo        |              1 | Michael           |      1 |
| Wesley        |              1 | Gonzalo Plata     |      1 |
| Gerson        |              1 | Alcaraz           |      1 |
| nan           |            nan | Thiaguinho        |      1 |
| nan           |            nan | Felip

In [21]:
# Unificando as tabelas gols e assistências
uni_df = pd.merge(df_gols_counts, df_assist_counts, on = 'Jogador', how ="left").fillna(0).head(15)

print(uni_df.to_markdown(index=False))

| Jogador           |   Gols |   Assistências |
|:------------------|-------:|---------------:|
| Bruno Henrique    |      5 |              0 |
| Luiz Araújo       |      4 |              2 |
| Wallace           |      4 |              2 |
| Carlinhos         |      3 |              0 |
| Juninho           |      2 |              0 |
| Arrascaeta        |      2 |              2 |
| Matheus Gonçalves |      2 |              0 |
| Léo Ortiz         |      2 |              0 |
| Guilherme         |      1 |              3 |
| Michael           |      1 |              1 |
| Gonzalo Plata     |      1 |              0 |
| Alcaraz           |      1 |              0 |
| Thiaguinho        |      1 |              0 |
| Felipe Teresa     |      1 |              1 |
| Everton Cebolinha |      1 |              0 |


In [22]:
stats['year'] = stats['kick-off'].map(lambda x: datetime.strftime(x,"%Y"))
stats['month'] = stats['kick-off'].map(lambda x: datetime.strftime(x,"%b"))
stats['weekday'] = stats['kick-off'].map(lambda x: datetime.strftime(x,"%a"))

In [23]:
stats.to_csv('../data/processed/stats_FLA2025_processed.csv', index=False)

In [24]:
stats

Unnamed: 0,id_match,marcou_gol,sofreu_gol,kick-off,resultado,locale,jogos_cumulativos,gols_marcados,gols_sofridos,gols_marcados_acumulados,gols_sofridos_acumulados,diferença_gols_acumulados,year,month,weekday
0,CA1,Sim,Sim,2025-01-12 16:00:00,Derrota,Casa,1,1,2,1,2,-1,2025,Jan,Sun
1,CA2,Sim,Sim,2025-01-16 18:30:00,Empate,Fora,2,1,1,2,3,-1,2025,Jan,Thu
2,AM1,Não,Não,2025-01-19 17:00:00,Empate,Fora,3,0,0,2,3,-1,2025,Jan,Sun
3,CA3,Sim,Sim,2025-01-19 18:30:00,Derrota,Casa,4,1,2,3,5,-2,2025,Jan,Sun
4,CA4,Sim,Não,2025-01-22 19:00:00,Vitória,Fora,5,5,0,8,5,3,2025,Jan,Wed
5,CA5,Sim,Não,2025-01-25 16:30:00,Vitória,Fora,6,2,0,10,5,5,2025,Jan,Sat
6,CA6,Sim,Não,2025-01-30 21:30:00,Vitória,Casa,7,2,0,12,5,7,2025,Jan,Thu
7,SC1,Sim,Sim,2025-02-02 16:00:00,Vitória,Neutro,8,3,1,15,6,9,2025,Feb,Sun
8,CA8,Sim,Não,2025-02-05 19:00:00,Vitória,Fora,9,5,0,20,6,14,2025,Feb,Wed
9,CA9,Não,Não,2025-02-08 16:30:00,Empate,Fora,10,0,0,20,6,14,2025,Feb,Sat
