# Últimas temporadas do Arsenal (17/18 e 18/19)

* [Introdução](#introdução)
* [Setup + Limpeza de dados](#setup-limpeza)
* [Plotagem de dados + análises](#plotagem-análises)
* [Conclusão](#conclusão)

<a id="introdução"></a>
## Introdução

Esse notebook visa fazer algumas observações sobre o desempenho do Arsenal em suas últimas temporadas completas: 2017/18 e 2018/19. Escolhi analisar tais temporadas pois em ambas, o clube não só falhou em conseguir uma vaga na Liga dos Campeões da UEFA, como também não conquistou nenhum título, e tal desempenho aquém do esperado é motivo de insatisfação para os torcedores e também para a diretoria, que promoveu duas trocas de técnico desde o fim da temporada 2017/18.

Esse é o primeiro notebook que escrevo, então qualquer tipo de sugestão que possa tornar os códigos ou a metodologia mais eficientes é bem vinda!

-----

The purpose of this notebook is to make some notes about Arsenal's performance in its last full seasons: 2017/18 and 2018/19. I chose these seasons because in both of them, the Gunners not only failed to get a place in the UEFA Champions League, but also didn’t win any title, and these poor performances keep disappointing the supporters and the board, resulting in two changes of the team's head coach since the end of the 2017/18 season.

This is my first notebook, so reviews or suggestions for improvement are welcomed!

<a id="setup-limpeza"></a>
## Setup + Limpeza de dados

In [None]:
import pandas as pd
pd.plotting.register_matplotlib_converters()
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns
sns.set(style = 'whitegrid')

In [None]:
import os
for dirname, _, filenames in os.walk('../input/statbunker-football-stats/'):
    for filename in filenames:
        print(os.path.join(dirname, filename))

Há um número grande de arquivos .csv no dataset usado (["Statbunker Football Stats"](https://www.kaggle.com/cclayford/statbunker-football-stats)), alguns dos quais contêm dados sobre tópicos que não serão abordados. Selecionei os arquivos que contemplariam minha análise e agrupei-os primeiramente em dataframes reunindo os dados de ambas as temporadas.

---

There is a lot of .csv files in the dataset I chose (["Statbunker Football Stats"](https://www.kaggle.com/cclayford/statbunker-football-stats)), and some of them are about topics that wouldn’t help me in my notes. I selected the files that would help my analysis and grouped them into dataframes combining data from both seasons.


In [None]:
offense = pd.concat(map(pd.read_csv, ['../input/statbunker-football-stats/Team Offense 2017-18.csv',
                                                 '../input/statbunker-football-stats/Team Offense 2018-19.csv'])).reset_index()

In [None]:
defense = pd.concat(map(pd.read_csv, ['../input/statbunker-football-stats/Team Defense 2017-18.csv',
                                                  '../input/statbunker-football-stats/Team Defense 2018-19.csv'])).reset_index()

In [None]:
tables = pd.concat(map(pd.read_csv, ['../input/statbunker-football-stats/Tables 2017-18.csv',
                                                 '../input/statbunker-football-stats/Tables 2018-19.csv'])).reset_index()

Selecionei então somente as linhas contendo informações sobre o Arsenal, visto que os arquivos do dataset escolhido contêm informações sobre equipes de diversas ligas europeias. Também eliminei dos dataframes algumas colunas que não seriam úteis para a análise.

---

Then, I selected only the rows containing information about Arsenal, since the files of the dataset contain information about many teams from different European leagues. I also dropped some columns that wouldn't be useful for the analysis.

In [None]:
arsenal_tables = tables.loc[(tables.Team == 'Arsenal')
                            & (tables['Table Type'] == 'League Table')].set_index('Team')
arsenal_tables.drop(['index', 'KEY', 'Table Type'], axis = 1, inplace = True)
arsenal_tables

In [None]:
arsenal_offense = offense.loc[offense.Team == 'Arsenal'].set_index('Team')
arsenal_offense.drop(['index', 'KEY', 'GF Pld'], axis = 1, inplace = True)
arsenal_offense

In [None]:
arsenal_defense = defense.loc[defense.Team == 'Arsenal'].set_index('Team')
arsenal_defense.drop(['index', 'KEY', 'GA Pld'], axis = 1, inplace = True)
arsenal_defense

Daí, uni os dataframes contendo informações sobre o clube em um único, pra que pudesse usar simultaneamente alguns dados antes contidos em dataframes distintos.

---

From that, I combined the dataframes containing the club's stats in a single one, so I could, simultaneoulsy, use data previously contained in different dataframes.

In [None]:
arsenal_stats = pd.concat([arsenal_tables, arsenal_offense, arsenal_defense], axis = 1)
arsenal_stats = arsenal_stats.loc[:,~arsenal_stats.columns.duplicated()]

In [None]:
pd.set_option('display.max_columns', None)
arsenal_stats

<a id="plotagem-análises"></a>
## Plotagem de dados + análises

As primeiras análises gráficas que fiz foram acerca do desempenho do clube nos jogos em casa. Plotei o nº de gols pró e contra nas partidas disputadas no Emirates Stadium nas duas últimas temporadas completas.

---

First of all, I analyzed Arsenal's performance at home games by plotting the  GF and GA stats in all league matches played at the Emirates in the last two full seasons.

In [None]:
g_home = sns.catplot(x = 'GF Home', y = 'GA Home', col = 'Season',
                capsize = .2, palette = 'Reds', height = 6, aspect = .75,
                kind = 'point', data = arsenal_stats)
g_home.despine(left = True);

A temporada 2017/18 do Arsenal em casa foi mais abundante em gols do que a seguinte, tanto em relação aos marcados quanto aos sofridos. 

Ao compararmos o saldo de gols em casa dos Gunners em ambas as temporadas, o saldo que era de 34 gols na 2017/18, passou para 26 na 2018/19. É válido ressaltar que nas duas temporadas, o saldo de gols do Arsenal em casa foi superior ao saldo de gols no total de jogos (23 e 22, respectivamente, como pôde ser visto no dataframe "arsenal_stats").

De forma análoga, plotei também o nº de gols pró e contra nos jogos que a equipe disputou como visitante na Premier League, nas temporadas analisadas:

---

Arsenal's 2017/18 home season was more abundant in gols than its next, both in terms of GF and GA.

When comparing the Gunners' goal difference at home games in both seasons, it dropped from 34 goals in 2017/18 to 26 in 2018/19. In both seasons, Arsenal's GD at home was higher than the total GD (23 and 22, respectively, as seen in the "arsenal_stats" dataframe).

I also plotted the GF and GA stats in all away matches played in the last two full seasons:

In [None]:
g_away = sns.catplot(x = 'GF Away', y = 'GA Away', col = 'Season',
                capsize = .2, palette = 'Reds', height = 6, aspect = .75,
                kind = 'point', data = arsenal_stats)
g_away.despine(left = True);

Na temporada 2017/18, o número de gols feitos fora de casa pela equipe foi constrangedor, beirando a marca de 1 gol a cada dois jogos. A equipe melhorou consideravelmente essa marca na temporada seguinte, passando de 20 para 31 gols marcados como visitante.

O número de gols sofridos fora de casa pelo Arsenal também teve um incremento, de 31 na temporada 2017/18 para 35 na 2018/19, mas vê-se que foi um acréscimo pequeno em comparação ao ocorrido nos gols marcados como visitante, e isso se confirma na diminuição do saldo negativo de gols entre as duas temporadas nos jogos fora de casa, que passou de -11 para -4.

Após comparar os gols feitos e sofridos pelos Gunners tendo como foco os jogos como mandante e visitante nas duas temporadas, resolvi plotar os dados a partir de outra metodologia, focando dessa vez nos diferentes contextos nos quais o Arsenal marcou e sofreu gols. Usei a função pandas.melt() pra remodelar os dataframes, de forma a obter dois dataframes contendo, respectivamente, os numeros totais de gols pró e contra, como também esses mesmos números desmembrados em algumas situações de jogo.

---
In the 2017/18 season, the away GF numbers were embarrassing, with a 0.53 goal per game ratio. The team improved this stat considerably in the following season, going from 20 to 31 away GF.

Arsenal's away GA has also increased, from 31 in the 2017/18 season to 35 in 2018/19, but that was a small increase compared to the away GF increase, and this is confirmed by the improvement in the negative GD in away games in the two seasons, which went from -11 to -4.

After comparing Gunners' GF and GA approaching the team's home and away games, I changed the point of view, focusing this time on the different contexts in which Arsenal scored and conceded goals. I used the pandas.melt() function to reshape the dataframes, in order to obtain two dataframes containing, respectively, the total of goals for and against, as well as those same numbers broken down in some game situations.

In [None]:
gf_melt = pd.melt(arsenal_offense,
           id_vars = ['League', 'GF Per Match', 'Season'],
           var_name = 'GF Stat')

In [None]:
g_gf = sns.catplot(x = 'GF Stat', y = 'value', col = 'Season',
                   data = gf_melt, kind = 'bar', palette = 'Reds')

g_gf.set_xticklabels(rotation = -85);

Comparando os números das duas temporadas analisadas no que diz respeito aos gols marcados pelo Arsenal, percebe-se que a diferença maior se dá entre os gols marcados como mandante e visitante. Enquanto na temporada 2017/18 a equipe marcou mais que o dobro de gols em casa do que fora de casa, a proporção se tornou mais equilibrada na seguinte: a diminuição dos gols feitos como mandante foi compensada por um aumento dos gols marcados como visitante.

No mais, é possivel notar certos padrões nos gols marcados pelo Arsenal: predominantemente, os Gunners fizeram gols no 2º tempo (porém, dentre estes, menos da metade nos 10 minutos finais das partidas), e a maior parte das partidas das quais a equipe marcou, em ambas temporadas, ocorreu no Emirates.

---
Comparing the GF situations of both seasons, it's clear that the biggest difference happened between the goals scored in home and away games. While in the 2017/18 season the team scored more than twice the goals at home than when visiting, the proportion became more balanced in the following season: the decrease in goals scored at the Emirates was compensated by an increase in goals scored as a visitor.

Beyond that, it's possible to notice certain similarities in the goals scored by Arsenal: predominantly, the Gunners scored goals in the 2nd half (however, of these ones, less than half were scored in the final 10 minutes of matches), and most of the matches that the team scored, in both seasons, were played at the Emirates.


In [None]:
ga_melt = pd.melt(arsenal_defense,
           id_vars = ['League', 'GA Per Match', 'Season'],
           var_name = 'GA Stat')

In [None]:
g_ga = sns.catplot(x = 'GA Stat', y = 'value', col = 'Season',
                   data = ga_melt, kind = 'bar', palette = 'Reds')

g_ga.set_xticklabels(rotation = -85);

Em relação aos gols contra, nota-se que em ambas temporadas analisadas, a equipe sofreu mais gols como visitante, havendo uma acentuação desse comportamento ao longo do tempo. O número de gols sofridos em casa diminuiu da temporada 2017/18 para a temporada 2018/19; não se pode dizer o mesmo, porém, em relação ao número de gols sofridos como visitante, que aumentou na temporada 2018/19 em relação à 2017/18, a ponto de mais de 2/3 dos gols sofridos na última temporada completa dos Gunners terem acontecido fora de casa.

Olhando pela perspectiva de gols sofridos no 1º e no 2º tempos, houve uma inversão: a equipe sofria mais gols na segunda etapa na temporada 2017/18, ao passo que na temporada seguinte, passou a sofrer mais gols no 1º tempo.

Algumas observações pertinentes:
* O nº de gols sofridos pelo Arsenal nos primeiros 15 minutos das partidas foi menor na temporada 2018/19 que na 2017/18
* Houve menos partidas na temporada 2018/19 que na 2017/18 nas quais o Arsenal sofreu gols, tanto como mandante quanto como visitante

---

Analyzing the GA stats, it's clear that in both seasons, the team conceded more goals as a visitor. The home GA stats decreased from 2017/18 to 2018/19; the same can't be said, however, about the away GA stats, which increased in the 2018/19 season compared to 2017/18, to the point of more than 2/3 of the goals conceded in the last full season of the Gunners have happened as a visitor.

Looking from the perspective of goals conceded in each half, there was an inversion: Gunners have conceded more goals in the second half in the 2017/18 season, while in the following season, they conceded more goals in the 1st half.

Some optimistic notes:
* The number of goals conceded by Arsenal in the first 15 minutes of matches was lower in 2018/19 than in 2017/18
* There were fewer matches in the 2018/19 season than in 2017/18 in which Arsenal conceded goals, both as home team and as a visitor

<a id="conclusão"></a>
## Conclusão

Ao analisar as temporadas 2017/18 e 2018/19 do Arsenal, vê-se que a equipe apresentou resultados bem semelhantes em vários dados, como nos gols a favor, contra, e no saldo de gols. Tendo uma vitória e um empate a mais em 18/19 do que em 17/18, houve o ganho de uma posição na tabela em relação à temporada anterior, o que não foi suficiente pra que a equipe se classificasse para a UCL. 

Ainda que tenha diminuído o nº de jogos nos quais os Gunners sofreram gols, a equipe seguiu com o mesmo percentual de gols sofridos por partida, o que demonstra que o setor defensivo persiste apresentando alguma fragilidade. Outro fato intrigante é a diminuição do nº de gols sofridos e marcados em casa na temporada 2018/19 em relação à anterior, o que demonstra uma dificuldade da equipe para equilibrar uma proposta de jogo ofensiva com certa segurança defensiva.

Tendo feito mais uma troca de técnico durante a atual temporada, espera que o Arsenal passe a apresentar um padrão de jogo mais constante e encontre o equilibrio que tanto precisa pra voltar ao patamar ao qual seus torcedores estão acostumados.

---

It's clear that the team presented very similar results in several stats, such as GF, GA, and GD. The gunners managed to increase both their wins and draws by one from 2017/18 to 2018/19. It took them to one position higher in the last season, but wasn't sufficient to qualify them for the UCL.

Although Arsenal conceded goals in fewer games in 2018/19 than in 2017/18, the GA Per Match stat remained the same, which demonstrates that the defensive sector persists showing some weaknesses. Another intriguing fact is the decrease in the GF and GA stats at the Emirates in 2018/19 comparing to the previous season, which shows the team's difficulty in balancing an offensive game proposal with some defensive approach.

As Arsenal has changed its head coach in the current season, it's expected that the team will demonstrate better game standards and finally find the balance needed to return to the level its supporters are used to.