## Estátistica no Futebol
### A duração de um técnico, no futebol, influencia na posição final do campeonato?

#### Grupo:
_Alexandre Ohtten, Bruno Pinheiro, Luciane, Márcio Siena, Thiago, Vinicius Melo, Vivian_

#### Descrição do problema

Uma posição _volátil_, no futebol (tanto no Brasil quanto fora), é a posição de técnico. Uma prática comum é substituir o treinador após alguns resultados negativos. Naturalmente, um time que não troca o técnico não é garantia de sucesso no campeonato. Assim, surge a dúvida: será que, **em geral**, times com técnicos mais longevos ficam em uma posição melhor na tabela, no fim do campeonato?

## Import de dados do JSON do campeonato
- Cada arquivo .json do campeonato deve estar contido na pasta `./input_files`

In [None]:
# Indique aqui o caminho do seu arquivo de dados, e o ano do campeonato
input_file_path = "./input_files/brasileirao-2019.json"
year_championship = 2019

In [None]:
import pandas as pd
input_json = pd.read_json(input_file_path)

### Apenas verifica se o arquivo foi importado corretamente

In [None]:
(input_json)

## Obtendo a Tabela Final do Campeonato

In [None]:
from utils import championship_parser as cp
from utils import coach_handler as ch

tabela_brasileirao = cp.championship_parser(input_json)

In [None]:
print(tabela_brasileirao)

### Posição Final do Campeonato

In [None]:
# print("Clube - Pts - Vit - SG - GP")
table = [(i + 1, team["name"], team["points"], team["wins"], team["goals_difference"], team["goals"]) for i, team in enumerate(tabela_brasileirao)]

print(f"-------------Tabela Brasileirão {year_championship}-------------")
print("-------------------------------------------------")
print("| Pos |      Clube      | Pts | Vit |  SG |  GP |")
print("-------------------------------------------------")
for row in table:
    print("| {:^3} | {:^15} | {:3} | {:3} | {:3} | {:3} |".format(*row))



## Criando Gráficos

In [None]:
# Preparando as séries de dados

clubs = [club["name"] for club in tabela_brasileirao]
scores = [club["points"] for club in tabela_brasileirao]
coaches = [ch.lasting_coach(club) for club in tabela_brasileirao]
matches = [coach[1] for coach in coaches]
coach = [coach[0] for coach in coaches]

In [None]:
# importando biblioteca usada para criação dos gráficos
import matplotlib.pyplot as plt

In [None]:
# Gráfico: pontuação dos times, com quantidade de técnicos no rótudo do time.
plt.figure(figsize=(10, 6))
bars = plt.bar(clubs, scores)

# Adicionando etiqueta de nº de tecnicos
for bar, club in zip(bars, tabela_brasileirao):
    plt.text(bar.get_x(), bar.get_height() + 1, f"{len(club["coachs"])} Tec.")

plt.xlabel("Times")
plt.ylabel("Pontos")
plt.title(f"Brasileirão {year_championship} - Classificação dos Times")
plt.xticks(rotation=45, ha="right")
plt.tight_layout()

plt.show()

In [None]:
# Gráfico: Número de rodadas do técnico por time, em ordem crescente de classificação no campeonato
plt.figure(figsize=(10, 6))
bars = plt.bar(clubs, matches)

plt.xlabel("Times")
plt.ylabel("Número de Rodadas")
plt.title(f"Brasileirão {year_championship} - Rodadas Técnico")
plt.xticks(rotation=45, ha="right")
plt.tight_layout()

plt.show()

In [None]:
# Gráfico de Dispersão - Número de Rodads do Técnico mais longevo por Pontuação Total do Time

plt.figure(figsize=(8, 6))
plt.title(f"Campeonato Brasileiro {year_championship} - Longevidade X Pontuação")

# plt.scatter(x,y)
plt.scatter(scores, matches, scores, alpha=0.5, c=scores)
plt.xlabel("Pontuação Obtida (Time)")
plt.ylabel("Rodadas no comando")
plt.xscale("linear")
plt.show()

In [None]:
# Gráfico de Dispersão: Pontuação total obtida pelo técnico X Número de rodadas no comando do time
list_coachs = ch.coachs_list(tabela_brasileirao)
x = [c["matches"] for c in list_coachs]
y = [c["points_obtained"] for c in list_coachs]

plt.figure(figsize=(8, 6))
plt.title(f"Campeonato Brasileiro {year_championship} - Pontuação X Partidas no Comando")

plt.scatter(x, y, alpha=0.5, c=y)
plt.xlabel("Partidas no Comando do Time")
plt.ylabel("Pontuação Obtida no Time")
plt.xscale("linear")
plt.show()