In [13]:
import pandas as pd

In [46]:
# Função para baixar e tratar tabelas do FBref
def get_fbref_table(url):
    tables = pd.read_html(url, header=[0, 1])
    df = tables[0]
    # Junta MultiIndex em nomes simples
    df.columns = [' '.join(col).strip() for col in df.columns.values]
    # Remove espaços extras
    df.columns = df.columns.str.strip()
    return df

In [47]:
# 1. Estatísticas gerais (Gols Pró)
url_stats = "https://fbref.com/en/comps/9/2024-2025/stats/2024-2025-Premier-League-Stats"
df_gols = get_fbref_table(url_stats)

In [48]:
# Conferir colunas para saber o nome real
print(df_gols.columns.tolist())

['Unnamed: 0_level_0 Squad', 'Unnamed: 1_level_0 # Pl', 'Unnamed: 2_level_0 Age', 'Unnamed: 3_level_0 Poss', 'Playing Time MP', 'Playing Time Starts', 'Playing Time Min', 'Playing Time 90s', 'Performance Gls', 'Performance Ast', 'Performance G+A', 'Performance G-PK', 'Performance PK', 'Performance PKatt', 'Performance CrdY', 'Performance CrdR', 'Expected xG', 'Expected npxG', 'Expected xAG', 'Expected npxG+xAG', 'Progression PrgC', 'Progression PrgP', 'Per 90 Minutes Gls', 'Per 90 Minutes Ast', 'Per 90 Minutes G+A', 'Per 90 Minutes G-PK', 'Per 90 Minutes G+A-PK', 'Per 90 Minutes xG', 'Per 90 Minutes xAG', 'Per 90 Minutes xG+xAG', 'Per 90 Minutes npxG', 'Per 90 Minutes npxG+xAG']


In [52]:
# Renomeia colunas
df_gols = df_gols.rename(columns={
    'Unnamed: 0_level_0 Squad': 'Time',
    'Performance Gls': 'Gols Pró'
})

In [53]:
# Seleciona apenas colunas de interesse
df_gols = df_gols[['Time', 'Gols Pró']]

In [54]:
print(df_gols.columns.tolist())

['Time', 'Gols Pró']


In [None]:
#ESTATISTICA DE CHUTES

In [55]:
# 2. Estatísticas de chutes
url_shots = "https://fbref.com/en/comps/9/2024-2025/shooting/2024-2025-Premier-League-Stats"
df_shots = get_fbref_table(url_shots)

In [56]:
# Conferir colunas para saber o nome real
print(df_shots.columns.tolist())

['Unnamed: 0_level_0 Squad', 'Unnamed: 1_level_0 # Pl', 'Unnamed: 2_level_0 90s', 'Standard Gls', 'Standard Sh', 'Standard SoT', 'Standard SoT%', 'Standard Sh/90', 'Standard SoT/90', 'Standard G/Sh', 'Standard G/SoT', 'Standard Dist', 'Standard FK', 'Standard PK', 'Standard PKatt', 'Expected xG', 'Expected npxG', 'Expected npxG/Sh', 'Expected G-xG', 'Expected np:G-xG']


In [57]:
#Renomear colunas
df_shots = df_shots.rename(columns={
    'Unnamed: 0_level_0 Squad': 'Time',
    'Standard SoT': 'Chutes no Alvo'
})

df_shots = df_shots[['Time', 'Chutes no Alvo']]


In [58]:
# Conferir colunas para saber o nome real
print(df_shots.columns.tolist())

['Time', 'Chutes no Alvo']


In [59]:
# Seleciona apenas colunas de interesse
df_shots = df_shots[['Time', 'Chutes no Alvo']]

In [60]:
# 3. Merge das tabelas
df_final = pd.merge(df_gols, df_shots, on='Time', how='inner')

In [61]:
# Exibe resultado
print(df_final)

               Time  Gols Pró  Chutes no Alvo
0           Arsenal        67             178
1       Aston Villa        56             159
2       Bournemouth        57             192
3         Brentford        65             173
4          Brighton        64             183
5           Chelsea        61             203
6    Crystal Palace        49             175
7           Everton        39             139
8            Fulham        53             167
9      Ipswich Town        35             120
10   Leicester City        33             105
11        Liverpool        85             215
12  Manchester City        71             208
13   Manchester Utd        42             168
14    Newcastle Utd        66             163
15  Nott'ham Forest        57             162
16      Southampton        25             106
17        Tottenham        61             177
18         West Ham        43             137
19           Wolves        53             155


In [None]:
#VISUALIZAR NO NAVEGADOR WEB
# 1. Adiciona estilo na tabela
styled_html = df_final.style \
    .set_table_attributes('border="1" class="dataframe"') \
    .set_caption("Premier League 2024/2025") \
    .set_properties(**{
        'border': '1px solid black',
        'text-align': 'center',
        'font-family': 'Arial',
        'font-size': '14px'
    }) \
    .to_html()  # <-- aqui trocamos render() por to_html()

# 2. Salva em HTML com UTF-8-SIG para acentos corretos
with open('premier_league_2024_2025.html', 'w', encoding='utf-8-sig') as f:
    f.write(styled_html)

print("Arquivo HTML salvo com sucesso! Abra no navegador para visualizar.")


Arquivo HTML salvo com sucesso! Abra no navegador para visualizar.


In [69]:


url_classificacao = "https://fbref.com/en/comps/9/Premier-League-Stats"
tabelas_class = pd.read_html(url_classificacao)

# Mostra quantas tabelas existem e os nomes das colunas
for i, tabela in enumerate(tabelas_class):
    print(f"\nTabela {i}:\n", tabela.columns.tolist())



Tabela 0:
 ['Rk', 'Squad', 'MP', 'W', 'D', 'L', 'GF', 'GA', 'GD', 'Pts', 'Pts/MP', 'xG', 'xGA', 'xGD', 'xGD/90', 'Attendance', 'Top Team Scorer', 'Goalkeeper', 'Notes']

Tabela 1:
 [('Unnamed: 0_level_0', 'Rk'), ('Unnamed: 1_level_0', 'Squad'), ('Home', 'MP'), ('Home', 'W'), ('Home', 'D'), ('Home', 'L'), ('Home', 'GF'), ('Home', 'GA'), ('Home', 'GD'), ('Home', 'Pts'), ('Home', 'Pts/MP'), ('Home', 'xG'), ('Home', 'xGA'), ('Home', 'xGD'), ('Home', 'xGD/90'), ('Away', 'MP'), ('Away', 'W'), ('Away', 'D'), ('Away', 'L'), ('Away', 'GF'), ('Away', 'GA'), ('Away', 'GD'), ('Away', 'Pts'), ('Away', 'Pts/MP'), ('Away', 'xG'), ('Away', 'xGA'), ('Away', 'xGD'), ('Away', 'xGD/90')]
