In [14]:
# Célula 1: Carregar e Filtrar Brasileirão 2024 (Novo Início)

import pandas as pd

print("Iniciando do Zero: Carregar e Filtrar Brasileirão 2024")

# URL do CSV com dados históricos (incluindo 2024)
url_csv = 'https://www.football-data.co.uk/new/BRA.csv'
df_br_hist = None
df_br24 = None

try:
    # Carrega o CSV, tentando a codificação correta
    df_br_hist = pd.read_csv(url_csv, encoding='ISO-8859-1')
    print(f"Dados históricos carregados ({df_br_hist.shape[0]} linhas).")

    # Copia para um DataFrame temporário
    df_temp = df_br_hist.copy()

    # Converte a coluna 'Date' para datetime (formato dd/mm/yy ou dd/mm/yyyy)
    df_temp['Date'] = pd.to_datetime(df_temp['Date'], dayfirst=True, errors='coerce')

    # Remove linhas com data inválida (se houver)
    df_temp.dropna(subset=['Date'], inplace=True)

    # Filtra para o ano 2024
    df_br24 = df_temp[df_temp['Date'].dt.year == 2024].copy()

    if not df_br24.empty:
        print(f"Encontrados {df_br24.shape[0]} jogos para 2024.")
        print("\n5 Primeiras Linhas de 2024:")
        display(df_br24.head())
    else:
        print("Nenhum jogo encontrado para 2024. Verifique os dados no CSV.")

except Exception as e:
    print(f"Erro ao carregar ou filtrar: {e}")

Iniciando do Zero: Carregar e Filtrar Brasileirão 2024
Dados históricos carregados (5039 linhas).
Encontrados 380 jogos para 2024.

5 Primeiras Linhas de 2024:


Unnamed: 0,ï»¿Country,League,Season,Date,Time,Home,Away,HG,AG,Res,...,PSCA,MaxCH,MaxCD,MaxCA,AvgCH,AvgCD,AvgCA,BFECH,BFECD,BFECA
4560,Brazil,Serie A,2024,2024-04-13,22:30,Criciuma,Juventude,1.0,1.0,D,...,4.13,2.21,3.21,4.2,2.13,3.0,3.89,,,
4561,Brazil,Serie A,2024,2024-04-13,22:30,Internacional,Bahia,2.0,1.0,H,...,4.58,1.93,3.57,4.62,1.87,3.38,4.31,,,
4562,Brazil,Serie A,2024,2024-04-14,01:00,Fluminense,Bragantino,2.0,2.0,D,...,5.31,1.91,3.65,5.31,1.78,3.48,4.79,,,
4563,Brazil,Serie A,2024,2024-04-14,01:00,Sao Paulo,Fortaleza,1.0,2.0,A,...,4.9,2.0,3.42,5.09,1.88,3.29,4.47,,,
4564,Brazil,Serie A,2024,2024-04-14,20:00,Athletico-PR,Cuiaba,4.0,0.0,H,...,7.33,1.62,3.85,7.33,1.57,3.69,6.61,,,


In [15]:
# Célula 2: Limpar e Salvar para BI


if df_br24 is not None and not df_br24.empty:
    print("\nLimpando e Salvando dados de 2024...")
    df_final = df_br24.copy()

    # 1. Renomear coluna 'ï»¿Country' se existir
    if 'ï»¿Country' in df_final.columns:
        df_final = df_final.rename(columns={'ï»¿Country': 'Country'})

    # 2. Garantir Gols (HG, AG) como inteiros
    df_final['HG'] = pd.to_numeric(df_final['HG'], errors='coerce').fillna(0).astype(int)
    df_final['AG'] = pd.to_numeric(df_final['AG'], errors='coerce').fillna(0).astype(int)

    # 3. Selecionar apenas as colunas ESSENCIAIS para a análise de Gols/Resultados
    #    Isso remove as colunas de Odds, que podem atrapalhar no BI se não forem usadas.
    cols_essenciais = ['Country', 'League', 'Season', 'Date', 'Time', 'Home', 'Away', 'HG', 'AG', 'Res']
    cols_manter = [col for col in cols_essenciais if col in df_final.columns]
    df_final = df_final[cols_manter]

    print("Dados limpos e colunas selecionadas.")
    display(df_final.head())

    # 4. Salvar em um novo arquivo CSV
    try:
        nome_arquivo = 'brasileirao_2024_para_bi.csv'
        df_final.to_csv(nome_arquivo, index=False, encoding='utf-8') # Salva em UTF-8, bom para BI
        print(f"\nDados salvos com sucesso no arquivo: '{nome_arquivo}'")
        print("Este arquivo está pronto para ser importado no Power BI ou Tableau!")
    except Exception as e:
        print(f"\nErro ao salvar o arquivo: {e}")

else:
    print("DataFrame df_br24 não está pronto. Rode a Célula 1.")


Limpando e Salvando dados de 2024...
Dados limpos e colunas selecionadas.


Unnamed: 0,Country,League,Season,Date,Time,Home,Away,HG,AG,Res
4560,Brazil,Serie A,2024,2024-04-13,22:30,Criciuma,Juventude,1,1,D
4561,Brazil,Serie A,2024,2024-04-13,22:30,Internacional,Bahia,2,1,H
4562,Brazil,Serie A,2024,2024-04-14,01:00,Fluminense,Bragantino,2,2,D
4563,Brazil,Serie A,2024,2024-04-14,01:00,Sao Paulo,Fortaleza,1,2,A
4564,Brazil,Serie A,2024,2024-04-14,20:00,Athletico-PR,Cuiaba,4,0,H



Dados salvos com sucesso no arquivo: 'brasileirao_2024_para_bi.csv'
Este arquivo está pronto para ser importado no Power BI ou Tableau!
