In [4]:
# Libraries
import pandas as pd
import requests
from bs4 import BeautifulSoup
from io import StringIO
from datetime import datetime

In [5]:
# Show columns and rows in terminal
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', None)
pd.set_option('display.width', None)

In [6]:
# Função para buscar os dataframes por título
def obter_dataframes_por_titulos(url, titulos_desejados):
    response = requests.get(url)
    soup = BeautifulSoup(response.content, 'html.parser')

    tabelas = soup.find_all('table', {'class': 'wikitable'})

    dataframes_encontrados = [
        (tabela.find_previous(['h2', 'h3']).text.strip().replace('[editar]', '').strip(), pd.read_html(StringIO(str(tabela)), flavor='bs4')[0])
        for tabela in tabelas
        for titulo_desejado in titulos_desejados
        if titulo_desejado.lower() in tabela.find_previous(['h2', 'h3']).text.lower()
    ]

    return dataframes_encontrados

# Função para criar o nome do arquivo com a data atual
def gerar_nome_arquivo():
    data_hoje = datetime.today().strftime('%Y-%m-%d')
    return f"tabelas_brasileirao2025_{data_hoje}.xlsx"

# Função para pegar os títulos
def obter_titulos_desejados():
    return [titulo.strip() for titulo in input("Digite os títulos que deseja buscar (separados por vírgula): ").split(',')]

# Função para salvar os dataframes no arquivo Excel
def salvar_tabelas_excel(dataframes, nome_arquivo):
    with pd.ExcelWriter(nome_arquivo) as writer:
        for i, (titulo, df) in enumerate(dataframes):
            print(f"\nTítulo: {titulo}\n{df.to_string(index=False)}")
            
            # Cria nome de aba válido
            aba = titulo[:31].replace('/', '-').replace('\\', '-')
            df.to_excel(writer, sheet_name=f"Aba {i + 1} - {aba}", index=False)
    
    print(f"\n Tabelas salvas com sucesso em '{nome_arquivo}'")

def main():
    titulos_desejados = obter_titulos_desejados()
    url = "https://pt.wikipedia.org/wiki/Campeonato_Brasileiro_de_Futebol_de_2025_-_S%C3%A9rie_A"

    dataframes = obter_dataframes_por_titulos(url, titulos_desejados)

    if dataframes:
        nome_arquivo = gerar_nome_arquivo()
        salvar_tabelas_excel(dataframes, nome_arquivo)
    else:
        print(f"Nenhum dataframe encontrado para os títulos: {', '.join(titulos_desejados)}.")

if __name__ == "__main__":
    main()


Título: Classificação
 Pos           Equipevde   Pts  J  V  E  D  GP  GC SG                    Classificação ou descenso
   1           Palmeiras    13  5  4  1  0   7   2 +5  Fase de grupos da Copa Libertadores de 2026
   2            Flamengo    11  5  3  2  0  11   2 +9  Fase de grupos da Copa Libertadores de 2026
   3          Fluminense 10[a]  5  3  1  1   6   4 +2  Fase de grupos da Copa Libertadores de 2026
   4 Red Bull Bragantino 10[a]  5  3  1  1   6   4 +2  Fase de grupos da Copa Libertadores de 2026
   5               Ceará     7  5  2  1  2   7   6 +1    Segunda fase da Copa Libertadores de 2026
   6         Corinthians  7[b]  5  2  1  2   6   6  0    Segunda fase da Copa Libertadores de 2026
   7            Cruzeiro  7[b]  5  2  1  2   6   6  0 Fase de grupos da Copa Sul-Americana de 2026
   8       Vasco da Gama     7  5  2  1  2   6   7 −1 Fase de grupos da Copa Sul-Americana de 2026
   9           Juventude     7  5  2  1  2   6  11 −5 Fase de grupos da Copa Sul-Ameri