In [33]:
import pandas as pd
import requests
from bs4 import BeautifulSoup

def maiores_bilheterias_2024():
    url = 'https://pt.wikipedia.org/wiki/2024_no_cinema'
    
    resposta = requests.get(url)
    resposta.encoding = 'utf-8'
    
    soup = BeautifulSoup(resposta.text, 'html.parser')
    
    tabelas = soup.find_all('table', class_='wikitable sortable')
    
    tabela_bilheteria = None
    
    for i, tabela in enumerate(tabelas):
        legenda = tabela.find('caption')
        if legenda and 'Filmes de maior bilheteria de 2024' in legenda.text:
            tabela_bilheteria = tabela
            break
    
    if not tabela_bilheteria:
        raise Exception("Tabela de bilheteria não encontrada")

    cabecalhos = []
    primeira_linha = tabela_bilheteria.find('tr')
    for th in primeira_linha.find_all('th'):
        cabecalhos.append(th.text.strip())

    dados = []
    linhas = tabela_bilheteria.find_all('tr')[1:] 

    for i, linha in enumerate(linhas, start=1):     
        cols = linha.find_all('td')
        if len(cols) >= 2:
            titulo = cols[0].text.strip()
            produtor = cols[1].text.strip() if len(cols) > 2 else produtor
            valor_bilheteria = cols[-1].text.strip()
            
            titulo = titulo.replace('\n', ' ').strip()
            if produtor:
                produtor = produtor.replace('\n', ' ').strip()
            
            dados.append([i, titulo, produtor, valor_bilheteria])
   
    if len(cabecalhos) < 4:
        cabecalhos = ['Ranque', 'Título', 'Produtor', 'Bilheteria global']
    df = pd.DataFrame(dados, columns=cabecalhos)
    
    df.to_csv('bilheteria_2024.csv', index=False, encoding='utf-8-sig')
    print("Arquivo CSV salvo com sucesso!")
    
    return df

try:
    df = maiores_bilheterias_2024()

except Exception as e:
    print(f"Erro ao fazer scraping: {e}")


Arquivo CSV salvo com sucesso!
