In [1]:
import requests
from bs4 import BeautifulSoup

# Função que faz o scraping para um ano específico
def raspar_dados_ano(ano):
    url = f"http://vitibrasil.cnpuv.embrapa.br/index.php?opcao=opt_04&ano={ano}"
    resposta = requests.get(url)

    if resposta.status_code == 200:
        soup = BeautifulSoup(resposta.text, 'html.parser')

        # Encontra a tabela (pode ajustar se tiver mais de uma tabela na página)
        tabela = soup.find('table', {'class': 'tb_base tb_dados'})

        if tabela:
            linhas = tabela.find_all('tr')
            dados = []
            categoria_atual = None
            
            for linha in linhas:
                colunas = linha.find_all('td')
                
                if not colunas:
                    continue  # Pula linhas vazias
                
                primeira_coluna = colunas[0]
                
                if 'tb_item' in primeira_coluna.get('class', []):
                    categoria_atual = primeira_coluna.text.strip()
                    dados.append({
                        'Categoria': categoria_atual,
                        'Produto': '-',
                        'Quantidade': [col.text.strip() for col in colunas[1:]]
                    })
                elif 'tb_subitem' in primeira_coluna.get('class', []):
                    produto = primeira_coluna.text.strip()
                    dados.append({
                        'Categoria': categoria_atual,
                        'Produto': produto,
                        'Quantidade': [col.text.strip() for col in colunas[1:]]
                    })
            
            # Exibir os dados organizados
            for d in dados:
                print(f"{d['Categoria']} -> {d['Produto']} | {d['Quantidade']}")

            return dados
        else:
            print(f"Nenhuma tabela encontrada para o ano {ano}")
            return None
    else:
        print(f"Erro ao acessar o ano {ano}: {resposta.status_code}")
        return None

# Exemplo: pegar dados de 2023
dados = raspar_dados_ano(2023)

# Exibir resultado
for linha in dados:
    print(linha)


VINHO DE MESA -> - | ['187.016.848']
VINHO DE MESA -> Tinto | ['165.097.539']
VINHO DE MESA -> Rosado | ['2.520.748']
VINHO DE MESA -> Branco | ['19.398.561']
VINHO FINO DE MESA -> - | ['18.589.310']
VINHO FINO DE MESA -> Tinto | ['12.450.606']
VINHO FINO DE MESA -> Rosado | ['1.214.583']
VINHO FINO DE MESA -> Branco | ['4.924.121']
VINHO FRIZANTE -> - | ['2.843.600']
VINHO ORGÂNICO -> - | ['9.123']
VINHO ESPECIAL -> - | ['-']
VINHO ESPECIAL -> Tinto | ['-']
VINHO ESPECIAL -> Rosado | ['-']
VINHO ESPECIAL -> Branco | ['-']
ESPUMANTES -> - | ['29.381.635']
ESPUMANTES -> Espumante  Moscatel | ['9.771.698']
ESPUMANTES -> Espumante | ['19.609.379']
ESPUMANTES -> Espumante Orgânico | ['558']
SUCO DE UVAS -> - | ['166.708.720']
SUCO DE UVAS -> Suco Natural Integral | ['129.419.407']
SUCO DE UVAS -> Suco Adoçado | ['128.599']
SUCO DE UVAS -> Suco Reprocessado/reconstituido | ['34.402.925']
SUCO DE UVAS -> Suco Orgânico | ['932.154']
SUCO DE UVAS -> Outros sucos de uvas | ['1.825.635']
SUCO DE