In [49]:
# Se o site estiver instável, usar dados locais (CSV/JSON pré-baixados).
import requests
from bs4 import BeautifulSoup
import pandas as pd

In [57]:
def scrape_embrapa(ano: int, opcao: str, subopcao: str = None):
    url = f"http://vitibrasil.cnpuv.embrapa.br/index.php?ano={ano}&opcao={opcao}"
    if subopcao:
        url += f"&subopcao={subopcao}"
    
    try:
        response = requests.get(url, timeout=10)
        soup = BeautifulSoup(response.text, 'html.parser')
        tabela = soup.find("table", {"class": "tb_base tb_dados"}) 
        linhas = tabela.find_all("tr")

        # Pegar cabeçalhos da primeira linha
        cabecalhos_linha = linhas[0].find_all("th")
        cabecalhos = [th.get_text(strip=True) for th in cabecalhos_linha]

        # Verificar número de colunas pelos cabeçalhos
        num_colunas = len(cabecalhos)

        # Criar dicionário apropriado baseado no número de colunas
        resultado = {}

        # Itera sobre as linhas para extrair os dados
        for linha in linhas[1:]:
            celulas = linha.find_all("td")
            if celulas:  # Ignora linhas sem células
                valores = [td.get_text(strip=True) for td in celulas]
                
                # Trata o caso de 2 colunas (Produto/Quantidade)
                if num_colunas == 2:
                    # Usa a primeira coluna como chave e a segunda como valor
                    if len(valores) >= 2:
                        resultado[valores[0]] = valores[1]
                
                # Trata o caso de 3 colunas (País/Quantidade/Valor)
                elif num_colunas == 3:
                    # Usa a primeira coluna como chave e cria um sub-dicionário para as outras colunas
                    if len(valores) >= 3:
                        resultado[valores[0]] = {
                            cabecalhos[1]: valores[1],
                            cabecalhos[2]: valores[2]
                        }
        
        return resultado
    
    except Exception as e:
        print(f"Erro ao fazer scraping: {e}")
        return {}

In [58]:
# PRODUTO opcao="opt_02"
scrape_embrapa(ano=2020, opcao="opt_02")

{'VINHO DE MESA': '124.200.414',
 'Tinto': '15.451.883',
 'Branco': '15.487.915',
 'Rosado': '1.576.888',
 'VINHO FINO DE MESA (VINIFERA)': '32.516.686',
 'SUCO': '69.261.287',
 'Suco de uva integral': '40.718.523',
 'Suco de uva concentrado': '27.963.865',
 'Suco de uva adoçado': '107.289',
 'Suco de uva orgânico': '471.610',
 'Suco de uva reconstituído': '-',
 'DERIVADOS': '92.533.804',
 'Espumante': '32.399',
 'Espumante moscatel': '689.139',
 'Base espumante': '-',
 'Base espumante moscatel': '3.006.705',
 'Base Champenoise champanha': '200.777',
 'Base Charmat champanha': '2.487.939',
 'Bebida de uva': '-',
 'Polpa de uva': '1.803.472',
 'Mosto simples': '80.355.474',
 'Mosto concentrado': '-',
 'Mosto de uva com bagaço': '3.078.256',
 'Mosto dessulfitado': '5.000',
 'Mistelas': '-',
 'Néctar de uva': '46.000',
 'Licorosos': '-',
 'Compostos': '-',
 'Jeropiga': '2.000',
 'Filtrado': '-',
 'Frisante': '-',
 'Vinho leve': '-',
 'Vinho licoroso': '48.678',
 'Brandy': '-',
 'Destilado

In [59]:
# PROCESSAMENTO opcao="opt_03"
scrape_embrapa(ano=2020, opcao="opt_03", subopcao="subopt_01")

{'TINTAS': '28.003.505',
 'Alicante Bouschet': '2.272.985',
 'Ancelota': '481.402',
 'Aramon': '-',
 'Alfrocheiro': '-',
 'Arinarnoa': '90.860',
 'Aspirant Bouschet': '34.513',
 'Barbera': '12.349',
 'Bonarda': '-',
 'Cabernet Franc': '1.506.219',
 'Cabernet Sauvignon': '5.889.427',
 'Caladoc': '5.230',
 'Campanario': '-',
 'Canaiolo': '-',
 'Carignan': '-',
 'Carmenere': '184.268',
 'Castelão': '-',
 'Corvina': '2.220',
 'Croatina': '-',
 'Cinsaut': '-',
 'Dom Felder': '-',
 'Dolcetto': '-',
 'Durif': '-',
 'Egiodola': '1.067.591',
 'Ekigaina': '1.990',
 'Festival (Sugraone)': '-',
 'Franconia': '-',
 'Freisa': '25.330',
 'Gamay St Romain': '-',
 'Gamay Beaujolais': '143.278',
 'Grand Noir': '-',
 'Grenache': '1.130',
 'Jaen': '-',
 'Lagrein': '3.020',
 'Lambrusco': '29.320',
 'Malbec': '493.966',
 'Marzemina': '-',
 'Merlot': '6.010.486',
 'Marselan': '449.156',
 'Mistura de uvas viníferas tinto': '-',
 'Molinera': '2.198',
 'Montepulciano': '22.968',
 'Moscato Bailey': '206.348',
 '

In [60]:
# COMERCIALIZAÇÃO opcao="opt_04"
scrape_embrapa(ano=2020, opcao="opt_04")

{'VINHO DE MESA': '215.557.931',
 'Tinto': '-',
 'Rosado': '-',
 'Branco': '-',
 'VINHO FINO DE MESA': '24.310.834',
 'VINHO FRIZANTE': '2.557.585',
 'VINHO ORGÂNICO': '10.718',
 'VINHO ESPECIAL': '-',
 'ESPUMANTES': '22.610.762',
 'Espumante  Moscatel': '9.298.571',
 'Espumante': '13.311.450',
 'Espumante Orgânico': '742',
 'SUCO DE UVAS': '144.889.668',
 'Suco Natural Integral': '114.453.657',
 'Suco Adoçado': '-',
 'Suco Reprocessado/reconstituido': '22.066.742',
 'Suco Orgânico': '553.391',
 'Outros sucos de uvas': '7.815.879',
 'SUCO DE UVAS CONCENTRADO': '22.422.414',
 'OUTROS PRODUTOS COMERCIALIZADOS': '26.547.242',
 'Outros vinhos (sem informação detalhada)': '192.057',
 'Agrin (fermentado, acetico misto)': '-',
 'Aguardente de vinho 50°gl': '866',
 'Alcool vinico': '6.640',
 'Bagaceira (graspa)': '7.610',
 'Base champenoise champanha': '8.772',
 'Base charmat champanha': '123',
 'Base espumante moscatel': '23.703',
 'Bebida de uva': '354.511',
 'Borra líquida': '22.975',
 'Bor

In [63]:
# IMPORTAÇÃO opcao="opt_05"
scrape_embrapa(ano=2020, opcao="opt_05", subopcao="subopt_01")

{'Africa do Sul': {'Quantidade (Kg)': '627.150', 'Valor (US$)': '1.701.072'},
 'Alemanha': {'Quantidade (Kg)': '136.992', 'Valor (US$)': '504.168'},
 'Argélia': {'Quantidade (Kg)': '-', 'Valor (US$)': '-'},
 'Arábia Saudita': {'Quantidade (Kg)': '-', 'Valor (US$)': '-'},
 'Argentina': {'Quantidade (Kg)': '22.610.267', 'Valor (US$)': '66.322.932'},
 'Armênia': {'Quantidade (Kg)': '-', 'Valor (US$)': '-'},
 'Austrália': {'Quantidade (Kg)': '212.595', 'Valor (US$)': '792.051'},
 'Áustria': {'Quantidade (Kg)': '6.540', 'Valor (US$)': '52.348'},
 'Bermudas': {'Quantidade (Kg)': '-', 'Valor (US$)': '-'},
 'Bélgica': {'Quantidade (Kg)': '-', 'Valor (US$)': '-'},
 'Bolívia': {'Quantidade (Kg)': '-', 'Valor (US$)': '-'},
 'Bósnia-Herzegovina': {'Quantidade (Kg)': '1.218', 'Valor (US$)': '902'},
 'Brasil': {'Quantidade (Kg)': '4.347', 'Valor (US$)': '41.213'},
 'Bulgária': {'Quantidade (Kg)': '23.110', 'Valor (US$)': '58.319'},
 'Canada': {'Quantidade (Kg)': '-', 'Valor (US$)': '-'},
 'Chile': {

In [62]:
# EXPORTAÇÃO opcao="opt_06"
scrape_embrapa(ano=2020, opcao="opt_06", subopcao="subopt_03")

{'Africa do Sul': {'Quantidade (Kg)': '44', 'Valor (US$)': '152'},
 'Alemanha, República Democrática': {'Quantidade (Kg)': '1.371.694',
  'Valor (US$)': '2.791.556'},
 'Angola': {'Quantidade (Kg)': '-', 'Valor (US$)': '-'},
 'Antígua e Barbuda': {'Quantidade (Kg)': '304', 'Valor (US$)': '1.013'},
 'Arabia Saudita': {'Quantidade (Kg)': '32.325', 'Valor (US$)': '95.999'},
 'Argélia': {'Quantidade (Kg)': '-', 'Valor (US$)': '-'},
 'Argentina': {'Quantidade (Kg)': '2.002.784', 'Valor (US$)': '3.707.550'},
 'Áustria': {'Quantidade (Kg)': '-', 'Valor (US$)': '-'},
 'Bahamas': {'Quantidade (Kg)': '3.208', 'Valor (US$)': '9.449'},
 'Bahrein': {'Quantidade (Kg)': '-', 'Valor (US$)': '-'},
 'Bangladesh': {'Quantidade (Kg)': '30', 'Valor (US$)': '214'},
 'Barbados': {'Quantidade (Kg)': '83', 'Valor (US$)': '197'},
 'Barein': {'Quantidade (Kg)': '250', 'Valor (US$)': '796'},
 'Bélgica': {'Quantidade (Kg)': '12.757', 'Valor (US$)': '24.336'},
 'Belize': {'Quantidade (Kg)': '20', 'Valor (US$)': '32'

In [None]:
from fastapi import FastAPI, Depends, HTTPException
from fastapi.security import HTTPBearer

In [65]:
app = FastAPI()
security = HTTPBearer()

# --- Autenticação (Opcional) ---
@app.post("/login")
def login(username: str, password: str):
    # Lógica JWT (exemplo simplificado)
    return {"token": "TOKEN_JWT_AQUI"}

# --- Endpoints Principais ---
@app.get("/producao/{ano}")
def get_producao(ano: int):
    return scrape_embrapa(ano, "opt_02")

@app.get("/processamento/{tipo}/{ano}")
def get_processamento(tipo: str, ano: int):
    subopcoes = tipo
    return scrape_embrapa(ano, "opt_03", subopcoes)

@app.get("/comercializacao/{ano}")
def get_comercializacao(ano: int):
    return scrape_embrapa(ano, "opt_04")

@app.get("/importacao/{produto}/{ano}")
def get_importacao(produto: str, ano: int):
    subopcoes = produto
    return scrape_embrapa(ano, "opt_05", subopcoes)

@app.get("/exportacao/{produto}/{ano}")
def get_exportacao(produto: str, ano: int):
    subopcoes = produto
    return scrape_embrapa(ano, "opt_06", subopcoes)