In [2]:
import pandas as pd
import ipywidgets as widgets
from IPython.display import display, clear_output
import sqlalchemy

# Conexão com o banco
db_string = "postgresql://postgres:senhasegura@database-services:5432/postgres"
engine = sqlalchemy.create_engine(db_string)

# Carrega a relação prefix ↔ projeto
df_projetos = pd.read_sql("""
    SELECT DISTINCT pr.prefix, pr.project_name
    FROM projects_registry pr
    JOIN storage_audit sa ON pr.prefix = sa.prefix
    WHERE pr.active = true
    ORDER BY pr.project_name;
""", engine)

prefixos = df_projetos['prefix'].tolist()
projetos = df_projetos['project_name'].tolist()
mapa_projetos = dict(zip(df_projetos['prefix'], df_projetos['project_name']))
mapa_inverso = {v: k for k, v in mapa_projetos.items()}

# Widgets sincronizados
dropdown_prefixo = widgets.Dropdown(
    options=prefixos,
    description="Prefixo:",
    layout=widgets.Layout(width='50%')
)

dropdown_projeto = widgets.Dropdown(
    options=projetos,
    description="Projeto:",
    layout=widgets.Layout(width='70%')
)

botao_gerar = widgets.Button(
    description="🔍 Preparar Cardápios",
    button_style='success',
    icon='filter'
)

out = widgets.Output()

# Sincronização bidirecional
def ao_mudar_prefixo(change):
    if change['name'] == 'value' and change['new'] in mapa_projetos:
        dropdown_projeto.value = mapa_projetos[change['new']]

def ao_mudar_projeto(change):
    if change['name'] == 'value' and change['new'] in mapa_inverso:
        dropdown_prefixo.value = mapa_inverso[change['new']]

dropdown_prefixo.observe(ao_mudar_prefixo, names='value')
dropdown_projeto.observe(ao_mudar_projeto, names='value')

# Classificador
def classificar_cardapio(nome):
    ext = nome.lower().split('.')[-1]
    if ext in ['csv', 'xls', 'xlsx']:
        return 'numerico'
    elif ext in ['pdf', 'docx', 'txt', 'md']:
        return 'texto'
    elif ext in ['jpg', 'jpeg', 'png', 'gif', 'wav', 'mp3']:
        return 'imagem'
    elif ext in ['json', 'npy', 'pkl']:
        return 'vetor'
    else:
        return 'outros'

# Ação principal
def preparar_cardapios(b):
    with out:
        clear_output()
        prefixo = dropdown_prefixo.value
        print(f"🔎 Prefixo selecionado: {prefixo} ({mapa_projetos[prefixo]})")

        query = f"""
            SELECT filename, full_path
            FROM storage_audit
            WHERE prefix = '{prefixo}'
            ORDER BY filename;
        """
        try:
            df = pd.read_sql(query, engine)
        except Exception as e:
            import traceback
            print("❌ Erro ao executar query:")
            traceback.print_exc()
            return

        if df.empty:
            print("⚠️ Nenhum arquivo encontrado para esse prefixo.")
            return

        df['cardapio'] = df['filename'].apply(classificar_cardapio)

        print(f"📦 Total de arquivos encontrados: {len(df)}")
        display(df.groupby('cardapio').size().rename("quantidade").to_frame())

        for tipo, grupo in df.groupby('cardapio'):
            print(f"\n🔸 Cardápio: {tipo}")
            display(grupo[['filename', 'full_path']].reset_index(drop=True))

# Conectar evento
botao_gerar.on_click(preparar_cardapios)

# Interface final
display(widgets.VBox([
    widgets.HBox([dropdown_prefixo, dropdown_projeto]),
    botao_gerar,
    out
]))


VBox(children=(HBox(children=(Dropdown(description='Prefixo:', layout=Layout(width='50%'), options=('FDL',), v…

In [3]:
import importlib
import pandas as pd
import ipywidgets as widgets
from IPython.display import display, clear_output

# Lista de tipos disponíveis
tipos_disponiveis = ['imagem', 'numerico', 'texto', 'vetor']

# Dropdown para tipo
dropdown_cardapio = widgets.Dropdown(
    options=tipos_disponiveis,
    description="Tipo de dado:",
    layout=widgets.Layout(width='40%')
)

# Botão de execução
botao_exec = widgets.Button(
    description="🚀 Executar Curadoria",
    button_style='primary',
    icon='play'
)

output_exec = widgets.Output()

# Lógica de chamada dinâmica
def executar_curadoria(b):
    with output_exec:
        clear_output()
        tipo = dropdown_cardapio.value
        prefixo = dropdown_prefixo.value  # já selecionado anteriormente
        try:
            df_filtrado = df[df['cardapio'] == tipo].copy()
        except:
            print("⚠️ Nenhum DataFrame de origem carregado. Execute o passo anterior.")
            return

        if df_filtrado.empty:
            print(f"⚠️ Nenhum arquivo do tipo '{tipo}' encontrado para o prefixo '{prefixo}'.")
            return

        try:
            modulo = importlib.import_module(f"curadoria_{tipo}")
            funcao = getattr(modulo, f"processar_{tipo}")
        except Exception as e:
            print(f"❌ Erro ao importar função de curadoria para tipo '{tipo}': {e}")
            return

        print(f"✅ Executando curadoria para tipo '{tipo}' com {len(df_filtrado)} arquivos.")
        resultado = funcao(df_filtrado, prefixo)

        print("🎯 Resultado:")
        display(resultado)

# Conecta evento
botao_exec.on_click(executar_curadoria)

# Exibe nova interface
display(widgets.VBox([dropdown_cardapio, botao_exec, output_exec]))


VBox(children=(Dropdown(description='Tipo de dado:', layout=Layout(width='40%'), options=('imagem', 'numerico'…

In [None]:
import pandas as pd
import ipywidgets as widgets
from IPython.display import display, clear_output
import sqlalchemy

# Conexão com o banco
db_string = "postgresql://postgres:senhasegura@database-services:5432/postgres"
engine = sqlalchemy.create_engine(db_string)

# Inicializa a variável global df
df = pd.DataFrame()

# Carrega a relação prefix ↔ projeto
df_projetos = pd.read_sql("""
    SELECT DISTINCT pr.prefix, pr.project_name
    FROM projects_registry pr
    JOIN storage_audit sa ON pr.prefix = sa.prefix
    WHERE pr.active = true
    ORDER BY pr.project_name;
""", engine)

prefixos = df_projetos['prefix'].tolist()
projetos = df_projetos['project_name'].tolist()
mapa_projetos = dict(zip(df_projetos['prefix'], df_projetos['project_name']))
mapa_inverso = {v: k for k, v in mapa_projetos.items()}

# Widgets sincronizados
dropdown_prefixo = widgets.Dropdown(
    options=prefixos,
    description="Prefixo:",
    layout=widgets.Layout(width='50%')
)

dropdown_projeto = widgets.Dropdown(
    options=projetos,
    description="Projeto:",
    layout=widgets.Layout(width='70%')
)

botao_gerar = widgets.Button(
    description="🔍 Preparar Cardápios",
    button_style='success',
    icon='filter'
)

out = widgets.Output()

# Sincronização bidirecional
def ao_mudar_prefixo(change):
    if change['name'] == 'value' and change['new'] in mapa_projetos:
        dropdown_projeto.value = mapa_projetos[change['new']]

def ao_mudar_projeto(change):
    if change['name'] == 'value' and change['new'] in mapa_inverso:
        dropdown_prefixo.value = mapa_inverso[change['new']]

dropdown_prefixo.observe(ao_mudar_prefixo, names='value')
dropdown_projeto.observe(ao_mudar_projeto, names='value')

# Classificador de tipo de arquivo
def classificar_cardapio(nome):
    ext = nome.lower().split('.')[-1]
    if ext in ['csv', 'xls', 'xlsx']:
        return 'numerico'
    elif ext in ['pdf', 'docx', 'txt', 'md']:
        return 'texto'
    elif ext in ['jpg', 'jpeg', 'png', 'gif', 'wav', 'mp3']:
        return 'imagem'
    elif ext in ['json', 'npy', 'pkl']:
        return 'vetor'
    else:
        return 'outros'

# Função principal para preparar os cardápios
def preparar_cardapios(b):
    global df  # Garante visibilidade entre células
    with out:
        clear_output()
        prefixo = dropdown_prefixo.value
        print(f"🔎 Prefixo selecionado: {prefixo} ({mapa_projetos[prefixo]})")

        query = f"""
            SELECT filename, full_path
            FROM storage_audit
            WHERE prefix = '{prefixo}'
            ORDER BY filename;
        """

        try:
            df = pd.read_sql(query, engine)
        except Exception as e:
            import traceback
            print("❌ Erro ao executar query:")
            traceback.print_exc()
            return

        if df.empty:
            print("⚠️ Nenhum arquivo encontrado para esse prefixo.")
            return

        df['cardapio'] = df['filename'].apply(classificar_cardapio)

        print(f"📦 Total de arquivos encontrados: {len(df)}")
        display(df.groupby('cardapio').size().rename("quantidade").to_frame())

        for tipo, grupo in df.groupby('cardapio'):
            print(f"\n🔸 Cardápio: {tipo}")
            display(grupo[['filename', 'full_path']].reset_index(drop=True))

# Conecta botão
botao_gerar.on_click(preparar_cardapios)

# Exibe interface
display(widgets.VBox([
    widgets.HBox([dropdown_prefixo, dropdown_projeto]),
    botao_gerar,
    out
]))


VBox(children=(HBox(children=(Dropdown(description='Prefixo:', layout=Layout(width='50%'), options=('FDL',), v…

In [5]:
import importlib

# Dropdown para tipo de dado
dropdown_cardapio = widgets.Dropdown(
    options=['imagem', 'numerico', 'texto', 'vetor'],
    description="Tipo de dado:",
    layout=widgets.Layout(width='40%')
)

# Botão de execução
botao_exec = widgets.Button(
    description="🚀 Executar Curadoria",
    button_style='primary',
    icon='play'
)

output_exec = widgets.Output()

# Lógica de execução dinâmica
def executar_curadoria(b):
    with output_exec:
        clear_output()
        tipo = dropdown_cardapio.value
        prefixo = dropdown_prefixo.value

        if df.empty:
            print("⚠️ Nenhum DataFrame carregado. Execute o passo de 'Preparar Cardápios' antes.")
            return

        df_filtrado = df[df['cardapio'] == tipo].copy()
        if df_filtrado.empty:
            print(f"⚠️ Nenhum arquivo do tipo '{tipo}' encontrado para o prefixo '{prefixo}'.")
            return

        try:
            modulo = importlib.import_module(f"curadoria_{tipo}")
            funcao = getattr(modulo, f"processar_{tipo}")
        except Exception as e:
            print(f"❌ Erro ao importar módulo/função para '{tipo}': {e}")
            return

        print(f"✅ Executando curadoria de '{tipo}' para o prefixo '{prefixo}' com {len(df_filtrado)} arquivos.")
        resultado = funcao(df_filtrado, prefixo)

        print("📄 Resultado da curadoria:")
        display(resultado)

# Conecta evento
botao_exec.on_click(executar_curadoria)

# Interface
display(widgets.VBox([
    dropdown_cardapio,
    botao_exec,
    output_exec
]))


VBox(children=(Dropdown(description='Tipo de dado:', layout=Layout(width='40%'), options=('imagem', 'numerico'…

In [7]:
variaveis = list(globals().keys())

for var in variaveis:
    try:
        valor = eval(var)
        if hasattr(valor, "shape"):
            print(f"{var:<30} → DataFrame, shape: {valor.shape}")
        elif isinstance(valor, (list, dict, set)):
            print(f"{var:<30} → {type(valor).__name__}, tamanho: {len(valor)}")
    except:
        pass  # ignora variáveis que não podem ser avaliadas


_ih                            → list, tamanho: 8
_oh                            → dict, tamanho: 0
_dh                            → list, tamanho: 1
In                             → list, tamanho: 8
Out                            → dict, tamanho: 0
__DW_SCOPE__                   → dict, tamanho: 2
df_projetos                    → DataFrame, shape: (1, 2)
prefixos                       → list, tamanho: 1
projetos                       → list, tamanho: 1
mapa_projetos                  → dict, tamanho: 1
mapa_inverso                   → dict, tamanho: 1
tipos_disponiveis              → list, tamanho: 4
df                             → DataFrame, shape: (23883, 3)
