In [8]:
# ‚úÖ C√©lula completa para conex√£o com MinIO e PostgreSQL (com nome correto do container)

# üîó Importa√ß√£o de bibliotecas necess√°rias
from minio import Minio
from minio.error import S3Error
import psycopg2
import pandas as pd
import ipywidgets as widgets
from IPython.display import display, clear_output
from datetime import datetime

# üîó Configura√ß√£o da conex√£o com o MinIO
MINIO_ENDPOINT = "localhost:9000"      # üîß Endere√ßo do MinIO (ajuste se necess√°rio)
MINIO_ACCESS_KEY = "minioadmin"        # üîß Acesso MinIO
MINIO_SECRET_KEY = "minioadmin"        # üîß Senha MinIO

# üîó Configura√ß√£o da conex√£o com o PostgreSQL
# ‚ö†Ô∏è O hostname correto √© o nome do container: postgres_db
PG_HOST = "postgres_db"
PG_PORT = "5432"
PG_DATABASE = "postgres"
PG_USER = "postgres"
PG_PASSWORD = "senhasegura"

# üîó Conex√£o com o MinIO
try:
    client = Minio(
        MINIO_ENDPOINT,
        access_key=MINIO_ACCESS_KEY,
        secret_key=MINIO_SECRET_KEY,
        secure=False
    )
    print("üü¢ Conectado ao MinIO com sucesso.")
except Exception as e:
    print(f"‚ùå Erro na conex√£o com o MinIO: {e}")

# üîó Conex√£o com o PostgreSQL
try:
    conn = psycopg2.connect(
        host=PG_HOST,
        port=PG_PORT,
        dbname=PG_DATABASE,
        user=PG_USER,
        password=PG_PASSWORD
    )
    print("üü¢ Conectado ao PostgreSQL com sucesso.")
except Exception as e:
    print(f"‚ùå Erro na conex√£o com o PostgreSQL: {e}")


üü¢ Conectado ao MinIO com sucesso.
üü¢ Conectado ao PostgreSQL com sucesso.


In [9]:
# ‚úÖ C√©lula completa ‚Äî Sele√ß√£o ou Cria√ß√£o de Projeto + Pipeline com Contadores Din√¢micos

# üîó Importa√ß√µes necess√°rias
from minio import Minio
from minio.error import S3Error
from minio.commonconfig import CopySource
import psycopg2
import pandas as pd
from tqdm.notebook import tqdm
from datetime import datetime
import ipywidgets as widgets
from IPython.display import display, clear_output

# üîó Conex√£o com MinIO
MINIO_ENDPOINT = "minio:9000"
MINIO_ACCESS_KEY = "admin"          # üîß Ajustar conforme ambiente
MINIO_SECRET_KEY = "senhasegura"    # üîß Ajustar conforme ambiente

client = Minio(
    MINIO_ENDPOINT,
    access_key=MINIO_ACCESS_KEY,
    secret_key=MINIO_SECRET_KEY,
    secure=False
)

# üîó Definir buckets
bucket_recepcao = "recepcao-raw"
bucket_destino = "storage-unique"

# üóÇÔ∏è Verificar e criar bucket de destino se n√£o existir
if not client.bucket_exists(bucket_destino):
    client.make_bucket(bucket_destino)
    print(f"‚úÖ Bucket '{bucket_destino}' criado.")
else:
    print(f"‚ÑπÔ∏è Bucket '{bucket_destino}' j√° existe.")

# üîç Fun√ß√£o para buscar projetos ativos no PostgreSQL
def fetch_projects():
    query = """
        SELECT prefix, project_name
        FROM projects_registry
        WHERE active = TRUE
        ORDER BY project_name;
    """
    df = pd.read_sql(query, conn)
    if df.empty:
        return []
    return [f"{row.prefix} - {row.project_name}" for _, row in df.iterrows()]

# üîß Widgets para sele√ß√£o de projeto
dropdown = widgets.Dropdown(
    options=fetch_projects(),
    description='Projeto:',
    layout=widgets.Layout(width='50%')
)

# üîß Widgets para cria√ß√£o de novo projeto
input_name = widgets.Text(description="Nome:")
input_prefix = widgets.Text(description="Prefixo:")
input_description = widgets.Text(description="Descri√ß√£o:")

button_create = widgets.Button(
    description="Criar Projeto",
    button_style='info'
)

# üîß Bot√£o para executar movimenta√ß√£o
button_run = widgets.Button(
    description="Iniciar Movimenta√ß√£o",
    button_style='success'
)

# üéØ Callback para criar projeto
def on_create_project(b):
    prefix = input_prefix.value.strip().upper()
    name = input_name.value.strip()
    desc = input_description.value.strip()

    if not prefix or not name:
        print("‚ùå Prefixo e Nome do Projeto s√£o obrigat√≥rios.")
        return

    cursor = conn.cursor()
    cursor.execute("SELECT 1 FROM projects_registry WHERE prefix = %s;", (prefix,))
    exists = cursor.fetchone()

    if exists:
        print(f"‚ùå Prefixo '{prefix}' j√° existe. Escolha outro.")
    else:
        cursor.execute("""
            INSERT INTO projects_registry (prefix, project_name, description, active, created_at)
            VALUES (%s, %s, %s, TRUE, CURRENT_TIMESTAMP);
        """, (prefix, name, desc))
        conn.commit()
        print(f"‚úÖ Projeto '{name}' com prefixo '{prefix}' criado com sucesso.")

        # üîÑ Atualizar dropdown
        dropdown.options = fetch_projects()

    cursor.close()

# üéØ Callback para movimenta√ß√£o
def on_run_clicked(b):
    if dropdown.value:
        prefix = dropdown.value.split(" - ")[0]
        project_name = dropdown.value.split(" - ")[1]
        print(f"üóÇÔ∏è Projeto selecionado: {project_name} (Prefixo: {prefix})")
    else:
        print("‚ùå Nenhum projeto selecionado.")
        return

    # üì¶ Listar arquivos no bucket de recep√ß√£o
    print(f"üîç Listando arquivos no bucket '{bucket_recepcao}'...")
    objects = list(client.list_objects(bucket_recepcao, recursive=True))
    print(f"‚û°Ô∏è {len(objects)} arquivos encontrados no bucket '{bucket_recepcao}'.")

    # üö© Contadores
    copiados = 0
    repetidos = 0

    # üöö Loop de movimenta√ß√£o com verifica√ß√£o dupla e barra de progresso com contadores
    with tqdm(total=len(objects), desc="Copiando arquivos", unit="arquivo") as pbar:
        for obj in objects:
            source_path = obj.object_name

            # üîÅ Gerar novo caminho no bucket de destino
            if source_path.startswith("recepcao-raw/FIAP_PI/"):
                relative_path = source_path.replace("recepcao-raw/FIAP_PI/", "")
            else:
                relative_path = source_path

            new_path = f"{prefix}/{relative_path}"

            # üîç Verificar na storage_audit (banco)
            cursor = conn.cursor()
            cursor.execute("""
                SELECT 1 FROM storage_audit WHERE full_path = %s;
            """, (new_path,))
            exists_in_audit = cursor.fetchone() is not None
            cursor.close()

            # üîç Verificar no bucket destino
            try:
                client.stat_object(bucket_destino, new_path)
                exists_in_bucket = True
            except S3Error as err:
                if err.code == "NoSuchKey":
                    exists_in_bucket = False
                else:
                    raise

            # üîé Decidir se copia
            if exists_in_audit and exists_in_bucket:
                repetidos += 1
                tqdm.write(f"‚è≠Ô∏è Arquivo j√° presente no audit e no bucket: {new_path}")
            else:
                try:
                    # üì§ Copiar usando CopySource
                    client.copy_object(
                        bucket_destino,
                        new_path,
                        CopySource(bucket_recepcao, source_path)
                    )
                    copiados += 1
                    tqdm.write(f"‚úÖ Arquivo copiado: {source_path} ‚Üí {new_path}")

                    # üóÉÔ∏è Registrar na storage_audit (se n√£o estiver)
                    if not exists_in_audit:
                        cursor = conn.cursor()
                        cursor.execute("""
                            INSERT INTO storage_audit (
                                prefix, project_name, bucket, full_path, filename,
                                size_bytes, upload_date, source_bucket
                            )
                            VALUES (%s, %s, %s, %s, %s, %s, CURRENT_TIMESTAMP, %s);
                        """, (
                            prefix,
                            project_name,
                            bucket_destino,
                            new_path,
                            new_path.split("/")[-1],
                            obj.size,
                            bucket_recepcao
                        ))
                        conn.commit()
                        cursor.close()

                except Exception as e:
                    tqdm.write(f"‚ùå Erro ao copiar {source_path}: {e}")

            # üîÑ Atualiza a barra com os contadores em tempo real
            pbar.set_postfix(copiados=copiados, repetidos=repetidos)
            pbar.update(1)

    # üîî Resumo final
    print(f"‚úÖ Finalizado: {copiados} arquivos copiados, {repetidos} arquivos j√° existentes.")
    
# üîó Conectar callbacks
button_create.on_click(on_create_project)
button_run.on_click(on_run_clicked)

# üóÇÔ∏è Montagem da interface
interface = widgets.VBox([
    widgets.HTML("<b>Selecione um Projeto Existente:</b>"),
    dropdown,
    widgets.HTML("<b>Ou Cadastre um Novo Projeto:</b>"),
    input_name,
    input_prefix,
    input_description,
    button_create,
    widgets.HTML("<b>Ap√≥s selecionar o projeto, execute a movimenta√ß√£o:</b>"),
    button_run
])

# üöÄ Exibir a interface
display(interface)


‚ÑπÔ∏è Bucket 'storage-unique' j√° existe.


  df = pd.read_sql(query, conn)


VBox(children=(HTML(value='<b>Selecione um Projeto Existente:</b>'), Dropdown(description='Projeto:', layout=L‚Ä¶

Copiando arquivos:   0%|          | 0/23883 [00:00<?, ?arquivo/s]