In [1]:
import pandas as pd
import pathlib
import duckdb
import openpyxl 
from datetime import datetime
import traceback
from IPython.display import display, HTML

In [2]:
# ==============================================================================
# Bloco 1: CONFIGURAÇÃO E LEITURA DO ARQUIVO DE CONTROLE
# ==============================================================================

# --- CAMINHOS DE ENTRADA E SAÍDA ---
PASTA_STAGING = pathlib.Path("dados_catalogo") / "staging"
CAMINHO_PARQUETS = str(PASTA_STAGING / "*.parquet")
PASTA_PROCESSED = pathlib.Path("dados_catalogo") / "processed"
PASTA_PROCESSED.mkdir(exist_ok=True)

# Arquivo de controle que você deve criar e manter
ARQUIVO_CONTROLE_PLATAFORMAS = 'plataformas_controle.xlsx'

# Arquivos de saída
ARQUIVO_TIMELINE_CSV = PASTA_PROCESSED / 'relatorio_timeline_plataformas.csv'
ARQUIVO_CONSOLIDADO_FILTRADO = PASTA_PROCESSED / 'dados_consolidados_filtrados.parquet'


In [3]:
print("--- Etapa 2: Validação e Filtragem ---")

# --- Leitura da lista de plataformas do arquivo Excel ---
try:
    df_controle = pd.read_excel(ARQUIVO_CONTROLE_PLATAFORMAS)
    # Valida se as colunas esperadas existem
    if 'Plataforma' not in df_controle.columns or 'USAR' not in df_controle.columns:
        raise ValueError("O arquivo de controle deve conter as colunas 'Plataforma' e 'USAR'.")
   
    # Cria a lista de plataformas a serem mantidas    
    PLATAFORMAS_PARA_MANTER = df_controle[df_controle['USAR'].str.upper() == 'S']['Plataforma'].tolist()
    
    print(f"Arquivo de controle '{ARQUIVO_CONTROLE_PLATAFORMAS}' lido com sucesso.")
    print(f"{len(PLATAFORMAS_PARA_MANTER)} plataformas serão mantidas no processamento.")
    plataformas_controle_ok = True
except Exception as e:
    print(f"ERRO ao ler o arquivo de controle: {e}")
    plataformas_controle_ok = False


--- Etapa 2: Validação e Filtragem ---
Arquivo de controle 'plataformas_controle.xlsx' lido com sucesso.
114 plataformas serão mantidas no processamento.


In [4]:
# ==============================================================================
# Bloco 2: GERAÇÃO DO RELATÓRIO COMPLETO DE VALIDAÇÃO (VERSÃO FINAL CORRIGIDA)
# ==============================================================================

if plataformas_controle_ok:
    print("\nIniciando a geração do relatório de validação...")
    try:
        con = duckdb.connect(database=':memory:')
        
        # 1. Gera a tabela de linha do tempo completa
        query_timeline = f"""
        SELECT data_ref, Platform_Name, COUNT(*) as total_registros
        FROM read_parquet('{CAMINHO_PARQUETS}', union_by_name=true)
        GROUP BY data_ref, Platform_Name
        """
        df_timeline_raw = con.execute(query_timeline).fetch_df()
        df_timeline_pivot = df_timeline_raw.pivot_table(
            index='Platform_Name', columns='data_ref', values='total_registros'
        ).fillna(0).astype(int)
        
        df_timeline_pivot = df_timeline_pivot.sort_index(axis=1)
        
        # Salva CSV e XLSX com data/hora
        timestamp = datetime.now().strftime("%Y-%m-%d_%H%M%S")
        caminho_csv = PASTA_PROCESSED / f'relatorio_timeline_plataformas_{timestamp}.csv'
        caminho_xlsx = PASTA_PROCESSED / f'relatorio_timeline_plataformas_{timestamp}.xlsx'
        
        df_timeline_pivot.to_csv(caminho_csv, sep=';', encoding='utf-8-sig')
        df_timeline_pivot.to_excel(caminho_xlsx)
        print(f"✔ Tabela de timeline completa salva em CSV e XLSX com o timestamp: {timestamp}")

        # 2. Análise de Novidades e Mudanças (Cronológica e Visual)
        print("\n" + "="*60)
        print("--- RELATÓRIO CRONOLÓGICO DE MUDANÇAS E NOVIDADES ---")
        print("="*60)
        
        plataformas_nos_dados = set(df_timeline_pivot.index)
        novas_plataformas = plataformas_nos_dados - set(df_controle['Plataforma'])
        if novas_plataformas:
            display(HTML("<h3>[!] NOVAS PLATAFORMAS ENCONTRADAS (não estão no seu arquivo de controle)</h3>"))
            df_novas = pd.DataFrame(sorted(list(novas_plataformas)), columns=['Plataforma'])
            display(df_novas.style.hide(axis="index"))
        else:
            display(HTML("<h4>✔ Nenhuma plataforma nova (fora do arquivo de controle) foi detectada.</h4>"))

        # 3. Análise de Variação de Catálogo semana a semana
        for i in range(len(df_timeline_pivot.columns)):
            semana_atual_str = df_timeline_pivot.columns[i]
            semana_atual_dt = pd.to_datetime(semana_atual_str)
            
            display(HTML(f"<br><h2>Semana {semana_atual_dt.strftime('%d/%m/%Y')}</h2>"))

            if i == 0:
                print("Esta é a primeira semana do histórico. Os dados abaixo servem como base inicial.")
                base_inicial = df_timeline_pivot[[semana_atual_str]].reset_index()
                base_inicial = base_inicial[base_inicial[semana_atual_str] > 0]
                base_inicial.columns = ['Plataforma', 'Registros']
                display(base_inicial.sort_values(by='Registros', ascending=False)
                        .style.format({'Registros': '{:,}'}).hide(axis="index"))
                display(HTML("<hr>"))
                continue

            semana_anterior_str = df_timeline_pivot.columns[i-1]
            entradas, saidas, gaps, variacoes = [], [], [], []

            for plataforma in PLATAFORMAS_PARA_MANTER:
                if plataforma not in df_timeline_pivot.index: continue
                registros_anteriores = df_timeline_pivot.loc[plataforma, semana_anterior_str]
                registros_atuais = df_timeline_pivot.loc[plataforma, semana_atual_str]
                
                if registros_atuais > 0 and registros_anteriores == 0:
                    if df_timeline_pivot.loc[plataforma, :semana_anterior_str].sum() > 0:
                        gaps.append({'Plataforma': plataforma, 'Registros Atuais': registros_atuais})
                    else:
                        entradas.append({'Plataforma': plataforma, 'Registros': registros_atuais})
                elif registros_anteriores > 0 and registros_atuais == 0:
                    saidas.append({'Plataforma': plataforma, 'Registros Anteriores': registros_anteriores})
                elif registros_anteriores > 0 and registros_atuais > 0:
                    variacao = (registros_atuais - registros_anteriores) / registros_anteriores # <-- LINHA CORRIGIDA
                    if abs(variacao) > 0.05:
                        variacoes.append({'Plataforma': plataforma, 'Variação': variacao, 'Registros Anteriores': registros_anteriores, 'Registros Atuais': registros_atuais})
            
            if not any([entradas, saidas, gaps]):
                print("Não houve variação no total de plataformas cobertas.")
            
            if entradas:
                display(HTML("<h4 style='color: #2E8B57;'>Novas Plataformas Cobertas</h4>"))
                df_entradas = pd.DataFrame(entradas).sort_values(by='Registros', ascending=False)
                display(df_entradas.style.format({'Registros': '{:,}'}).bar(subset=['Registros'], color='#90EE90').hide(axis="index"))

            if saidas:
                display(HTML("<h4 style='color: #CD5C5C;'>Plataformas que deixaram a cobertura</h4>"))
                df_saidas = pd.DataFrame(saidas).sort_values(by='Registros Anteriores', ascending=False)
                display(df_saidas.style.format({'Registros Anteriores': '{:,}'}).bar(subset=['Registros Anteriores'], color='#FFA07A').hide(axis="index"))

            if gaps:
                display(HTML("<h4 style='color: #DAA520;'>Plataformas que Retornaram à Cobertura</h4>"))
                df_gaps = pd.DataFrame(gaps).sort_values(by='Registros Atuais', ascending=False)
                display(df_gaps.style.format({'Registros Atuais': '{:,}'}).bar(subset=['Registros Atuais'], color='#FFD700').hide(axis="index"))

            if variacoes:
                display(HTML("<h4>Variações >5% no Catálogo de Conteúdos</h4>"))
                df_variacoes = pd.DataFrame(variacoes).sort_values(by='Variação', key=abs, ascending=False)
                display(df_variacoes.style.format({'Variação': '{:+.1%}', 'Registros Anteriores': '{:,}', 'Registros Atuais': '{:,}'}).background_gradient(subset=['Variação'], cmap='RdYlGn', vmin=-1, vmax=1).hide(axis="index"))

            display(HTML("<hr>")) 

    except Exception as e:
        print(f"ERRO ao gerar o relatório de validação: {e}")
        traceback.print_exc()


Iniciando a geração do relatório de validação...
✔ Tabela de timeline completa salva em CSV e XLSX com o timestamp: 2025-09-18_174118

--- RELATÓRIO CRONOLÓGICO DE MUDANÇAS E NOVIDADES ---


Esta é a primeira semana do histórico. Os dados abaixo servem como base inicial.


Plataforma,Registros
Archivio Luce,68820
Claro TV+,42986
NBA League Pass,27773
Amazon Prime Video,26612
Vivo Play,25107
AppleTV,10772
Sky+,10696
Plex,10593
Netflix,7348
UNIVER VIDEO,6285


Plataforma,Registros
YouTube,8695
Tamanduá TV,2347
Curta!On,995
Filmicca,391
Cardume,235
Cine Humberto Mauro Mais,160


Plataforma,Variação,Registros Anteriores,Registros Atuais
KweliTV,-45.5%,1403,764


Plataforma,Registros
Bombozila,174
MINASplay,131


Plataforma,Variação,Registros Anteriores,Registros Atuais
KweliTV,+83.9%,764,1405
Demand Africa,-41.2%,670,394
Means TV,+7.3%,2087,2239
Kidoodle.TV,-6.5%,1138,1064


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
Cardume,+10.2%,235,259


Plataforma,Registros
CultSP Play,122


Plataforma,Registros Anteriores
CGood TV,160


Plataforma,Variação,Registros Anteriores,Registros Atuais
Demand Africa,-12.7%,393,343
Cardume,-6.9%,259,241
OnDemandKorea,-6.8%,2222,2072
Troma NOW!,-5.8%,1462,1377
Claro Video,+5.2%,2718,2860


Plataforma,Registros
Banco de Conteúdos Culturais,5900


Plataforma,Registros
Embaúba Play,590
Itaú Cultural Play,196
Todesplay,183


Plataforma,Variação,Registros Anteriores,Registros Atuais
CultSP Play,+1243.4%,122,1639
UOL Play,+10.8%,753,834
MINASplay,+8.3%,133,144
Cardume,+7.1%,241,258


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
Cine Humberto Mauro Mais,+12.2%,156,175


Não houve variação no total de plataformas cobertas.


Plataforma,Registros
Spcine Play,275


Plataforma,Variação,Registros Anteriores,Registros Atuais
Retina Latina,+73.2%,179,310
CultSP Play,-13.8%,1639,1413
Cardume,-8.9%,258,235
UOL Play,+8.1%,829,896
ShemarooMe,+7.5%,2521,2709
Means TV,-7.3%,2259,2093
Itaú Cultural Play,-5.4%,203,192


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
Sky+,-26.7%,11338,8308


Não houve variação no total de plataformas cobertas.


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
IWantTFC,+9.0%,1981,2160


Plataforma,Registros
TV Caiçara,351


Plataforma,Variação,Registros Anteriores,Registros Atuais
Met Opera on Demand,-41.2%,1584,932
OnDemandKorea,+14.7%,2033,2332
CultSP Play,+10.5%,1453,1606
Anime Onegai,+8.8%,353,384
Means TV,-8.5%,2093,1915
ShemarooMe,-8.0%,2708,2492
Sky+,+7.8%,8308,8954
Bombozila,+5.6%,180,190


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
Todesplay,+12.7%,189,213
CultSP Play,-9.6%,1606,1452
History Hit,-5.0%,317,301


Plataforma,Registros
Darkflix+,1405
Narrativas Indígenas do Nordeste,112


Plataforma,Variação,Registros Anteriores,Registros Atuais
SBT Videos,+164.2%,137,362
Todesplay,-8.0%,213,196
History Hit,+6.6%,301,321


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
Kidoodle.TV,-32.6%,1072,723
Umbra,+30.7%,251,328
Means TV,+25.2%,1915,2397
Curta!On,-7.4%,990,917


Plataforma,Registros
Reserva Imovision,506
Sesc Digital,38


Plataforma,Variação,Registros Anteriores,Registros Atuais
Teatrix,+7.3%,327,351
WOW Presents Plus,-7.2%,278,258
Spcine Play,+6.8%,265,283
Todesplay,+5.7%,192,203


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
Cine Humberto Mauro Mais,-9.1%,175,159


Plataforma,Registros
AmazôniaFLIX,133


Plataforma,Variação,Registros Anteriores,Registros Atuais
Vivo Play,-25.7%,24380,18109
Cine Humberto Mauro Mais,+22.0%,159,194
WOW Presents Plus,+7.8%,258,278
Discovery+,-6.0%,1559,1465
Todesplay,+5.9%,203,215


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
Filmbox+,+163.3%,425,1119
Reserva Imovision,+50.8%,510,769
Canela.TV,+15.3%,2717,3132
Todesplay,-11.6%,215,190
Cine Humberto Mauro Mais,-9.8%,194,175
Itaú Cultural Play,-8.5%,211,193
Marquee TV,+5.1%,474,498
TV Brasil Play,+5.0%,259,272


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
Itaú Cultural Play,+14.0%,193,220
Spcine Play,+12.2%,279,313
Arte1 Play,-6.9%,130,121
Discovery+,-5.3%,1409,1334


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
Spcine Play,-9.3%,313,284
Discovery+,-5.2%,1334,1265


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
Sesc Digital,+21.1%,38,46
Todesplay,+8.3%,192,208
CultSP Play,+8.3%,1446,1566
MINASplay,+7.4%,175,188
Retina Latina,-7.1%,322,299
Demand Africa,-6.5%,355,332
Itaú Cultural Play,-5.0%,219,208


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
MINASplay,-27.1%,188,137
Sesc Digital,-15.2%,46,39
SBT Videos,+7.7%,362,390
Todesplay,-6.7%,208,194
Claro Video,+6.6%,2864,3052
Belas Artes À La Carte,-6.2%,742,696
Filmzie,-5.8%,1338,1261
Cinemateca Pernambucana,+5.7%,369,390
History Hit,-5.1%,332,315


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
MINASplay,+26.3%,137,173
Demand Africa,+13.3%,332,376
CultSP Play,+11.4%,1566,1744
Sesc Digital,+7.7%,39,42
Filmicca,+6.7%,431,460


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
MINASplay,+31.2%,173,227
Spcine Play,-18.5%,271,221
Cindie,-15.7%,553,466
Claro TV+,-9.3%,45794,41539
ALTBalaji,+5.4%,166,175


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
Cindie,+19.3%,466,556
Todesplay,+16.3%,196,228
Spcine Play,-8.6%,221,202


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
Todesplay,-14.0%,228,196
UOL Play,+7.4%,934,1003
IWantTFC,-6.6%,2061,1925
Itaú Cultural Play,+5.6%,215,227


Não houve variação no total de plataformas cobertas.


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
DOCSVILLE,+9.4%,320,350
Spcine Play,-5.9%,203,191


Não houve variação no total de plataformas cobertas.


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
IWantTFC,-27.1%,1848,1348
Marquee TV,-7.2%,515,478
MINASplay,+5.1%,234,246


Plataforma,Registros Anteriores
Box Brazil Play,1088


Plataforma,Variação,Registros Anteriores,Registros Atuais
WOW Presents Plus,-23.7%,278,212
UOL Play,-9.5%,1065,964
Itaú Cultural Play,+6.7%,239,255
IWantTFC,-6.6%,1348,1259
Canais Globo,-5.3%,1636,1549


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
UOL Play,+9.1%,964,1052
WOW Presents Plus,+5.2%,212,223


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
Arte1 Play,+2032.5%,120,2559
Umbra,-27.5%,335,243
Spcine Play,+15.2%,191,220
Anime Onegai,-14.2%,424,364


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
Umbra,+37.9%,243,335
Reserva Imovision,+9.3%,789,862
History Hit,-8.8%,364,332
UOL Play,+8.7%,1052,1144
Itaú Cultural Play,-8.4%,249,228
Mercado Play,-8.3%,2054,1884
MUBI,-7.2%,682,633
SBT Videos,+5.1%,412,433


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
Sesc Digital,+454.8%,42,233
Vivo Play,-11.4%,18183,16109
History Hit,+8.4%,332,360
IWantTFC,-5.9%,1254,1180


Não houve variação no total de plataformas cobertas.


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
Filmbox+,+7.2%,1133,1215
Curta!On,-6.8%,964,898


Plataforma,Registros
Reel Short,808


Plataforma,Variação,Registros Anteriores,Registros Atuais
ShemarooMe,-46.3%,2513,1349
Curta!On,+8.2%,898,972
Kidoodle.TV,-7.7%,865,798
Retina Latina,+7.1%,340,364
Itaú Cultural Play,-5.0%,239,227


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
ShemarooMe,+55.9%,1349,2103
Todesplay,+11.2%,196,218
Itaú Cultural Play,+7.5%,227,244
Crunchyroll,-6.5%,1712,1600
Spcine Play,-5.2%,230,218


Plataforma,Registros Anteriores
Discovery+,1249


Plataforma,Variação,Registros Anteriores,Registros Atuais
Crunchyroll,+6.8%,1600,1709
Darkflix+,+6.6%,1480,1577


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
Canela.TV,-5.8%,3191,3005
Itaú Cultural Play,-5.1%,234,222
History Hit,-5.0%,357,339
Mercado Play,+5.0%,1954,2052


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
Filmzie,+135.2%,1284,3020
IWantTFC,+76.7%,1177,2080
Revry,-46.2%,749,403
Demand Africa,-7.1%,367,341


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
History Hit,+8.0%,336,363
Canela.TV,+7.5%,2919,3137
Filmicca,-5.9%,510,480
Darkflix+,+5.8%,1528,1616


Plataforma,Registros Anteriores
Canais Globo,1605


Plataforma,Variação,Registros Anteriores,Registros Atuais
Darkflix+,-10.1%,1616,1453
Revry,-6.0%,403,379


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
MUBI,+7.6%,632,680
TVN Play,-5.2%,421,399


Plataforma,Registros Anteriores
Insight TV,149


Plataforma,Variação,Registros Anteriores,Registros Atuais
MovieSaints,+76.4%,157,277
Canela.TV,-28.7%,3137,2236
UOL Play,+13.5%,1144,1298
NBA League Pass,+8.4%,29440,31913
Todesplay,-6.5%,216,202
ShemarooMe,+5.6%,2161,2282


Não houve variação no total de plataformas cobertas.


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
WOW Presents Plus,+18.5%,227,269
Vivo Play,-15.6%,16379,13826


Plataforma,Registros
Universal+,123


Plataforma,Registros Anteriores
Claro TV+,40494
Amazon Prime Video,29554
Vivo Play,13826
Plex,12705
Sky+,10264
YouTube,9396
Netflix,7796
UNIVER VIDEO,6285
Banco de Conteúdos Culturais,5929
Looke,5753


Plataforma,Registros Atuais
Claro TV+,37965
Amazon Prime Video,29890
Vivo Play,14152
Plex,12756
Sky+,10264
YouTube,9425
Netflix,7780
UNIVER VIDEO,6285
Banco de Conteúdos Culturais,5929
Looke,5768


Plataforma,Variação,Registros Anteriores,Registros Atuais
Universal+,+308.1%,123,502


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
Simply South,+100.7%,1723,3458
IWantTFC,-75.0%,2252,564
Itaú Cultural Play,+11.0%,246,273


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
SBT Videos,-63.8%,442,160
Simply South,-49.9%,3458,1732
Itaú Cultural Play,+9.2%,273,298
TV Brasil Play,+6.6%,290,309


Não houve variação no total de plataformas cobertas.


Plataforma,Variação,Registros Anteriores,Registros Atuais
KINOA.TV,-49.7%,153,77
Canela.TV,+8.2%,2306,2496
TV Brasil Play,-5.8%,309,291


In [5]:
# ==============================================================================
# Bloco 3: CONSOLIDAÇÃO E FILTRAGEM FINAL (VERSÃO OTIMIZADA PARA MEMÓRIA)
# ==============================================================================
if plataformas_controle_ok:
    print("\n" + "="*60)
    print("--- CONSOLIDAÇÃO E FILTRAGEM FINAL (MODO OTIMIZADO) ---")
    print("="*60)
    
    con = None
    try:
        con = duckdb.connect(database=':memory:')
        
        # Converte a lista de plataformas para um formato que o SQL entende (ex: ('Netflix', 'Max', ...))
        plataformas_sql = tuple(PLATAFORMAS_PARA_MANTER)
        
        print("Consolidando e filtrando dados diretamente no banco de dados...")

        # Cria uma query que já filtra e se prepara para salvar
        # A cláusula WHERE aplica o filtro de plataformas diretamente no DuckDB
        # A cláusula COPY salva o resultado sem passar por um DataFrame gigante no Pandas
        query_filtragem_e_salvamento = f"""
        COPY (
            SELECT *
            FROM read_parquet('{CAMINHO_PARQUETS}', union_by_name=true)
            WHERE Platform_Name IN {plataformas_sql}
        ) TO '{ARQUIVO_CONSOLIDADO_FILTRADO}' (FORMAT PARQUET, COMPRESSION 'snappy');
        """
        
        # Executa a operação
        con.execute(query_filtragem_e_salvamento)
        
        print(f"✔ Arquivo consolidado e filtrado salvo em: '{ARQUIVO_CONSOLIDADO_FILTRADO}'")
        print("\nProcesso concluído com sucesso com baixo uso de memória!")

    except Exception as e:
        print(f"ERRO ao consolidar e filtrar os dados: {e}")
    
    finally:
        if con:
            con.close()


--- CONSOLIDAÇÃO E FILTRAGEM FINAL (MODO OTIMIZADO) ---
Consolidando e filtrando dados diretamente no banco de dados...


FloatProgress(value=0.0, layout=Layout(width='auto'), style=ProgressStyle(bar_color='black'))

✔ Arquivo consolidado e filtrado salvo em: 'dados_catalogo\processed\dados_consolidados_filtrados.parquet'

Processo concluído com sucesso com baixo uso de memória!
