In [2]:
import pandas as pd
import re
import unicodedata
import numpy as np

# Função de limpeza (necessária para os nomes das colunas)
def clean_colname(col: str) -> str:
    col = unicodedata.normalize("NFKD", str(col))
    col = "".join(c for c in col if not unicodedata.combining(c))
    col = col.strip().lower()
    col = re.sub(r"\s+", "_", col)
    col = re.sub(r"[^\w_]", "", col)
    return col

# Carregar o Financeiro
try:
    FILE_PATH = "data/dados.xlsx"
    SHEET_NAME_FIN = "Financeiro"
    
    df_fin_raw = pd.read_excel(FILE_PATH, sheet_name=SHEET_NAME_FIN)
    
    # Limpar nomes das colunas e a coluna 'marca'
    df_fin_clean = df_fin_raw.copy()
    df_fin_clean.columns = [clean_colname(c) for c in df_fin_clean.columns]
    
    # Extrair marcas-alvo
    marcas_financeiro = set(
        df_fin_clean['marca']
        .astype(str)
        .str.strip()
        .str.upper()
        .str.replace(r"\s+", " ", regex=True)
        .unique()
    )
    
    print("--- 1. Marcas-Alvo (do P&L Histórico / Financeiro) ---")
    print(f"Total de marcas-alvo no Financeiro: {len(marcas_financeiro)}")
    print(sorted(marcas_financeiro))

except Exception as e:
    print(f"ERRO ao carregar 'Financeiro': {e}")

--- 1. Marcas-Alvo (do P&L Histórico / Financeiro) ---
Total de marcas-alvo no Financeiro: 22
['CC', 'CC CAFE', 'CC IMPORT', 'CC MA IMPORT', 'CC MENOS AÇÚ', 'CC SEM AÇÚ', 'CC ZERO', 'CCLIGHT', 'FANTA', 'FANTA ZERO', 'FANTALAR', 'FANTAMAR', 'FANTAUVA', 'KUAT', 'MULMRCA', 'SCHWEPPES', 'SCHWPSALE', 'SCHWPSORIG', 'SPRITE', 'SPRITE FRESH', 'SPRITE SEM', 'SPRITE ZERO']


In [5]:
import pandas as pd
import re
import numpy as np

# (Função clean_colname é necessária do Bloco 1)

# Carregar a aba Comercial
try:
    FILE_PATH = "data/dados.xlsx"
    SHEET_NAME_COM = "Comercial" 
    
    df_com_raw = pd.read_excel(FILE_PATH, sheet_name=SHEET_NAME_COM)
    
    # Limpar nomes das colunas e a coluna 'marca'
    df_com_clean = df_com_raw.copy()
    df_com_clean.columns = [clean_colname(c) for c in df_com_clean.columns]
    
    # Extrair marcas
    marcas_comercial = set(
        df_com_clean['marca']
        .astype(str)
        .str.strip()
        .str.upper()
        .str.replace(r"\s+", " ", regex=True)
        .unique()
    )
    
    print("\n--- 4. Marcas na Aba Comercial ---")
    print(f"Total de marcas na aba 'Comercial': {len(marcas_comercial)}")
    print(sorted(marcas_comercial))

except Exception as e:
    print(f"ERRO ao carregar 'Comercial': {e}")


--- 4. Marcas na Aba Comercial ---
Total de marcas na aba 'Comercial': 167
['120', '1906', '3 MEDALHAS', '7BELO', 'ABSOLUT', 'ADES FRUTA', 'ADES MAX', 'ADES ORIGI', 'ADES SEEDS', 'ALMA MORA', 'ALWAYS', 'AMOR', 'AMORAS', 'AMSTEL', 'APEROL', 'ARISCO', 'BAILEYS', 'BANANAS', 'BAVARIA', 'BEIJOS', "BELL'S", 'BICKENS', 'BIS EXTRA', 'BLACK AND', 'BORGES', 'BULLDOG', 'BURN', 'BUTT TOFFE', 'CAMPARI', 'CC', 'CC SEM AÇÚ', 'CC ZERO', 'CCLCAFF', 'CCLIGHT', 'CHALEAO', 'CHEEZ IT', 'CHICLE', 'CHICLETS', 'CINZANO', 'CLU SOCIAL', 'CRYSTAL', 'CRYSTAL SP', 'CYNAR', 'CÎROC', 'DENTADURA', 'DIAMANTNEG', 'DOW BRIS S', 'DOWNY BV', 'DOWNY LC', 'DREHER', 'DRURY´S', 'DV 100%', 'DV FRESH', 'DV FRUT', 'DV KAPO', 'DV MAIS', 'EISENBAHN', 'ELEFANTE', 'ESPOLON', 'ESTRELLAGA', 'FANTA', 'FINCAMORAS', 'FNTAZER', 'FRANGELICO', 'FRUITELLA', 'FUZEICETEA', "GILBEY'S", 'GOMESDAC', 'GORDON’S', 'GUARALEAO', 'GUARAPAN', 'HALLS', 'HEAD&SHOUL', 'HEINKEN', 'HELLMANNS', 'HOWLER HEA', 'I9', 'INTEN BRIS', 'INTOCABLES', 'JACK TENNE', 'J

In [3]:
import pandas as pd
import re
import numpy as np

# (Função clean_colname é necessária do Bloco 1)

# Carregar Elasticidade
try:
    FILE_PATH_ELAST = "data/Elasticidade_Envio.xlsx"
    df_elast_raw = pd.read_excel(FILE_PATH_ELAST)
    
    df_elast_clean = df_elast_raw.copy()
    df_elast_clean.columns = [clean_colname(c) for c in df_elast_clean.columns]
    
    # Extrair marcas
    marcas_elasticidade = set(
        df_elast_clean['marca']
        .astype(str)
        .str.strip()
        .str.upper()
        .str.replace(r"\s+", " ", regex=True)
        .unique()
    )

    print("\n--- 2. Marcas na Elasticidade ---")
    print(f"Total de marcas na Elasticidade: {len(marcas_elasticidade)}")
    print(sorted(marcas_elasticidade))

except Exception as e:
    print(f"ERRO ao carregar 'Elasticidade_Envio': {e}")


--- 2. Marcas na Elasticidade ---
Total de marcas na Elasticidade: 164
['120', '1906', '3 MEDALHAS', '7BELO', 'ABSOLUT', 'ADES FRUTA', 'ADES MAX', 'ADES ORIGI', 'ADES SEEDS', 'ALMA MORA', 'ALWAYS', 'AMOR', 'AMORAS', 'AMSTEL', 'APEROL', 'ARISCO', 'BAILEYS', 'BANANAS', 'BAVARIA', 'BEIJOS', "BELL'S", 'BICKENS', 'BIS EXTRA', 'BLACK AND', 'BORGES', 'BULLDOG', 'BURN', 'BUTT TOFFE', 'CAMPARI', 'CC', 'CC SEM AÇÚ', 'CC ZERO', 'CCLCAFF', 'CCLIGHT', 'CHALEAO', 'CHEEZ IT', 'CHICLE', 'CHICLETS', 'CINZANO', 'CLU SOCIAL', 'CRYSTAL', 'CRYSTAL SP', 'CYNAR', 'CÎROC', 'DENTADURA', 'DIAMANTNEG', 'DOW BRIS S', 'DOWNY BV', 'DOWNY LC', 'DREHER', 'DRURY´S', 'DV 100%', 'DV FRESH', 'DV FRUT', 'DV KAPO', 'DV MAIS', 'EISENBAHN', 'ELEFANTE', 'ESPOLON', 'ESTRELLAGA', 'FANTA', 'FINCAMORAS', 'FNTAZER', 'FRANGELICO', 'FRUITELLA', 'FUZEICETEA', "GILBEY'S", 'GOMESDAC', 'GORDON’S', 'GUARALEAO', 'GUARAPAN', 'HALLS', 'HEAD&SHOUL', 'HEINKEN', 'HELLMANNS', 'HOWLER HEA', 'I9', 'INTEN BRIS', 'INTOCABLES', 'JACK TENNE', 'JACKC

In [None]:
import pandas as pd
import re
import numpy as np

# Carregar Projeção
try:
    FILE_PATH = "data/dados.xlsx"
    SHEET_NAME_PROJ = "Projeção"
    
    df_proj_raw = pd.read_excel(FILE_PATH, sheet_name=SHEET_NAME_PROJ, header=3)
    
    # Renomear 'Marca' antes de limpar
    df_proj_clean = df_proj_raw.copy()
    
    # Extrair marcas
    marcas_projecao = set(
        df_proj_clean['Marca'] # Usar o nome de coluna original
        .astype(str)
        .str.strip()
        .str.upper()
        .str.replace(r"\s+", " ", regex=True)
        .replace("COCA-COLA", "CC") # Aplicar a regra que já conhecemos
        .unique()
    )

    print("\n--- 3. Marcas na Projeção de Volume ---")
    print(f"Total de marcas na Projeção: {len(marcas_projecao)}")
    print(sorted(marcas_projecao))

except Exception as e:
    print(f"ERRO ao carregar 'Projeção': {e}")


--- 3. Marcas na Projeção de Volume ---
Total de marcas na Projeção: 14
['CC', 'COCA-COLA CAFÉ', 'COCA-COLA LIGHT', 'COCA-COLA ZERO', 'FANTA', 'FANTA GUARANA', 'FANTA MARACUJA', 'FANTA TUTTI-FRUTTI', 'GUARAPAN', 'KUAT', 'SCHWEPPES', 'SCHWEPPES TONICA', 'SPRITE', 'SPRITE FRESH']


In [8]:
import pandas as pd
import re
import numpy as np

# Carregar a nova planilha de Projeção (com Território)
try:
    FILE_PATH_PROJ_TERR = "data/Projeção Vol UC com Territorio_Envio.xlsx"
    df_proj_terr_raw = pd.read_excel(FILE_PATH_PROJ_TERR)
    
    # Extrair marcas
    marcas_proj_territorio = set(
        df_proj_terr_raw['Marca'] # A coluna se chama 'Marca', como você disse
        .astype(str)
        .str.strip()
        .str.upper()
        .str.replace(r"\s+", " ", regex=True)
        .replace("COCA-COLA", "CC") # Aplicar a regra que já conhecemos
        .unique()
    )
    
    print("\n--- 5. Marcas na 'Projeção Vol UC com Territorio_Envio' ---")
    print(f"Total de marcas: {len(marcas_proj_territorio)}")
    print(sorted(marcas_proj_territorio))

except FileNotFoundError:
    print(f"ERRO: Arquivo '{FILE_PATH_PROJ_TERR}' não encontrado.")
except KeyError:
    # A CORREÇÃO ESTÁ AQUI (aspas fechadas)
    print(f"ERRO: A coluna 'Marca' não foi encontrada no arquivo '{FILE_PATH_PROJ_TERR}'.")
except Exception as e:
    print(f"ERRO ao carregar 'Projeção Vol UC com Territorio_Envio': {e}")


--- 5. Marcas na 'Projeção Vol UC com Territorio_Envio' ---
Total de marcas: 14
['CC', 'COCA-COLA CAFÉ', 'COCA-COLA LIGHT', 'COCA-COLA ZERO', 'FANTA', 'FANTA GUARANA', 'FANTA MARACUJA', 'FANTA TUTTI-FRUTTI', 'GUARAPAN', 'KUAT', 'SCHWEPPES', 'SCHWEPPES TONICA', 'SPRITE', 'SPRITE FRESH']


In [7]:
import pandas as pd
import re
import numpy as np

# Carregar a planilha 'Volume com regionais'
try:
    FILE_PATH_VOL_REG = "data/Volume com regionais.xlsx"
    df_vol_reg_raw = pd.read_excel(FILE_PATH_VOL_REG)
    
    # Extrair marcas
    marcas_vol_regionais = set(
        df_vol_reg_raw['Marca'] # A coluna se chama 'Marca'
        .astype(str)
        .str.strip()
        .str.upper()
        .str.replace(r"\s+", " ", regex=True)
        .replace("COCA-COLA", "CC") # Aplicar a regra que já conhecemos
        .unique()
    )
    
    print("\n--- 6. Marcas em 'Volume com regionais' ---")
    print(f"Total de marcas: {len(marcas_vol_regionais)}")
    print(sorted(marcas_vol_regionais))

except FileNotFoundError:
    print(f"ERRO: Arquivo '{FILE_PATH_VOL_REG}' não encontrado.")
except KeyError:
    print(f"ERRO: A coluna 'Marca' não foi encontrada no arquivo '{FILE_PATH_VOL_REG}'.")
except Exception as e:
    print(f"ERRO ao carregar 'Volume com regionais': {e}")


--- 6. Marcas em 'Volume com regionais' ---
Total de marcas: 167
['120', '1906', '3 MEDALHAS', '7BELO', 'ABSOLUT', 'ADES FRUTA', 'ADES MAX', 'ADES ORIGI', 'ADES SEEDS', 'ALMA MORA', 'ALWAYS', 'AMOR', 'AMORAS', 'AMSTEL', 'APEROL', 'ARISCO', 'BAILEYS', 'BANANAS', 'BAVARIA', 'BEIJOS', "BELL'S", 'BICKENS', 'BIS EXTRA', 'BLACK AND', 'BORGES', 'BULLDOG', 'BURN', 'BUTT TOFFE', 'CAMPARI', 'CC', 'CC SEM AÇÚ', 'CC ZERO', 'CCLCAFF', 'CCLIGHT', 'CHALEAO', 'CHEEZ IT', 'CHICLE', 'CHICLETS', 'CINZANO', 'CLU SOCIAL', 'CRYSTAL', 'CRYSTAL SP', 'CYNAR', 'CÎROC', 'DENTADURA', 'DIAMANTNEG', 'DOW BRIS S', 'DOWNY BV', 'DOWNY LC', 'DREHER', 'DRURY´S', 'DV 100%', 'DV FRESH', 'DV FRUT', 'DV KAPO', 'DV MAIS', 'EISENBAHN', 'ELEFANTE', 'ESPOLON', 'ESTRELLAGA', 'FANTA', 'FINCAMORAS', 'FNTAZER', 'FRANGELICO', 'FRUITELLA', 'FUZEICETEA', "GILBEY'S", 'GOMESDAC', 'GORDON’S', 'GUARALEAO', 'GUARAPAN', 'HALLS', 'HEAD&SHOUL', 'HEINKEN', 'HELLMANNS', 'HOWLER HEA', 'I9', 'INTEN BRIS', 'INTOCABLES', 'JACK TENNE', 'JACKCOKE', 

In [9]:
import pandas as pd

# (Este bloco assume que as variáveis dos Blocos 1-6
#  marcas_financeiro, marcas_comercial, marcas_elasticidade,
#  marcas_projecao, marcas_proj_territorio, marcas_vol_regionais
#  ...estão em memória)

# ===================================================================
print("--- Diagnóstico de 'De-Para' de Marcas (Alvo: Financeiro) ---")
# ===================================================================

print(f"\n1. ALVO: Marcas no 'Financeiro' (22)")
print("-------------------------------------------------")
print(sorted(marcas_financeiro))


# =Não é mais necessário, pois foi substituído por "Volume com regionais"
# print("\n2. Fonte: 'Comercial' (167 marcas)")
# print("-------------------------------------------------")
# diff_comercial = marcas_comercial - marcas_financeiro
# print(f"Marcas que estão no 'Comercial' mas NÃO no 'Financeiro': {len(diff_comercial)}")


print("\n2. Fonte: 'Elasticidade' (164 marcas)")
print("-------------------------------------------------")
diff_elasticidade = marcas_elasticidade - marcas_financeiro
# Limpar o "lixo" (não-refrigerantes) que já conhecemos
lixo_conhecido = {
    '120', '1906', '3 MEDALHAS', '7BELO', 'ABSOLUT', 'ADES FRUTA', 'ADES MAX', 
    'ADES ORIGI', 'ADES SEEDS', 'ALMA MORA', 'ALWAYS', 'AMOR', 'AMORAS', 'AMSTEL', 
    'APEROL', 'ARISCO', 'BAILEYS', 'BANANAS', 'BAVARIA', 'BEIJOS', "BELL'S", 
    'BICKENS', 'BIS EXTRA', 'BLACK AND', 'BORGES', 'BULLDOG', 'BURN', 'BUTT TOFFE', 
    'CAMPARI', 'CHALEAO', 'CHEEZ IT', 'CHICLE', 'CHICLETS', 'CINZANO', 
    'CLU SOCIAL', 'CRYSTAL', 'CRYSTAL SP', 'CYNAR', 'CÎROC', 'DENTADURA', 
    'DIAMANTNEG', 'DOW BRIS S', 'DOWNY BV', 'DOWNY LC', 'DREHER', 'DRURY´S', 
    'DV 100%', 'DV FRESH', 'DV FRUT', 'DV KAPO', 'DV MAIS', 'EISENBAHN', 
    'ELEFANTE', 'ESPOLON', 'ESTRELLAGA', 'FINCAMORAS', 'FRANGELICO', 'FRUITELLA', 
    'FUZEICETEA', "GILBEY'S", 'GOMESDAC', 'GORDON’S', 'GUARALEAO', 'HALLS', 
    'HEAD&SHOUL', 'HEINKEN', 'HELLMANNS', 'HOWLER HEA', 'I9', 'INTEN BRIS', 
    'INTOCABLES', 'JACK TENNE', 'JACKCOKE', 'JIM BEAM', 'JOHNWABL', 'JOHNWALBLN', 
    'JOHNWARL', 'JW GOLD', 'KAISER', 'KAPO', 'KETEL ONE', 'KNORR', 'LACTA', 
    'LAKA', 'LARIOS', 'LEMON DOU', 'LEÃO CHÁ V', 'LIEBFRULMI', 'LIZA', 'M.LEÃO', 
    'MAKERS MAR', 'MARIA', 'MARIANA', 'MARSHMALLO', 'MATH3', 'MENTOS', 'MINHOCAS', 
    'MONSTER', 'MÃE TERRA', 'NAN', 'NEGRONI', 'NÃO ATRIBUÍDO', 'OLD EIGHT', 
    'OLD PARR', 'ORAL B100%', 'ORAL-B', 'ORAL-B 123', 'OREO', 'OSPIC SRAY', 
    'OUR BRANCO', 'OUROBRANCO', 'PANTENE', 'PASTILHA', 'PETTIZ', 'PILAO', 
    'POMAROLA', 'PRESTOBA2', 'PRESTOBA3', 'PRINGLES', 'PROBAK', 'PWERADE', 
    'REIGN', 'SAGATIBA', 'SCHIN', 'SCHW MIXED', 'SKYY', 'SMIRNOFF', 'SMIRNOFF I', 
    'SMTWATR', 'SOL', 'SON VALSA', 'SONHOVALSA', 'SUCRILHOS', 'SUSTAGEN K', 
    'TANQUERAY', 'TARANTELLA', 'THEREZOPOL', 'TOPOCHI', 'TRIDENT', 'TUBES', 
    'TUBESAZEDI', 'TÍGER', 'URSINHOS', 'VENUS SIMP', 'VERDECAMPO', 'WHITE HORS', 
    'WILDTURKEY', 'YPIÓCA'
}
marcas_para_mapear_elast = diff_elasticidade - lixo_conhecido
print(f"Marcas RELEVANTES da 'Elasticidade' que precisam de 'De-Para': {len(marcas_para_mapear_elast)}")
print(f"   -> {sorted(marcas_para_mapear_elast)}")


print("\n3. Fonte: 'Projeção' (Aba) (14 marcas)")
print("-------------------------------------------------")
diff_proj_aba = marcas_projecao - marcas_financeiro
print(f"Marcas da 'Projeção (Aba)' que precisam de 'De-Para': {len(diff_proj_aba)}")
print(f"   -> {sorted(diff_proj_aba)}")


print("\n4. Fonte: 'Projeção Vol UC com Territorio' (14 marcas)")
print("-------------------------------------------------")
diff_proj_terr = marcas_proj_territorio - marcas_financeiro
print(f"Marcas da 'Projeção (Territorio)' que precisam de 'De-Para': {len(diff_proj_terr)}")
print(f"   -> {sorted(diff_proj_terr)}")


print("\n5. Fonte: 'Volume com regionais' (167 marcas)")
print("-------------------------------------------------")
diff_vol_reg = marcas_vol_regionais - marcas_financeiro
marcas_para_mapear_vol_reg = diff_vol_reg - lixo_conhecido # Reutilizando a lista de lixo
print(f"Marcas RELEVANTES do 'Volume com regionais' que precisam de 'De-Para': {len(marcas_para_mapear_vol_reg)}")
print(f"   -> {sorted(marcas_para_mapear_vol_reg)}")


# ===================================================================
print("\n--- 'De-Para' Combinado (O que precisamos mapear) ---")
# ===================================================================

# Juntar todas as marcas "problemáticas" que encontramos
marcas_a_mapear_total = (
    marcas_para_mapear_elast | 
    diff_proj_aba | 
    diff_proj_terr | 
    marcas_para_mapear_vol_reg
)

print(f"Total de marcas únicas (não-lixo) que precisam de 'De-Para': {len(marcas_a_mapear_total)}")
print(sorted(marcas_a_mapear_total))

--- Diagnóstico de 'De-Para' de Marcas (Alvo: Financeiro) ---

1. ALVO: Marcas no 'Financeiro' (22)
-------------------------------------------------
['CC', 'CC CAFE', 'CC IMPORT', 'CC MA IMPORT', 'CC MENOS AÇÚ', 'CC SEM AÇÚ', 'CC ZERO', 'CCLIGHT', 'FANTA', 'FANTA ZERO', 'FANTALAR', 'FANTAMAR', 'FANTAUVA', 'KUAT', 'MULMRCA', 'SCHWEPPES', 'SCHWPSALE', 'SCHWPSORIG', 'SPRITE', 'SPRITE FRESH', 'SPRITE SEM', 'SPRITE ZERO']

2. Fonte: 'Elasticidade' (164 marcas)
-------------------------------------------------
Marcas RELEVANTES da 'Elasticidade' que precisam de 'De-Para': 7
   -> ['CCLCAFF', 'FNTAZER', 'GUARAPAN', 'SCHWPS', 'SCHWPSL', 'SPRITE FRE', 'SPRTEZR']

3. Fonte: 'Projeção' (Aba) (14 marcas)
-------------------------------------------------
Marcas da 'Projeção (Aba)' que precisam de 'De-Para': 8
   -> ['COCA-COLA CAFÉ', 'COCA-COLA LIGHT', 'COCA-COLA ZERO', 'FANTA GUARANA', 'FANTA MARACUJA', 'FANTA TUTTI-FRUTTI', 'GUARAPAN', 'SCHWEPPES TONICA']

4. Fonte: 'Projeção Vol UC com Territor

In [10]:
import pandas as pd

print("--- Bloco 8: Auditoria de Cobertura de Marcas (Alvo: Financeiro) ---")

# 1. Definir o 'De-Para' (baseado na análise do Bloco 7)
# Este é o mapa de "tradução"
de_para_map = {
    # Mapeamentos Diretos
    'CCLCAFF': 'CC CAFE',
    'COCA-COLA CAFÉ': 'CC CAFE',
    'COCA-COLA LIGHT': 'CCLIGHT',
    'COCA-COLA ZERO': 'CC ZERO',
    'FNTAZER': 'FANTA ZERO',
    'FANTA MARACUJA': 'FANTAMAR',
    'FANTA TUTTI-FRUTTI': 'FANTALAR', # Mapeando para Laranja
    'SCHWPS': 'SCHWEPPES',
    'SCHWPSL': 'SCHWPSALE',
    'SPRITE FRE': 'SPRITE FRESH',
    'SPRTEZR': 'SPRITE ZERO',
    
    # Mapeamentos para Agrupar
    'FANTA GUARANA': 'FANTA', # Agrupar em FANTA
    'SCHWEPPES TONICA': 'SCHWEPPES', # Agrupar
    
    # Lixo a ser ignorado (mapear para None)
    'GUARAPAN': None,
    "M&M'S": None,
    'SNICKERS': None,
    'TWIX': None
}

# 2. Função de Harmonização
def harmonize_marcas(lista_marcas_sujas, mapa_de_para, lista_alvo):
    """
    Limpa uma lista de marcas:
    1. Mantém marcas que já estão no alvo (ex: 'CC').
    2. Traduz marcas que estão no mapa (ex: 'CCLCAFF' -> 'CC CAFE').
    3. Ignora o resto (lixo).
    """
    marcas_limpas = set()
    for marca in lista_marcas_sujas:
        if marca in lista_alvo:
            marcas_limpas.add(marca) # 1. Já está limpa
        elif marca in mapa_de_para:
            marca_traduzida = mapa_de_para[marca]
            if marca_traduzida: # 2. Traduz (ignora se for None)
                marcas_limpas.add(marca_traduzida)
        # 3. Se não está em nenhum, é lixo e será ignorada
    return marcas_limpas

# 3. Harmonizar todas as listas de origem
# (marcas_financeiro é o nosso conjunto "alvo")
marcas_elast_clean = harmonize_marcas(marcas_elasticidade, de_para_map, marcas_financeiro)
marcas_proj_clean = harmonize_marcas(marcas_projecao, de_para_map, marcas_financeiro)
marcas_proj_terr_clean = harmonize_marcas(marcas_proj_territorio, de_para_map, marcas_financeiro)
marcas_vol_reg_clean = harmonize_marcas(marcas_vol_regionais, de_para_map, marcas_financeiro)


# 4. Calcular as Marcas Faltantes (O que você pediu)
# (O que o Financeiro TEM que as outras fontes NÃO TÊM)
faltantes_elasticidade = marcas_financeiro - marcas_elast_clean
faltantes_projecao = marcas_financeiro - marcas_proj_clean
faltantes_proj_terr = marcas_financeiro - marcas_proj_terr_clean
faltantes_vol_regionais = marcas_financeiro - marcas_vol_reg_clean

# 5. Gerar o Relatório Auditável
print("\n--- Relatório de Marcas Faltantes (O que o 'Financeiro' tem que as outras fontes NÃO têm) ---")

print(f"\nMarcas-Alvo do Financeiro: {len(marcas_financeiro)}")

print("\n---------------------------------------------------------------")
print("Faltantes na 'Projeção (Aba)':")
print("---------------------------------------------------------------")
print(f"   -> {len(faltantes_projecao)} marcas do Financeiro estão faltando nesta fonte:")
print(f"   {sorted(faltantes_projecao)}")

print("\n---------------------------------------------------------------")
print("Faltantes na 'Projeção Vol UC com Territorio':")
print("---------------------------------------------------------------")
print(f"   -> {len(faltantes_proj_terr)} marcas do Financeiro estão faltando nesta fonte:")
print(f"   {sorted(faltantes_proj_terr)}")

print("\n---------------------------------------------------------------")
print("Faltantes na 'Elasticidade':")
print("---------------------------------------------------------------")
print(f"   -> {len(faltantes_elasticidade)} marcas do Financeiro estão faltando nesta fonte:")
print(f"   {sorted(faltantes_elasticidade)}")

print("\n---------------------------------------------------------------")
print("Faltantes no 'Volume com regionais':")
print("---------------------------------------------------------------")
print(f"   -> {len(faltantes_vol_regionais)} marcas do Financeiro estão faltando nesta fonte:")
print(f"   {sorted(faltantes_vol_regionais)}")

--- Bloco 8: Auditoria de Cobertura de Marcas (Alvo: Financeiro) ---

--- Relatório de Marcas Faltantes (O que o 'Financeiro' tem que as outras fontes NÃO têm) ---

Marcas-Alvo do Financeiro: 22

---------------------------------------------------------------
Faltantes na 'Projeção (Aba)':
---------------------------------------------------------------
   -> 11 marcas do Financeiro estão faltando nesta fonte:
   ['CC IMPORT', 'CC MA IMPORT', 'CC MENOS AÇÚ', 'CC SEM AÇÚ', 'FANTA ZERO', 'FANTAUVA', 'MULMRCA', 'SCHWPSALE', 'SCHWPSORIG', 'SPRITE SEM', 'SPRITE ZERO']

---------------------------------------------------------------
Faltantes na 'Projeção Vol UC com Territorio':
---------------------------------------------------------------
   -> 11 marcas do Financeiro estão faltando nesta fonte:
   ['CC IMPORT', 'CC MA IMPORT', 'CC MENOS AÇÚ', 'CC SEM AÇÚ', 'FANTA ZERO', 'FANTAUVA', 'MULMRCA', 'SCHWPSALE', 'SCHWPSORIG', 'SPRITE SEM', 'SPRITE ZERO']

----------------------------------------

Usando a aba Financeiro (com 22 marcas) como nossa "fonte da verdade", comparei todas as outras planilhas (Projeção, Elasticidade, Comercial) contra esta lista e criei um dicionário "De-Para" para traduzir 17 variações (ex: 'CCLCAFF' -> 'CC CAFE'). A descoberta mais importante é que nossos dados de Projeção Futura só fornecem volumes para 11 das 22 marcas-alvo, e nossos dados de Elasticidade só cobrem 15 das 22 (faltando 7).

Inicialmente disseram para juntar as Fantas, por exemplo. Mas se elas tiverem elasticidades diferentes, elas não podem ser juntas, certo?

Bom, o importante é achar esse de-para de marcas e checar regional antes de seguir.

In [None]:
import pandas as pd
import numpy as np

# 1. Definir o "De-Para" (com base na auditoria do Bloco 7)
de_para_map = {
    # Marcas a Mapear (Tradução Direta)
    'CCLCAFF': 'CC CAFE',
    'COCA-COLA CAFÉ': 'CC CAFE',
    'COCA-COLA LIGHT': 'CCLIGHT',
    'COCA-COLA ZERO': 'CC ZERO',
    'FNTAZER': 'FANTA ZERO',
    'FANTA MARACUJA': 'FANTAMAR',
    'FANTA TUTTI-FRUTTI': 'FANTALAR', # Palpite (Tutti-Frutti -> Laranja)
    'SCHWPS': 'SCHWEPPES',
    'SCHWPSL': 'SCHWPSALE',
    'SPRITE FRE': 'SPRITE FRESH',
    'SPRTEZR': 'SPRITE ZERO',
    
    # Marcas a Mapear (Agrupamento)
    'FANTA GUARANA': 'FANTA',
    'SCHWEPPES TONICA': 'SCHWEPPES',
    
    # Marcas a Ignorar (Lixo / Snacks)
    'GUARAPAN': None,
    "M&M'S": None,
    'SNICKERS': None,
    'TWIX': None
}

# 2. Transformar o dicionário em um DataFrame para visualização
map_list = list(de_para_map.items())

df_de_para = pd.DataFrame(map_list, columns=['Marca "Suja" (Origem)', 'Marca "Limpa" (Alvo no Financeiro)'])

# 3. Limpar a visualização (Substituir 'None' por 'IGNORAR')
df_de_para['Marca "Limpa" (Alvo no Financeiro)'] = \
    df_de_para['Marca "Limpa" (Alvo no Financeiro)'].fillna('IGNORAR (Lixo)')
    
# 4. Exibir a tabela final, ordenada para facilitar a leitura
print("--- Tabela 'De-Para' de Marcas (Auditável) ---")
display(
    df_de_para.sort_values(by=['Marca "Limpa" (Alvo no Financeiro)', 'Marca "Suja" (Origem)'])
)

--- Tabela 'De-Para' de Marcas (Auditável) ---


Unnamed: 0,"Marca ""Suja"" (Origem)","Marca ""Limpa"" (Alvo no Financeiro)"
0,CCLCAFF,CC CAFE
1,COCA-COLA CAFÉ,CC CAFE
3,COCA-COLA ZERO,CC ZERO
2,COCA-COLA LIGHT,CCLIGHT
11,FANTA GUARANA,FANTA
4,FNTAZER,FANTA ZERO
6,FANTA TUTTI-FRUTTI,FANTALAR
5,FANTA MARACUJA,FANTAMAR
13,GUARAPAN,IGNORAR (Lixo)
14,M&M'S,IGNORAR (Lixo)
