<a href="https://colab.research.google.com/github/movi-data/tratamento_base/blob/main/tratamento_base.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [3]:
import pandas as pd

# --- ETAPA 1: Carregar os arquivos ---
df_propostas = pd.read_csv("propostas.csv", sep=";", encoding="utf-8", low_memory=False)
df_lojas = pd.read_excel("de_para_loja.xlsx")
df_canais = pd.read_excel("de_para_canal.xlsx")

# --- ETAPA 2: Criar mapeamento Nome PDV -> Nome ajustado ---
mapa_nomes = dict(zip(df_lojas["Nome PDV"], df_lojas["Nome ajustado"]))

# --- ETAPA 3: Corrigir os nomes no df_propostas ---
df_propostas["Nome PDV"] = df_propostas["Nome PDV"].replace(mapa_nomes)

In [11]:

df_propostas.to_csv("propostas_ajustadas.csv",sep=";", index=False, encoding="utf-8")

In [None]:




# --- ETAPA 4: Excluir colunas erradas ---
df_propostas = df_propostas.drop(columns=["regiao", "Cidade", "UF", "CEP"])

# --- ETAPA 5: Criar merge com base no arquivo Lojas ---
df_lojas_unique = df_lojas.drop_duplicates(subset=["Nome PDV"], keep="first")

df_propostas = pd.merge(df_propostas, df_lojas_unique, on="Nome PDV", how="left")

# --- ETAPA 6: Criar mapeamento Canal -> De/Para nominal - De/Para Ajustado ---
mapa_canais = dict(zip(df_canais["Original"], df_canais["De/Para nominal"]))
mapa_canais_ajustado = dict(zip(df_canais["Original"], df_canais["De/Para Ajustado"]))

# --- ETAPA 7: Adicionar colunas De/Para nominal e De/Para Ajustado com base na coluna Canal ---
df_propostas["De/Para nominal"] = df_propostas["Canal"].replace(mapa_canais)
df_propostas["De/Para Ajustado"] = df_propostas["Canal"].replace(mapa_canais_ajustado)

# --- ETAPA 8: Criar mapeamento 1° atendimento ---
mapa_1atendimento = dict(zip(df_aux_central["Cod Assistente de Vendas"], df_aux_central["Projeto"]))

# --- ETAPA 8: Criar mapeamento Bot Abandonado ---
#mapa_bot_abandonado = dict(zip(df_bot["BOT"], df_bot["BOT Abandonado"]))

# --- ETAPA 9: Adicionar colunas 1° atendimento ---
df_propostas["1° ATENDIMENTO"] = df_propostas["ID do Assistente de Vendas"].replace(mapa_1atendimento)

# --- ETAPA 9: Adicionar coluna Bot Abandonado, se valor nulo preencher "-", senão "Bot abandonado"---
df_propostas["BOT Abandonado"] = df_propostas["tags"].apply(lambda x: "-" if pd.isna(x) else "Bot abandonado")

# --- ETAPA 10: Salvar o resultado ---
output_file = "propostas_ajustadas.csv"
df_propostas.to_csv(output_file, sep=";", index=False, encoding="utf-8")

# --- ETAPA 11: ---

print("Arquivo corrigido gerado:", output_file)

In [6]:
df_propostas.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 379664 entries, 0 to 379663
Data columns (total 37 columns):
 #   Column                            Non-Null Count   Dtype  
---  ------                            --------------   -----  
 0   ID Lead                           379664 non-null  int64  
 1   Data                              379664 non-null  object 
 2   Data ultima interação             379664 non-null  object 
 3   Nome PDV                          379664 non-null  object 
 4   CNPJ PDV                          379664 non-null  int64  
 5   Nome Cliente                      376320 non-null  object 
 6   Email Cliente                     235555 non-null  object 
 7   Telefone Cliente                  379415 non-null  object 
 8   CPF                               10160 non-null   float64
 9   Lead                              49330 non-null   object 
 10  Origem                            379664 non-null  object 
 11  Canal                             364936 non-null  o

In [None]:
#valores unicos na colune 'Nome PDV'
print(df_propostas['Nome PDV'].unique())

In [None]:
df_propostas.head()

In [None]:
# Relatorio checagem de leads

# --- ETAPA 1: Carregar arquivo(s) ---
df_propostas = pd.read_csv("propostas.csv", sep=";", encoding="utf-8", low_memory=False)

# --- ETAPA 2: Platafomas -  Criar colunas com base

df_plataformas = pd.DataFrame




In [None]:
import pandas as pd

# --- ETAPA 1: Carregar os arquivos ---
df_propostas = pd.read_csv("propostas.csv", sep=";", encoding="utf-8", low_memory=False)

In [None]:
# Tranformar 'Canal' em maiuscula
df_propostas['Canal'] = df_propostas['Canal'].str.upper()
# Filtrar o primeiro Canal na coluna 'Canal'
df_propostas['Canal'] = df_propostas['Canal'].str.split(',').str[0]

# Agrupar leads por mês na coluna 'Data ultima interação' e 'Canal'
leads_por_canal_mes = df_propostas.groupby([pd.to_datetime(df_propostas["Data ultima interação"], format="%d/%m/%Y", errors='coerce').dt.to_period("d"),
                                            "Canal"]).size().reset_index(name="Quantidade de Leads")
# Ordenar por 'Quantidade de Leads'
leads_por_canal_mes = leads_por_canal_mes.sort_values(by="Quantidade de Leads", ascending=False)

In [None]:
# Criar arquivo .csv
leads_por_canal_mes.to_csv("leads_por_canal_mes.csv",sep=";" ,index=False)

In [None]:
leads_por_canal_mes.head(30)

Unnamed: 0,Data ultima interação,Canal,Quantidade de Leads
1349,2025-09-16,INSTAGRAM,5497
1333,2025-09-15,INSTAGRAM,4780
728,2025-08-01,INSTAGRAM,3688
1359,2025-09-16,WHATSAPP,2690
1343,2025-09-15,WHATSAPP,2491
1291,2025-09-12,INSTAGRAM,2480
172,2025-06-17,INSTAGRAM,2369
161,2025-06-16,INSTAGRAM,2226
1306,2025-09-13,INSTAGRAM,2222
1236,2025-09-08,INSTAGRAM,2152


In [None]:
df_propostas.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 377389 entries, 0 to 377388
Data columns (total 37 columns):
 #   Column                            Non-Null Count   Dtype  
---  ------                            --------------   -----  
 0   ID Lead                           377389 non-null  int64  
 1   Data                              377389 non-null  object 
 2   Data ultima interação             377389 non-null  object 
 3   Nome PDV                          377389 non-null  object 
 4   CNPJ PDV                          377389 non-null  int64  
 5   Nome Cliente                      374063 non-null  object 
 6   Email Cliente                     234123 non-null  object 
 7   Telefone Cliente                  377143 non-null  object 
 8   CPF                               9959 non-null    float64
 9   Lead                              48927 non-null   object 
 10  Origem                            377389 non-null  object 
 11  Canal                             362677 non-null  o