# **Projeto "De olho nos dados"**

[Braian Fernandes](https://www.linkedin.com/in/braian-fernandes/)

---

# Contexto

**1.1 - TLDR**

- Dashboard:

  Google Data Studio [(link)](https://lookerstudio.google.com/reporting/ac271d3a-5f03-4b00-a49e-be5347b14f04);

- Processamento:

  Kaggle [(link)](https://www.kaggle.com/braianalex);

- Fonte:

  Corretores Camim [(link)](https://corretores.camim.com.br/);

**1.2 - Clínica Camim e o Corretores Camim**

A clínica Camim é uma empresa que trabalha no segmento ambulatorial de planos de saúde a mais de 45 anos. Possui 13 unidades espalhadas pela cidade do Rio de Janeiro e também na baixada fluminense. Oferece atendimento em diversas especialidades, tendo em média 70 mil consultas por mês.

Oferece estrutura moderna e profissionais qualificados para atendimento. E como qualquer empresa nesse setor, busca sempre se aperfeiçoar e aumentar sua base de clientes. Nesse sentido, foi criada uma plataforma digital voltada para atendimento online e por ligação, o Corretores Camim.

No Corretores Camim entram possíveis clientes de diversas formas, seja por ligação na central de atendimento, através do preenchimento de cadastro no site da Camim para informações sobre o plano, contato através do whatsapp da central de relacionamento, ou através das redes sociais.



**1.3 - leads**

A partir do momento que um possível cliente entra em contato e demonstra interesse, é criado um lead com suas principais informações: nome, telefone, e-mail, idade, bairro. Esse lead vai para a plataforma Corretores Camim, onde é direcionado para atendimento mais próximo de sua residência. Então o corretor da unidade designada entra em contato para passar as informação e buscar a conclusão do plano. Porém, nem todos que entram em contato aderem ao plano. Sendo assim, a plataforma oferece alguns Status para conclusão do lead:



*   Plano concluido
*   Ignora contato
*   Sem interesse
*   Vai na unidade
*   Em processo final



**1.4 - Objetivo**

O presente projeto visa analisar os leads fechados com cada desses status no ano de 2024 para apresentar um panaroma sobre eles. Sendo assim, o intuito é realizar uma análise exploratória de dados e apresentar indicadores como quantidades total de leads finalizados em cada status por mês, percentual de conversão para cada status e quantidade de dias que foram necessários para finalizar o lead em cada um desses status.

Com desses indicadores, podemos criar campanhas de vendas mais assertiva, como por exemplo direcionar mensagens oferecendo alguma condição especial para clientes que não demonstraram interesse no primeiro momento e estipular um prazo para essa campanha baseada na quantidade dias que leva para um lead ser finalizado com "Plano Concluido".

**2 - Importante as bibliotecas**

In [25]:
import pandas as pd
import numpy as np

**3 - Fazendo download do arquivo**

Para acessar o Corretores Camim é necessário ser funcionário. Por isso, deixarei o link da planilha exportada da plataforma com todos os leads finalizados de janeiro a novembro de 2024:

In [26]:
!wget --show-progress --continue -O ./lead_2024.xlsx "https://docs.google.com/spreadsheets/d/1KNXjcvD6SSfPQMLIOkXILJmGfb09dT0PGgIrimJGuhE/export?format=xlsx"

--2024-12-21 18:17:25--  https://docs.google.com/spreadsheets/d/1KNXjcvD6SSfPQMLIOkXILJmGfb09dT0PGgIrimJGuhE/export?format=xlsx
Resolving docs.google.com (docs.google.com)... 172.217.7.46, 2607:f8b0:4025:803::200e
Connecting to docs.google.com (docs.google.com)|172.217.7.46|:443... connected.
HTTP request sent, awaiting response... 307 Temporary Redirect
Location: https://doc-0s-10-sheets.googleusercontent.com/export/54bogvaave6cua4cdnls17ksc4/82ccist3v6e268ou2ppmggkb34/1734805045000/105181857868577854338/*/1KNXjcvD6SSfPQMLIOkXILJmGfb09dT0PGgIrimJGuhE?format=xlsx [following]
--2024-12-21 18:17:26--  https://doc-0s-10-sheets.googleusercontent.com/export/54bogvaave6cua4cdnls17ksc4/82ccist3v6e268ou2ppmggkb34/1734805045000/105181857868577854338/*/1KNXjcvD6SSfPQMLIOkXILJmGfb09dT0PGgIrimJGuhE?format=xlsx
Resolving doc-0s-10-sheets.googleusercontent.com (doc-0s-10-sheets.googleusercontent.com)... 172.217.15.225, 2607:f8b0:4025:802::2001
Connecting to doc-0s-10-sheets.googleusercontent.com (do

In [27]:
!file ./lead_2024.xlsx

./lead_2024.xlsx: Microsoft Excel 2007+


In [28]:
lead = pd.read_excel('/content/lead_2024.xlsx')
lead

Unnamed: 0,Cliente,Origem,Posto,Bairro,Data Entrada,Data Saída
0,Yan\nSem interesse\nRazão: Plano com internaçã...,Site,A,Anchieta,01/01/2024 às 02h58,PRESENCIAL - Braian - ANCHIETA\n12/01/2024 às ...
1,Katia Paula\nCliente Ignora o Contato\nRazão: ...,Site,A,Anchieta,01/01/2024 às 07h41,PRESENCIAL - Braian - ANCHIETA\n11/01/2024 às ...
2,Reinaldo Oliveira dos Santos\nCliente Ignora o...,Site,N,Nilopolis,01/01/2024 às 09h23,PRESENCIAL - Braian - ANCHIETA\n05/01/2024 às ...
3,Reinaldo\nEm processo final\nRazão: Outros,WhatsApp Central,N,Nilópolis,02/01/2024 às 10h23,PRESENCIAL - Braian - ANCHIETA\n02/01/2024 às ...
4,Alverina\nCliente Ignora o Contato\nRazão: Est...,Aplicativo Camim,A,Nova Iguaçu,02/01/2024 às 21h15,PRESENCIAL - Braian - ANCHIETA\n05/01/2024 às ...
...,...,...,...,...,...,...
701,Maria Fernanda de Paiva Guimarães\nPlano Concl...,Site,A,Guadalupe,24/11/2024 às 19h37,PRESENCIAL - Braian - ANCHIETA\n25/11/2024 às ...
702,UILES SACRAMENTO GAMA DE OLIVEIRA\nPlano Concl...,Matrícula cancelada F5 - Sistema Camim,A,,25/11/2024 às 13h06,PRESENCIAL - Braian - ANCHIETA\n03/12/2024 às ...
703,FISK\nPlano Concluído\nMatrícula: 138439A,Matrícula cancelada F5 - Sistema Camim,A,,25/11/2024 às 15h09,PRESENCIAL - Braian - ANCHIETA\n25/11/2024 às ...
704,Ana Lúcia Soares de Almeida\nPlano Concluído\n...,Site,A,Ricardo de Albuquerque,25/11/2024 às 22h59,PRESENCIAL - Braian - ANCHIETA\n28/11/2024 às ...


**4 - Exploração**

Primeiramente, vamos trabalhar em cima das colunas Cliente e Data Saída. O objetivo é separar o nome, status e a matrícula da coluna Cliente, e carregar essas informações em outras colunas com esses respectivos nomes:

In [29]:
def separar_nome_matricula(nome):
  partes = nome.split('\n')
  nome = partes[0]
  status = partes[1] if len(partes) > 1 else None
  matricula = None
  for parte in partes:
    if 'Matrícula' in parte:
      matricula = parte.split(':')[-1].strip()
      break
  return pd.Series([nome, status, matricula])

In [30]:
lead[['Nome', 'Status', 'Matrícula']] = lead['Cliente'].apply(separar_nome_matricula)
lead.head()

Unnamed: 0,Cliente,Origem,Posto,Bairro,Data Entrada,Data Saída,Nome,Status,Matrícula
0,Yan\nSem interesse\nRazão: Plano com internaçã...,Site,A,Anchieta,01/01/2024 às 02h58,PRESENCIAL - Braian - ANCHIETA\n12/01/2024 às ...,Yan,Sem interesse,
1,Katia Paula\nCliente Ignora o Contato\nRazão: ...,Site,A,Anchieta,01/01/2024 às 07h41,PRESENCIAL - Braian - ANCHIETA\n11/01/2024 às ...,Katia Paula,Cliente Ignora o Contato,
2,Reinaldo Oliveira dos Santos\nCliente Ignora o...,Site,N,Nilopolis,01/01/2024 às 09h23,PRESENCIAL - Braian - ANCHIETA\n05/01/2024 às ...,Reinaldo Oliveira dos Santos,Cliente Ignora o Contato,
3,Reinaldo\nEm processo final\nRazão: Outros,WhatsApp Central,N,Nilópolis,02/01/2024 às 10h23,PRESENCIAL - Braian - ANCHIETA\n02/01/2024 às ...,Reinaldo,Em processo final,
4,Alverina\nCliente Ignora o Contato\nRazão: Est...,Aplicativo Camim,A,Nova Iguaçu,02/01/2024 às 21h15,PRESENCIAL - Braian - ANCHIETA\n05/01/2024 às ...,Alverina,Cliente Ignora o Contato,


Da mesma forma, vamos trabalhar em cima da coluna Data Saída:

In [31]:
def dividir_corretor_data(corretor):
  partes = corretor.split('\n')
  vendedor = partes[0]
  data_fechamento = partes[1] if len(partes) > 1 else None
  return pd.Series([vendedor, data_fechamento])

In [32]:
lead[['Vendedor', 'Data Fechamento']] = lead['Data Saída'].apply(dividir_corretor_data)
lead.head()

Unnamed: 0,Cliente,Origem,Posto,Bairro,Data Entrada,Data Saída,Nome,Status,Matrícula,Vendedor,Data Fechamento
0,Yan\nSem interesse\nRazão: Plano com internaçã...,Site,A,Anchieta,01/01/2024 às 02h58,PRESENCIAL - Braian - ANCHIETA\n12/01/2024 às ...,Yan,Sem interesse,,PRESENCIAL - Braian - ANCHIETA,12/01/2024 às 15h03
1,Katia Paula\nCliente Ignora o Contato\nRazão: ...,Site,A,Anchieta,01/01/2024 às 07h41,PRESENCIAL - Braian - ANCHIETA\n11/01/2024 às ...,Katia Paula,Cliente Ignora o Contato,,PRESENCIAL - Braian - ANCHIETA,11/01/2024 às 10h57
2,Reinaldo Oliveira dos Santos\nCliente Ignora o...,Site,N,Nilopolis,01/01/2024 às 09h23,PRESENCIAL - Braian - ANCHIETA\n05/01/2024 às ...,Reinaldo Oliveira dos Santos,Cliente Ignora o Contato,,PRESENCIAL - Braian - ANCHIETA,05/01/2024 às 14h57
3,Reinaldo\nEm processo final\nRazão: Outros,WhatsApp Central,N,Nilópolis,02/01/2024 às 10h23,PRESENCIAL - Braian - ANCHIETA\n02/01/2024 às ...,Reinaldo,Em processo final,,PRESENCIAL - Braian - ANCHIETA,02/01/2024 às 10h36
4,Alverina\nCliente Ignora o Contato\nRazão: Est...,Aplicativo Camim,A,Nova Iguaçu,02/01/2024 às 21h15,PRESENCIAL - Braian - ANCHIETA\n05/01/2024 às ...,Alverina,Cliente Ignora o Contato,,PRESENCIAL - Braian - ANCHIETA,05/01/2024 às 14h58


Em seguida, vamos exluir as colunas Cliente, Data Saída e Vendedor(visto que todos esses leads pertencem a mesma pessoa). Além disso, vamos converter as colunas Data Entrada e Data Fechamento para o formato datetime. Asism, ficará mais facil de realizamos a análise da quantidade de dias para finalizar cada lead.

In [33]:
leads_nov = lead.drop(columns=['Cliente', 'Data Saída', 'Vendedor'])

leads_nov['Data Entrada'] = pd.to_datetime(leads_nov['Data Entrada'], format='%d/%m/%Y às %Hh%M', errors='coerce')
leads_nov['Data Fechamento'] = pd.to_datetime(leads_nov['Data Fechamento'], format='%d/%m/%Y às %Hh%M', errors='coerce')
leads_nov = leads_nov[['Nome', 'Status', 'Matrícula', 'Data Entrada', 'Data Fechamento', 'Origem', 'Posto', 'Bairro']]
leads_nov.head()

Unnamed: 0,Nome,Status,Matrícula,Data Entrada,Data Fechamento,Origem,Posto,Bairro
0,Yan,Sem interesse,,2024-01-01 02:58:00,2024-01-12 15:03:00,Site,A,Anchieta
1,Katia Paula,Cliente Ignora o Contato,,2024-01-01 07:41:00,2024-01-11 10:57:00,Site,A,Anchieta
2,Reinaldo Oliveira dos Santos,Cliente Ignora o Contato,,2024-01-01 09:23:00,2024-01-05 14:57:00,Site,N,Nilopolis
3,Reinaldo,Em processo final,,2024-01-02 10:23:00,2024-01-02 10:36:00,WhatsApp Central,N,Nilópolis
4,Alverina,Cliente Ignora o Contato,,2024-01-02 21:15:00,2024-01-05 14:58:00,Aplicativo Camim,A,Nova Iguaçu


A partir da data de entrada, vamos criar duas colunas temporais(mês e ano) para utilizarmos nos filtros do dashboard:

In [34]:
leads_nov['Mês'] = leads_nov['Data Entrada'].apply(lambda data: data.strftime('%Y-%m'))
leads_nov['Ano'] = leads_nov['Data Entrada'].apply(lambda data: data.strftime('%Y'))
leads_nov.head()

Unnamed: 0,Nome,Status,Matrícula,Data Entrada,Data Fechamento,Origem,Posto,Bairro,Mês,Ano
0,Yan,Sem interesse,,2024-01-01 02:58:00,2024-01-12 15:03:00,Site,A,Anchieta,2024-01,2024
1,Katia Paula,Cliente Ignora o Contato,,2024-01-01 07:41:00,2024-01-11 10:57:00,Site,A,Anchieta,2024-01,2024
2,Reinaldo Oliveira dos Santos,Cliente Ignora o Contato,,2024-01-01 09:23:00,2024-01-05 14:57:00,Site,N,Nilopolis,2024-01,2024
3,Reinaldo,Em processo final,,2024-01-02 10:23:00,2024-01-02 10:36:00,WhatsApp Central,N,Nilópolis,2024-01,2024
4,Alverina,Cliente Ignora o Contato,,2024-01-02 21:15:00,2024-01-05 14:58:00,Aplicativo Camim,A,Nova Iguaçu,2024-01,2024


In [35]:
leads_nov.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 706 entries, 0 to 705
Data columns (total 10 columns):
 #   Column           Non-Null Count  Dtype         
---  ------           --------------  -----         
 0   Nome             706 non-null    object        
 1   Status           706 non-null    object        
 2   Matrícula        100 non-null    object        
 3   Data Entrada     706 non-null    datetime64[ns]
 4   Data Fechamento  706 non-null    datetime64[ns]
 5   Origem           706 non-null    object        
 6   Posto            706 non-null    object        
 7   Bairro           566 non-null    object        
 8   Mês              706 non-null    object        
 9   Ano              706 non-null    object        
dtypes: datetime64[ns](2), object(8)
memory usage: 55.3+ KB


Vamos filtrar a coluna Status e contar a quantidade de leads finalizados:

In [36]:
leads_nov['Status'].value_counts()

Unnamed: 0_level_0,count
Status,Unnamed: 1_level_1
Cliente Ignora o Contato,380
Sem interesse,159
Plano Concluído,119
Em processo final,32
Vai na unidade,15
NÃO ATENDEU,1


Para finalizar essa parte exploratória, vamos criar algumas colunas com os nomes de cada status, utilizar a função lambda para quando o valor da coluna corresponder ao valor desse status, na coluna status, retornar 1. Quando não, retornar 0.

Isso nos ajudará a quantificar melhor os valores e gerar métricar em cima disso.

In [37]:
leads_nov['Ignora Contato'] = leads_nov['Status'].apply(lambda status: 1 if status == 'Cliente Ignora o Contato' else 0)
leads_nov['Plano Concluido'] = leads_nov['Status'].apply(lambda status: 1 if status == 'Plano Concluído' else 0)
leads_nov['Em processo final'] = leads_nov['Status'].apply(lambda status: 1 if status == 'Em processo final' else 0)
leads_nov['Vai na unidade'] = leads_nov['Status'].apply(lambda status: 1 if status == 'Vai na unidade' else 0)
leads_nov['NÃO ATENDEU'] = leads_nov['Status'].apply(lambda status: 1 if status == 'NÃO ATENDEU' else 0)
leads_nov['Sem interesse'] = leads_nov['Status'].apply(lambda status: 1 if status == 'Sem interesse' else 0)
leads_nov

Unnamed: 0,Nome,Status,Matrícula,Data Entrada,Data Fechamento,Origem,Posto,Bairro,Mês,Ano,Ignora Contato,Plano Concluido,Em processo final,Vai na unidade,NÃO ATENDEU,Sem interesse
0,Yan,Sem interesse,,2024-01-01 02:58:00,2024-01-12 15:03:00,Site,A,Anchieta,2024-01,2024,0,0,0,0,0,1
1,Katia Paula,Cliente Ignora o Contato,,2024-01-01 07:41:00,2024-01-11 10:57:00,Site,A,Anchieta,2024-01,2024,1,0,0,0,0,0
2,Reinaldo Oliveira dos Santos,Cliente Ignora o Contato,,2024-01-01 09:23:00,2024-01-05 14:57:00,Site,N,Nilopolis,2024-01,2024,1,0,0,0,0,0
3,Reinaldo,Em processo final,,2024-01-02 10:23:00,2024-01-02 10:36:00,WhatsApp Central,N,Nilópolis,2024-01,2024,0,0,1,0,0,0
4,Alverina,Cliente Ignora o Contato,,2024-01-02 21:15:00,2024-01-05 14:58:00,Aplicativo Camim,A,Nova Iguaçu,2024-01,2024,1,0,0,0,0,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
701,Maria Fernanda de Paiva Guimarães,Plano Concluído,302393A,2024-11-24 19:37:00,2024-11-25 14:34:00,Site,A,Guadalupe,2024-11,2024,0,1,0,0,0,0
702,UILES SACRAMENTO GAMA DE OLIVEIRA,Plano Concluído,302451A,2024-11-25 13:06:00,2024-12-03 16:12:00,Matrícula cancelada F5 - Sistema Camim,A,,2024-11,2024,0,1,0,0,0,0
703,FISK,Plano Concluído,138439A,2024-11-25 15:09:00,2024-11-25 16:25:00,Matrícula cancelada F5 - Sistema Camim,A,,2024-11,2024,0,1,0,0,0,0
704,Ana Lúcia Soares de Almeida,Plano Concluído,302408A,2024-11-25 22:59:00,2024-11-28 11:22:00,Site,A,Ricardo de Albuquerque,2024-11,2024,0,1,0,0,0,0


In [38]:
leads_nov.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 706 entries, 0 to 705
Data columns (total 16 columns):
 #   Column             Non-Null Count  Dtype         
---  ------             --------------  -----         
 0   Nome               706 non-null    object        
 1   Status             706 non-null    object        
 2   Matrícula          100 non-null    object        
 3   Data Entrada       706 non-null    datetime64[ns]
 4   Data Fechamento    706 non-null    datetime64[ns]
 5   Origem             706 non-null    object        
 6   Posto              706 non-null    object        
 7   Bairro             566 non-null    object        
 8   Mês                706 non-null    object        
 9   Ano                706 non-null    object        
 10  Ignora Contato     706 non-null    int64         
 11  Plano Concluido    706 non-null    int64         
 12  Em processo final  706 non-null    int64         
 13  Vai na unidade     706 non-null    int64         
 14  NÃO ATENDE

**5 - Manipulação**

Agora, vamos para a manipulação dos dados. Em um novo DataFrame, vamos selecionar as colunas de interesse e criar a coluna "Tempo para conclusão". Nela, vamos calcular o tempo percorrido para finalização de todos os leads.

In [39]:
lead_final = leads_nov[['Status', 'Data Entrada', 'Data Fechamento', 'Mês', 'Ano', 'Ignora Contato', 'Plano Concluido', 'Em processo final', 'Vai na unidade', 'Sem interesse', 'NÃO ATENDEU']]
lead_final['Tempo para Conclusão'] = (lead_final['Data Fechamento']-lead_final['Data Entrada'])
lead_final = lead_final[['Mês', 'Ano', 'Status', 'Data Entrada', 'Data Fechamento', 'Tempo para Conclusão', 'Ignora Contato', 'Plano Concluido', 'Em processo final', 'Vai na unidade', 'Sem interesse', 'NÃO ATENDEU']]
lead_final

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  lead_final['Tempo para Conclusão'] = (lead_final['Data Fechamento']-lead_final['Data Entrada'])


Unnamed: 0,Mês,Ano,Status,Data Entrada,Data Fechamento,Tempo para Conclusão,Ignora Contato,Plano Concluido,Em processo final,Vai na unidade,Sem interesse,NÃO ATENDEU
0,2024-01,2024,Sem interesse,2024-01-01 02:58:00,2024-01-12 15:03:00,11 days 12:05:00,0,0,0,0,1,0
1,2024-01,2024,Cliente Ignora o Contato,2024-01-01 07:41:00,2024-01-11 10:57:00,10 days 03:16:00,1,0,0,0,0,0
2,2024-01,2024,Cliente Ignora o Contato,2024-01-01 09:23:00,2024-01-05 14:57:00,4 days 05:34:00,1,0,0,0,0,0
3,2024-01,2024,Em processo final,2024-01-02 10:23:00,2024-01-02 10:36:00,0 days 00:13:00,0,0,1,0,0,0
4,2024-01,2024,Cliente Ignora o Contato,2024-01-02 21:15:00,2024-01-05 14:58:00,2 days 17:43:00,1,0,0,0,0,0
...,...,...,...,...,...,...,...,...,...,...,...,...
701,2024-11,2024,Plano Concluído,2024-11-24 19:37:00,2024-11-25 14:34:00,0 days 18:57:00,0,1,0,0,0,0
702,2024-11,2024,Plano Concluído,2024-11-25 13:06:00,2024-12-03 16:12:00,8 days 03:06:00,0,1,0,0,0,0
703,2024-11,2024,Plano Concluído,2024-11-25 15:09:00,2024-11-25 16:25:00,0 days 01:16:00,0,1,0,0,0,0
704,2024-11,2024,Plano Concluído,2024-11-25 22:59:00,2024-11-28 11:22:00,2 days 12:23:00,0,1,0,0,0,0


In [40]:
lead_final.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 706 entries, 0 to 705
Data columns (total 12 columns):
 #   Column                Non-Null Count  Dtype          
---  ------                --------------  -----          
 0   Mês                   706 non-null    object         
 1   Ano                   706 non-null    object         
 2   Status                706 non-null    object         
 3   Data Entrada          706 non-null    datetime64[ns] 
 4   Data Fechamento       706 non-null    datetime64[ns] 
 5   Tempo para Conclusão  706 non-null    timedelta64[ns]
 6   Ignora Contato        706 non-null    int64          
 7   Plano Concluido       706 non-null    int64          
 8   Em processo final     706 non-null    int64          
 9   Vai na unidade        706 non-null    int64          
 10  Sem interesse         706 non-null    int64          
 11  NÃO ATENDEU           706 non-null    int64          
dtypes: datetime64[ns](2), int64(6), object(3), timedelta64[ns](1)
me

Com essa parte finalizada, vamos agrupar as informações sobre representação percentual, quantidade total e tempo para conclusão de cada um dos status nos meses de janeiro a novembro de 2024.

In [41]:
dados_ignora_contato = pd.DataFrame()
dados_ignora_contato['Ignora Contato Percentual'] = lead_final[['Mês', 'Ignora Contato']].groupby('Mês').agg('mean')
dados_ignora_contato['Total Ignora Contato'] = lead_final[['Mês', 'Ignora Contato']].groupby('Mês').agg('sum')
ignora_contato = lead_final.query("`Ignora Contato` == 1")
dados_ignora_contato['Tempo para conclusão'] = ignora_contato.groupby('Mês')['Tempo para Conclusão'].mean()
dados_ignora_contato['Tempo para conclusão'] = dados_ignora_contato['Tempo para conclusão'].dt.days
dados_ignora_contato

Unnamed: 0_level_0,Ignora Contato Percentual,Total Ignora Contato,Tempo para conclusão
Mês,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2024-01,0.593407,54,17
2024-02,0.527027,39,18
2024-03,0.4625,37,24
2024-04,0.561404,32,14
2024-05,0.363636,36,23
2024-06,0.75,21,15
2024-07,0.55,11,27
2024-08,0.571429,20,18
2024-09,0.571429,44,11
2024-10,0.586207,34,14


In [42]:
dados_plano_concluido = pd.DataFrame()
dados_plano_concluido['Plano Concluido Percentual'] = lead_final[['Mês', 'Plano Concluido']].groupby('Mês').agg('mean')
dados_plano_concluido['Total Plano Concluido'] = lead_final[['Mês', 'Plano Concluido']].groupby('Mês').agg('sum')
plano_concluido = lead_final.query("`Plano Concluido` == 1")
dados_plano_concluido['Tempo para conclusão'] = plano_concluido.groupby('Mês')['Tempo para Conclusão'].mean()
dados_plano_concluido['Tempo para conclusão'] = dados_plano_concluido['Tempo para conclusão'].dt.days
dados_plano_concluido

Unnamed: 0_level_0,Plano Concluido Percentual,Total Plano Concluido,Tempo para conclusão
Mês,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2024-01,0.21978,20,4
2024-02,0.175676,13,10
2024-03,0.1625,13,2
2024-04,0.157895,9,3
2024-05,0.181818,18,4
2024-06,0.035714,1,3
2024-07,0.2,4,1
2024-08,0.171429,6,1
2024-09,0.103896,8,5
2024-10,0.189655,11,6


In [43]:
dados_sem_interesse = pd.DataFrame()
dados_sem_interesse['Sem Interesse Percentual'] = lead_final[['Mês', 'Sem interesse']].groupby('Mês').agg('mean')
dados_sem_interesse['Total Sem Interesse'] = lead_final[['Mês', 'Sem interesse']].groupby('Mês').agg('sum')
sem_interesse = lead_final.query("`Sem interesse` == 1")
dados_sem_interesse['Tempo para conclusão'] = sem_interesse.groupby('Mês')['Tempo para Conclusão'].mean()
dados_sem_interesse['Tempo para conclusão'] = dados_sem_interesse['Tempo para conclusão'].dt.days
dados_sem_interesse

Unnamed: 0_level_0,Sem Interesse Percentual,Total Sem Interesse,Tempo para conclusão
Mês,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2024-01,0.120879,11,15
2024-02,0.216216,16,19
2024-03,0.2875,23,16
2024-04,0.263158,15,20
2024-05,0.424242,42,7
2024-06,0.142857,4,26
2024-07,0.25,5,7
2024-08,0.2,7,15
2024-09,0.25974,20,14
2024-10,0.051724,3,13


In [44]:
dados_vai_na_unidade = pd.DataFrame()
dados_vai_na_unidade['Vai na unidade Percentual'] = lead_final[['Mês', 'Vai na unidade']].groupby('Mês').agg('mean')
dados_vai_na_unidade['Total Vai na unidade'] = lead_final[['Mês', 'Vai na unidade']].groupby('Mês').agg('sum')
vai_na_unidade = lead_final.query("`Vai na unidade` == 1")
dados_vai_na_unidade['Tempo para conclusão'] = vai_na_unidade.groupby('Mês')['Tempo para Conclusão'].mean()
dados_vai_na_unidade['Tempo para conclusão'] = dados_vai_na_unidade['Tempo para conclusão'].dt.days
dados_vai_na_unidade.fillna(0, inplace=True)
dados_vai_na_unidade

Unnamed: 0_level_0,Vai na unidade Percentual,Total Vai na unidade,Tempo para conclusão
Mês,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2024-01,0.021978,2,23.0
2024-02,0.054054,4,27.0
2024-03,0.025,2,13.0
2024-04,0.017544,1,9.0
2024-05,0.010101,1,19.0
2024-06,0.0,0,0.0
2024-07,0.0,0,0.0
2024-08,0.0,0,0.0
2024-09,0.012987,1,0.0
2024-10,0.051724,3,9.0


In [45]:
dados_processo_final = pd.DataFrame()
dados_processo_final['Processo final Percentual'] = lead_final[['Mês', 'Em processo final']].groupby('Mês').agg('mean')
dados_processo_final['Total processo final'] = lead_final[['Mês', 'Em processo final']].groupby('Mês').agg('sum')
processo_final = lead_final.query("`Em processo final` == 1")
dados_processo_final['Tempo para conclusão'] = processo_final.groupby('Mês')['Tempo para Conclusão'].mean()
dados_processo_final['Tempo para conclusão'] = dados_processo_final['Tempo para conclusão'].dt.days
dados_processo_final.fillna(0, inplace=True)
dados_processo_final

Unnamed: 0_level_0,Processo final Percentual,Total processo final,Tempo para conclusão
Mês,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2024-01,0.043956,4,1.0
2024-02,0.027027,2,0.0
2024-03,0.0625,5,1.0
2024-04,0.0,0,0.0
2024-05,0.020202,2,0.0
2024-06,0.071429,2,0.0
2024-07,0.0,0,0.0
2024-08,0.057143,2,0.0
2024-09,0.051948,4,1.0
2024-10,0.103448,6,9.0


**6 - Salvando as informações**

Vamos salvar cada uma das informações geradas em um arquivo .csv:

In [None]:
leads_nov.to_csv('leads_nov.csv', sep=',', index=False)

In [None]:
dados_ignora_contato.to_csv('dados_ignora_contato.csv', sep=',', index=True)

In [None]:
dados_plano_concluido.to_csv('dados_plano_concluido.csv', sep=',', index=True)

In [None]:
dados_sem_interesse.to_csv('dados_sem_interesse.csv', sep=',', index=True)

In [None]:
dados_vai_na_unidade.to_csv('dados_vai_na_unidade.csv', sep=',', index=True)

In [None]:
dados_processo_final.to_csv('dados_processo_final.csv', sep=',', index=True)