# Análise de Dados de Marketing



## **Introdução**

### **O que é o funil de Vendas?**

Um funil de marketing, também conhecido como funil de vendas, é um conceito amplamente utilizado no marketing e nas estratégias de vendas para representar o processo pelo qual os potenciais clientes (prospects) avançam desde o primeiro contato com uma empresa até a conversão em clientes pagantes. Ele é chamado de "funil" porque, visualmente, a forma do processo se assemelha a um funil, com uma ampla abertura na parte superior e uma estreita na parte inferior.

O funil de marketing é dividido em várias etapas que representam a jornada do cliente, e cada etapa tem um propósito específico:

**Topo do Funil** - Nesta fase, os prospects estão na fase inicial de descoberta.

**Meio do Funil** - No meio do funil, os prospects estão considerando ativamente a oferta da empresa.

**Fundo do Funil** - O fundo do funil é onde os prospects estão mais próximos da decisão de compra.

![](https://sitetray.s3.amazonaws.com/wp-content/uploads/sites/2/2017/03/funil-de-vendas.png)


### **Porque é importante endender o funil de uma empresa?**


Com o funil de marketing, é possível segmentar o público-alvo e entender as necessidades dele em cada momento da jornada de compra. Assim, a partir dessas informações podemos criar conteúdos específicos para ajudar o cliente a avançar nas etapas visando a aderencia do possível cliente a um produto ou serviço.


### **Objetivos do projeto**

Esse projeto visa compreender os aspctos gerais do funil Olist e avaliar os desempenho de cada etapa, proporcionando mais informação sobre o fluxo seguido pelos vendedores interessadas nos serviços prestados pela empresa.

### **Funil Olist**

Um vendedor se junta ao Olist por meio de um funil de marketing e vendas que foi divulgado neste conjunto de dados. Descrição das etapas:

1. Inscrição em uma landing page.
2. Contato com um Representante de Desenvolvimento de Vendas (SDR), para confirma algumas informações e agende uma consultoria.
3. A consultoria é feita por um Representante Comercial (SR). O SR pode fechar o negócio (lead sing up) ou perder o negócio (led sai sem login)
4. Lead se torna vendedor e começa a construir seu catálogo no Olist.
5. Publicação de produtos em marketplaces.

## **Sobre os dados**

O conjunto de dados apresenta o funil de marketing de vendedores que preencheram solicitações de contato para vender seus produtos na Olist Store. O conjunto de dados contém informações de 8 mil Leads Qualificados de Marketing (MQLs) que solicitaram contato entre 1º de junho de 2017 e 1º de junho de 2018. Eles foram amostrados aleatoriamente do total de MQLs.

O dados utilizados foram dispnibilizados publicamente pela Olist, na platafomra Kaggle em:

[Marketing Funnel by Olist](https://www.kaggle.com/datasets/olistbr/marketing-funnel-olist/data).


### **Leads qualificados de marketing**

> Após um lead preencher um formulário em uma landing page, é feito um filtro para selecionar aqueles que estão qualificados para vender seus produtos no Olist. Eles são os Leads Qualificados de Marketing (MQLs).

```olist_marketing_qualified_leads_dataset.csv```


- **mql_id:** ID do MQL (Marketing Qualified Lead)
- **first_contact_date:** Data do primeiro contato
- **landing_page_id:** ID da página de destino onde o lead foi adquirido
- **origin:** Tipo de mídia onde o lead foi adquirido



### **Conjunto de dados de negócios fechados**

> Depois que um lead qualificado preenche um formulário em uma landing page, ele é contatado por um Representante de Desenvolvimento de Vendas. Nesta etapa algumas informações são verificadas e mais informações sobre o lead são coletadas.

```olist_closed_deals_dataset.csv```

- **mql_id:** ID do MQL (Marketing Qualified Lead)
- **seller_id:** ID do vendedor
- **sdr_id:** ID do SDR (Sales Development Representative)
- **sr_id:** ID do SR (Sales Representative)
- **won_date:** Data de fechamento da venda
- **business_segment:** Segmento de negócios
- **lead_type:** Tipo de lead
- **lead_behaviour_profile:** Perfil de comportamento do lead
- **has_company:** Possui empresa (documentação formal)?
- **has_gtin:** Possui GTIN (Global Trade Item Number), código de barras, para seus produtos?
- **average_stock:** Estoque médio
- **business_type:** Tipo de negócio
- **declared_product_catalog_size:** Tamanho declarado do catálogo de produtos
- **declared_monthly_revenue:** Receita mensal declarada

## **Perguntas para análise**



Origem e Qualidade dos Leads:

- Quais são as principais origens de leads que se convertem em vendas?
- Quais origens têm a maior taxa de conversão?
- Existem origens que geram leads de maior qualidade em termos de receita?


Estratégias de Otimização:

- Com base nos insights obtidos, quais ações específicas podemos tomar para melhorar a aquisição de clientes e o desempenho de vendas?
- Como podemos refinar nossas estratégias de marketing e vendas para maximizar a conversão e a receita?
- Quais métricas-chave devemos monitorar continuamente para avaliar o sucesso das estratégias implementadas?

## **Preparação do ambiente**

In [89]:
# Resource imports
import pandas as pd

In [90]:
# Importing MQL (Marketing Qualified Lead) dataser
mql_df = pd.read_csv('/content/olist_marketing_qualified_leads_dataset.csv')
mql_df.head(3)

Unnamed: 0,mql_id,first_contact_date,landing_page_id,origin
0,dac32acd4db4c29c230538b72f8dd87d,2018-02-01,88740e65d5d6b056e0cda098e1ea6313,social
1,8c18d1de7f67e60dbd64e3c07d7e9d5d,2017-10-20,007f9098284a86ee80ddeb25d53e0af8,paid_search
2,b4bc852d233dfefc5131f593b538befa,2018-03-22,a7982125ff7aa3b2054c6e44f9d28522,organic_search


In [91]:
# Importing closed deals dataset
cd_df = pd.read_csv('/content/olist_closed_deals_dataset.csv')
cd_df.head(3)

Unnamed: 0,mql_id,seller_id,sdr_id,sr_id,won_date,business_segment,lead_type,lead_behaviour_profile,has_company,has_gtin,average_stock,business_type,declared_product_catalog_size,declared_monthly_revenue
0,5420aad7fec3549a85876ba1c529bd84,2c43fb513632d29b3b58df74816f1b06,a8387c01a09e99ce014107505b92388c,4ef15afb4b2723d8f3d81e51ec7afefe,2018-02-26 19:58:54,pet,online_medium,cat,,,,reseller,,0.0
1,a555fb36b9368110ede0f043dfc3b9a0,bbb7d7893a450660432ea6652310ebb7,09285259593c61296eef10c734121d5b,d3d1e91a157ea7f90548eef82f1955e3,2018-05-08 20:17:59,car_accessories,industry,eagle,,,,reseller,,0.0
2,327174d3648a2d047e8940d7d15204ca,612170e34b97004b3ba37eae81836b4c,b90f87164b5f8c2cfa5c8572834dbe3f,6565aa9ce3178a5caf6171827af3a9ba,2018-06-05 17:27:23,home_appliances,online_big,cat,,,,reseller,,0.0


## **Tratamento dos dados**

Unindo os datasets

In [92]:
# Merging the datas
merged_df = mql_df.merge(cd_df, on=["mql_id"], how="inner")
merged_df.head(2)

Unnamed: 0,mql_id,first_contact_date,landing_page_id,origin,seller_id,sdr_id,sr_id,won_date,business_segment,lead_type,lead_behaviour_profile,has_company,has_gtin,average_stock,business_type,declared_product_catalog_size,declared_monthly_revenue
0,5420aad7fec3549a85876ba1c529bd84,2018-02-21,b48ec5f3b04e9068441002a19df93c6c,organic_search,2c43fb513632d29b3b58df74816f1b06,a8387c01a09e99ce014107505b92388c,4ef15afb4b2723d8f3d81e51ec7afefe,2018-02-26 19:58:54,pet,online_medium,cat,,,,reseller,,0.0
1,a555fb36b9368110ede0f043dfc3b9a0,2018-04-04,2f08471dfb83baef522f952438a36f6e,referral,bbb7d7893a450660432ea6652310ebb7,09285259593c61296eef10c734121d5b,d3d1e91a157ea7f90548eef82f1955e3,2018-05-08 20:17:59,car_accessories,industry,eagle,,,,reseller,,0.0


In [93]:
merged_df.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 842 entries, 0 to 841
Data columns (total 17 columns):
 #   Column                         Non-Null Count  Dtype  
---  ------                         --------------  -----  
 0   mql_id                         842 non-null    object 
 1   first_contact_date             842 non-null    object 
 2   landing_page_id                842 non-null    object 
 3   origin                         828 non-null    object 
 4   seller_id                      842 non-null    object 
 5   sdr_id                         842 non-null    object 
 6   sr_id                          842 non-null    object 
 7   won_date                       842 non-null    object 
 8   business_segment               841 non-null    object 
 9   lead_type                      836 non-null    object 
 10  lead_behaviour_profile         665 non-null    object 
 11  has_company                    63 non-null     object 
 12  has_gtin                       64 non-null     obj

Tratamento de nulos

In [94]:
merged_df.isnull().sum()

mql_id                             0
first_contact_date                 0
landing_page_id                    0
origin                            14
seller_id                          0
sdr_id                             0
sr_id                              0
won_date                           0
business_segment                   1
lead_type                          6
lead_behaviour_profile           177
has_company                      779
has_gtin                         778
average_stock                    776
business_type                     10
declared_product_catalog_size    773
declared_monthly_revenue           0
dtype: int64

In [95]:
def CalculaNulos(coluna):
    nulos = merged_df[coluna].isnull().sum()
    total_nulos = merged_df[coluna].count() + nulos
    porcentagem_nulos = (nulos / total_nulos) * 100

    print(f'Coluna: {coluna}, Nulos: {porcentagem_nulos:.2f}%')

In [96]:
CalculaNulos('origin')
CalculaNulos('business_segment')
CalculaNulos('lead_type')
CalculaNulos('lead_behaviour_profile')
CalculaNulos('has_company')
CalculaNulos('has_gtin')
CalculaNulos('average_stock')
CalculaNulos('business_type')
CalculaNulos('declared_product_catalog_size')

Coluna: origin, Nulos: 1.66%
Coluna: business_segment, Nulos: 0.12%
Coluna: lead_type, Nulos: 0.71%
Coluna: lead_behaviour_profile, Nulos: 21.02%
Coluna: has_company, Nulos: 92.52%
Coluna: has_gtin, Nulos: 92.40%
Coluna: average_stock, Nulos: 92.16%
Coluna: business_type, Nulos: 1.19%
Coluna: declared_product_catalog_size, Nulos: 91.81%


As colunas:

- has_company
- has_gtin
- average_stock
- declared_product_catalog_size

tem valores nulos muitos significativo o que torna a tomada de decisões baseadas nessas colunas não confiavel.

In [97]:
merged_df = merged_df.drop('has_company', axis=1)
merged_df = merged_df.drop('has_gtin', axis=1)
merged_df = merged_df.drop('average_stock', axis=1)
merged_df = merged_df.drop('declared_product_catalog_size', axis=1)

Para as colunas:
- origin
- business_segment
- lead_type
- business_type

Definiremos os valores nulos como 'Unknown'

In [98]:
merged_df['origin'] = merged_df['origin'].fillna('Unknown')
merged_df['business_segment'] = merged_df['business_segment'].fillna('Unknown')
merged_df['lead_type'] = merged_df['lead_type'].fillna('Unknown')
merged_df['business_type'] = merged_df['business_type'].fillna('Unknown')
merged_df['lead_behaviour_profile'] = merged_df['lead_behaviour_profile'].fillna('Unknown')

In [99]:
merged_df.isnull().sum()

mql_id                      0
first_contact_date          0
landing_page_id             0
origin                      0
seller_id                   0
sdr_id                      0
sr_id                       0
won_date                    0
business_segment            0
lead_type                   0
lead_behaviour_profile      0
business_type               0
declared_monthly_revenue    0
dtype: int64

Verificando duplicados

In [100]:
merged_df.duplicated().sum()

0

Tipos de dados

In [101]:
merged_df.dtypes

mql_id                       object
first_contact_date           object
landing_page_id              object
origin                       object
seller_id                    object
sdr_id                       object
sr_id                        object
won_date                     object
business_segment             object
lead_type                    object
lead_behaviour_profile       object
business_type                object
declared_monthly_revenue    float64
dtype: object

In [102]:
#Tratando colunas de data

merged_df['first_contact_date'] = pd.to_datetime(merged_df['first_contact_date'], format='%Y-%m-%d')
merged_df['won_date'] = pd.to_datetime(merged_df['won_date'])

In [103]:
merged_df.head(2)

Unnamed: 0,mql_id,first_contact_date,landing_page_id,origin,seller_id,sdr_id,sr_id,won_date,business_segment,lead_type,lead_behaviour_profile,business_type,declared_monthly_revenue
0,5420aad7fec3549a85876ba1c529bd84,2018-02-21,b48ec5f3b04e9068441002a19df93c6c,organic_search,2c43fb513632d29b3b58df74816f1b06,a8387c01a09e99ce014107505b92388c,4ef15afb4b2723d8f3d81e51ec7afefe,2018-02-26 19:58:54,pet,online_medium,cat,reseller,0.0
1,a555fb36b9368110ede0f043dfc3b9a0,2018-04-04,2f08471dfb83baef522f952438a36f6e,referral,bbb7d7893a450660432ea6652310ebb7,09285259593c61296eef10c734121d5b,d3d1e91a157ea7f90548eef82f1955e3,2018-05-08 20:17:59,car_accessories,industry,eagle,reseller,0.0


Renomendo dataframe

In [107]:
lead_df = merged_df
lead_df.head(2)

Unnamed: 0,mql_id,first_contact_date,landing_page_id,origin,seller_id,sdr_id,sr_id,won_date,business_segment,lead_type,lead_behaviour_profile,business_type,declared_monthly_revenue
0,5420aad7fec3549a85876ba1c529bd84,2018-02-21,b48ec5f3b04e9068441002a19df93c6c,organic_search,2c43fb513632d29b3b58df74816f1b06,a8387c01a09e99ce014107505b92388c,4ef15afb4b2723d8f3d81e51ec7afefe,2018-02-26 19:58:54,pet,online_medium,cat,reseller,0.0
1,a555fb36b9368110ede0f043dfc3b9a0,2018-04-04,2f08471dfb83baef522f952438a36f6e,referral,bbb7d7893a450660432ea6652310ebb7,09285259593c61296eef10c734121d5b,d3d1e91a157ea7f90548eef82f1955e3,2018-05-08 20:17:59,car_accessories,industry,eagle,reseller,0.0


## **Análise dos dados**

In [106]:
lead_df.head()

Unnamed: 0,mql_id,first_contact_date,landing_page_id,origin,seller_id,sdr_id,sr_id,won_date,business_segment,lead_type,lead_behaviour_profile,business_type,declared_monthly_revenue
0,5420aad7fec3549a85876ba1c529bd84,2018-02-21,b48ec5f3b04e9068441002a19df93c6c,organic_search,2c43fb513632d29b3b58df74816f1b06,a8387c01a09e99ce014107505b92388c,4ef15afb4b2723d8f3d81e51ec7afefe,2018-02-26 19:58:54,pet,online_medium,cat,reseller,0.0
1,a555fb36b9368110ede0f043dfc3b9a0,2018-04-04,2f08471dfb83baef522f952438a36f6e,referral,bbb7d7893a450660432ea6652310ebb7,09285259593c61296eef10c734121d5b,d3d1e91a157ea7f90548eef82f1955e3,2018-05-08 20:17:59,car_accessories,industry,eagle,reseller,0.0
2,327174d3648a2d047e8940d7d15204ca,2018-04-03,1ceb590cd1e00c7ee95220971f82693d,organic_search,612170e34b97004b3ba37eae81836b4c,b90f87164b5f8c2cfa5c8572834dbe3f,6565aa9ce3178a5caf6171827af3a9ba,2018-06-05 17:27:23,home_appliances,online_big,cat,reseller,0.0
3,f5fee8f7da74f4887f5bcae2bafb6dd6,2018-01-14,22c29808c4f815213303f8933030604c,paid_search,21e1781e36faf92725dde4730a88ca0f,56bf83c4bb35763a51c2baab501b4c67,d3d1e91a157ea7f90548eef82f1955e3,2018-01-17 13:51:03,food_drink,online_small,Unknown,reseller,0.0
4,ffe640179b554e295c167a2f6be528e0,2017-10-09,a0fbc0263cb98bdb0d72b9f9f283a172,unknown,ed8cb7b190ceb6067227478e48cf8dde,4b339f9567d060bcea4f5136b9f5949e,d3d1e91a157ea7f90548eef82f1955e3,2018-07-03 20:17:45,home_appliances,industry,wolf,manufacturer,0.0


## **Resultados**

## **Compartilhamento**