O Marketing Digital tomou conta da indústria de varejo. Com isso, a cada campanha de marketing para promover uma marca ou mesmo para vender os produtos, muitos dados são gerados pelas principais plataformas deste tipo de serviço. Após a pesquisa de mercado realizada, a startup desenvolveu seu produto usando metodologias ágeis e concluiu seu MVP (Minimum Viable Product: Versão inicial de um produto que já entrega valor para o cliente e permite receber feedback para os próximos ciclos de melhoria). Após o lançamento do MVP, a startup iniciou sua campanha de marketing na plataforma de anúncios do Facebook.

O objetivo desta campanha era direcionar os leads (potenciais clientes) para sua landing page (formato de página de internet focada em determinada ação. Ex: Venda de um produto, assinatura em uma newsletter, download de um e-book etc.). Uma vez na landing page, os clientes poderiam comprar o produto. Após 2 meses de campanha de marketing, a startup recebeu os dados disponíveis na plataforma para estudar a performance das campanhas.
Como é possível observar, a startup recebeu 38.165 cliques nos anúncios do Facebook, o que custou mais de R$ 58 mil reais para a empresa. O resultado das 3 campanhas foi a venda de 6.877 cursos online.

Para melhores resultados, assim como qualquer empresa, a startup precisa aumentar as vendas e/ou diminuir os custos para maximizar o lucro da operação.

Com base nisso, você, como um(a) bom(a) analista de dados, precisa identificar o melhor perfil de cliente para ajustar o público em que os anúncios da próxima campanha serão vinculados. Portanto, o objetivo deste trabalho de Analytics é:

 

Como maximizar o lucro da startup aumentando as vendas dos cursos e/ou diminuindo os custos de marketing com as campanhas?

 

Algumas informações importantes para iniciar a análise:

·       Valor de venda do curso online: R$ 85 reais

·       Verba de marketing para a próxima campanha: R$ 20 mil reais

·       É mais interessante realizar a análise com as campanhas que geraram mais dados (princípio da teoria frequentista).

In [2]:
#Manipulação dos dados 
import pandas as pd
import numpy as np

#Pacotes gráficos
import matplotlib.pyplot as plt
import seaborn as sns

#Analises
from sklearn import linear_model
from sklearn.metrics import accuracy_score

from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split


from sklearn.metrics import precision_score, recall_score, f1_score, confusion_matrix
from sklearn.metrics import roc_auc_score, average_precision_score

# Módulo de Análise Exploratória
#import aed


In [3]:
dados = pd.read_excel('dados_campanha.xlsx',sheet_name=1)

In [13]:
dados.columns

Index(['id_do_anuncio', 'campanha', 'faixa_etária', 'sexo',
       'categoria_de_interesse', 'qte_de_impressões', 'qte_de_clicks',
       'valor_investido_no_anúncio', 'Qte_de_Vendas_após_Clique', 'Unnamed: 9',
       'Unnamed: 10'],
      dtype='object')

## Analise exploratória

In [20]:
#Agrupamento por campanha
campanha = dados.groupby('campanha')[['qte_de_clicks','valor_investido_no_anúncio','Qte_de_Vendas_após_Clique']].sum()

In [21]:
#Criação de metricas
campanha['Click-through-rate'] = (campanha['qte_de_clicks'] * 100) / dados['qte_de_impressões']
campanha['Taxa_de_Conversão'] = (campanha['Qte_de_Vendas_após_Clique'] * 100) / dados['qte_de_clicks']
campanha['Custo_por_clique'] = campanha['valor_investido_no_anúncio']  / dados['qte_de_clicks']
campanha['Custo_por_conversão'] = campanha['valor_investido_no_anúncio'] / dados['Qte_de_Vendas_após_Clique']
campanha['ROI'] =  ((campanha['Qte_de_Vendas_após_Clique'] * 85) - dados['valor_investido_no_anúncio']) / dados['valor_investido_no_anúncio']

In [22]:
campanha

Unnamed: 0_level_0,qte_de_clicks,valor_investido_no_anúncio,Qte_de_Vendas_após_Clique,Click-through-rate,Taxa_de_Conversão,Custo_por_clique,Custo_por_conversão,ROI
campanha,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
Campanha A,113,149.710001,55,,,,,
Campanha B,1984,2893.369999,474,,,,,
Campanha C,36068,55662.149959,6279,,,,,


In [35]:
#Verificação das categorias que mais venderam
categoria = dados.groupby('categoria_de_interesse')[['qte_de_clicks','valor_investido_no_anúncio','qte_de_impressões','Qte_de_Vendas_após_Clique']].sum()
categoria_ordenada = categoria.sort_values(by='Qte_de_Vendas_após_Clique', ascending=False)

In [41]:
oitenta=categoria_ordenada["Qte_de_Vendas_após_Clique"].sum()*0.8

soma_primeiros_20 = categoria_ordenada["Qte_de_Vendas_após_Clique"][:22].sum()
print("oitenta por cento das vendas é equivantente a:", oitenta)
print("Soma dos primeiros 22 elementos da coluna 'qte_de_vendas':", soma_primeiros_20)

oitenta por cento das vendas é equivantente a: 5446.400000000001
Soma dos primeiros 22 elementos da coluna 'qte_de_vendas': 5520


In [42]:
categoria_ordenada

Unnamed: 0_level_0,qte_de_clicks,valor_investido_no_anúncio,qte_de_impressões,Qte_de_Vendas_após_Clique
categoria_de_interesse,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
16,5144,8084.90999,31809524,671
29,3315,5045.190008,18768653,581
10,3317,5086.379995,17989844,480
27,3409,5176.169992,16352527,401
15,1609,2597.259995,10745856,337
20,1234,1960.770001,6899907,314
28,2025,3205.850004,10959830,302
19,1188,1940.359993,6083217,225
63,1675,2484.060002,8365640,206
64,989,1486.129996,5085460,206


Logo focar na campanha A e nas 22 categorias que mais venderam. 