<a href="https://colab.research.google.com/github/KaioViana/clicks-conversion-tracking/blob/main/CampanhaPublicit%C3%A1ria.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#**<center>Análise de dados de campanha publicitária<center>**
---
**Dados:**

Os dados utilizados neste projeto é de uma campanha publicitária, disponibilizados por uma organização anônima de social media. O dataset em questão contêm 1143 observações de 11 variáveis. A seguir estão as descrições das variáveis:

* ad_id: ID único de cada ad;
* xyzcampagnid: ID associado com cada campanha da empresa XYZ;
* fbcampagnid: ID associado com como o Facebook rastreiou cada campanha;
* age: idade da pessoa a quem o ad é mostrado;
* gender: genêro da pessoa a quem o anúncio é mostrado;
* interest: código que específica a categoria à qual pertence o interesse da pessoa(os interesses são mostrados no perfil público da pessoa);
* impressions: números de vezes que o ad foi mostrado;
* clicks: número de clicks no ad;
* spent: valor pago pela companhia XYZ para Facebook, para mostrar o ad;
* total conversion: total de pessoas que mostraram interesse após ver o anúncio;
* approved conversion: total de pessoas que compraram o produto após ver o anúncio;
---
**Objetivo:**

Explorar os recursos para determinar os segmentos de clientes ideais e as próximas etapas de uma campanha publicitária.

In [5]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns


# carregando o dataset
dataset = pd.read_csv('KAG_conversion_data.csv')

In [6]:
# pegando uma primeira visão do dataset
dataset.head(10)

Unnamed: 0,ad_id,xyz_campaign_id,fb_campaign_id,age,gender,interest,Impressions,Clicks,Spent,Total_Conversion,Approved_Conversion
0,708746,916,103916,30-34,M,15,7350,1,1.43,2,1
1,708749,916,103917,30-34,M,16,17861,2,1.82,2,0
2,708771,916,103920,30-34,M,20,693,0,0.0,1,0
3,708815,916,103928,30-34,M,28,4259,1,1.25,1,0
4,708818,916,103928,30-34,M,28,4133,1,1.29,1,1
5,708820,916,103929,30-34,M,29,1915,0,0.0,1,1
6,708889,916,103940,30-34,M,15,15615,3,4.77,1,0
7,708895,916,103941,30-34,M,16,10951,1,1.27,1,1
8,708953,916,103951,30-34,M,27,2355,1,1.5,1,0
9,708958,916,103952,30-34,M,28,9502,3,3.16,1,0


In [7]:
# renomeiando as colunas e alguns valores para facilitar o workflow
dataset.rename(columns={'xyz_campaign_id': 'xyzCampId', 'fb_campaign_id': 'fbCampId', 'Total_Conversion': 'conv', 'Approved_Conversion': 'appConv'}, inplace=True)
# colunas renomeiadas
dataset.head(10)

Unnamed: 0,ad_id,xyzCampId,fbCampId,age,gender,interest,Impressions,Clicks,Spent,conv,appConv
0,708746,916,103916,30-34,M,15,7350,1,1.43,2,1
1,708749,916,103917,30-34,M,16,17861,2,1.82,2,0
2,708771,916,103920,30-34,M,20,693,0,0.0,1,0
3,708815,916,103928,30-34,M,28,4259,1,1.25,1,0
4,708818,916,103928,30-34,M,28,4133,1,1.29,1,1
5,708820,916,103929,30-34,M,29,1915,0,0.0,1,1
6,708889,916,103940,30-34,M,15,15615,3,4.77,1,0
7,708895,916,103941,30-34,M,16,10951,1,1.27,1,1
8,708953,916,103951,30-34,M,27,2355,1,1.5,1,0
9,708958,916,103952,30-34,M,28,9502,3,3.16,1,0


In [20]:
# renomeiando valores
dataset['xyzCampId'].unique() # valores únicos

array([ 916,  936, 1178])

In [23]:
# renomeiando
dataset['xyzCampId'].replace({916: 'campA', 936: 'campB', 1178: 'campC'}, inplace=True)
dataset.head(10)

Unnamed: 0,ad_id,xyzCampId,fbCampId,age,gender,interest,Impressions,Clicks,Spent,conv,appConv
0,708746,campA,103916,30-34,M,15,7350,1,1.43,2,1
1,708749,campA,103917,30-34,M,16,17861,2,1.82,2,0
2,708771,campA,103920,30-34,M,20,693,0,0.0,1,0
3,708815,campA,103928,30-34,M,28,4259,1,1.25,1,0
4,708818,campA,103928,30-34,M,28,4133,1,1.29,1,1
5,708820,campA,103929,30-34,M,29,1915,0,0.0,1,1
6,708889,campA,103940,30-34,M,15,15615,3,4.77,1,0
7,708895,campA,103941,30-34,M,16,10951,1,1.27,1,1
8,708953,campA,103951,30-34,M,27,2355,1,1.5,1,0
9,708958,campA,103952,30-34,M,28,9502,3,3.16,1,0


#**Análise exploratória**
---


In [24]:
# checando valores faltantes
dataset.isnull().sum()

ad_id          0
xyzCampId      0
fbCampId       0
age            0
gender         0
interest       0
Impressions    0
Clicks         0
Spent          0
conv           0
appConv        0
dtype: int64

In [25]:
# mostrando uma descrição resumida dos dados
dataset.describe()

Unnamed: 0,ad_id,fbCampId,interest,Impressions,Clicks,Spent,conv,appConv
count,1143.0,1143.0,1143.0,1143.0,1143.0,1143.0,1143.0,1143.0
mean,987261.1,133783.989501,32.766404,186732.1,33.390201,51.360656,2.855643,0.944007
std,193992.8,20500.308622,26.952131,312762.2,56.892438,86.908418,4.483593,1.737708
min,708746.0,103916.0,2.0,87.0,0.0,0.0,0.0,0.0
25%,777632.5,115716.0,16.0,6503.5,1.0,1.48,1.0,0.0
50%,1121185.0,144549.0,25.0,51509.0,8.0,12.37,1.0,1.0
75%,1121804.0,144657.5,31.0,221769.0,37.5,60.025,3.0,1.0
max,1314415.0,179982.0,114.0,3052003.0,421.0,639.949998,60.0,21.0
