# Adwords

In this notebook, I am going to work with adwords data:
    - Load datasets.
    - Merge these datasets into one main dataset
    - Clean data (rename, select columns, etc.)
    - Select specific references and their data from previous dataset.
    - Split the main dataframe into multiple dataframes (a dataframe per reference)
    - Merge multiples dataframes with "datatime_df"
    - Save multiples dataframes correctly as csv files

First of all, I import the required libraries

In [1]:
from datetime import datetime
import numpy as np
import pandas as pd
import os

I set the directory to open "Adwords" dataset

In [2]:
path = "/media/sf_Carpeta/Smart_Shopping/Data/Adwords"
os.chdir(path)

I open adwords data. I have to open three files according to different time periods:
    - TFM_Datos_2017_18_1.csv
    - TFM_Datos_2017_18_2.csv
    - TFM_Datos_2018_19.csv

In [19]:
#file 1
df_2017_18_1 = pd.read_csv("TFM_Datos_2017_18_1.csv", sep=";", error_bad_lines=True)

#file 2
df_2017_18_2 = pd.read_csv("TFM_Datos_2017_18_2.csv", sep=";", error_bad_lines=True)

#file 3
df_2018_19 = pd.read_csv("TFM_Datos_2018_19.csv", sep=";", error_bad_lines=True)

I check all the data

In [21]:
df_2017_18_1.head(3)

Unnamed: 0,ID de producto,Campaña,ID de la campaña,Tipo de producto (primer nivel),Tipo de producto (segundo nivel),Día,Etiqueta personalizada 1,CPC máximo predeterminado del grupo de anuncios,Moneda,Impresiones,...,CTR,CPC medio,Coste,Conversiones,Todas las conversiones,Tasa de conversión,Coste/conv.,Coste/todas las conversiones,Valor conv./coste,Valor de todas las conversiones/coste
0,88264,SHOP - Campaña Base - Inventario Completo,210135538,navidad,decoración de navidad,22/11/2017,20,15,EUR,2.0,...,"0,00 %",0,0,0,0,"0,00 %",0,0,0,0
1,92618,SHOP - Campaña Base - Inventario Completo,210135538,muebles,mueble de dormitorio,15/10/2017,300,15,EUR,63.0,...,"0,00 %",0,0,0,0,"0,00 %",0,0,0,0
2,2080200,SHOP - Campaña Base - Inventario Completo,210135538,playa y camping,cenadores y gazebos plegables,12/03/2018,100,15,EUR,5.0,...,"0,00 %",0,0,0,0,"0,00 %",0,0,0,0


In [22]:
df_2017_18_2.head(3)

Unnamed: 0,ID de producto,Campaña,ID de la campaña,Tipo de producto (primer nivel),Tipo de producto (segundo nivel),Día,Etiqueta personalizada 1,CPC máximo predeterminado del grupo de anuncios,Moneda,Impresiones,...,CTR,CPC medio,Coste,Conversiones,Todas las conversiones,Tasa de conversión,Coste/conv.,Coste/todas las conversiones,Valor conv./coste,Valor de todas las conversiones/coste
0,103316,"Shop_Decoración_Faroles, portavelas y candelab...",1318376294,decoración para tu casa,"faroles, portavelas y candelabros",13/05/2018,40,2,EUR,5.0,...,"0,00 %",0,0,0,0,"0,00 %",0,0,0,0
1,103718,Shop_Muebles_Mesas de centro y auxiliares_Y18_W12,1317788794,muebles,mesas de centro y auxiliares,01/05/2018,60,17,EUR,9.0,...,"0,00 %",0,0,0,0,"0,00 %",0,0,0,0
2,82066,Shop_Jardín y terraza_Parasoles y bases para p...,1320869973,jardín y terraza,parasoles para jardín y bases para parasol,20/07/2018,100,2,EUR,42.0,...,"0,00 %",0,0,0,0,"0,00 %",0,0,0,0


In [18]:
df_2017_18_1.head(5)

Unnamed: 0,ID de producto,Campaña,ID de la campaña,Tipo de producto (primer nivel),Tipo de producto (segundo nivel),Día,Etiqueta personalizada 1,CPC máximo predeterminado del grupo de anuncios,Moneda,Impresiones,...,CTR,CPC medio,Coste,Conversiones,Todas las conversiones,Tasa de conversión,Coste/conv.,Coste/todas las conversiones,Valor conv./coste,Valor de todas las conversiones/coste
0,88264,SHOP - Campaña Base - Inventario Completo,210135538,navidad,decoración de navidad,22/11/2017,20,15,EUR,2.0,...,"0,00 %",0,0,0,0,"0,00 %",0,0,0,0
1,92618,SHOP - Campaña Base - Inventario Completo,210135538,muebles,mueble de dormitorio,15/10/2017,300,15,EUR,63.0,...,"0,00 %",0,0,0,0,"0,00 %",0,0,0,0
2,2080200,SHOP - Campaña Base - Inventario Completo,210135538,playa y camping,cenadores y gazebos plegables,12/03/2018,100,15,EUR,5.0,...,"0,00 %",0,0,0,0,"0,00 %",0,0,0,0
3,48586,SHOP - Campaña Base - Inventario Completo,210135538,textil hogar,ropa de cama,05/10/2017,50,15,EUR,2.0,...,"0,00 %",0,0,0,0,"0,00 %",0,0,0,0
4,101322,SHOP - Muebles - Sillas,940394307,muebles,sillería y tapicería,27/10/2017,150,24,EUR,14.0,...,"0,00 %",0,0,0,0,"0,00 %",0,0,0,0


In [23]:
df_2018_19.head(3)

Unnamed: 0,ID de producto,Campaña,ID de la campaña,Tipo de producto (primer nivel),Tipo de producto (segundo nivel),Día,Etiqueta personalizada 1,CPC máximo predeterminado del grupo de anuncios,Moneda,Impresiones,...,CTR,CPC medio,Coste,Conversiones,Todas las conversiones,Tasa de conversión,Coste/conv.,Coste/todas las conversiones,Valor conv./coste,Valor de todas las conversiones/coste
0,127156,Shop_Smart_N1_Téxtil_Hogar_Y19_W5,1695676698,textil hogar,alfombras de vinilo,20/02/2019,200,1,EUR,153.0,...,"0,00 %",0,0,0,0,"0,00 %",0,0,0,0
1,104268,Shop_Decoración_N1_Y18_W37,1559890739,decoración para tu casa,figuras decorativas,16/10/2018,40,15,EUR,9.0,...,"0,00 %",0,0,0,0,"0,00 %",0,0,0,0
2,123872,Shop_Smart_N1_Téxtil_Hogar_Y19_W5,1695676698,textil hogar,edredones,25/03/2019,80,1,EUR,1.0,...,"0,00 %",0,0,0,0,"0,00 %",0,0,0,0


In [25]:
df_2017_18_1.info()
df_2017_18_2.info()
df_2018_19.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 774564 entries, 0 to 774563
Data columns (total 21 columns):
ID de producto                                     774564 non-null int64
Campaña                                            774564 non-null object
ID de la campaña                                   774564 non-null int64
Tipo de producto (primer nivel)                    774564 non-null object
Tipo de producto (segundo nivel)                   774564 non-null object
Día                                                774564 non-null object
Etiqueta personalizada 1                           774564 non-null object
CPC máximo predeterminado del grupo de anuncios    774564 non-null object
Moneda                                             774564 non-null object
Impresiones                                        774564 non-null float64
Clics                                              774564 non-null int64
CTR                                                774564 non-null object
CPC

In [31]:
df_2017_18_1.shape

(774564, 21)

In [32]:
df_2017_18_2.shape

(361465, 21)

In [33]:
df_2018_19.shape

(447539, 21)

Now, I am going to merge all the data into one main dataframe