# Importação e tratamento dos dados

Explorando, limpando e organizando os dados.

In [1]:
import pandas as pd

In [2]:
base = pd.read_excel('./engajamento.xlsx')

In [3]:
base = base.drop("Visualizações",axis=1)

In [4]:
# As primeiras 5 linhas
base.head()

Unnamed: 0,Tipo,Data,Curtidas,Comentários,Tags,Pessoas,Campanhas,Carrossel,Interacoes
0,Foto,2021-09-11,2858,16,Loja,N,N,,2874
1,Foto,2021-09-11,2930,28,Loja/Produtos,N,N,,2958
2,Foto,2021-09-11,2807,9,Loja,N,N,,2816
3,Vídeo,2021-09-12,5115,49,Produtos,N,N,,5164
4,Foto,2021-09-13,4392,45,Produtos,S,N,,4437


In [5]:
# As últimas 5 linhas
base.tail()

Unnamed: 0,Tipo,Data,Curtidas,Comentários,Tags,Pessoas,Campanhas,Carrossel,Interacoes
47,IGTV,2022-03-12,5489,77,Dicas de como usar/Novos Produtos,S,N,,5566
48,Foto,2022-03-20,29084,479,Datas comemorativas/Promoções,S,S,,29563
49,Foto,2022-03-22,9087,106,,S,S,,9193
50,Foto,2022-03-26,16551,186,,S,N,,16737
51,IGTV,2022-03-27,4934,65,Dicas de como usar/Produtos,S,N,,4999


In [6]:
# Informação geral sob os dados
base.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 52 entries, 0 to 51
Data columns (total 9 columns):
 #   Column       Non-Null Count  Dtype         
---  ------       --------------  -----         
 0   Tipo         52 non-null     object        
 1   Data         52 non-null     datetime64[ns]
 2   Curtidas     52 non-null     int64         
 3   Comentários  52 non-null     int64         
 4   Tags         44 non-null     object        
 5   Pessoas      52 non-null     object        
 6   Campanhas    52 non-null     object        
 7   Carrossel    8 non-null      object        
 8   Interacoes   52 non-null     int64         
dtypes: datetime64[ns](1), int64(3), object(5)
memory usage: 3.8+ KB


# Valores que precisam ser tratados

**1. Tags**

**2. Carrossel**

In [7]:
# Dimensões do DataFrame
# (linha, coluna)
base.shape

(52, 9)

In [8]:
# Contagem dos valores existentes
base.Carrossel.value_counts()

Carrossel
S    8
Name: count, dtype: int64

In [9]:
base.loc[base.Carrossel.isnull(), "Carrossel"] = "N"

In [10]:
base.loc[base.Tags.isnull(), "Tags"] = "Nenhuma"

In [11]:
base.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 52 entries, 0 to 51
Data columns (total 9 columns):
 #   Column       Non-Null Count  Dtype         
---  ------       --------------  -----         
 0   Tipo         52 non-null     object        
 1   Data         52 non-null     datetime64[ns]
 2   Curtidas     52 non-null     int64         
 3   Comentários  52 non-null     int64         
 4   Tags         52 non-null     object        
 5   Pessoas      52 non-null     object        
 6   Campanhas    52 non-null     object        
 7   Carrossel    52 non-null     object        
 8   Interacoes   52 non-null     int64         
dtypes: datetime64[ns](1), int64(3), object(5)
memory usage: 3.8+ KB


In [12]:
base.sort_values(
    by='Curtidas',
    ascending= False
).head()

Unnamed: 0,Tipo,Data,Curtidas,Comentários,Tags,Pessoas,Campanhas,Carrossel,Interacoes
39,Foto,2022-02-17,37351,502,Promoções,S,S,N,37853
30,Reels,2022-01-24,29981,502,Trends,S,S,N,30483
48,Foto,2022-03-20,29084,479,Datas comemorativas/Promoções,S,S,N,29563
33,Foto,2022-02-06,24655,186,Influenciadores,S,S,N,24841
26,Foto,2022-01-08,24585,354,Datas comemorativas,S,S,S,24939


In [13]:
base.sort_values(
    by='Curtidas',
    ascending= False
).tail()

Unnamed: 0,Tipo,Data,Curtidas,Comentários,Tags,Pessoas,Campanhas,Carrossel,Interacoes
17,Vídeo,2021-11-09,3213,60,Produtos,N,N,N,3273
1,Foto,2021-09-11,2930,28,Loja/Produtos,N,N,N,2958
20,Foto,2021-12-16,2881,29,Produtos,N,N,N,2910
0,Foto,2021-09-11,2858,16,Loja,N,N,N,2874
2,Foto,2021-09-11,2807,9,Loja,N,N,N,2816


In [14]:
# Contagem dos diferentes tipos de publicação
base.Tipo.value_counts()

Tipo
Foto     36
Vídeo     6
Reels     5
IGTV      5
Name: count, dtype: int64

In [15]:
# Contagem das Tags usadas
base.Tags.value_counts()

Tags
Produtos                             12
Nenhuma                               8
Novos Produtos                        7
Influenciadores                       7
Datas comemorativas                   3
Trends                                3
Dicas de como usar/Produtos           3
Loja                                  2
Promoções                             2
Dicas de como usar/Novos Produtos     2
Loja/Produtos                         1
Trends/Produtos                       1
Datas comemorativas/Promoções         1
Name: count, dtype: int64

# Agrupando e analisando

In [16]:
pd.options.display.float_format = '{:,.2f}'.format

In [17]:
base.groupby('Tipo')[['Curtidas', 'Comentários']].mean()

Unnamed: 0_level_0,Curtidas,Comentários
Tipo,Unnamed: 1_level_1,Unnamed: 2_level_1
Foto,13341.14,193.42
IGTV,6833.4,133.6
Reels,14873.0,244.4
Vídeo,8141.5,166.83


In [18]:
base.Tags = base.Tags.str.split("/")
base.head()

Unnamed: 0,Tipo,Data,Curtidas,Comentários,Tags,Pessoas,Campanhas,Carrossel,Interacoes
0,Foto,2021-09-11,2858,16,[Loja],N,N,N,2874
1,Foto,2021-09-11,2930,28,"[Loja, Produtos]",N,N,N,2958
2,Foto,2021-09-11,2807,9,[Loja],N,N,N,2816
3,Vídeo,2021-09-12,5115,49,[Produtos],N,N,N,5164
4,Foto,2021-09-13,4392,45,[Produtos],S,N,N,4437


In [19]:
base = base.explode("Tags")
base.head(15)

Unnamed: 0,Tipo,Data,Curtidas,Comentários,Tags,Pessoas,Campanhas,Carrossel,Interacoes
0,Foto,2021-09-11,2858,16,Loja,N,N,N,2874
1,Foto,2021-09-11,2930,28,Loja,N,N,N,2958
1,Foto,2021-09-11,2930,28,Produtos,N,N,N,2958
2,Foto,2021-09-11,2807,9,Loja,N,N,N,2816
3,Vídeo,2021-09-12,5115,49,Produtos,N,N,N,5164
4,Foto,2021-09-13,4392,45,Produtos,S,N,N,4437
5,Foto,2021-09-17,5359,62,Novos Produtos,N,S,S,5421
6,Foto,2021-09-19,21597,852,Novos Produtos,S,S,N,22449
7,Foto,2021-09-25,6346,33,Produtos,N,S,N,6379
8,Foto,2021-09-27,6355,89,Produtos,S,N,S,6444


In [20]:
base.groupby('Tags')["Curtidas"].mean()

Tags
Datas comemorativas   20,752.25
Dicas de como usar     6,833.40
Influenciadores       15,197.29
Loja                   2,865.00
Nenhuma               15,347.88
Novos Produtos        10,304.89
Produtos               6,269.82
Promoções             27,458.33
Trends                20,024.00
Name: Curtidas, dtype: float64

In [21]:
base.groupby('Tags')[["Curtidas", "Comentários"]].mean().sort_values("Curtidas",ascending=False).head(5)

Unnamed: 0_level_0,Curtidas,Comentários
Tags,Unnamed: 1_level_1,Unnamed: 2_level_1
Promoções,27458.33,531.0
Datas comemorativas,20752.25,343.5
Trends,20024.0,352.25
Nenhuma,15347.88,207.75
Influenciadores,15197.29,161.71


In [22]:
base.groupby(['Pessoas', 'Tags'])[['Curtidas', 'Comentários']].mean().sort_values("Curtidas", ascending=False)

Unnamed: 0_level_0,Unnamed: 1_level_0,Curtidas,Comentários
Pessoas,Tags,Unnamed: 2_level_1,Unnamed: 3_level_1
S,Promoções,27458.33,531.0
S,Datas comemorativas,20752.25,343.5
S,Trends,20024.0,352.25
S,Nenhuma,15347.88,207.75
S,Influenciadores,15197.29,161.71
S,Novos Produtos,10923.12,215.62
S,Produtos,8316.38,131.62
S,Dicas de como usar,6833.4,133.6
N,Novos Produtos,5359.0,62.0
N,Produtos,4450.67,60.78


In [23]:
base.groupby(['Campanhas', 'Tags'])[['Curtidas', 'Comentários']].mean().sort_values("Curtidas", ascending=False)

Unnamed: 0_level_0,Unnamed: 1_level_0,Curtidas,Comentários
Campanhas,Tags,Unnamed: 2_level_1,Unnamed: 3_level_1
S,Promoções,33217.5,490.5
S,Trends,22400.67,386.67
S,Datas comemorativas,20752.25,343.5
S,Influenciadores,18715.4,197.6
S,Nenhuma,16850.75,257.75
N,Promoções,15940.0,612.0
N,Nenhuma,13845.0,157.75
N,Trends,12894.0,249.0
S,Novos Produtos,11040.67,323.0
N,Novos Produtos,9937.0,136.33
