## Projeto de Análise de Dados: Analisando o engajamento do Instagram

### Resumo do Projeto:

Este projeto analisa uma base de dados sobre o engajamento de publicações no Instagram de uma empresa fictícia. O objetivo é identificar os fatores que mais influenciam o engajamento, com foco nas tags utilizadas.

A base de dados cobre o período desde a criação da conta até 27 de março e inclui métricas como curtidas, comentários e interações. As visualizações foram desconsideradas, pois o foco da análise está nas métricas de engajamento direto. Este projeto se concentra na preparação dos dados e na análise exploratória para gerar insights sobre o desempenho das publicações.

In [1]:
import pandas as pd

from src.config import DADOS_ORIGINAIS

Projeto Engajamento Instagram/notebooks/01_GG_analise_projeto.ipynb

df_insta = pd.read_excel(DADOS_ORIGINAIS)

df_insta.head()

Unnamed: 0,Tipo,Data,Curtidas,Comentários,Visualizações,Tags,Pessoas,Campanhas,Carrossel,Interacoes
0,Foto,2021-09-11,2858,16,,Loja,N,N,,2874
1,Foto,2021-09-11,2930,28,,Loja/Produtos,N,N,,2958
2,Foto,2021-09-11,2807,9,,Loja,N,N,,2816
3,Vídeo,2021-09-12,5115,49,82878.0,Produtos,N,N,,5164
4,Foto,2021-09-13,4392,45,,Produtos,S,N,,4437


In [2]:
df_insta = df_insta.drop("Visualizações", axis=1)

df_insta.head()

Unnamed: 0,Tipo,Data,Curtidas,Comentários,Tags,Pessoas,Campanhas,Carrossel,Interacoes
0,Foto,2021-09-11,2858,16,Loja,N,N,,2874
1,Foto,2021-09-11,2930,28,Loja/Produtos,N,N,,2958
2,Foto,2021-09-11,2807,9,Loja,N,N,,2816
3,Vídeo,2021-09-12,5115,49,Produtos,N,N,,5164
4,Foto,2021-09-13,4392,45,Produtos,S,N,,4437


In [3]:
df_insta.tail()

Unnamed: 0,Tipo,Data,Curtidas,Comentários,Tags,Pessoas,Campanhas,Carrossel,Interacoes
47,IGTV,2022-03-12,5489,77,Dicas de como usar/Novos Produtos,S,N,,5566
48,Foto,2022-03-20,29084,479,Datas comemorativas/Promoções,S,S,,29563
49,Foto,2022-03-22,9087,106,,S,S,,9193
50,Foto,2022-03-26,16551,186,,S,N,,16737
51,IGTV,2022-03-27,4934,65,Dicas de como usar/Produtos,S,N,,4999


In [4]:
df_insta.shape

(52, 9)

In [5]:
df_insta.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 52 entries, 0 to 51
Data columns (total 9 columns):
 #   Column       Non-Null Count  Dtype         
---  ------       --------------  -----         
 0   Tipo         52 non-null     object        
 1   Data         52 non-null     datetime64[ns]
 2   Curtidas     52 non-null     int64         
 3   Comentários  52 non-null     int64         
 4   Tags         44 non-null     object        
 5   Pessoas      52 non-null     object        
 6   Campanhas    52 non-null     object        
 7   Carrossel    8 non-null      object        
 8   Interacoes   52 non-null     int64         
dtypes: datetime64[ns](1), int64(3), object(5)
memory usage: 3.8+ KB


In [6]:
df_insta["Carrossel"].value_counts()

Carrossel
S    8
Name: count, dtype: int64

In [7]:
df_insta.loc[df_insta["Carrossel"].isnull()].head()

Unnamed: 0,Tipo,Data,Curtidas,Comentários,Tags,Pessoas,Campanhas,Carrossel,Interacoes
0,Foto,2021-09-11,2858,16,Loja,N,N,,2874
1,Foto,2021-09-11,2930,28,Loja/Produtos,N,N,,2958
2,Foto,2021-09-11,2807,9,Loja,N,N,,2816
3,Vídeo,2021-09-12,5115,49,Produtos,N,N,,5164
4,Foto,2021-09-13,4392,45,Produtos,S,N,,4437


In [8]:
df_insta.loc[df_insta["Carrossel"].notnull()].head(10)

Unnamed: 0,Tipo,Data,Curtidas,Comentários,Tags,Pessoas,Campanhas,Carrossel,Interacoes
5,Foto,2021-09-17,5359,62,Novos Produtos,N,S,S,5421
8,Foto,2021-09-27,6355,89,Produtos,S,N,S,6444
12,Foto,2021-10-21,6166,55,Novos Produtos,S,S,S,6221
21,Foto,2021-12-23,8328,93,Produtos,S,N,S,8421
25,Foto,2022-01-02,12193,138,Novos Produtos,S,N,S,12331
26,Foto,2022-01-08,24585,354,Datas comemorativas,S,S,S,24939
28,Foto,2022-01-15,9936,119,Novos Produtos,S,N,S,10055
40,Foto,2022-02-21,21621,213,Influenciadores,S,S,S,21834


In [9]:
df_insta.loc[df_insta["Carrossel"].isnull(), "Carrossel"] = "N"

In [10]:
df_insta.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 52 entries, 0 to 51
Data columns (total 9 columns):
 #   Column       Non-Null Count  Dtype         
---  ------       --------------  -----         
 0   Tipo         52 non-null     object        
 1   Data         52 non-null     datetime64[ns]
 2   Curtidas     52 non-null     int64         
 3   Comentários  52 non-null     int64         
 4   Tags         44 non-null     object        
 5   Pessoas      52 non-null     object        
 6   Campanhas    52 non-null     object        
 7   Carrossel    52 non-null     object        
 8   Interacoes   52 non-null     int64         
dtypes: datetime64[ns](1), int64(3), object(5)
memory usage: 3.8+ KB


In [11]:
df_insta["Carrossel"].value_counts()

Carrossel
N    44
S     8
Name: count, dtype: int64

In [12]:
df_insta["Tipo"].value_counts()

Tipo
Foto     36
Vídeo     6
Reels     5
IGTV      5
Name: count, dtype: int64

In [13]:
with pd.option_context("float_format", "{:.2f}".format):
    display(df_insta.describe(exclude=["datetime", "object"]))
#df_insta.describe(exclude=["datetime", "object"])

Unnamed: 0,Curtidas,Comentários,Interacoes
count,52.0,52.0,52.0
mean,12262.73,189.5,12452.23
std,8165.88,170.69,8299.39
min,2807.0,9.0,2816.0
25%,5492.0,69.5,5562.5
50%,9603.0,128.0,9773.5
75%,17621.75,265.25,17920.75
max,37351.0,852.0,37853.0


In [14]:
df_insta.sort_values(by="Curtidas", ascending=False).head()

Unnamed: 0,Tipo,Data,Curtidas,Comentários,Tags,Pessoas,Campanhas,Carrossel,Interacoes
39,Foto,2022-02-17,37351,502,Promoções,S,S,N,37853
30,Reels,2022-01-24,29981,502,Trends,S,S,N,30483
48,Foto,2022-03-20,29084,479,Datas comemorativas/Promoções,S,S,N,29563
33,Foto,2022-02-06,24655,186,Influenciadores,S,S,N,24841
26,Foto,2022-01-08,24585,354,Datas comemorativas,S,S,S,24939


In [15]:
df_insta.sort_values(by="Curtidas", ascending=True).head()

Unnamed: 0,Tipo,Data,Curtidas,Comentários,Tags,Pessoas,Campanhas,Carrossel,Interacoes
2,Foto,2021-09-11,2807,9,Loja,N,N,N,2816
0,Foto,2021-09-11,2858,16,Loja,N,N,N,2874
20,Foto,2021-12-16,2881,29,Produtos,N,N,N,2910
1,Foto,2021-09-11,2930,28,Loja/Produtos,N,N,N,2958
17,Vídeo,2021-11-09,3213,60,Produtos,N,N,N,3273


As 5 postagens com maior número de curtidas tinham pessoas e eram campanhas, enquanto as 5 postagens com menor número de curtidas não tinham pessoas e nem eram campanhas.

É possível analisar que as curtidas estão relacionadas a presença de pessoas nas fotos e as campanhas

In [16]:
pd.options.display.float_format = "{:,.2f}".format

In [17]:
df_insta.groupby("Tipo")["Curtidas"].mean()

Tipo
Foto    13,341.14
IGTV     6,833.40
Reels   14,873.00
Vídeo    8,141.50
Name: Curtidas, dtype: float64

In [18]:
df_insta.groupby(["Tipo"])[["Curtidas", "Comentários"]].mean().sort_values("Curtidas", ascending=False)

Unnamed: 0_level_0,Curtidas,Comentários
Tipo,Unnamed: 1_level_1,Unnamed: 2_level_1
Reels,14873.0,244.4
Foto,13341.14,193.42
Vídeo,8141.5,166.83
IGTV,6833.4,133.6


Pode se inferir que vale a pena investir em postagens do tipo reels e fotos

In [19]:
df_insta.groupby(["Pessoas"])[["Curtidas", "Comentários"]].mean().sort_values("Curtidas", ascending=False)

Unnamed: 0_level_0,Curtidas,Comentários
Pessoas,Unnamed: 1_level_1,Unnamed: 2_level_1
S,14664.55,230.5
N,4256.67,52.83


Pode se inferir que postagens com pessoas engaja mais

In [20]:
df_insta.groupby(["Tipo", "Pessoas"])[["Curtidas", "Comentários"]].mean().sort_values("Curtidas", ascending=False)

Unnamed: 0_level_0,Unnamed: 1_level_0,Curtidas,Comentários
Tipo,Pessoas,Unnamed: 2_level_1,Unnamed: 3_level_1
Reels,S,20832.0,342.0
Vídeo,S,16409.5,370.0
Foto,S,15236.67,226.2
IGTV,S,6833.4,133.6
Reels,N,5934.5,98.0
Vídeo,N,4007.5,65.25
Foto,N,3863.5,29.5


Nesse caso, vídeos com pessoas também engajam muito

In [21]:
df_insta.groupby(["Tipo", "Pessoas", "Campanhas"])[["Curtidas", "Comentários"]].mean().sort_values("Curtidas", 
                                                                                                   ascending=False)

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,Curtidas,Comentários
Tipo,Pessoas,Campanhas,Unnamed: 3_level_1,Unnamed: 4_level_1
Reels,S,S,24801.0,388.5
Foto,S,S,19105.38,284.19
Vídeo,S,S,16409.5,370.0
Reels,S,N,12894.0,249.0
Foto,S,N,10815.29,159.93
IGTV,S,N,6833.4,133.6
Reels,N,N,5934.5,98.0
Foto,N,S,5852.5,47.5
Vídeo,N,N,4007.5,65.25
Foto,N,N,2869.0,20.5


Fica entendido que as postagens do tipo reels e fotos são as melhores para engajar, principalmente ao incluir pessoas.

Vídeos performaram bem nos casos de serem campanhas com pessoas, ao ponto de terem mais comentários que as fotos.

In [22]:
df_insta.groupby("Tags")["Curtidas"].mean()

Tags
Datas comemorativas                 17,975.00
Datas comemorativas/Promoções       29,084.00
Dicas de como usar/Novos Produtos    5,703.50
Dicas de como usar/Produtos          7,586.67
Influenciadores                     15,197.29
Loja                                 2,832.50
Loja/Produtos                        2,930.00
Novos Produtos                      11,619.57
Produtos                             5,666.92
Promoções                           26,645.50
Trends                              22,400.67
Trends/Produtos                     12,894.00
Name: Curtidas, dtype: float64

In [23]:
df_insta["Tags"] = df_insta["Tags"].str.split("/")

df_insta.head()

Unnamed: 0,Tipo,Data,Curtidas,Comentários,Tags,Pessoas,Campanhas,Carrossel,Interacoes
0,Foto,2021-09-11,2858,16,[Loja],N,N,N,2874
1,Foto,2021-09-11,2930,28,"[Loja, Produtos]",N,N,N,2958
2,Foto,2021-09-11,2807,9,[Loja],N,N,N,2816
3,Vídeo,2021-09-12,5115,49,[Produtos],N,N,N,5164
4,Foto,2021-09-13,4392,45,[Produtos],S,N,N,4437


In [24]:
df_insta = df_insta.explode("Tags")
df_insta.head()

Unnamed: 0,Tipo,Data,Curtidas,Comentários,Tags,Pessoas,Campanhas,Carrossel,Interacoes
0,Foto,2021-09-11,2858,16,Loja,N,N,N,2874
1,Foto,2021-09-11,2930,28,Loja,N,N,N,2958
1,Foto,2021-09-11,2930,28,Produtos,N,N,N,2958
2,Foto,2021-09-11,2807,9,Loja,N,N,N,2816
3,Vídeo,2021-09-12,5115,49,Produtos,N,N,N,5164


In [25]:
df_insta.groupby("Tags")["Curtidas"].mean()

Tags
Datas comemorativas   20,752.25
Dicas de como usar     6,833.40
Influenciadores       15,197.29
Loja                   2,865.00
Novos Produtos        10,304.89
Produtos               6,269.82
Promoções             27,458.33
Trends                20,024.00
Name: Curtidas, dtype: float64

In [26]:
df_insta.loc[df_insta["Tags"].isnull(), "Tags"]

11    NaN
19    NaN
29    NaN
38    NaN
41    NaN
43    NaN
49    NaN
50    NaN
Name: Tags, dtype: object

In [27]:
df_insta.loc[df_insta["Tags"].isnull(), "Tags"] = "Sem Tag"

In [28]:
df_insta.groupby("Tags")[["Curtidas", "Comentários"]].mean().sort_values("Curtidas", ascending=False)

Unnamed: 0_level_0,Curtidas,Comentários
Tags,Unnamed: 1_level_1,Unnamed: 2_level_1
Promoções,27458.33,531.0
Datas comemorativas,20752.25,343.5
Trends,20024.0,352.25
Sem Tag,15347.88,207.75
Influenciadores,15197.29,161.71
Novos Produtos,10304.89,198.56
Dicas de como usar,6833.4,133.6
Produtos,6269.82,94.12
Loja,2865.0,17.67


Podemos observar que as postagens de promoções são as que possuem mais engajamento, seguido por datas comemorativas e trends.

In [29]:
df_insta.groupby(["Pessoas", "Tags"])[["Curtidas", "Comentários"]].mean().sort_values("Curtidas", ascending=False)

Unnamed: 0_level_0,Unnamed: 1_level_0,Curtidas,Comentários
Pessoas,Tags,Unnamed: 2_level_1,Unnamed: 3_level_1
S,Promoções,27458.33,531.0
S,Datas comemorativas,20752.25,343.5
S,Trends,20024.0,352.25
S,Sem Tag,15347.88,207.75
S,Influenciadores,15197.29,161.71
S,Novos Produtos,10923.12,215.62
S,Produtos,8316.38,131.62
S,Dicas de como usar,6833.4,133.6
N,Novos Produtos,5359.0,62.0
N,Produtos,4450.67,60.78


In [30]:
df_insta.groupby(["Campanhas", "Tags"])[["Curtidas", "Comentários"]].mean().sort_values("Curtidas", ascending=False)

Unnamed: 0_level_0,Unnamed: 1_level_0,Curtidas,Comentários
Campanhas,Tags,Unnamed: 2_level_1,Unnamed: 3_level_1
S,Promoções,33217.5,490.5
S,Trends,22400.67,386.67
S,Datas comemorativas,20752.25,343.5
S,Influenciadores,18715.4,197.6
S,Sem Tag,16850.75,257.75
N,Promoções,15940.0,612.0
N,Sem Tag,13845.0,157.75
N,Trends,12894.0,249.0
S,Novos Produtos,11040.67,323.0
N,Novos Produtos,9937.0,136.33


## Conclusões

Usar pessoas nas postagens é fundamental para um bom engajamento.

Criar campanhas impulsiona a divulgação da marca.

Promoção é a tag mais procurada, mas deve ser usada de forma mais estratégica devido ao custo.

Usar conteúdos que estão nos trends também trazem bastante visualizações para a marca.

Aproveitar datas especiais para divulgar a marca é uma ótima estratégia de marketing.

Novos produtos performam melhor ao serem apresentados com outras pessoas.

A tag loja, a princípio, não ajuda a divulgar a marca, mas também não foi utilizada ao lado de pessoas e campanhas que já foram vistas como ótimos meios para alcançar um público maior.

Ainda há espaço para mais tipos de postagens que a marca ainda não tentou, como campanhas com o IGTV.