In [None]:
#importando a base de dados
import pandas as pd

#leitura do arquivo
tabela = pd.read_excel("08. Analisando o engajamento no Instagram.xlsx")

In [None]:
#visualizando a tabela
display(tabela)

In [None]:
#retirando coluna desnecessária para a análise

tabela = tabela.drop("Visualizações", axis=1)

In [None]:
#verificando as informações disponíveis
display(tabela.info())

In [None]:
#contando os valores que aparecem na coluna Carrossel (apenas 8 valores, o que pode impactar na análise)
tabela.Carrossel.value_counts()

#os valores nulos deveriam ser N, indicando que se trata de uma postagem sem Carrossel de imagens

In [None]:
# tratando a base ao atribuir o valor N para a coluna Carrossel 
tabela.loc[tabela.Carrossel.isnull(),"Carrossel"] = "N"

In [None]:
#verificando se a atribuição funcionou
tabela.loc[tabela.Carrossel.isnull()]
tabela.Carrossel.value_counts()

In [None]:
#verificando novamente as informações disponíveis
display(tabela.info())

In [None]:
#coluna Tags também precisa ter NaN atribuídos a N
tabela.loc[tabela.Tags.isnull(),"Tags"] = "Sem tags"

In [None]:
#verificando se a atribuição funcionou
tabela.Tags.value_counts()

In [None]:
#verificando novamente as informações disponíveis
tabela.info()

In [None]:
#descrição estatística da base
tabela.describe()

In [None]:
#visualizando o comportamento das Curtidas em um gráfico de dispersão 
tabela.plot(kind="scatter",x="Data",y="Curtidas",figsize=(14,8));

#observa-se que não há um padrão notável

In [None]:
#visualizando o comportamento das Comentários em um gráfico de dispersão 
tabela.plot(kind="scatter",x="Data",y="Comentários",color="red",label="Comentários",figsize=(14,8));

#observa-se que também não há um padrão notável. As demais colunas precisam ser utilizadas para verificar a existência de um padrão

In [None]:
#ordenando os valores para observar os 5 primeiros registros com mais Curtidas
tabela.sort_values(by="Curtidas",ascending=False).head()


#pode-se observar que no top 5 de todas a postagens em Curtidas, havia pessoas (S) e eram fotos de campanha (S)

In [None]:
#ordenando os valores para observar os 5 primeiros registros com menos Curtidas
tabela.sort_values(by="Curtidas",ascending=False).tail()

#pode-se observar que no top 5 de pior desempenho em Curtidas, não havia pessoas (N) e nem eram fotos de campanha (N)
#pode ser um indicativo de que publicações com pessoas e que sejam de campanhas tem relação com melhor desempenho no que se refere ap número de Curtidas

In [None]:
#para melhorar a visualização, vamos criar um padrão no formato dos valores
pd.options.display.float_format = '{:,.2f}'.format

In [None]:
#agrupando as informações por tipo
tabela.groupby("Pessoas")[["Comentários", "Curtidas"]].mean()


In [None]:
#agrupando por Tipo
tabela.groupby("Tipo")[["Comentários","Curtidas"]].mean()

In [None]:
#agrupando por Tipo e Pessoas
tabela.groupby(["Tipo","Pessoas"])[["Curtidas",'Comentários']].mean()

In [None]:
#incluindo a coluna de campanhas
tabela.groupby(["Tipo","Pessoas","Campanhas"])[["Curtidas",'Comentários']].mean()

In [None]:
#somente para pessoas
tabela.groupby("Pessoas")[["Curtidas",'Comentários']].mean()

In [None]:
#somente para campanhas
tabela.groupby("Campanhas")[["Curtidas",'Comentários']].mean()

In [None]:
#filtrando a coluna Carrossel, pois apenas o tipo "Foto" se encaixa nessa categoria
tabela[tabela.Tipo == "Foto"].groupby(["Carrossel"])[["Curtidas","Comentários"]].mean()

#Carrossel não parece contribuir com o engajamento

In [None]:
#agregando por pessoas e campanhas
tabela.groupby(["Pessoas","Campanhas"])[["Curtidas",'Comentários']].mean()

#publicações que unem campanhas com pessoas aumentam consideravelmente o engajamento

In [None]:
#filtrandp a base apenas onde o tipo é Vídeo
tabela[tabela.Tipo == 'Vídeo']

#poucos vídeos com pessoas e campanhas fizeram com que a média de desempenho caísse. Porém os vídeos que englobaram "Campanhas" e "Pessoas" tiveram bom desempenho, próximo ao desempenho das "Fotos"

In [None]:
#explorando as tags
tabela.groupby("Tags")["Curtidas"].mean()

In [None]:
#precisa-se analisar as tags individualmente. Portanto, separa-se as tags duplas com a função split
tabela.Tags = tabela.Tags.str.split("/")
tabela.head()


In [None]:
#separando a coluna Tag em 1 linha para cada elemento da lista (as demais colunas não indicadas apenas são repetidas)
tabela = tabela.explode('Tags')
tabela.head()

In [None]:
#agora fazendo a análise de média para as Tags
tabela.groupby("Tags")["Curtidas"].mean()

In [None]:
#mostrando novamente a tabela de curtidas por tag
tabela.groupby("Tags")[["Curtidas","Comentários"]].mean().sort_values("Curtidas",ascending=False)

In [None]:
#verificando novamente as informações disponíveis
tabela.info()

In [None]:
#ordenando por curtidas
tabela.groupby(["Pessoas","Tags"])[["Curtidas","Comentários"]].mean().sort_values("Curtidas",ascending=False)

#publicações que tenham pessoas realmente são fundamentais para um bom engajamento (dobro de desempenho nas tags "Produtos" e "Novos Produtos")

In [None]:
#fazendo para Campanhas e Tag
tabela.groupby(["Campanhas","Tags"])[["Curtidas","Comentários"]].mean().sort_values("Curtidas",ascending=False)

# postagens feitas associando promoções em época de campanha tem mais do que o dobro de desempenho 
# não há uma diferença perceptível entre a associação de campanhas eo lançamento de novos produtos

In [None]:
## Conclusões
# postagens com pessoas engajam muito mais do que aquelas que não possuem ninguém (10 mil curtidas)
# postagens em épocas de campanha também possuem um ótimo engajamento (5.3 mil curtidas)
# postagens que agregam pessoas e campanhas tem em média 19.4 mil curtidas (excelente)
# carrossel não foi um diferencial para melhorar o engajamento da marca
# a média de curtidas sem carrossel é maior do que com. Portanto, sugere-se focar em outros tipos de publicação que gerem melhor engajamento
# sugere-se postar apenas vídeos que agreguem pessoas e campanhas que tiveram 
# desempenho próximo ao das fotos, uma vez que os não apresentaram ambos não tiveram um bom desempenho 
# IGTV mesmo com pessoas não agradaram  
# em todas as tags, quando há pessoas envolvidas o desempenho foi muito melhor
# campanhas ajudam na divulgação da marca
# promoções tiveram um desempenho muito superior do que qualquer outra tag (é uma tag que pode resultar em custo para a empresa = avaliar)
# conteúdo que estão em trends também ajudam na divulgação
# para novos produtos, a inclusão de pessoas é essencial (o dobro de desempenho)
# não há dados para cravar que a tag "Loja" não é boa, pois não há publicações com pessoas ou campanha. Sugere-se testar ambas