In [14]:
import pandas as pd
import plotly.express as px
from tabulate import tabulate

# Carregar o conjunto de dados
df_reviews_dataset = pd.read_csv('assets/olist_order_reviews_dataset.csv', encoding='latin1')
df_reviews_dataset = df_reviews_dataset.dropna()

# Renomear colunas
df_reviews_dataset = df_reviews_dataset.rename(columns={
    'review_id': 'ID_de_revisao',
    'order_id': 'ID_pedido',
    'review_score': 'Pontuacao_de_revisao',
    'review_comment_title': 'Titulo_de_comentario',
    'review_comment_message': 'Comentario',
    'review_creation_date': 'Data_de_criacao',
    'review_answer_timestamp': 'Data_de_registro'
})

# Mostrar o dataset
display(df_reviews_dataset)

# Analisar a distribuição das avaliações dos produtos
distribution = df_reviews_dataset['Pontuacao_de_revisao'].value_counts().sort_index()

print("Distribuição das Avaliações dos Produtos:")
display(distribution)

import pandas as pd
import plotly.express as px

# Definindo as cores para cada pontuação de revisão
cores = {
    1: 'red', 
    2: 'orange', 
    3: 'yellow', 
    4: 'green',  
    5: 'blue'    
}

# Criando uma nova coluna 'Cor' com base na pontuação de revisão
df_reviews_dataset['Cor'] = df_reviews_dataset['Pontuacao_de_revisao'].map(cores)

# Agrupando os dados pela pontuação de revisão e contando a frequência
distribution = df_reviews_dataset.groupby('Pontuacao_de_revisao').size().reset_index(name='Frequência')

# Plotar a distribuição das avaliações com cores específicas
fig = px.bar(distribution, x='Pontuacao_de_revisao', y='Frequência', color='Pontuacao_de_revisao',
             labels={'Pontuacao_de_revisao': 'Pontuação de Revisão', 'Frequência': 'Frequência'},
             title='Distribuição das Avaliações dos Produtos',
             color_discrete_map=cores)  # Mapeando as cores diretamente no Plotly Express
fig.show()


# Carregar o conjunto de dados de pedidos para ligar com produtos
df_order_items = pd.read_csv('assets/olist_order_items_dataset.csv', encoding='latin1')

# Renomear colunas no conjunto de dados de itens de pedidos
df_order_items = df_order_items.rename(columns={
    'order_id': 'ID_pedido',
    'product_id': 'ID_produto',
    'order_item_id': 'ID_item_pedido',
    'shipping_limit_date': 'Data_limite_envio',
    'price': 'Preco',
    'freight_value': 'Valor_frete'
})

# Combinar os datasets de revisões e itens de pedidos
df_combined = pd.merge(df_reviews_dataset, df_order_items, on='ID_pedido')

# Calcular a média das pontuações das revisões por produto
avg_reviews_by_product = df_combined.groupby('ID_produto')['Pontuacao_de_revisao'].mean().sort_values(ascending=False)

print("\nProdutos com Melhores Avaliações:\n")
display(avg_reviews_by_product.head(10))

# Plotar as melhores avaliações
fig = px.bar(x=avg_reviews_by_product.head(10).index, y=avg_reviews_by_product.head(10).values,
             labels={'x': 'ID do Produto', 'y': 'Pontuação Média de Revisão'},
             title='Top 10 Produtos com Melhores Avaliações')
fig.show()

print("\nProdutos com Piores Avaliações:\n")
display(avg_reviews_by_product.tail(10))
print("\n")

# Plotar as piores avaliações
fig = px.bar(x=avg_reviews_by_product.tail(10).index, y=avg_reviews_by_product.tail(10).values,
             labels={'x': 'ID do Produto', 'y': 'Pontuação Média de Revisão'},
             title='Top 10 Produtos com Piores Avaliações')
fig.show()
# Calcular o total de avaliações
total_geral = df_reviews_dataset.shape[0]

# Calcular o total de avaliações positivas (pontuação 4 ou 5)
total_positivas = df_reviews_dataset[df_reviews_dataset['Pontuacao_de_revisao'] >= 4].shape[0]

# Calcular o total de avaliações negativas (pontuação 1 ou 2)
total_negativas = df_reviews_dataset[df_reviews_dataset['Pontuacao_de_revisao'] <= 2].shape[0]

# Calcular as porcentagens de avaliações positivas e negativas em relação ao total de avaliações
porcentagem_positivas = (total_positivas / total_geral) * 100
porcentagem_negativas = (total_negativas / total_geral) * 100

# Criar um DataFrame para os dados do gráfico de pizza
dados_grafico = pd.DataFrame({
    'Tipo de Avaliação': ['Positivas', 'Negativas'],
    'Porcentagem': [porcentagem_positivas, porcentagem_negativas]
})

# Plotar o gráfico de pizza
fig = px.pie(dados_grafico, values='Porcentagem', names='Tipo de Avaliação',
             title='Porcentagem de Avaliações Positivas e Negativas')
fig.update_traces(textinfo='percent+label', hole=0.4)  # Adiciona rótulos de porcentagem e define a espessura do gráfico
fig.show()

# Exibir o total de avaliações
print(f"Total de Avaliações: {total_geral}")


Unnamed: 0,ID_de_revisao,ID_pedido,Pontuacao_de_revisao,Titulo_de_comentario,Comentario,Data_de_criacao,Data_de_registro
9,8670d52e15e00043ae7de4c01cc2fe06,b9bf720beb4ab3728760088589c62129,4,recomendo,aparelho eficiente. no site a marca do aparelh...,2018-05-22 00:00:00,2018-05-23 16:45:47
15,3948b09f7c818e2d86c9a546758b2335,e51478e7e277a83743b6f9991dbfa3fb,5,Super recomendo,"Vendedor confiÃ¡vel, produto ok e entrega ante...",2018-05-23 00:00:00,2018-05-24 03:00:01
19,373cbeecea8286a2b66c97b1b157ec46,583174fbe37d3d5f0d6661be3aad1786,1,NÃ£o chegou meu produto,PÃ©ssimo,2018-08-15 00:00:00,2018-08-15 04:10:37
22,d21bbc789670eab777d27372ab9094cc,4fc44d78867142c627497b60a7e0228a,5,Ãtimo,Loja nota 10,2018-07-10 00:00:00,2018-07-11 14:10:25
34,c92cdd7dd544a01aa35137f901669cdf,37e7875cdce5a9e5b3a692971f370151,4,Muito bom.,Recebi exatamente o que esperava. As demais en...,2018-06-07 00:00:00,2018-06-09 18:44:02
...,...,...,...,...,...,...,...
99187,47e0954e156dac6512c25c6d2ecc1c66,16cbf959cfdb88c47ee2a29303547ec2,5,Nota mÃ¡xima!,"Muito obrigado,\r\n\r\nExcelente atendimento,b...",2018-05-22 00:00:00,2018-05-23 00:51:43
99192,0e7bc73fde6782891898ea71443f9904,bd78f91afbb1ecbc6124974c5e813043,4,ð,Aprovado!,2018-07-04 00:00:00,2018-07-05 00:25:13
99196,58be140ccdc12e8908ff7fd2ba5c7cb0,0ebf8e35b9807ee2d717922d5663ccdb,5,muito bom produto,"Ficamos muito satisfeitos com o produto, atend...",2018-06-30 00:00:00,2018-07-02 23:09:35
99197,51de4e06a6b701cb2be47ea0e689437b,b7467ae483dbe956fe9acdf0b1e6e3f4,3,NÃ£o foi entregue o pedido,Bom dia \r\nDas 6 unidades compradas sÃ³ receb...,2018-06-05 00:00:00,2018-06-06 10:52:19


Distribuição das Avaliações dos Produtos:


Pontuacao_de_revisao
1    1789
2     458
3     737
4    1433
5    5422
Name: count, dtype: int64


Produtos com Melhores Avaliações:



ID_produto
000b8f95fcb9e0096488278317764d19    5.0
8b3fe8c89624abf9d932b87faae6b587    5.0
8b5a6c234469d41bbd08bffea91feb3e    5.0
8b68bdd62b3d58f750f213d3ae36dc4e    5.0
8b6bd2f1787ccf9f63fa540492dd74c2    5.0
8b6ec82b7089cbbb7d187eaa3c74275f    5.0
8b879b701aba1cd9adffb70411eb05d5    5.0
8baff20b1d1f194101d0b37036772bca    5.0
8bb27b1d96be90b36b8d0c7f30931d52    5.0
8bd822c04ee6a8292a7b0debc3dbd74a    5.0
Name: Pontuacao_de_revisao, dtype: float64


Produtos com Piores Avaliações:



ID_produto
2c0b8a973e616502de1d80482fb9c5be    1.0
9fab8bd1f9c69cf2301b8ad3bec47480    1.0
df33ce690c4eb43954b4d511302ed033    1.0
df480c7d3f979093ac4c2d1109e78289    1.0
df4bcf4a328103951507064660c445e9    1.0
9ef6c728ed471353c6f06bf8013882c5    1.0
9e9a222ec8c28d9ab56658263c17f16c    1.0
9e92e1d0e33230b26c551bca363f1c41    1.0
9e88896ff9b39f42a9652dc0730ecabc    1.0
7f6b034a2bb30ba8e1da93017a86bd58    1.0
Name: Pontuacao_de_revisao, dtype: float64





Total de Avaliações: 9839
