In [1]:
import cufflinks as cf
import pandas as pd
from plotly.offline import download_plotlyjs, init_notebook_mode, plot, iplot
import plotly.graph_objs as go
%matplotlib inline

In [2]:
# Modo offline
init_notebook_mode(connected=True)
cf.go_offline()

# Análise Exploratória

* Avaliação geral;
* Nível de Satisfação;
* Problemas com atraso, produtos defeituosos, devolução e outros.

In [4]:
# Somente colunas relevantes

cols_df1 = ['order_id',
            'review_score']

cols_df2 = ['votes_before_estimate',
            'votes_delayed',
            'votes_low_quality',
            'votes_return',
            'votes_not_as_anounced',
            'votes_partial_delivery',
            'votes_other_order',
            'votes_satisfied',
            'most_voted_subclass',
            'most_voted_class']

# Dataframes
orders = pd.read_csv('olist_public_dataset_v2.csv',
                     usecols=cols_df1)

classf_orders = pd.read_csv('olist_classified_public_dataset.csv',
                            usecols=cols_df2)

**Avaliação Geral**

In [5]:
#Review dados pelos clientes

reviews = orders['review_score'].value_counts()
reviews

5    56693
4    19247
1    11905
3     8743
2     3412
Name: review_score, dtype: int64

In [6]:
# Ver em grafico

colors = ['#33691e',
          '#006064',
          '#b71c1c',
          '#fbc02d',
          '#ff6f00']

trace_reviews = go.Bar(x=reviews.values,
                       y=reviews.index,
                       orientation='h',
                       marker=dict(color=colors))

layout_reviews = go.Layout(title='Reviews',
                           yaxis=dict(title='Nota (em estrelas)'),
                           bargap=.1)

fig_reviews = go.Figure(data=[trace_reviews],
                        layout=layout_reviews)

iplot(fig_reviews)

    Nível de satisfação alto - 56,69% de avaliações, 5 estrelas e 19,25% com 4 estrelas 
    (75,94% de satisfação quase total).
   **Note:** 1 estrela representam quase 12%.

**Problemas na Compra**

    Os problemas foram divididos em duas classes: 
   **Problemas de entrega** e **Problemas de qualidade**.

In [7]:
# Classes mais votadas de NAO SATISFEITOS
mv_class = classf_orders['most_voted_class']\
                .value_counts()

mv_class

satisfeito_com_pedido     1983
problemas_de_entrega       950
problemas_de_qualidade     480
Name: most_voted_class, dtype: int64

Classes de Problemas

In [8]:
trace_mvclass = go.Pie(labels=['Problema com Entrega',
                               'Problema de Qualidade'],
                       values=mv_class[1:].values,
                       hoverinfo='label',
                       textinfo='percent',
                       textfont=dict(size=12),
                       textposition='outside',
                       hole=.4,
                       marker=dict(colors=['#FFD600',
                                           '#D32F2F'],
                                   line=dict(color='#ffffff',
                                             width=4)))

fig_mvclass = go.Figure(data=[trace_mvclass],
                        layout= go.Layout(title='Problemas - Categorias'))

iplot(fig_mvclass)

    Atraso na entrega é o grande responsável pela falta de satisfação.
    Aprofundar e Verificar sobre a qualidade do produto

Subclasses de Problemas

In [9]:
# Subclasses mais votadas
mv_subclass = classf_orders['most_voted_subclass']\
                .value_counts()

mv_subclass

satisfeito                1491
antes_prazo                492
atrasado                   434
entrega_parcial            401
diferente_do_anunciado     163
baixa_qualidade            149
devolucao                  134
outro_entrega              115
outro_pedido                34
Name: most_voted_subclass, dtype: int64

In [10]:
# Foco apenas nos problemas

labels = ['Atraso na Entrega',
          'Entrega Incompleta',
          'Diferente do Anúncio',
          'Baixa Qualidade',
          'Devolução do Produto',
          'Outros Problemas com Entrega',
          'Outros Problemas com Pedido']

colors_mvsubclass = ['#FFD600',
                     '#FF6D00',
                     '#512DA8',
                     '#B71C1C',
                     '#388E3C',
                     '#FF4081',
                     '#1976D2']

trace_mvsubclass = go.Pie(labels=labels,
                          values=mv_subclass[2:].values,
                          hoverinfo='label',
                          textinfo='percent',
                          textfont=dict(size=12),
                          textposition='outside',
                          hole=.4,
                          marker=dict(colors=colors_mvsubclass,
                                      line=dict(color='#ffffff',
                                                width=4)))

fig_mvsubclass = go.Figure(data=[trace_mvsubclass],
                           layout= go.Layout(
                               title='Problemas - Subcategorias'))

iplot(fig_mvsubclass)