# An√°lise de Dados de Produtos - Dashboard Interativo

Este projeto tem como objetivo realizar uma an√°lise explorat√≥ria de um dataset de e-commerce, com foco na rela√ß√£o entre pre√ßo, desconto, avalia√ß√µes e quantidade de vendas.

Os gr√°ficos foram constru√≠dos utilizando as bibliotecas **Plotly Express** para visualiza√ß√£o de dados e **Dash** para criar um dashboard interativo.
---


## Importa√ß√£o das Bibliotecas

Abaixo est√£o as bibliotecas utilizadas para constru√ß√£o do dashboard:
- pandas
- plotly.express
- dash


In [28]:
!pip install dash
import pandas as pd
import plotly.express as px
from dash import Dash, html, dcc



## Fun√ß√£o de Cria√ß√£o dos Gr√°ficos

A fun√ß√£o abaixo cria os principais gr√°ficos para an√°lise dos dados.

In [29]:
def cria_graficos(df):
    fig1 = px.histogram(df, x='Nota', nbins=10, title='Distribui√ß√£o das Notas dos Produtos')
    fig2 = px.histogram(df, x='N_Avalia√ß√µes', nbins=20, title='Distribui√ß√£o do N√∫mero de Avalia√ß√µes')
    fig3 = px.density_heatmap(df, x='N_Avalia√ß√µes', y='Nota', 
                               title='Produtos avaliados e suas notas', 
                               marginal_x='histogram', marginal_y='histogram')
    df_corr = df[['Desconto', 'N_Avalia√ß√µes', 'Pre√ßo', 'Qtd_Vendidos_Cod']].corr()
    fig4 = px.imshow(df_corr, text_auto=True, title='Mapa de Calor - Correla√ß√£o entre Vari√°veis')
    fig5 = px.bar(df, x='Temporada_Cod', y='Qtd_Vendidos_Cod', 
                  title='Quantidade Vendida na Temporada', color_discrete_sequence=['#90ee70'])
    genero_counts = df.groupby('G√™nero')['Qtd_Vendidos_Cod'].sum().reset_index()
    fig6 = px.pie(genero_counts, names='G√™nero', values='Qtd_Vendidos_Cod', 
                  title='Quantidade de Produtos Vendidos por G√™nero')
    fig7 = px.density_contour(df, x='Pre√ßo_MinMax', title='Densidade de Pre√ßos')
    fig8 = px.scatter(df, x='Qtd_Vendidos_Cod', y='Desconto', 
                      title='Regress√£o de Quantidade Vendida pelo Desconto')
    
    return fig1, fig2, fig3, fig4, fig5, fig6, fig7, fig8

## üñ•Ô∏è Fun√ß√£o para Criar o App com Dash

Essa fun√ß√£o define o layout do dashboard e insere todos os gr√°ficos na interface.


In [30]:
def criar_app(df):
    app = Dash(__name__)
    fig1, fig2, fig3, fig4, fig5, fig6, fig7, fig8 = cria_graficos(df)

    app.layout = html.Div([
        dcc.Graph(figure=fig1),
        dcc.Graph(figure=fig2),
        dcc.Graph(figure=fig3),
        dcc.Graph(figure=fig4),
        dcc.Graph(figure=fig5),
        dcc.Graph(figure=fig6),
        dcc.Graph(figure=fig7),
        dcc.Graph(figure=fig8),
    ])

    return app


## Carregando os Dados

Vamos carregar o dataset `ecommerce_estatistica.xlsx`.


In [31]:
df = pd.read_excel('ecommerce_estatistica.xlsx')
df.head()


Unnamed: 0.1,Unnamed: 0,T√≠tulo,Nota,N_Avalia√ß√µes,Desconto,Marca,Material,G√™nero,Temporada,Review1,...,Nota_MinMax,N_Avalia√ß√µes_MinMax,Desconto_MinMax,Pre√ßo_MinMax,Marca_Cod,Material_Cod,Temporada_Cod,Qtd_Vendidos_Cod,Marca_Freq,Material_Freq
0,1,Kit 10 Cuecas Boxer Lupo Cueca Box Algod√£o Mas...,4.5,3034,18,lupo,algod√£o,Masculino Adulto,outono/inverno,As cuecas s√£o boas; por√©m voc√™ percebe na cost...,...,0.814815,0.334178,0.213115,0.378585,463,25,3,10000,0.042292,0.176444
1,2,Kit Com 10 Cuecas Boxer Algod√£o Sem Costura Zo...,4.7,5682,20,zorba,algod√£o,Masculino Adulto,n√£o definido,O tecido √© bom e s√£o confort√°veis. S√≥ que a nu...,...,0.888889,0.625937,0.245902,0.322329,838,25,1,50000,0.009095,0.176444
2,3,Kit 10 Cuecas Boxer Mash Algod√£o Cotton Box Or...,4.6,1700,22,mash,algod√£o,Masculino Adulto,primavera/ver√£o,"As cuecas s√£o boas, por√©m meu marido usa g e p...",...,0.851852,0.187197,0.278689,0.372617,494,25,7,10000,0.010914,0.176444
3,4,Kit 3 Short Jeans Feminino Cintura Alta Barato...,4.4,507,9,menina linda,jean,Feminino Adulto,primavera/ver√£o,Estou encantada com essas pe√ßas!.\nOs shorts s...,...,0.777778,0.055751,0.065574,0.201767,509,74,7,1000,0.010005,0.025466
4,5,Blusa + Cal√ßa T√©rmica Treino Futebol Crian√ßa I...,4.7,58,5,roupa zero grau,termico unissex,Sem g√™nero infantil,outono/inverno,"Produto √≥timo , mesmo ap√≥s v√°rias lavagens n√£o...",...,0.888889,0.00628,0.0,0.114508,669,166,3,100,0.002274,0.00091


## ‚ñ∂Ô∏è Executando o Dashboard

Execute o c√≥digo abaixo. Ele ir√° abrir o dashboard na porta **8050** no seu navegador.


In [32]:
if __name__ == '__main__':
    app = criar_app(df)
    app.run(debug=True, port=8050)

# 1. Histogramas
## a) Distribui√ß√£o das Notas dos Produtos
A maioria dos produtos possui notas entre 4.0 e 4.8, com um pico pr√≥ximo de 4.5. Poucos produtos est√£o abaixo de 3.5. A curva KDE indica uma distribui√ß√£o levemente assim√©trica para a esquerda, sugerindo que a maioria das avalia√ß√µes √© positiva.

Decis√µes:

Focar em campanhas de marketing para produtos bem avaliados (notas acima de 4.0) para impulsionar as vendas.

Investigar produtos com notas abaixo de 3.5 para identificar causas de avalia√ß√µes negativas e buscar melhorias.

## b) Distribui√ß√£o do N√∫mero de Avalia√ß√µes
Poucos produtos recebem muitas avalia√ß√µes, enquanto a maioria tem poucas. Isso aponta para uma concentra√ß√£o da visibilidade das avalia√ß√µes em alguns produtos populares.

Decis√µes:

Promover os produtos com maior n√∫mero de avalia√ß√µes para alavancar vendas.

Incentivar os clientes a deixarem avalia√ß√µes por meio de e-mails p√≥s-compra ou benef√≠cios.

# 2. Gr√°fico de Dispers√£o ‚Äì Rela√ß√£o entre Notas e N√∫mero de Avalia√ß√µes
O padr√£o refor√ßa a concentra√ß√£o de visibilidade e engajamento em poucos produtos populares, que recebem muitas avalia√ß√µes.

Decis√£o:

Focar em estrat√©gias para maximizar o engajamento nas avalia√ß√µes desses produtos.

# 3. Mapa de Calor ‚Äì Correla√ß√£o entre Desconto, Avalia√ß√µes, Pre√ßo e Quantidade Vendida
Correla√ß√£o forte (0.91) entre n√∫mero de avalia√ß√µes e quantidade vendida.

Correla√ß√£o fraca (0.15) entre desconto e quantidade vendida.

Decis√µes:

Priorizar estrat√©gias que incentivem avalia√ß√µes.

Diversificar estrat√©gias de vendas al√©m de descontos, como frete gr√°tis e programas de fidelidade.

# 4. Gr√°fico de Barras ‚Äì Quantidade Vendida nas Temporadas
A maior quantidade de vendas ocorreu na Primavera/Ver√£o. Por√©m, muitos dados est√£o com temporadas ‚Äún√£o definidas‚Äù, dificultando an√°lises precisas.

Decis√£o:

Melhorar a categoriza√ß√£o das temporadas para otimizar planejamento de estoque e promo√ß√µes.

# 5. Gr√°fico de Pizza ‚Äì Distribui√ß√£o de Produtos Vendidos por G√™nero
Maior concentra√ß√£o nos g√™neros masculino e feminino, com parcela significativa sem defini√ß√£o.

Decis√µes:

Criar filtros mais espec√≠ficos por g√™nero na plataforma.

Avaliar investimento em p√∫blicos menos atendidos (beb√™s, plus size, etc).

# 6. Gr√°fico de Densidade ‚Äì Distribui√ß√£o de Pre√ßos
Gr√°fico apresenta m√∫ltiplos picos, indicando diferentes faixas de pre√ßo (entrada, intermedi√°rio, premium). A cauda longa √† direita mostra poucos produtos com pre√ßos muito altos.

Decis√µes:

Analisar precifica√ß√£o por categoria para otimizar vendas.

Verificar se produtos caros t√™m diferenciais claros.

# 7. Gr√°fico de Regress√£o ‚Äì Quantidade Vendida vs. Desconto
Rela√ß√£o fraca entre desconto e quantidade vendida. Alguns outliers indicam vendas altas com descontos variados.

Decis√µes:

Testar estrat√©gias de vendas al√©m dos descontos.

Investigar outliers para entender fatores de sucesso.