### Análise de dados - Caso Hipotético E-commerce

Projeto apresentado para avaliação na disciplina Banco de Dados I

Aluna: Renata Cristina Oliveira Leal Lima

- Dataset extraído de: [data.word](https://data.world/jerrys/sql-12-applying-functions-in-sql)

In [43]:
#!pip install psycopg2-binary pandas matplotlib seaborn sqlalchemy

In [84]:
#importando as bibliotecas
import pandas as pd
import numpy as np
import plotly.express as px
from sqlalchemy import create_engine

In [45]:
# string de conexão com o banco de dados ecommerce
engine = create_engine('postgresql://postgres:postgres@localhost:5432/ecommerce')

In [46]:
# select amostra da tabela produtos
produtos = pd.read_sql("SELECT * FROM produtos LIMIT 10;", engine); produtos.head()

Unnamed: 0,Codigo,Produto,Preco
0,BS001873,Apple Lightning Cable,$21.99
1,BS001874,SanDisk Extreme microSDXC,$31.50
2,BS001875,Seagate 2TB Expansion Portable HDD,$79.00
3,BS001876,TicWatch Pro 3 Ultra GPS Smartwatch Qualcomm,$399.00
4,BS001877,Webcam HD 1080p Web Camera,$59.00


In [47]:
# select amostra da tabela vendas
vendas = pd.read_sql("SELECT * FROM vendas LIMIT 10;", engine); vendas.head()

Unnamed: 0,Order ID,Date,ship-service-level,Style,Codigo,Courier Status,Qty,ship-country,Fulfillment
0,171-8536041-9190708,6/29/2022,Expedited,SET400,BS001879,Cancelled,4,AU,Yes
1,407-4176879-6571509,6/29/2022,Expedited,JNE3486,BS001890,Cancelled,2,BR,Yes
2,404-4382011-4681149,6/29/2022,Expedited,JNE3887,BS001873,Cancelled,2,BR,Yes
3,406-3412504-2471555,6/29/2022,Expedited,JNE3487,BS001888,Cancelled,2,BR,Yes
4,408-2481787-8248368,6/29/2022,Expedited,JNE3566,BS001898,Cancelled,2,BR,Yes


**Qual a faixa de preço dos produtos com status de entrega cancelado? Há relação com valores(preço) mais altos?**

In [48]:
# Consulta SQL dos produtos com respectivos preços e a quantidade de cancelamentos

cancelamento = pd.read_sql("SELECT * FROM cancelamento_por_preço LIMIT 10;", engine); cancelamento.head()

Unnamed: 0,Produto,Codigo,Preco,Courier Status,quantidade_cancelada
0,YABER WiFi Projector Mini Portable Projector 6...,BS001900,$218.00,Cancelled,775.0
1,Kindle Paperwhite (8GB),BS001892,$239.00,Cancelled,738.0
2,PHILIPS Sonicare 9900 Prestige Power Toothbrush,BS001891,$329.00,Cancelled,737.0
3,Logitech MK270R Wireless Keyboard and Mouse Combo,BS001878,$38.00,Cancelled,734.0
4,TP-Link Tapo Pan/Tilt Smart Security Camera,BS001881,$66.43,Cancelled,729.0


**Não foi encontrada relação direta entre preço e quantidade cancelada que pudesse afirmar que os produtos mais caros são os mais cancelados. Ao realizar consultas na base de dados, os mais cancelados ficam inclusive em faixas baixas ou intermediárias de preços. Conforme pode ser visto no gráfico abaixo:**

In [49]:

fig = px.bar(data_frame=cancelamento, x="Produto", y="quantidade_cancelada", color='Preco')
fig.show()

In [50]:
#Consulta SQl quantidade de produtos entregues versus e seus preços
entrega = pd.read_sql("SELECT * FROM entrega_por_preço LIMIT 10;", engine); entrega.head()

Unnamed: 0,Produto,Codigo,Preco,Courier Status,quantidade_entregue
0,Taco Cat Goat Cheese Pizza Card Game,BS001889,$14.99,Shipped,13775.0
1,Nintendo Switch Console Lite,BS001890,$329.95,Shipped,13747.0
2,Logitech MK270R Wireless Keyboard and Mouse Combo,BS001878,$38.00,Shipped,13726.0
3,TP-Link Tapo Pan/Tilt Smart Security Camera,BS001881,$66.43,Shipped,13641.0
4,Sony WH1000XM4 Noise Canceling Wireless Headph...,BS001894,$385.00,Shipped,13640.0


*Complementando a análise dos produtos que sofreram mais cancelamentos, os produtos mais entregues revela mais uma vez que o preço não é prepoderante, inclusive produtos que estão nos mais cancelados também aparecem nos mais entregues, isso demonstra que o seu volume de vendas que foi alto, o que aumenta também suas possibilidades de cancelamento/entrega.*

*Tomada de decisão/ação: mandar pesquisa para clientes que cancelaram os pedidos para entender os motivos desse cancelamento, se foi compra por impulso que gerou arrependimento, algum tipo de insatisfação com o produto etc.*


**O preço dos produtos influenciam no volume de vendas? Mais baratos > volume?**

In [62]:
# Consulta SQL dos produtos mais venditos e seus respectivos preços
volumevenda = pd.read_sql("SELECT * FROM volume_venda_preço;", engine); volumevenda.head()

Unnamed: 0,Produto,Codigo,Preco,quantidade_vendida
0,Logitech MK270R Wireless Keyboard and Mouse Combo,BS001878,$38.00,15264.0
1,Nintendo Switch Console Lite,BS001890,$329.95,15256.0
2,Taco Cat Goat Cheese Pizza Card Game,BS001889,$14.99,15247.0
3,Sony WH1000XM4 Noise Canceling Wireless Headph...,BS001894,$385.00,15174.0
4,TP-Link Tapo Pan/Tilt Smart Security Camera,BS001881,$66.43,15168.0


In [67]:
fig = px.histogram(data_frame=volumevenda, x="quantidade_vendida", y="Preco")
fig.show()

*O produto com o valor mais baixo é também o mais vendido, mas a quantidade vendida em outras faixas de preço são similares, seria interessante saber se o momento do compra foi em uma promoção, já que existe uma certa similaridade se for levar em conta somente o preço. Como também pode ser visto abaixo neste gráfico de dispersão*

In [68]:
px.scatter(data_frame=volumevenda, x="quantidade_vendida", y="Preco", color="Preco")

*Tomada de decisão/ação: Se o momento de compra do consumidor foi por uma promoçao, seria interessante repetir as campanhas e também gerar alerta de preço para pessoas que tenham buscado e não comprado o produto anteriormente.*

**Qual o valor de estoque parado devido a cancelamentos?**

In [72]:
#Consulta SQL do valor em estoque de cada produto
valorcancel = pd.read_sql("SELECT * FROM estoque_cancelamento LIMIT 10;", engine); valorcancel.head()

Unnamed: 0,Produto,Codigo,valor_cancelamento,Courier Status
0,Sony WH1000XM4 Noise Canceling Wireless Headph...,BS001894,91245.0,Cancelled
1,LEGO Ideas Home Alone McCallisters’ House 21330,BS001888,88004.0,Cancelled
2,Nintendo Switch Console Lite,BS001890,77868.0,Cancelled
3,TicWatch Pro 3 Ultra GPS Smartwatch Qualcomm,BS001876,77406.0,Cancelled
4,PHILIPS Sonicare 9900 Prestige Power Toothbrush,BS001891,77315.0,Cancelled


In [73]:
fig = px.scatter(data_frame=valorcancel, x="valor_cancelamento",
	         size="valor_cancelamento", color="Produto", log_x=True, size_max=60)
fig.show()

In [82]:
# Valor em estoque por motivo de cancelamento
valorcancelnl = pd.read_sql("SELECT * FROM estoque_cancelamento;", engine);
sum(valorcancelnl.valor_cancelamento)

1002759.0

In [83]:
#Valor arrecadado por vendas concluídas(entregues)
entregaarrecad = pd.read_sql("SELECT * FROM arrecadado_vendas;", engine);
sum(entregaarrecad.valor_entrega)

19114211.0

*O valor em estoque parado é de ($) 1.002.759,00 que representa 5.25 por cento do total arrecadado pelas vendas finalizadas (shipped) que foi de ($) 19.114.211,00, esta porcentagem em rápida pesquisa se configura dentro da média dos e-commerces.*


*Tomada de decisão/ação: Como são produtos bem vendidos esse estoque tente a diminuir ao longo das campanhas e promoções, pode ser também caso se rever a continuidade de alguns produtos na plataforma e suas quantidades em estoque, levando em conta também a avaliação dos mesmos pelos consumidores para essa decisão.*