In [0]:
/* 
1. Qual pedido com maior valor de frete? E o menor?
2. Qual vendedor tem mais pedidos?
3. Qual vendedor tem mais itens vendidos? E o com menos?
4. Qual dia tivemos mais pedidos?
5. Quantos vendedores são do estado de São Paulo?
6. Quantos vendedores são de Presidente Prudente?
7. Quantos clientes são do estado do Rio de Janeiro?
8. Quantos produtos são de construção?
9. Qual o valor médio de um pedido? E do frete?
10. Em média os pedidos são de quantas parcelas de cartão? E o valor médio por parcela?
11. Quanto tempo em média demora para um pedido chegar depois de aprovado?
12. Qual estado tem mais vendedores?
13. Qual cidade tem mais clientes?
14. Qual categoria tem mais itens?
15. Qual categoria tem maior peso médio de produto?
16. Qual a série histórica de pedidos por dia? E receita?
17. Qual produto é o campeão de vendas? Em receita? Em quantidade? */

In [0]:
/* 1. Qual pedido com maior valor de frete? E o menor? */
SELECT idPedido,
       sum(vlFrete) AS totalFrete
FROM silver.olist.item_pedido
GROUP BY idPedido
ORDER BY totalFrete DESC
/* Para ver os menores fretes substitua DESC por ASC */

In [0]:
/* 2. Qual vendedor tem mais pedidos? */

SELECT idVendedor,
       count(DISTINCT idPedido) AS qtPedido
FROM silver.olist.item_pedido
GROUP BY idVendedor
ORDER BY qtPedido DESC
LIMIT 1



In [0]:
/* 3. Qual vendedor tem mais itens vendidos? E o com menos? */
SELECT idVendedor,
       count(idProduto) AS qtItens
FROM silver.olist.item_pedido
GROUP BY idVendedor
ORDER BY qtItens DESC

In [0]:
/* 4. Qual dia tivemos mais pedidos? */
SELECT date(dtPedido) AS diaPedido,
       count(DISTINCT idPedido) AS qtPedido
FROM silver.olist.pedido
GROUP BY diaPedido
ORDER BY qtPedido DESC
/* Também é possível utilizar 
GROUP BY 1
ORDER BY 2 DESC */
/* Funciona para Apache Spark e para outros */

In [0]:
/* 5. Quantos vendedores são do estado de São Paulo? */
SELECT count(DISTINCT idVendedor) AS qtVendedor
FROM silver.olist.vendedor
WHERE descUF = 'SP'
/* Nesta correção ele não utilizou o GROUP BY porque a consulta era para um estado específico */

In [0]:
/* 6. Quantos vendedores são de Presidente Prudente? */
SELECT count(DISTINCT idVendedor) AS qtVendedor
FROM silver.olist.vendedor
WHERE descCidade = 'presidente prudente'

In [0]:
/* 7. Quantos clientes são do estado do Rio de Janeiro? */
SELECT count(DISTINCT idCliente) AS qtCliente
FROM silver.olist.cliente
WHERE descUF = 'RJ'

In [0]:
/* 8. Quantos produtos são de construção? */
SELECT count(DISTINCT idProduto) AS qtProduto
FROM silver.olist.produto
WHERE descCategoria LIKE '%construcao%'

In [0]:
/* 9. Qual o valor médio de um pedido? E do frete? */
SELECT sum(vlPreco) / count(DISTINCT idPedido) AS vlMediaPedido, -- valor médio por pedido
       sum(vlFrete) / count(DISTINCT idPedido) AS vlMediaFretePedido, -- preço médio frete por pedido

       avg(vlPreco) AS avgPedido, -- valor médio por item (incorreto)
       avg(vlFrete) AS avgFrete   -- preco médio frete por item (incorreto)

FROM silver.olist.item_pedido

In [0]:
/* 10. Em média os pedidos são de quantas parcelas de cartão? E o valor médio por parcela? */

SELECT avg(nrParcelas) as avgQtParcelas,
       avg(vlPagamento / nrParcelas) AS avgValorParcela
FROM silver.olist.pagamento_pedido
WHERE descTipoPagamento = 'credit_card' AND nrParcelas > 0
/* Na correção não é contemplado o erro de divisão por zero que foi considerado nesta correção. */

In [0]:
/* 11. Quanto tempo em média demora para um pedido chegar depois de aprovado? */
SELECT DISTINCT avg(datediff(dtEntregue, dtAprovado)) AS qtDias
FROM silver.olist.pedido
WHERE descSituacao IN ('approved',
                       'shipped',
                       'delivered',
                       'invoiced')

In [0]:
/* 12. Qual estado tem mais vendedores? */
SELECT descUF,
       count(DISTINCT idVendedor) AS qtVendedor
FROM silver.olist.vendedor
GROUP BY descUF
ORDER BY qtVendedor DESC

In [0]:
/* 13. Qual cidade tem mais clientes? */
SELECT descCidade,
       count(DISTINCT idCliente) AS qtCliente, -- clientes que podem não ser únicos
       count(DISTINCT idClienteUnico) AS qtClienteDistinto -- clientes que podem ser únicos
FROM silver.olist.cliente
GROUP BY descCidade
ORDER BY qtCliente DESC

In [0]:
/* 14. Qual categoria tem mais itens? */
SELECT descCategoria,
       count(DISTINCT idProduto) AS qtProduto
FROM silver.olist.produto
GROUP BY descCategoria
ORDER BY qtProduto DESC

In [0]:
/* 15. Qual categoria tem maior peso médio de produto? */
SELECT descCategoria,
       avg(vlPesoGramas) AS pesoMedio,
       count(DISTINCT idProduto) AS qtProduto
FROM silver.olist.produto
GROUP BY descCategoria
ORDER BY pesoMedio DESC

In [0]:
/* 16. Qual a série histórica de pedidos por dia? E receita? */
SELECT date(dtPedido) AS diaPedido,
       count(DISTINCT idPedido) AS qtPedido 
FROM silver.olist.pedido 
GROUP BY diaPedido
ORDER BY diaPedido

Databricks visualization. Run in Databricks to view.

In [0]:
/* 17. Qual produto é o campeão de vendas? Em receita? Em quantidade? */
/* Quantidade Venda */
SELECT idProduto,
       count(*) AS qtVenda,
       sum(vlPreco) AS vlReceita

FROM silver.olist.item_pedido
GROUP BY idProduto
ORDER BY qtVenda DESC

In [0]:
/* 17. Qual produto é o campeão de vendas? Em receita? Em quantidade? */
/* Receita */
SELECT idProduto,
       count(*) AS qtVenda,
       sum(vlPreco) AS vlReceita

FROM silver.olist.item_pedido
GROUP BY idProduto
ORDER BY vlReceita DESC