# Análise Inicial

O objetivo é de ter uma visão geral dos dados, usado posteriormente para guiar as queries.

## Tabela Customers

In [0]:
SELECT * FROM workspace.projeto_vendas_bronze.customers
LIMIT 5

In [0]:
-- Clientes únicos
SELECT COUNT(DISTINCT customer_unique_id) AS unique_client_count FROM workspace.projeto_vendas_bronze.customers

In [0]:
-- Clientes por estado
SELECT customer_state, COUNT(DISTINCT customer_unique_id) AS client_by_state 
FROM workspace.projeto_vendas_bronze.customers 
GROUP BY customer_state
ORDER BY client_by_state DESC

In [0]:
-- TOP 5 estados com mais clientes
SELECT customer_state, COUNT(DISTINCT customer_unique_id) AS client_by_state 
FROM workspace.projeto_vendas_bronze.customers 
GROUP BY customer_state
ORDER BY client_by_state DESC
LIMIT 5

In [0]:
-- Concentração de clientes por cidade
SELECT customer_city, COUNT(DISTINCT customer_unique_id) AS client_by_city 
FROM workspace.projeto_vendas_bronze.customers 
GROUP BY customer_city
ORDER BY client_by_city DESC

In [0]:
-- Estados com > 1000 clientes
SELECT customer_state, COUNT(DISTINCT customer_unique_id) AS client_by_state 
FROM workspace.projeto_vendas_bronze.customers 
GROUP BY customer_state
HAVING COUNT(DISTINCT customer_unique_id) > 1000
ORDER BY client_by_state DESC

A concentração de clientes está principalmente nos estados de SP, RJ  e MG. O que também é representado pela maior quantidade de clientes nas capitais desses estados.

## Tabela Orders

In [0]:
SELECT * FROM workspace.projeto_vendas_bronze.orders
LIMIT 5

In [0]:
-- Quantidade de pedidos
SELECT COUNT(DISTINCT order_id) FROM workspace.projeto_vendas_bronze.orders

In [0]:
-- Quantidade de pedidos por status
SELECT order_status, COUNT(DISTINCT order_id) AS order_by_status
FROM workspace.projeto_vendas_bronze.orders
GROUP BY order_status
ORDER BY order_by_status DESC

In [0]:
-- Pedidos ao longo do tempo por ano
SELECT YEAR(order_purchase_timestamp) AS purchase_year, COUNT(DISTINCT order_id) AS order_by_year
FROM workspace.projeto_vendas_bronze.orders
GROUP BY purchase_year
ORDER BY purchase_year

Aumento bastante expressivo entre 2016 e 2017, mas em 2018 não cresceu tanto.

## Tabela Products

In [0]:
SELECT * FROM workspace.projeto_vendas_bronze.products
LIMIT 5

In [0]:
-- Categorias de produtos
SELECT COUNT(DISTINCT product_category_name) AS product_category_count FROM workspace.projeto_vendas_bronze.products

In [0]:
-- Quantidade de produtos por categoria
SELECT product_category_name, COUNT(DISTINCT product_id) AS product_by_category
FROM workspace.projeto_vendas_bronze.products
GROUP BY product_category_name
ORDER BY product_by_category DESC

Quantidade de categorias bem diversificado, enquanto que alguns tem poucos produtos cadastrados nessas categorias.

## Tabela Order Items

In [0]:
SELECT * FROM workspace.projeto_vendas_bronze.order_items
LIMIT 5

In [0]:
-- Valor médio dos itens vendidos
SELECT AVG(price) AS avg_price FROM workspace.projeto_vendas_bronze.order_items

In [0]:
-- TOP 5 pedidos mais caros
SELECT order_id, SUM(price) AS total_order_price
FROM workspace.projeto_vendas_bronze.order_items
GROUP BY order_id
ORDER BY total_order_price DESC
LIMIT 5

In [0]:
-- Faturamento total
SELECT SUM(price) AS total_price FROM workspace.projeto_vendas_bronze.order_items

In [0]:
-- Ticket médio por pedido
SELECT AVG(order_total) AS avg_ticket
FROM (
  SELECT order_id, SUM(price) AS order_total
  FROM workspace.projeto_vendas_bronze.order_items
  GROUP BY order_id
)