### Importando os dados do CSV e criando tabela

In [0]:
DROP TABLE IF EXISTS vendas

In [0]:
CREATE TABLE vendas
USING delta 
FROM read_files(
  '/Volumes/workspace/default/vendas/vendas.csv',
  format => 'csv',
  header => true,
  mode => 'FAILFAST'
)

num_affected_rows,num_inserted_rows


## Validando os dados

In [0]:
SELECT * FROM vendas;

id_transacao,data,cliente_id,produto,categoria,quantidade,preco_unitario,valor_total,forma_pagamento,regiao,_rescued_data
1,2025-01-01,C001,Notebook A,Eletrônicos,1,3500.0,3500.0,Cartão Crédito,SP,
2,2025-01-01,C002,Camiseta Azul,Vestuário,2,50.0,100.0,Pix,RJ,
3,2025-01-01,C003,Geladeira X,Eletrodoméstico,1,2500.0,2500.0,Boleto,MG,
4,2025-01-02,C002,Notebook A,Eletrônicos,1,3500.0,3500.0,Cartão Débito,RJ,
5,2025-01-02,C004,Smartwatch Y,Eletrônicos,1,900.0,900.0,Pix,SP,
6,2025-01-02,C005,Camiseta Azul,Vestuário,3,50.0,150.0,Dinheiro,RS,
7,2025-01-03,C006,Fone Bluetooth,Eletrônicos,1,200.0,200.0,Cartão Crédito,BA,
8,2025-01-03,C007,Notebook A,Eletrônicos,2,3500.0,7000.0,Pix,SP,
9,2025-01-03,C008,Cafeteira Z,Eletrodoméstico,1,300.0,300.0,Boleto,MG,
10,2025-01-03,C009,Camiseta Azul,Vestuário,1,50.0,50.0,Cartão Crédito,RJ,


#### OLTP

### Método INSERT

In [0]:
INSERT INTO vendas VALUES(51, '2025-10-13', 'C059', 'Celular POCO X7 PRO', 'Eletrônicos', 3, 1800, 5400, 'Cartão de Crédito', 'SP', null);

num_affected_rows,num_inserted_rows
1,1


In [0]:
SELECT * FROM vendas WHERE id_transacao == 51;

id_transacao,data,cliente_id,produto,categoria,quantidade,preco_unitario,valor_total,forma_pagamento,regiao,_rescued_data
51,2025-10-13,C059,Celular POCO X7 PRO,Eletrônicos,3,1800.0,5400.0,Cartão de Crédito,SP,


### Método UPDATE

In [0]:
UPDATE vendas SET data = '2025-10-10' WHERE id_transacao = 51;

num_affected_rows
1


In [0]:
SELECT * FROM vendas WHERE id_transacao == 51;

id_transacao,data,cliente_id,produto,categoria,quantidade,preco_unitario,valor_total,forma_pagamento,regiao,_rescued_data
51,2025-10-10,C059,Celular POCO X7 PRO,Eletrônicos,3,1800.0,5400.0,Cartão de Crédito,SP,


### Método DELETE

In [0]:
DELETE FROM vendas WHERE id_transacao = 51;

num_affected_rows
1


In [0]:
SELECT * FROM vendas WHERE id_transacao == 51;

id_transacao,data,cliente_id,produto,categoria,quantidade,preco_unitario,valor_total,forma_pagamento,regiao,_rescued_data


### Método SELECT

In [0]:
SELECT * FROM vendas WHERE cliente_id == 'C031' ORDER BY data DESC LIMIT 5 ;

id_transacao,data,cliente_id,produto,categoria,quantidade,preco_unitario,valor_total,forma_pagamento,regiao,_rescued_data
24,2025-01-10,C031,Fone Bluetooth,Eletrônicos,4,200.0,800.0,Cartão Débito,SC,
45,2025-01-09,C031,Notebook A,Eletrônicos,4,3500.0,14000.0,Dinheiro,PE,


### DESAFIO EXTRA

In [0]:
MERGE INTO vendas AS target
USING (
  SELECT
    1001 AS id_transacao,
    DATE('2006-06-06') AS data,
    'C666' AS cliente_id,
    'Bíblia' AS produto,
    'Livros' AS categoria,
    1 AS quantidade,
    666 AS preco_unitario,
    666 AS valor_total,
    'Dinheiro' AS forma_pagamento,
    'SP' AS regiao,
    NULL AS _rescued_data
) AS source
ON target.id_transacao = source.id_transacao
WHEN MATCHED THEN
  UPDATE SET valor_total = 200
WHEN NOT MATCHED THEN
  INSERT (
    id_transacao, data, cliente_id, produto, categoria, quantidade,
    preco_unitario, valor_total, forma_pagamento, regiao, _rescued_data
  )
  VALUES (
    source.id_transacao, source.data, source.cliente_id, source.produto, source.categoria,
    source.quantidade, source.preco_unitario, source.valor_total, source.forma_pagamento,
    source.regiao, source._rescued_data
  )

num_affected_rows,num_updated_rows,num_deleted_rows,num_inserted_rows
1,1,0,0


In [0]:
SELECT * FROM vendas WHERE id_transacao == 1001;

id_transacao,data,cliente_id,produto,categoria,quantidade,preco_unitario,valor_total,forma_pagamento,regiao,_rescued_data
1001,2006-06-06,C666,Bíblia,Livros,1,666.0,200.0,Dinheiro,SP,


#### OLAP

In [0]:
SELECT categoria, COUNT(*)
FROM vendas
GROUP BY categoria
ORDER BY COUNT(*) DESC

categoria,count(1)
Eletrônicos,22
Vestuário,14
Eletrodoméstico,14
Livros,1


Databricks visualization. Run in Databricks to view.

A categoria que mais vendeu foi Eletrônicos

In [0]:
SELECT regiao, COUNT(*)
FROM vendas
GROUP BY regiao
ORDER BY COUNT(*) DESC

regiao,count(1)
MG,10
RS,8
SC,7
BA,6
SP,6
RJ,6
PR,5
PE,3


Databricks visualization. Run in Databricks to view.

O estado que mais vendeu foi Minas Gerais

In [0]:
SELECT MONTH(data) as `Mês`, COUNT(*) as `Vendas`
FROM vendas
GROUP BY MONTH(data)
ORDER BY MONTH(data)

Mês,Vendas
1,50
6,1


Houve queda de vendas ao longo dos meses

In [0]:
SELECT produto AS `Produto`, SUM(valor_total) as `Faturamento`
FROM vendas
GROUP BY produto
ORDER BY SUM(valor_total) DESC
LIMIT 3

Produto,Faturamento
Notebook A,84000.0
Geladeira X,22500.0
"TV 50""""",19600.0


Databricks visualization. Run in Databricks to view.

In [0]:
SELECT ROUND(SUM(valor_total) / COUNT(*), 2) as `Ticket Médio`
FROM vendas

Ticket Médio
3078.43


Databricks visualization. Run in Databricks to view.

In [0]:
CREATE OR REPLACE VIEW receita
AS SELECT
  categoria AS `Categoria`,
  SUM(valor_total) AS `Receita`	,
  COUNT(*) AS `Total de Vendas`,
  ROUND(SUM(valor_total) / COUNT(*), 2) AS `Ticket médio`
FROM vendas
GROUP BY categoria

In [0]:
SELECT * FROM receita

Categoria,Receita,Total de Vendas,Ticket médio
Vestuário,8500.0,14,607.14
Eletrônicos,118000.0,22,5363.64
Eletrodoméstico,30300.0,14,2164.29
Livros,200.0,1,200.0


Databricks visualization. Run in Databricks to view.