## Criando Banco de dados

Neste tópico, vamos aprender como criar um banco de dados no Databricks, que servirá como base para armazenar e organizar as tabelas utilizadas em nossas análises. A criação de um banco de dados é um passo fundamental para garantir a estruturação e o gerenciamento eficiente dos dados ao longo do projeto.

In [0]:
path = "/Volumes/workspace/default/tutorial/bike-store"

In [0]:
display(dbutils.fs.ls(path))

In [0]:
%sql
CREATE DATABASE IF NOT EXISTS bike_store;


## Criando tabela de Produtos

Neste tópico, vamos aprender como criar uma tabela de produtos no Databricks. A criação dessa tabela é essencial para organizar e armazenar informações relevantes sobre os produtos que serão utilizados em nossas análises, facilitando consultas e garantindo a integridade dos dados ao longo do projeto.

In [0]:
%sql

use default;
CREATE OR REPLACE TEMPORARY VIEW products_tmp
USING csv
OPTIONS (
  'path' '/Volumes/workspace/default/tutorial/bike-store/products.csv', -- Caminho para o arquivo no DBFS
  'header' 'true',  -- Se a primeira linha do arquivo contém cabeçalho
  'inferSchema' 'true' -- Inferir automaticamente os tipos de dados das colunas
)


In [0]:
%sql
-- Fina a partir da view (CTAS)
CREATE OR REPLACE TABLE bike_store.products AS SELECT * FROM products_tmp;

In [0]:
%sql
-- ver todos os dados 
use bike_store;
SELECT * FROM products;


In [0]:
%sql
SELECT count(*) FROM bike_store.products;

In [0]:
%sql
-- Quantidade de Bikes por ano do modelo produzido 
select 
model_year as Ano
,count(product_id) QNT
from bike_store.products
group by model_year
order by  QNT desc;



## Criando tabela de Clientes

Neste tópico, vamos aprender como criar uma tabela de clientes no Databricks. A criação dessa tabela é fundamental para organizar e armazenar informações relevantes sobre os clientes, facilitando análises, consultas e garantindo a integridade dos dados ao longo do projeto.

In [0]:
%sql

use default;
CREATE OR REPLACE TEMPORARY VIEW clients_tmp
USING csv
OPTIONS (
  path '/Volumes/workspace/default/tutorial/bike-store/customers.csv',
  header 'true',
  inferSchema 'true'
);

CREATE OR REPLACE TABLE bike_store.clients AS SELECT * FROM clients_tmp;


In [0]:
%sql
select * from bike_store.clients;

In [0]:
%sql
--  Quantos Clientes?
select count(*) from bike_store.clients;


In [0]:
%sql
--  Quantos Clientes Por Cidade
select  
count(customer_id) Quantidade
,city as Cidade
from bike_store.clients
group by city
order by Quantidade desc;


In [0]:
%sql
--  Quantos Clientes Por Estado
select  
state
,count(customer_id) Quantidade
from bike_store.clients
group by state
order by 2 desc;

## Criando outras tabelas

Neste tópico, vamos aprender como criar outras tabelas no Databricks, essenciais para complementar a estrutura do nosso banco de dados. A criação dessas tabelas permitirá organizar e armazenar diferentes tipos de informações relevantes para as análises do projeto, garantindo maior flexibilidade e eficiência no gerenciamento dos dados.

In [0]:
%sql

CREATE OR REPLACE TEMPORARY VIEW brands_tmp
USING csv
OPTIONS (
  path '/Volumes/workspace/default/tutorial/bike-store/brands.csv',
  header 'true',
  inferSchema 'true'
);
CREATE OR REPLACE TABLE bike_store.brands AS SELECT * FROM brands_tmp;

CREATE OR REPLACE TEMPORARY VIEW categories_tmp
USING csv
OPTIONS (
  path '/Volumes/workspace/default/tutorial/bike-store/categories.csv',
  header 'true',
  inferSchema 'true'
);
CREATE OR REPLACE TABLE bike_store.categories AS SELECT * FROM categories_tmp;

CREATE OR REPLACE TEMPORARY VIEW order_items_tmp
USING csv
OPTIONS (
  path '/Volumes/workspace/default/tutorial/bike-store/order_items.csv',
  header 'true',
  inferSchema 'true'
);
CREATE OR REPLACE TABLE bike_store.order_items AS SELECT * FROM order_items_tmp;

CREATE OR REPLACE TEMPORARY VIEW orders_tmp
USING csv
OPTIONS (
  path '/Volumes/workspace/default/tutorial/bike-store/orders.csv',
  header 'true',
  inferSchema 'true'
);
CREATE OR REPLACE TABLE bike_store.orders AS SELECT * FROM orders_tmp;

CREATE OR REPLACE TEMPORARY VIEW staffs_tmp
USING csv
OPTIONS (
  path '/Volumes/workspace/default/tutorial/bike-store/staffs.csv',
  header 'true',
  inferSchema 'true'
);
CREATE OR REPLACE TABLE bike_store.staffs AS SELECT * FROM staffs_tmp;

CREATE OR REPLACE TEMPORARY VIEW stocks_tmp
USING csv
OPTIONS (
  path '/Volumes/workspace/default/tutorial/bike-store/stocks.csv',
  header 'true',
  inferSchema 'true'
);
CREATE OR REPLACE TABLE bike_store.stocks AS SELECT * FROM stocks_tmp;

CREATE OR REPLACE TEMPORARY VIEW stores_tmp
USING csv
OPTIONS (
  path '/Volumes/workspace/default/tutorial/bike-store/stores.csv',
  header 'true',
  inferSchema 'true'
);
CREATE OR REPLACE TABLE bike_store.stores AS SELECT * FROM stores_tmp;

In [0]:
%sql
select * from bike_store.stores;

In [0]:
%sql
-- Deletar o database de test
DROP DATABASE bike_store CASCADE;