### Criando Banco de dados (lhdw_vendas)

In [0]:
# Criar o banco de dados
spark.sql("CREATE DATABASE IF NOT EXISTS lhdw_vendas")

# Usar o banco de dados
spark.sql("USE lhdw_vendas")

Out[1]: DataFrame[]

**Criação do Banco de Dados**
- CREATE DATABASE IF NOT EXISTS: Esse comando cria um banco de dados no Spark SQL chamado lhdw_vendas, se ele ainda não existir.
  - O uso da cláusula IF NOT EXISTS evita erros no caso de o banco de dados já existir, garantindo que o comando não falhe repetidamente.
- Esse banco de dados pode ser usado para armazenar tabelas e outros objetos como views, que podem ser acessados em consultas SQL subsequentes.

**Definição do Contexto do Banco de Dados**
- **USE lhdw_vendas**: Esse comando define o banco de dados lhdw_vendas como o contexto atual para as operações SQL subsequentes. Isso significa que todas as tabelas ou consultas SQL subsequentes serão executadas dentro desse banco de dados, a menos que um banco de dados diferente seja especificado.
- É útil quando se quer garantir que qualquer tabela criada ou manipulada nas próximas operações seja associada ao banco de dados correto.

**Resumo**: O código cria um banco de dados chamado lhdw_vendas (se ele não existir) e, em seguida, define este banco como o banco de dados atual para que as operações SQL subsequentes sejam executadas nele.

#### Criando tabelas Delta

In [0]:
delta_table_path = "dbfs:/mnt/lhdw/gold/vendas_delta/dim_produto"

# Registre a tabela Delta no catálogo do Spark
spark.sql(f"""
    CREATE TABLE IF NOT EXISTS lhdw_vendas.dim_produto
    USING DELTA
    LOCATION '{delta_table_path}'
""")

# Verifique se a tabela foi criada
spark.sql("SHOW TABLES").show()

+-----------+-----------+-----------+
|   database|  tableName|isTemporary|
+-----------+-----------+-----------+
|lhdw_vendas|dim_produto|      false|
+-----------+-----------+-----------+



**Definindo o Caminho da Tabela Delta**
- Aqui você define o caminho onde a tabela Delta será armazenada. No caso, o caminho aponta para o diretório dim_produto dentro da camada Gold.

**Criando a Tabela no Spark SQL**
- **CREATE TABLE IF NOT EXISTS**: Esse comando cria uma tabela chamada dim_produto no banco de dados lhdw_vendas, caso ela ainda não exista.
  - USING DELTA: Define o formato da tabela como Delta, que é um formato de armazenamento transacional no Spark com suporte a operações ACID.
  - LOCATION: Especifica o caminho onde os dados da tabela serão armazenados, neste caso, o caminho que você definiu em delta_table_path.

**Exibindo as Tabelas Existentes**
- **SHOW TABLES**: Esse comando lista todas as tabelas existentes no banco de dados atual (lhdw_vendas).
- .show(): Exibe o resultado da consulta no console, mostrando o nome e outras informações das tabelas que existem no banco de dados.

In [0]:
delta_table_path = "dbfs:/mnt/lhdw/gold/vendas_delta/dim_categoria"
# Registre a tabela Delta no catálogo do Spark
spark.sql(f"""
    CREATE TABLE IF NOT EXISTS lhdw_vendas.dim_categoria
    USING DELTA
    LOCATION '{delta_table_path}'
""")

# Verifique se a tabela foi criada
spark.sql("SHOW TABLES").show()

+-----------+--------------+-----------+
|   database|     tableName|isTemporary|
+-----------+--------------+-----------+
|lhdw_vendas| dim_categoria|      false|
|lhdw_vendas|   dim_cliente|      false|
|lhdw_vendas|dim_fabricante|      false|
|lhdw_vendas| dim_geografia|      false|
|lhdw_vendas|   dim_produto|      false|
|lhdw_vendas|  dim_segmento|      false|
|lhdw_vendas|   fato_vendas|      false|
+-----------+--------------+-----------+



In [0]:
delta_table_path = "dbfs:/mnt/lhdw/gold/vendas_delta/dim_segmento"
# Registre a tabela Delta no catálogo do Spark
spark.sql(f"""
    CREATE TABLE IF NOT EXISTS lhdw_vendas.dim_segmento
    USING DELTA
    LOCATION '{delta_table_path}'
""")

# Verifique se a tabela foi criada
spark.sql("SHOW TABLES").show()

+-----------+-------------+-----------+
|   database|    tableName|isTemporary|
+-----------+-------------+-----------+
|lhdw_vendas|dim_categoria|      false|
|lhdw_vendas|  dim_produto|      false|
|lhdw_vendas| dim_segmento|      false|
+-----------+-------------+-----------+



In [0]:
delta_table_path = "dbfs:/mnt/lhdw/gold/vendas_delta/dim_fabricante"
# Registre a tabela Delta no catálogo do Spark
spark.sql(f"""
    CREATE TABLE IF NOT EXISTS lhdw_vendas.dim_fabricante
    USING DELTA
    LOCATION '{delta_table_path}'
""")

# Verifique se a tabela foi criada
spark.sql("SHOW TABLES").show()

+-----------+--------------+-----------+
|   database|     tableName|isTemporary|
+-----------+--------------+-----------+
|lhdw_vendas| dim_categoria|      false|
|lhdw_vendas|dim_fabricante|      false|
|lhdw_vendas|   dim_produto|      false|
|lhdw_vendas|  dim_segmento|      false|
+-----------+--------------+-----------+



In [0]:
delta_table_path = "dbfs:/mnt/lhdw/gold/vendas_delta/dim_geografia"
# Registre a tabela Delta no catálogo do Spark
spark.sql(f"""
    CREATE TABLE IF NOT EXISTS lhdw_vendas.dim_geografia
    USING DELTA
    LOCATION '{delta_table_path}'
""")

# Verifique se a tabela foi criada
spark.sql("SHOW TABLES").show()

+-----------+--------------+-----------+
|   database|     tableName|isTemporary|
+-----------+--------------+-----------+
|lhdw_vendas| dim_categoria|      false|
|lhdw_vendas|dim_fabricante|      false|
|lhdw_vendas| dim_geografia|      false|
|lhdw_vendas|   dim_produto|      false|
|lhdw_vendas|  dim_segmento|      false|
+-----------+--------------+-----------+



In [0]:
delta_table_path = "dbfs:/mnt/lhdw/gold/vendas_delta/dim_cliente"
# Registre a tabela Delta no catálogo do Spark
spark.sql(f"""
    CREATE TABLE IF NOT EXISTS lhdw_vendas.dim_cliente
    USING DELTA
    LOCATION '{delta_table_path}'
""")

# Verifique se a tabela foi criada
spark.sql("SHOW TABLES").show()

+-----------+--------------+-----------+
|   database|     tableName|isTemporary|
+-----------+--------------+-----------+
|lhdw_vendas| dim_categoria|      false|
|lhdw_vendas|   dim_cliente|      false|
|lhdw_vendas|dim_fabricante|      false|
|lhdw_vendas| dim_geografia|      false|
|lhdw_vendas|   dim_produto|      false|
|lhdw_vendas|  dim_segmento|      false|
+-----------+--------------+-----------+



In [0]:
delta_table_path = "dbfs:/mnt/lhdw/gold/vendas_delta/fato_vendas"
# Registre a tabela Delta no catálogo do Spark
spark.sql(f"""
    CREATE TABLE IF NOT EXISTS lhdw_vendas.fato_vendas
    USING DELTA
    LOCATION '{delta_table_path}'
""")

# Verifique se a tabela foi criada
spark.sql("SHOW TABLES").show()

+-----------+--------------+-----------+
|   database|     tableName|isTemporary|
+-----------+--------------+-----------+
|lhdw_vendas| dim_categoria|      false|
|lhdw_vendas|   dim_cliente|      false|
|lhdw_vendas|dim_fabricante|      false|
|lhdw_vendas| dim_geografia|      false|
|lhdw_vendas|   dim_produto|      false|
|lhdw_vendas|  dim_segmento|      false|
|lhdw_vendas|   fato_vendas|      false|
+-----------+--------------+-----------+



In [0]:
import gc
spark.catalog.clearCache()
# Coletar lixo após operações pesadas para liberar memória
gc.collect()

Out[10]: 266