# Tabela Bronze Clientes
## Overview

 | Detail Tag | Information |
 |------------|-------------|
 |Versão inicial | Paulo Henrique  |
 |Tabela final | bronze.clientes |
 |Origem dos dados |Camada Bronze |


## Histórico de atualização
 | Date | Developed By | Reason |
 |:----:|--------------|--------|
 |29/01/2024 | Paulo Henrique |Criação do notebook |
 
 

## Informações

Este notebook contém a construção da tabela bronze contendo os dados de clientes

In [0]:
%sql
CREATE DATABASE IF NOT EXISTS bronze;

In [0]:
from pyspark.sql import SparkSession
from pyspark.sql.functions import col, current_date, current_timestamp, date_format, expr
import unicodedata
import re
spark = SparkSession.builder.appName("DatabricksTableCreation").getOrCreate()

folder_path = 'dbfs:/FileStore/tables/bronze_silver_gold/clientes_final.csv'
table = 'clientes'
database_name = 'bronze'

In [0]:
df = spark.read.csv(folder_path, header=True, inferSchema=True)
df.display()


ID Cliente,Nome,Email,Telefone
1,Marcos Vinicius Pires,moreirarafael@gmail.com,+55 (051) 1476-7634
2,Srta. Ana Laura Novaes,aliciapires@gmail.com,+55 71 2686-2429
3,Sr. Francisco Silveira,pteixeira@gmail.com,31 6691-7704
4,Elisa da Rocha,enascimento@gmail.com,11 1007-1988
5,Sr. Kevin da Luz,moreirajoao-felipe@gmail.com,0500-152-8310
6,Gabriela Cunha,alexandre58@gmail.com,0800 925 0073
7,Lucca Aragão,ana-carolina81@gmail.com,+55 51 3202 5452
8,Dr. Vinicius Costela,maysaporto@gmail.com,0800 264 7109
9,Cauê Teixeira,marcelocostela@gmail.com,84 3515 0712
10,Vitor Hugo Barbosa,xnunes@gmail.com,(041) 1168 4578


In [0]:
def normalize_column_name(name):
    # Normalizar para a forma NFD e codificar para ASCII, ignorando erros de codificação
    name = unicodedata.normalize('NFD', name).encode('ascii', 'ignore').decode('utf-8')
    # Substituir "ç" por "c"
    name = name.replace('ç', 'c')
    # Substituir espaços por underscores
    name = name.replace(' ', '_')
    # Converter para minúsculas
    name = name.lower()
    return name

# Supondo que df seja o seu DataFrame PySpark
# Aplicar a normalização nos nomes das colunas
df = df.select([col(c).alias(normalize_column_name(c)) for c in df.columns])

# Exibir o esquema do DataFrame para verificar os nomes das colunas
df.printSchema()

root
 |-- id_cliente: integer (nullable = true)
 |-- nome: string (nullable = true)
 |-- email: string (nullable = true)
 |-- telefone: string (nullable = true)



In [0]:
# Adicionar coluna data_carga com a data atual
df = df.withColumn("data_carga", current_date())
# Adicionar coluna hora_carga com o horário atual formatado como HH:mm:ss
df = df.withColumn("hora_carga", date_format(current_timestamp(), "HH:mm:ss"))
# Exibir o esquema do DataFrame para verificar as novas colunas
df.printSchema()

root
 |-- id_cliente: integer (nullable = true)
 |-- nome: string (nullable = true)
 |-- email: string (nullable = true)
 |-- telefone: string (nullable = true)
 |-- data_carga: date (nullable = false)
 |-- hora_carga: string (nullable = false)



In [0]:
df.write.format('delta').mode('overwrite').option('overwriteSchema',True).saveAsTable(f'{database_name}.{table}')

In [0]:
%sql
select *
from bronze.clientes

id_cliente,nome,email,telefone,data_carga,hora_carga
1,Marcos Vinicius Pires,moreirarafael@gmail.com,+55 (051) 1476-7634,2024-02-07,21:01:24
2,Srta. Ana Laura Novaes,aliciapires@gmail.com,+55 71 2686-2429,2024-02-07,21:01:24
3,Sr. Francisco Silveira,pteixeira@gmail.com,31 6691-7704,2024-02-07,21:01:24
4,Elisa da Rocha,enascimento@gmail.com,11 1007-1988,2024-02-07,21:01:24
5,Sr. Kevin da Luz,moreirajoao-felipe@gmail.com,0500-152-8310,2024-02-07,21:01:24
6,Gabriela Cunha,alexandre58@gmail.com,0800 925 0073,2024-02-07,21:01:24
7,Lucca Aragão,ana-carolina81@gmail.com,+55 51 3202 5452,2024-02-07,21:01:24
8,Dr. Vinicius Costela,maysaporto@gmail.com,0800 264 7109,2024-02-07,21:01:24
9,Cauê Teixeira,marcelocostela@gmail.com,84 3515 0712,2024-02-07,21:01:24
10,Vitor Hugo Barbosa,xnunes@gmail.com,(041) 1168 4578,2024-02-07,21:01:24
