In [2]:
import pandas as pd
import os
from datetime import datetime

def create_silver_layer(bronze_file, silver_path):
    """
    Cria a camada Silver a partir dos dados da camada Bronze, adicionando a data e hora de processamento.

    Args:
        bronze_file (str): Caminho para o arquivo na camada Bronze.
        silver_path (str): Caminho para o diretório da camada Silver.
    """
    try:
        # Lê o arquivo da camada Bronze
        df_bronze = pd.read_csv(bronze_file)

        # Remove duplicatas
        df_silver = df_bronze.drop_duplicates()

        # Adiciona a coluna de data e hora de processamento
        df_silver['data_hora_processamento'] = datetime.now()

        # Trata valores nulos (substitui por "desconhecido" na coluna "cidade")
        # df_silver['cidade'] = df_silver['cidade'].fillna('desconhecido')

        # Converte a coluna "data_nascimento" para o tipo datetime
        # df_silver['data_nascimento'] = pd.to_datetime(df_silver['data_nascimento'], errors='coerce')

        # Cria o nome do arquivo de destino na camada Silver
        filename = os.path.basename(bronze_file)
        destination_file = os.path.join(silver_path, filename)

        # Salva o DataFrame na camada Silver
        df_silver.to_csv(destination_file, index=False)

        print(f"Camada Silver criada com sucesso em: {destination_file}")

    except FileNotFoundError:
        print(f"Erro: arquivo da camada Bronze não encontrado: {bronze_file}")
    except Exception as e:
        print(f"Ocorreu um erro durante a criação da camada Silver: {e}")

# Exemplo de uso
bronze_file = "E:/etl-with-ingestion/data/bronze/clientes.csv"
silver_path = "E:/etl-with-ingestion/data/silver"

# Cria o diretório da camada Silver se não existir
os.makedirs(silver_path, exist_ok=True)

create_silver_layer(bronze_file, silver_path)

Camada Silver criada com sucesso em: E:/etl-with-ingestion/data/silver\clientes.csv
