# Limpieza y Consolidación de Datos (Silver)  
## Dataknow – Estimación de Costos para Equipo de Construcción

---

Este notebook realiza la **limpieza, estandarización** de los precios de las materias primas **X, Y y Z**,ademas de castearlos con su **Type** correspondiente, con el fin de preparar los datos para la **aplicación de reglas de negocio y estimación de costos**.

---

### Información del proyecto

- **Equipo:** Dataknow  
- **Data Scientist:** Juan Pablo Guerra Osorio


In [0]:
%run ../configs/utils/params

In [0]:
# Cambiamos el directorio de trabajo
os.chdir(directorio_proceso["workspace"])

# Añadimos el directorio al PYTHONPATH
sys.path.append(directorio_proceso["workspace"])

In [0]:
from configs.utils.functions import *

In [0]:
# Carga de las tablas traidas desde el UC 
silver_x = spark.table("dataknow_dll.construccion.bronze_x")
silver_y = spark.table("dataknow_dll.construccion.bronze_y")
silver_z = spark.table("dataknow_dll.construccion.bronze_z")

In [0]:
# Castearemos la tabla con el formato correcto
# 1. Convertir "Date" al formato de fecha
# 2. # Reemplazar comas en "Price" y cast a tipo float

silver_x = (
    silver_x
    .withColumn("Date", F.to_date(F.col("Date"), "M/d/yyyy"))
    .withColumn("Price", F.regexp_replace(F.col("Price"), ",", ".").cast("double"))
)
silver_y = (
    silver_y
    .withColumn("Date", F.to_date(F.col("Date"), "M/d/yyyy"))
    .withColumn("Price", F.regexp_replace(F.col("Price"), ",", ".").cast("double"))
)
silver_z = (
    silver_z
    .withColumn("Date", F.to_date(F.col("Date"), "M/d/yyyy"))
    .withColumn("Price", F.regexp_replace(F.col("Price"), ",", ".").cast("double"))
)

## Guardar las tablas en el UC para el paso a limpieza
---
**Responsable Ingesta:** Juan Pablo Guerra Osorio

In [0]:
# Guardamos las tablas en una lista para recorrerlas en una sola llamada a la funcion
silver_tables = [
    silver_x,
    silver_y,
    silver_z
]
for i, table in enumerate(silver_tables):
    save_table_unity(df= table, table_name = silver_table_names[i])