In [0]:
%sql
CREATE DATABASE IF NOT EXISTS tfm_config
COMMENT 'Base de configuración del Data Lakehouse. Contiene reglas y catálogos auxiliares para la normalización, mapeo y tipificación de columnas en las capas Bronze y Silver.';

In [0]:
%sql
-- ==========================================================================
-- TABLA: tfm_config.column_cast_rules
-- Descripción general:
-- Esta tabla define las reglas de tipificación, limpieza y normalización 
-- aplicables a cada columna canónica dentro del pipeline de transformación
-- de datos (principalmente en la capa Silver del Data Lakehouse).
--
-- Su propósito es garantizar que los valores provenientes de archivos fuente
-- heterogéneos sean convertidos correctamente al tipo de dato esperado 
-- (por ejemplo: int, double, date o timestamp), aplicando además reglas 
-- de formato, trim, y conversión a mayúsculas cuando corresponda.
--
-- Permite controlar la vigencia temporal de cada regla y establecer 
-- configuraciones específicas por año de origen o dataset, facilitando 
-- el mantenimiento, la trazabilidad y la evolución de los esquemas de datos.
-- ==========================================================================
--DROP TABLE IF EXISTS tfm_config.column_cast_rules
CREATE TABLE IF NOT EXISTS tfm_config.column_cast_rules (
  dataset_id        STRING COMMENT 'Identificador lógico del dataset al que pertenecen las reglas (por ejemplo: "vehiculos"). Permite reutilizar el mismo catálogo entre distintos datasets.',
  header_canonical  STRING COMMENT 'Nombre canónico de la columna a la que aplica la regla de casteo o transformación. Ejemplo: "CODIGO_VEHICULO", "FECHA_PROCESO".',
  target_type       STRING COMMENT 'Tipo de dato de destino esperado tras la conversión. Valores posibles: string, int, double, date, timestamp.',
  date_format       STRING COMMENT 'Formato de fecha a aplicar durante el parseo (por ejemplo: "MM/dd/yy", "dd/MM/yyyy"). NULL indica que no aplica o se infiere automáticamente.',
  normalize_upper   BOOLEAN COMMENT 'Indica si se debe convertir el texto a mayúsculas como parte de la normalización.',
  trim_all          BOOLEAN COMMENT 'Indica si se deben eliminar espacios en blanco antes y después del contenido.',
  effective_start   TIMESTAMP COMMENT 'Fecha y hora desde la cual la regla es vigente (inclusiva). Permite versionar cambios de configuración a lo largo del tiempo.',
  effective_end     TIMESTAMP COMMENT 'Fecha y hora hasta la cual la regla es válida (exclusiva). NULL indica que la regla continúa vigente.',
  source_year       INT COMMENT 'Año específico de los datos a los que aplica la regla. NULL indica que aplica de forma global a todos los años.',
  note              STRING COMMENT 'Campo descriptivo para observaciones, justificación o contexto adicional sobre la regla definida.'
)
USING DELTA
COMMENT 'Catálogo de reglas de conversión y limpieza por columna canónica. Define formatos, tipos de datos y condiciones de vigencia temporal para asegurar la consistencia en la transformación de datos hacia la capa Silver.';