Skip to content

enerBit/sui_data

Repository files navigation

SUI Scrapper

Cliente para el SUI - "Sistema Único de Información de Servicios Públicos Domiciliarios". Una base de datos publica para informacin de los servicios publicos en Colombia.

Datos Prolijos

Los datos prolijos ("tidy data" en inglés) son una forma estándar de relacionar el significado de un conjunto de datos a su estructura. Un conjunto de datos está prolijo o desprolijo dependiendo de cómo se relacionan las filas, columnas y tablas con las observaciones, las variables y los tipos.

En datos prolijos:

  1. Cada variable es una columna; cada columna es una variable.

  2. Cada observación es una fila; cada fila es una observación.

  3. Cada valor es una celda; cada celda es un valor único.

Mas detalles en el articulo original Tidy data

Esta es la tercera forma normal de Codd, pero con las restricciones enmarcadas en el lenguaje estadístico y el enfoque puesto en un único conjunto de datos en lugar de los muchos conjuntos de datos conectados comunes en las bases de datos relacionales. Los datos desprolijos son cualquier otra disposición de los datos.