<img src="logo.png">

# Normalización de bases de datos

La normalización es un proceso de simplificación de datos. Se trata de un concepto fundamental en el diseño de bases de datos relacionales. Se trata de un proceso cuyo objetivo es optimizar una base de datos en cuanto a espacio y orden, haciendo bases de datos más eficientes pero sin perder información.

Buscaremos almacenar en menor espacio, eliminar registros repetidos, elminación de errores lógicos y protección de la integridad de la base de datos.

Las reglas que sigue el proceso de normalización se clasifica en seis niveles:

* Primera forma normal
* Segunda forma normal
* Tercera forma normal


### Datos de tipo atómico

Los datos de tipo atómico, en el contexto de la programación y la informática, se refieren a valores que no se pueden dividir en partes más pequeñas significativas. Estos valores son indivisibles o "atómicos" en el sentido de que representan una única unidad de información y no pueden ser descompuestos en partes más pequeñas con significado propio.

En términos más prácticos, los datos de tipo atómico suelen referirse a tipos de datos simples como números enteros, números de punto flotante, caracteres individuales, booleanos, entre otros. Estos tipos de datos son básicos y no se pueden dividir en componentes más pequeños que tengan sentido dentro del contexto del lenguaje de programación o la operación que se está realizando.

Por ejemplo, un número entero como 5 o un carácter como 'a' son ejemplos de datos de tipo atómico, ya que no se pueden descomponer en partes más pequeñas dentro del contexto de la mayoría de los lenguajes de programación. Por otro lado, una cadena de texto, que está compuesta por caracteres individuales, no sería considerada un dato de tipo atómico, ya que puede dividirse en caracteres individuales con significado propio.

## Primera forma normal (1FN)

Las reglas de la **1FN** son:

**1FN_1)** No necesariamente debe haber orden de arriba hacia abajo

**1FN_2)** No deben haber filas duplicadas

**1FN_3)** Todos los datos deben ser de tipo **atómicos**.

**1FN_4)** Las tablas deben tener clave primaria

Supongamos que tenemos la siguiente tabla:

| Entidad          | Nombre de la entidad | UPM  | Vivienda | Hogar | Renglon | Tipo_Delito | Descripcion_delito |
|------------------|----------------------|------|----------|-------|---------|-------------|--------------------|
|02|Baja California|02|01|02|01|1|Robo de autopartes|
|02|Baja California|02|01|02|01|1|Robo de autopartes|
|01|Aguascalientes|18|02|01|03|3|Robo en transporte publico|
|32|Zacatecas|12|03|05|04|14,15|Desaparición forzada, secuestro|
|09|CDMX|15|04|01|02|4|Violencia verbal|
|21|Puebla|17|01|02|03|1|Robo de autopartes|

Vemos que hay registros repetidos, lo cual viola 1FN_2. Además no hay llave primaria y el tipo de delito no es atómico.

Para solucionar el primer problema, simplemente eliminamos el registro repetido:


| Entidad          | Nombre de la entidad | UPM  | Vivienda | Hogar | Renglon | Tipo_Delito | Descripcion_delito |
|------------------|----------------------|------|----------|-------|---------|-------------|--------------------|
|02|Baja California|02|01|02|01|1|Robo de autopartes|
|01|Aguascalientes|18|02|01|03|3|Robo en transporte publico|
|32|Zacatecas|12|03|05|04|14,15|Desaparición forzada y secuestro|
|09|CDMX|15|04|01|02|4|Violencia verbal|
|21|Puebla|17|01|02|03|1|Robo de autopartes|

Antes de solucionar el segundo problema, vayamos con el tercero. Para ello, simplemente descomponemos los datos no atómicos añadiendo renglones:

| Entidad          | Nombre de la entidad | UPM  | Vivienda | Hogar | Renglon | Tipo_Delito | Descripcion_delito |
|------------------|----------------------|------|----------|-------|---------|-------------|--------------------|
|02|Baja California|02|01|02|01|1|Robo de autopartes|
|01|Aguascalientes|18|02|01|03|3|Robo en transporte publico|
|32|Zacatecas|12|03|05|04|14|Desaparición forzada|
|32|Zacatecas|12|03|05|04|15|Secuestro|
|09|CDMX|15|04|01|02|4|Violencia verbal|
|21|Puebla|17|01|02|03|1|Robo de autopartes|


Para solucionar el segundo problema, debemos crear una clave de identificación única de cada renglón, lo que se conoce como una llave primaria. Podemos notar que, por ejemplo, Entidad+Vivienda+Hogar+Renglon+Tipo determina de manera única cada renglón. Por lo tanto utilizamos esa combinación como llave primaria:

|Llave primaria| Entidad          | Nombre de la entidad | UPM  | Vivienda | Hogar | Renglon | Tipo_Delito | Descripcion_delito |
|------------------|------------------|----------------------|------|----------|-------|---------|-------------|--------------------|
|02_02_01_02_01|02|Baja California     |02 |01      |02   |01     |1          |Robo de autopartes|
|01_18_02_01_03|01|Aguascalientes    |18 |02      |01   |03     |3          |Robo en transporte publico|
|32_12_03_05_04|32|Zacatecas     |12 |03      |05   |04     |14|Desaparición forzada|
|32_12_03_05_04|32|Zacatecas     |12 |03      |05   |04     |15|Secuestro|
|09_15_04_01_02|09|CDMX     |15 |04      |01   |02     |4          |Violencia verbal|
|21_17_01_02_03|21|Puebla|17|01|02|03|1|Robo de autopartes|

# Segunda Forma Normal (2FN)

**2FN_1:** La tabla debe estar en 1FN_1.

**2FN_2:** Identificar las dependencias entre los campos y la clave primaria. Todo campo debe depender únicamente de la clave primaria.

Volvamos a nuestra tabla anterior, que ya está en 1FN:

|Llave primaria| Entidad          | Nombre de la entidad | UPM  | Vivienda | Hogar | Renglon | Tipo_Delito | Descripcion_delito |
|------------------|------------------|----------------------|------|----------|-------|---------|-------------|--------------------|
|02_02_01_02_01|02|Baja California     |02 |01      |02   |01     |1          |Robo de autopartes|
|01_18_02_01_03|01|Aguascalientes    |18 |02      |01   |03     |3          |Robo en transporte publico|
|32_12_03_05_04|32|Zacatecas     |12 |03      |05   |04     |14|Desaparición forzada|
|32_12_03_05_04|32|Zacatecas     |12 |03      |05   |04     |15|Secuestro|
|09_15_04_01_02|09|CDMX     |15 |04      |01   |02     |4          |Violencia verbal|
|21_17_01_02_03|21|Puebla|17|01|02|03|1|Robo de autopartes|

Observamos que tipo de delito y descripción del delito no dependen de la clave primaria. Separamos en tablas la información

**Tabla persona**

|Llave primaria| Entidad          | Nombre de la entidad | UPM  | Vivienda | Hogar | Renglon | 
|------------------|------------------|----------------------|------|----------|-------|---------|
|02_02_01_02_01|02|Baja California     |02 |01      |02   |01     |
|01_18_02_01_03|01|Aguascalientes    |18 |02      |01   |03     |
|32_12_03_05_04|32|Zacatecas     |12 |03      |05   |04     |
|32_12_03_05_04|32|Zacatecas     |12 |03      |05   |04     |
|09_15_04_01_02|09|CDMX     |15 |04      |01   |02     |
|21_17_01_02_03|21|Puebla|17|01|02|03|


**Tabla persona-delitos**

|Llave primaria| Tipo de delito          | 
|------------------|------------------|
|02_02_01_02_01|1          |
|01_18_02_01_03|3          |
|32_12_03_05_04|14|
|32_12_03_05_04|15|
|09_15_04_01_02|4          |
|21_17_01_02_03|1|

**Tabla delitos**

|codigo|descripcion|
|------------------|------------------|
|1|Robo de autopartes|
|3|Robo en transporte público|
|4|Violencia verbal|
|14|Desaparición forzada|
|15|Secuestro|

## Tercera Forma Normal (3FN)

**3FN_1:** la tabla debe estar en 2FN

**3FN_2:** No deben existir dependencia transitiva entre los campos de las tablas.

En este caso, vemos que **Tabla Persona** no cumple 3FN_2, pues *Nombre de la entidad*, aunque depende de la llave primaria, lo hace a través de *Entidad*. Dividimos **Tabla A** y obtenemos finalmente el modelo en Forma Normal:

**Tabla Persona**

|Llave primaria| Entidad          | UPM  | Vivienda | Hogar | Renglon | 
|------------------|----------------------|------|----------|-------|---------|
|02_02_01_02_01|02|02 |01      |02   |01     |
|01_18_02_01_03|01|18 |02      |01   |03     |
|32_12_03_05_04|32|12 |03      |05   |04     |
|32_12_03_05_04|32|12 |03      |05   |04     |
|09_15_04_01_02|09|15 |04      |01   |02     |
|21_17_01_02_03|21|17|01|02|03|

**Tabla Entidades**

|Entidad|Nombre de la entidad|
|--|--|
|01|Aguascalientes|
|02|Baja California|
|09|CDMX|
|21|Puebla|
|32|Zacatecas|

**Tabla persona-delitos**

|Llave primaria| Entidad          | 
|------------------|------------------|
|02_02_01_02_01|1          |
|01_18_02_01_03|3          |
|32_12_03_05_04|14|
|32_12_03_05_04|15|
|09_15_04_01_02|4          |
|21_17_01_02_03|1|

**Tabla delitos**

|codigo|descripcion|
|------------------|------------------|
|1|Robo de autopartes|
|3|Robo en transporte público|
|4|Violencia verbal|
|14|Desaparición forzada|
|15|Secuestro|



**Tabla Persona**

|Llave primaria| Entidad          | UPM  | Vivienda | Hogar | Renglon | Tipo
|------------------|----------------------|------|----------|-------|---------|---------|
|02_02_01_02_01_1|02|02 |01      |02   |01     |1|
|01_18_02_01_03_3|01|18 |02      |01   |03     |3|
|32_12_03_05_04_14|32|12 |03      |05   |04     |14|
|32_12_03_05_04_15|32|12 |03      |05   |04     |15|
|09_15_04_01_02_4|09|15 |04      |01   |02     |4|
|21_17_01_02_03_1|21|17|01|02|03|1|

**Tabla Entidades**

|Entidad|Nombre de la entidad|
|--|--|
|01|Aguascalientes|
|02|Baja California|
|09|CDMX|
|21|Puebla|
|32|Zacatecas|

**Tabla delitos**

|codigo|descripcion|
|------------------|------------------|
|1|Robo de autopartes|
|3|Robo en transporte público|
|4|Violencia verbal|
|14|Desaparición forzada|
|15|Secuestro|
