# Normalización

La normalización como su nombre lo indica nos ayuda a dejar todo de una forma normal. Esto obedece a las 12 reglas de Codd y nos permiten separar componentes en la base de datos:

* **Primera forma normal (1FN):** Atributos atómicos (Sin campos repetidos)
* **Segunda forma normal (2FN):** Cumple 1FN y cada campo de la tabla debe depender de una clave única.
* **Tercera forma normal (3FN):** Cumple 1FN y 2FN y los campos que NO son clave, NO deben tener dependencias.
* **Cuarta forma normal (4FN):** Cumple 1FN, 2FN, 3FN y los campos multivaluados se identifican por una clave única.

**Ejemplo de una Base de datos sin normalizar**
![image-2.png](attachment:image-2.png)

## Primera forma normal (1FN)

Atributos atómicos (Sin campos repetidos)

Esta FN nos ayuda a eliminar los valores repetidos y no atómicos dentro de una base de datos.

Formalmente, una tabla está en primera forma normal si:

* Todos los atributos son atómicos. 
* Un atributo es atómico si los elementos del dominio son simples e indivisibles.
* No debe existir variación en el número de columnas.
* Los campos no clave deben identificarse por la clave (dependencia funcional).
* Debe existir una independencia del orden tanto de las filas como de las columnas; es decir, si los datos cambian de orden no deben cambiar sus significados.

Se traduce básicamente a que si tenemos campos compuestos como por ejemplo “nombre_completo” que en realidad contiene varios datos distintos, en este caso podría ser “nombre”, “apellido_paterno”, “apellido_materno”, etc.

También debemos asegurarnos que las columnas son las mismas para todos los registros, que no haya registros con columnas de más o de menos.

Todos los campos que no se consideran clave deben depender de manera única por el o los campos que si son clave.

Los campos deben ser tales que si reordenamos los registros o reordenamos las columnas, cada dato no pierda el significado.

**Ejemplo de una Base de datos en 1FN**
![image-2.png](attachment:image-2.png)


## Segunda forma normal (2FN)

Esta FN nos ayuda a diferenciar los datos en diversas entidades.

Formalmente, una tabla está en segunda forma normal si:

* Está en 1FN
* Sí los atributos que no forman parte de ninguna clave dependen de forma completa de la clave principal. Es decir, que no existen dependencias parciales.
* Todos los atributos que no son clave principal deben depender únicamente de la clave principal.

Lo anterior quiere decir que sí tenemos datos que pertenecen a diversas entidades, cada entidad debe tener un campo clave separado. 

En la tabla anterior tenemos por lo menos dos entidades que debemos separar para que cada uno dependa de manera única de su campo llave o ID. En este caso las entidades son alumnos por un lado y materias por el otro. El ejemplo anterior, quedaría de la siguiente manera:

**Ejemplo de una Base de datos en 2FN**
![image.png](attachment:image.png)

## Tercera forma normal (3FN)

Esta FN nos ayuda a separar conceptualmente las entidades que no son dependientes.

Formalmente, una tabla está en tercera forma normal si:

* Se encuentra en 2FN
* No existe ninguna dependencia funcional transitiva en los atributos que no son clave

Esta FN se traduce en que aquellos datos que no pertenecen a la entidad deben tener una independencia de las demás y debe tener un campo clave propio. Continuando con el ejemplo anterior, al aplicar la 3FN separamos la tabla alumnos ya que contiene datos de los cursos en ella quedando de la siguiente manera.



**Ejemplo de una Base de datos en 3FN**
![image.png](attachment:image.png)

## Cuarta forma normal (4FN)

Esta FN nos trata de atomizar los datos multivaluados de manera que no tengamos datos repetidos entre rows.

Formalmente, una tabla está en cuarta forma normal si:

* Se encuentra en 3FN
* Los campos multivaluados se identifican por una clave única
* Esta FN trata de eliminar registros duplicados en una entidad, es decir que cada registro tenga un contenido único y de necesitar repetir la data en los resultados se realiza a través de claves foráneas.

Aplicado al ejemplo anterior la tabla materia se independiza y se relaciona con el alumno a través de una tabla transitiva o pivote, de tal manera que si cambiamos el nombre de la materia solamente hay que cambiarla una vez y se propagara a cualquier referencia que haya de ella.

De esta manera, aunque parezca que la información se multiplicó, en realidad la descompusimos o normalizamos de manera que a un sistema le sea fácil de reconocer y mantener la consistencia de los datos.

Algunos autores precisan una 5FN que hace referencia a que después de realizar esta normalización a través de uniones (JOIN) permita regresar a la data original de la cual partió.


**Ejemplo de una Base de datos en 4FN**
![image.png](attachment:image.png)

## Ejemplo de Diagrama Físico normalizado

![image.png](attachment:image.png)


En el diagrama anterior se ve reflejado un Diagrama físico que se encuentra normalizado, contiene los tipos de variables y se encuentran relacionadas cada una de las entidades.

##### Aspectos a considerar en las relaciones

* 1.- Cuando la relación es 1 a 1 es indistinto en que tabla se coloque la clave foránea (FK).
* 2.- Cuando la relación es 1 a n la clave pirncipal (PK) se coloca en la tabla que tiene relación muchos como FK. 
* 3.- Cuando la relación es n a n se rompe la relación y se crea una tabla pivote, esta tabla deberá tener una clave compuesta formada por el ID de las dos tablas.

![image-2.png](attachment:image-2.png)

### Fuente 

- Curso de Fundamentos de Bases de Datos - Israel Vázquez Morales **(Platzi)**