# Normalización

La normalización tiene como objetivo optimizar la base de datos siguiendo ciertas reglas que ya están definidas.

Existen muchas reglas, pero las más importantes son: 1NF, 2NF y 3NF.

Y es algo que se debe de hacer en todas las bases de datos.

## Primera Forma Normal (1NF)

Cada columna debe tener solo 1 valor y no debe de haber grupos repetidos.

Considere la siguiente consulta:

`SELECT id, nombre, servicios FROM reservaciones WHERE id IN (1,2,3,4,5);`
***
```
mysql> SELECT id, nombre, servicios FROM reservaciones WHERE id IN (1,2,3,4,5);
+----+---------+-----------------------------------------+
| id | nombre  | servicios                               |
+----+---------+-----------------------------------------+
|  1 | Juan    | Corte de Cabello Adulto, Corte de Barba |
|  2 | Antonio | Corte de Cabello Niño                   |
|  3 | Pedro   | Corte de Cabello Adulto                 |
|  4 | Mireya  | Peinado Mujer                           |
|  5 | Jose    | Peinado Hombre                          |
+----+---------+-----------------------------------------+
5 rows in set (0.01 sec)

```
***

El registro **|  1 | Juan    | Corte de Cabello Adulto, Corte de Barba |** no cumple con la primera forma normal en la columna servicios.

Para poder solventar la separación de los servicios, se podría crear otra tabla en donde cada registro haga referencia al id de cliente.


***
```
+----+---------+
| id | nombre  |
+----+---------+
|  1 | Juan    |
|  2 | Antonio |
|  3 | Pedro   |
|  4 | Mireya  |
|  5 | Jose    |
+----+---------+

+----+---------+-------------------------------+
| servicios                               | id |
+----+---------+-------------------------------+
| Corte de Cabello Adulto, Corte de Barba |  1 |
| Corte de Barba                          |  1 |
| Corte de Cabello Niño                   |  2 |
| Corte de Cabello Adulto                 |  3 |
| Peinado Mujer                           |  4 |
| Peinado Hombre                          |  5 |
+----+---------+-------------------------------+

```
***

## Segunda Forma Normal (2NF)

Una vez quqe se aplica la primera regla de normalización, debemos pasar a la segunda regla, porque va en orden.

Recordando, la primera regla indica que no se deben tener múltiples valores en una celda, la 2da y la 3ra se enfocan más en la relación con otras columnas.

La 2NF se utiliza en llaves primarias compuestas. Una llave primaria compuesta es la que utiliza dos columnas para ser una clave.  El problema con esta llave primaria es que podrían duplicarse y por regla, una llave primaria no se puede duplicar, por lo que se deben separa las tablas.

Considere la siguiente consulta, y suponga que la llave primaria compuesta son los campos **id,fecha**:

`SELECT id, fecha, nombre, servicios FROM reservaciones WHERE id IN (1,2,3,4,5);`

***
```
+----+------------+---------+-----------------------------------------+
| id | fecha      | nombre  | servicios                               |
+----+------------+---------+-----------------------------------------+
|  1 | 2024-09-28 | Juan    | Corte de Cabello Adulto                 |
|  2 | 2024-10-30 | Antonio | Corte de Cabello Niño                   |
|  3 | 2024-09-25 | Pedro   | Corte de Cabello Adulto                 |
|  4 | 2024-09-25 | Mireya  | Peinado Mujer                           |
|  5 | 2024-10-30 | Jose    | Peinado Hombre                          |
+----+------------+---------+-----------------------------------------+
```
***

La combinación de **id,fecha** pueden repetirse, por eso es necesario separar en dos tablas.

Tabla **Clientes**
***
```
+----+---------+
| id | nombre  |
+----+---------+
|  1 | Juan    |
|  2 | Antonio |
|  3 | Pedro   |
|  4 | Mireya  |
|  5 | Jose    |
+----+---------+

```
***

Tabla **Citas**
***
```
+----+------------+-----------------------------------------+
| id | fecha      | servicios                               |
+----+------------+-----------------------------------------+
|  1 | 2024-09-28 | Corte de Cabello Adulto                 |
|  2 | 2024-10-30 | Corte de Cabello Niño                   |
|  3 | 2024-09-25 | Corte de Cabello Adulto                 |
|  4 | 2024-09-25 | Peinado Mujer                           |
|  5 | 2024-10-30 | Peinado Hombre                          |
+----+------------+-----------------------------------------+
```
***

Ahora no habría duplicidad, ya que en citas, solo se guarda la referencia del cliente, y si queremos saber más información sobre el cliente, tenemos que irnos a la tabla de **Clientes**

En la tabla de **Clientes** la columna **id** de le conoce como **PK (Primary Key)** y en la tabla **Citas**, la columna **id** se le conoce como **FK (Foreign Key)**.

Para poder realizar esta relación, ambas columnas **id** deben tener el mismo tipo de dato en ambas tablas y la misma extensión.

Por lo visto anteriormente, concluimos que la 2NF aplica a las llaves primarias, mientras que la tercera forma normal se refiere a los demás campos y sus relaciones.

## Tercera Forma Normal (3NF)

Al igual que la 2NF, tiene que ver con la relación de los datos.

Mientras que la 2NF se enfoca en la llave compuesta, la 3NF se enfoca en los demás datos que no forman parte de la llave compuesta.

Consideremos las siguientes tablas


Tabla **Clientes**
***
```
+----+---------+
| id | nombre  |
+----+---------+
|  1 | Juan    |
|  2 | Antonio |
|  3 | Pedro   |
|  4 | Mireya  |
|  5 | Jose    |
+----+---------+

```
***

Tabla **Citas**
***
```
+----+------------+-----------------------------------------+
| id | fecha      | servicios                               |
+----+------------+-----------------------------------------+
|  1 | 2024-09-28 | Corte de Cabello Adulto                 |
|  2 | 2024-10-30 | Corte de Cabello Niño                   |
|  3 | 2024-09-25 | Corte de Cabello Adulto                 |
|  4 | 2024-09-25 | Peinado Mujer                           |
|  5 | 2024-10-30 | Peinado Hombre                          |
+----+------------+-----------------------------------------+
```
***

Los servicios no forman parte de la llave primaria de Citas, sin embargo, se observa que se tienen datos duplicados, por ejemplo, se tiene al **Corte de Cabello Adulto** en dos ocaciones. 

Para esto, la 3NF, nos indica que tenemos que crear una tabla adicional denominada **Servicios**, de esta forma se evita duplicar datos. Así mismo, en la tabla de **Servicios** también se deben agregar todas las columnas que dependan del **servicio**. Asi que la base de datos quedaría de la siguiente manera:

Tabla **Clientes**
***
```
+----+---------+
| Id | nombre  |
+----+---------+
|  1 | Juan    |
|  2 | Antonio |
|  3 | Pedro   |
|  4 | Mireya  |
|  5 | Jose    |
+----+---------+

```
***

Tabla **Servicios**
***
```
+-----------+-------------------------+-------+
| id        | servicio                | costo
+-----------+-------------------------+-------+
|  1        | Corte de Cabello Adulto |  200  |
|  2        | Corte de Cabello Niño   |  150  |
|  3        | Peinado Mujer           |  240  |
|  4        | Peinado Hombre          |  75   |
+----+--------------------------------+-------+
```
***


Tabla **Citas**
***
```
+-----------+------------+------------+
| idCliente | idServicio | fecha      |
+-----------+------------+------------+
|      1    |     1      | 2024-09-28 |
|      2    |     2      | 2024-10-30 |
|      3    |     1      | 2024-09-25 |
|      4    |     3      | 2024-09-25 |
|      5    |     4      | 2024-10-30 |
+-----------+------------+------------+
```
***

De esta manera se evita la duplicidad, y para conocer más información de los servicios o los clientes se tienen que hacer consultas a las tablas.

## Denormalización

En algunas bases de datos, podrían encontrarse tablas a las que no se les ha aplicado la normalización. Lo anterior no significa que esté mal, sino que tal vez el diseñador consideró que no era necesario normalizar.

Si bien, es recomendable aplicar las reglas formales, en el caso de que el proyecto sea muy sencillo, con poco presupuesto, o no requiere tanta complejidad de relacionar datos, se puede hacer de esta forma denormalizada sin ningún problema. Todo depende de evaluar qué es lo mejor para el proyecto.

