# <b>Acerca de un poco más de las bases de datos</b>

### <b>Normalización</b>

La **normalización** es el proceso de organizar los datos de una base de datos. Se debe tener en cuenta la creación de tablas y las reglas que se usan para definir las relaciones, estas reglas son diseñadas para proteger los datos, y para que la base de datos sea flexible con el fin de eliminar redundancias y dependencias incoherentes.

#### <b>¿Por qué se debe normalizar?</b>

Las bases de datos se deben normalizar debido a lo siguiente:

- Evitar la redundancia de los datos.
- Proteger la integridad de los datos
- Evitar problemas de actualización de los datos en las tablas
- Facilitar el acceso e interpretación de los datos.
- Optimizar el espacio de almacenamiento.
- Reducir el tiempo y complejidad de revisión de las bases de datos.

#### <b>Tipos de normalización</b>

Hay reglas en la normalización de una base de datos y cada una de ellas se denomina Forma Normal. Existen 3 tipos principales.

| **#** | **Paso**                                      | **Descripción**                                                                                     |
|-------|-----------------------------------------------|---------------------------------------------------------------------------------------------------|
| 1     | Datos en Primera Forma Normal (1FN)         | Se asegura que los datos están en una tabla con valores atómicos y cada columna contiene un solo valor. |
| 2     | Identificar redundancias                     | Se observan datos repetidos, como el nombre del club en múltiples filas.                           |
| 3     | Descomponer en Segunda Forma Normal (2FN)    | Se eliminan dependencias parciales dividiendo los datos en tablas separadas según las claves primarias. |
| 4     | Identificar dependencias transitivas         | Se revisa si algún atributo depende de otro que no sea la clave primaria.                         |
| 5     | Aplicar la Tercera Forma Normal (3FN)        | Se eliminan dependencias transitivas, creando nuevas tablas para atributos que no dependen directamente de la clave primaria. |

#### <b>Ejemplo</b>

####  Primera Forma Normal (1FN)
Tabla sin normalizar con datos redundantes y valores repetidos.

| ID | Club          | País       | Año Fundación | Jugador         | Posición    |
|----|--------------|------------|--------------|----------------|-------------|
| 1  | Barcelona    | España     | 1899         | Lionel Messi   | Delantero   |
| 2  | Barcelona    | España     | 1899         | Xavi Hernández | Mediocampista |
| 3  | Man City     | Inglaterra | 1880         | Kevin De Bruyne| Mediocampista |
| 4  | Man City     | Inglaterra | 1880         | Erling Haaland | Delantero   |
| 5  | Carabobo FC  | Venezuela  | 1997         | Choco Ruiz   | Mediocampista |

**Problema:**  
- Hay redundancia en los nombres de los clubes y sus datos (país, año de fundación).  
- Un mismo club aparece en varias filas, lo que aumenta el almacenamiento innecesario.  


#### Segunda Forma Normal (2FN)
Se eliminan **dependencias parciales** separando los clubes y jugadores en tablas distintas.

#### Tabla de Clubes
| Club ID | Nombre       | País       | Año Fundación |
|---------|-------------|------------|--------------|
| 1       | Barcelona   | España     | 1899         |
| 2       | Man City    | Inglaterra | 1880         |
| 3       | Carabobo FC | Venezuela  | 1997         |

#### Tabla de Jugadores
| Jugador ID | Nombre          | Posición       | Club ID |
|------------|----------------|---------------|---------|
| 1          | Lionel Messi   | Delantero     | 1       |
| 2          | Xavi Hernández | Mediocampista | 1       |
| 3          | Kevin De Bruyne| Mediocampista | 2       |
| 4          | Erling Haaland | Delantero     | 2       |
| 5          | Choco Ruiz   | Mediocampista | 3       |

**Problema:**  
- Aún hay dependencias transitivas (por ejemplo, la posición del jugador podría necesitar una tabla aparte).  

#### Tercera Forma Normal (3FN)
Se eliminan **dependencias transitivas** creando una tabla para **Posiciones**.

#### Tabla de Posiciones
| Posición ID | Nombre         |
|------------|---------------|
| 1          | Delantero     |
| 2          | Mediocampista |

#### Tabla de Jugadores (Refinada)
| Jugador ID | Nombre          | Posición ID | Club ID |
|------------|----------------|------------|---------|
| 1          | Lionel Messi   | 1          | 1       |
| 2          | Xavi Hernández | 2          | 1       |
| 3          | Kevin De Bruyne| 2          | 2       |
| 4          | Erling Haaland | 1          | 2       |
| 5          | Choco Ruiz    | 2          | 3       |

**Ventajas de la 3FN:**  
- **Menos redundancia**: No se repiten valores innecesarios.  
- **Mayor integridad**: Cambiar el nombre de una posición solo requiere modificar una tabla.  
- **Facilita actualizaciones y consultas** en bases de datos.  


---


### <b>Migraciones</b>

La migración de datos es el proceso de selección, preparación, extracción, transformación y transferencia permanente de datos de un sistema de almacenamiento informático a otro.


#### <b>¿Qué son las migraciones de base de datos?</b>

Las migraciones son archivos de script que modifican la estructura de la base de datos de forma incremental. Estas modificaciones pueden incluir:

- Creación, modificación o eliminación de tablas
- Adición o eliminación de columnas
- Definición o actualización de claves primarias y foráneas
- Creación de índices para mejorar el rendimiento
- Inserción o actualización de datos esenciales

#### <b>Beneficios de las Migraciones</b>

| **Beneficio**             | **Descripción** |
|---------------------------|--------------------------------------------------------|
| Control de versiones      | Permite registrar cambios en la base de datos de forma estructurada. |
| Reproducibilidad          | Facilita la aplicación de cambios en distintos entornos de desarrollo, prueba y producción. |
| Integridad y consistencia | Reduce el riesgo de errores al modificar la estructura de la base de datos. |
| Automatización            | Se pueden aplicar y revertir cambios mediante herramientas de gestión de migraciones. |

#### <b>Herramientas Populares para Migraciones</b>

Existen diversas herramientas para gestionar migraciones de bases de datos, dependiendo del lenguaje y framework utilizado:
| **Herramienta**                      | **Tecnología**          | **Descripción** |
|--------------------------------------|------------------------|-----------------------------------------------------------|
| **Help Desk Migration**             | Java, SQL, REST API    | Plataforma SaaS que automatiza la migración de datos entre sistemas de help desk y CRM. |
| **AWS Database Migration Service**  | Java, AWS SDK, SQL    | Servicio de AWS que permite migrar bases de datos con replicación continua y mínima interrupción. |
| **Fivetran**                        | Python, SQL, REST API | Herramienta ETL sin código que automatiza la sincronización de datos en tiempo real desde múltiples fuentes. |
| **Matillion**                        | Java, SQL, Python     | Plataforma ETL basada en la nube con capacidades de transformación de datos y carga en data warehouses. |
| **Integrate.io**                     | Python, SQL, REST API | Plataforma ETL de bajo código con integración y automatización de canalizaciones de datos. |
| **Talend**                           | Java, Spark, SQL      | Solución de integración de datos con herramientas de transformación, calidad y gobernanza de datos. |
| **Oracle Data Integrator (ODI)**     | Java, SQL, ELT        | Herramienta de integración de datos de Oracle que permite la extracción, carga y transformación (ELT). |
| **Hevo Data**                        | Python, SQL, REST API | Plataforma de datos en tiempo real que permite replicar, transformar y mover datos sin escribir código. |
| **Google Cloud Migration Tools**     | Python, Go, SQL       | Conjunto de herramientas de Google Cloud para migraciones de datos y aplicaciones en entornos híbridos y multi-nube. |


<img src="https://cloud.google.com/static/architecture/images/database-migration-concepts-principles-part-1-migration-architecture-multi-environment.png?hl=es-419" alt="GooglemDBMigracion">

#### <b>Referencias</b>

- https://ed.team/blog/normalizacion-de-bases-de-datos
- https://platzi.com/blog/normalizar-una-base-de-datos-y-no-morir-en-el-intento/
- https://azure.microsoft.com/es-mx/resources/cloud-computing-dictionary/what-is-data-migration
- https://help-desk-migration.com/es/data-migration-tools/