# SQL Intro a BBDD y Normalización | Materiales Promo I Data Analytics

## Introducción

En esta lección, exploraremos los conceptos fundamentales esenciales para comprender cómo funcionan las bases de datos, cómo se diseñan y cómo se gestionan utilizando MySQL, un sistema de gestión de bases de datos muy popular. El objetivo principal es proporcionar una visión general de los componentes básicos de las bases de datos, cómo se estructuran y por qué la normalización es un aspecto esencial en el diseño de bases de datos eficientes.

## Importación de las Bases de Datos de las Clases

En este apartado se explica cómo importar las bases de datos necesarias para cada una de las lecciones correspondientes a SQL. Se ha creado una base de datos diferente para cada una de las lecciones, permitiendo probar los ejemplos explicados a lo largo de la teoría. Además, incluye bases de datos de ejemplo que vienen por defecto con la instalación de MySQL Workbench.

## Estructura

- **Modelo Relacional:** Las bases de datos relacionales organizan los datos en tablas relacionadas entre sí.
- **Sistema de Gestión de Bases de Datos (SGBD):** Un SGBD es una herramienta que permite crear, gestionar y manipular bases de datos de manera eficiente.

## Claves Primarias (Primary Key - PK)

- **Definición:** Una clave primaria es un campo que identifica de manera única cada registro en una tabla.
- **Ejemplos de Claves Primarias:** Se utilizan en tablas para asegurar la unicidad de cada registro.

## Claves Foráneas (Foreign Key - FK)

- **Definición:** Una clave foránea es un campo en una tabla que crea una relación con una clave primaria en otra tabla.
- **Importancia:** Mantiene la integridad de los datos, evitando relaciones incorrectas o registros huérfanos.
- **Ejemplos:** En la tabla "productos", la columna "id_producto" es la clave primaria, y en la tabla "pedidos", "id_producto" es una clave foránea que referencia a la tabla "productos".

## Normalización

### Definición

La normalización es un proceso de diseño que ayuda a organizar la información de manera eficiente y libre de redundancias. Consiste en dividir los datos en tablas relacionadas para evitar la repetición de la misma información y garantizar la integridad de los datos.

### Importancia

- **Eliminación de la Redundancia:** Evita la duplicación innecesaria de datos, ahorrando espacio de almacenamiento y mejorando la consistencia de los datos.
- **Mantenimiento de la Integridad Referencial:** Asegura que las relaciones entre las tablas sean coherentes y que los datos estén vinculados de manera adecuada.
- **Facilita la Actualización y Modificación de Datos:** Minimiza la duplicación y las dependencias, facilitando cambios en los datos sin afectar negativamente otras partes de la base de datos.
- **Mejora el Rendimiento de las Consultas:** Las consultas se vuelven más eficientes en bases de datos normalizadas, permitiendo búsquedas y combinaciones de datos más efectivas.

### Formas Normales

La normalización se divide en diferentes formas normales, siendo las tres primeras las más comunes y esenciales. Cada uno de estos pasos se debe cumplir en cascada:

1. **Primera Forma Normal (1FN):** Los datos deben ser atómicos (indivisibles) y cada columna debe contener un solo valor.
2. **Segunda Forma Normal (2FN):** Debe cumplir con 1FN y todos los atributos no clave deben depender completamente de la clave primaria.
3. **Tercera Forma Normal (3FN):** Debe cumplir con 2FN y todos los atributos no clave deben ser independientes entre sí.

### Ejemplos de Problemas Resueltos con la Normalización

- **Ejemplo de Clientes:** Una tabla de clientes que incluye país y ciudad en una sola columna dificulta las búsquedas por país.
- **Ejemplo de Pedidos:** Una tabla de pedidos con precios duplicados para un mismo producto requiere actualizaciones en varias filas, lo cual no es operativo.

Al aplicar la normalización, estas tablas se dividen y organizan de manera que cada pieza de información se almacena una sola vez y las relaciones entre tablas se mantienen coherentes y eficientes.

En resumen, la normalización es esencial para garantizar que una base de datos sea eficiente, precisa y fácil de mantener. Permite diseñar una estructura de datos adaptada a las necesidades de una aplicación, reduciendo problemas potenciales relacionados con la integridad de los datos y la eficiencia de las consultas.

## Ejercicio

Haz un esquema que resuelva los conflictos en la tabla.

| id_pedido | id_cliente | nombre_cliente | id_artículo | artículo_marca   | cantidad | precio_unitario |
|-----------|------------|----------------|-------------|------------------|----------|-----------------|
| 1         | 101        | Patricia Díaz  | 1           | chaqueta, marca A| 2        | 29              |
| 2         | 102        | Marta Gutierrez| 2           | chaqueta, marca B| 5        | 37              |
| 3         | 103        | Cristina López | 3           | pantalón, marca C| 3        | 42              |
| 3         | 103        | Cristina López | 2           | chaqueta, marca B| 1        | 37              |



In [1]:
import pandas as pd

t1 = {"id_pedido":[],
      "id_cliente":[],
      "nombre_cliente":[],
      "apellido_cliente":[],
      "id_artículo":[],
      "articulo":[],
      "marca":[],
      "cantidad":[],
      "precio_unitario":[]
    }

df = pd.DataFrame(t1)
df

Unnamed: 0,id_pedido,id_cliente,nombre_cliente,apellido_cliente,id_artículo,articulo,marca,cantidad,precio_unitario


Para resolver los conflictos en la tabla y cumplir con las reglas de la 1NF, 2NF y 3NF, primero debemos entender los principios de cada forma normal:

1. **Primera Forma Normal (1NF)**:
   - Asegúrate de que cada columna contenga solo valores atómicos (no repetidos ni múltiples valores por columna).
   - Cada columna debe contener un tipo de dato único.
   - Cada fila debe ser única.

2. **Segunda Forma Normal (2NF)**:
   - Cumple con 1NF.
   - Cada campo no clave debe depender de la clave principal en su totalidad, no de una parte de ella.

3. **Tercera Forma Normal (3NF)**:
   - Cumple con 2NF.
   - No debe haber dependencias transitivas, es decir, los campos no clave deben depender únicamente de la clave principal.

### Paso 1: Identificar las entidades y sus atributos

1. **Pedidos**:
   - id_pedido (clave primaria)
   - id_cliente
   - nombre_cliente

2. **Artículos**:
   - id_artículo (clave primaria)
   - artículo_marca
   - precio_unitario

3. **Detalles de Pedido**:
   - id_pedido (parte de la clave primaria compuesta)
   - id_artículo (parte de la clave primaria compuesta)
   - cantidad

### Paso 2: Crear las tablas normalizadas

#### Tabla de Clientes
```md
| id_cliente | nombre_cliente   |
|------------|------------------|
| 101        | Patricia Díaz    |
| 102        | Marta Gutierrez  |
| 103        | Cristina López   |
```

#### Tabla de Artículos
```md
| id_artículo | artículo_marca   | precio_unitario |
|-------------|------------------|-----------------|
| 1           | chaqueta, marca A| 29              |
| 2           | chaqueta, marca B| 37              |
| 3           | pantalón, marca C| 42              |
```

#### Tabla de Pedidos
```md
| id_pedido | id_cliente |
|-----------|------------|
| 1         | 101        |
| 2         | 102        |
| 3         | 103        |
```

#### Tabla de Detalles de Pedido
```md
| id_pedido | id_artículo | cantidad |
|-----------|-------------|----------|
| 1         | 1           | 2        |
| 2         | 2           | 5        |
| 3         | 3           | 3        |
| 3         | 2           | 1        |
```

### Esquema en formato Markdown

```md
## Tabla de Clientes
| id_cliente | nombre_cliente   |
|------------|------------------|
| 101        | Patricia Díaz    |
| 102        | Marta Gutierrez  |
| 103        | Cristina López   |

## Tabla de Artículos
| id_artículo | artículo_marca   | precio_unitario |
|-------------|------------------|-----------------|
| 1           | chaqueta, marca A| 29              |
| 2           | chaqueta, marca B| 37              |
| 3           | pantalón, marca C| 42              |

## Tabla de Pedidos
| id_pedido | id_cliente |
|-----------|------------|
| 1         | 101        |
| 2         | 102        |
| 3         | 103        |

## Tabla de Detalles de Pedido
| id_pedido | id_artículo | cantidad |
|-----------|-------------|----------|
| 1         | 1           | 2        |
| 2         | 2           | 5        |
| 3         | 3           | 3        |
| 3         | 2           | 1        |
```

### Justificación del Esquema

1. **1NF**: Cada tabla tiene solo valores atómicos, cada columna contiene un tipo de dato único, y cada fila es única.
2. **2NF**: Cada atributo no clave en las tablas `Clientes`, `Artículos` y `Pedidos` depende completamente de la clave primaria de la tabla. La tabla `Detalles de Pedido` tiene una clave primaria compuesta (`id_pedido` + `id_artículo`), y los atributos no clave dependen completamente de esta clave primaria compuesta.
3. **3NF**: No hay dependencias transitivas en las tablas, ya que todos los atributos no clave dependen únicamente de la clave primaria de su tabla.

Con este esquema, se resuelven los conflictos originales y se cumplen las condiciones de 1NF, 2NF y 3NF.