## Ejercicio Crear BBDD

En este ejercicio vamos a crear una base de datos ficticia de estudiantes de HACK A BOSS.

Para esto vamos a separar este ejercicio en 3 partes:

1. Creación del modelo entidad-relación en SQL.
2. Crear datos ficticios en Python.
3. Llenar las tablas usando la librería de MySQL en Python.

---

### 1. Modelo Entidad-Relación

Existen muchas formas de crear una base de datos de estudiantes, para hacer este ejercicio vamos a guiarnos por este ejemplo:

![schema-estudiantes.png](attachment:91cb735e-0eb4-4c48-8509-ba956c2d6d07.png)

Donde existen 5 tablas:

- **Tabla _Modulos_**:
    - **modulo_id** es la **Primary Key**.
    - La tabla debe tener estos elementos.

|modulo_id|modulos         |
|---------|----------------|
|1        |Python          |
|2        |Matemáticas     |
|3        |Ciencia de Datos|
|4        |SQL             |
|5        |Machine Learning|
|6        |PySpark         |
|7        |Streamlit       |

---

- **Tabla _Bootcamps_**:
    - **bootcamp_id** es la **Primary Key**.
    - La primera fecha es del 2020.
    - Empieza un nuevo bootcamp cada 30 días.
    - Cada bootcamp termina después de 154 días.
    - La tabla tiene 200 elementos.
    
|bootcamp_id |bootcamp|inicio_bootcamp|final_bootcamp|
|------------|--------|---------------|--------------|
|1           |DSB01RT |2020-01-01     |2020-06-03    |
|2           |DSB02RT |2020-01-31     |2020-07-03    |
|3           |DSB03RT |2020-03-01     |2020-08-02    |
|4           |DSB04RT |2020-03-31     |2020-09-01    |
|5           |DSB05RT |2020-04-30     |2020-10-01    |
|...         |...     |...            |...           |
|196         |DSB196RT|2036-01-07     |2036-06-09    |
|197         |DSB197RT|2036-02-06     |2036-07-09    |
|198         |DSB198RT|2036-03-07     |2036-08-08    |
|199         |DSB199RT|2036-04-06     |2036-09-07    |
|200         |DSB200RT|2036-05-06     |2036-10-07    |

---

- **Tabla _Estudiantes_**:
    - **estudiante_id** es la **Primary Key**.
    - **bootcamp_id** es una **Foreign Key** de la **Tabla _Bootcamp_**.
    - **email** es una columna que no permite repetidos.
    - **beca** es una columna de booleanos.
    - **inscripcion** es una columna de fechas.
    - La tabla debe tener entre 5.000 y 8.000 elementos (número de filas aleatorio).
    - Las columnas **beca** y **bootcamp_id** son aleatorias.
    - La columna **inscripcion** solo tiene fechas del año 2019.

|estudiante_id|nombre     |apellido     |email                               |inscripcion|beca |bootcamp_id|
|-------------|-----------|-------------|------------------------------------|-----------|-----|-----------|
|1            |nombre00   |apellido00   |nombre00.apellido00@python.com      |2019-07-13 |True |177        |
|2            |nombre01   |apellido01   |nombre01.apellido01@python.com      |2019-12-07 |False|185        |
|3            |nombre02   |apellido02   |nombre02.apellido02@python.com      |2019-02-27 |True |69         |
|4            |nombre03   |apellido03   |nombre03.apellido03@python.com      |2019-11-07 |True |186        |
|5            |nombre04   |apellido04   |nombre04.apellido04@python.com      |2019-11-26 |True |116        |
|...          |...        |...          |...                                 |...        |...  |...        |
|7532         |nombre7531 |apellido7531 |nombre7531.apellido7531@python.com  |2019-08-21 |False|37         |

---

- **Tabla _Modulo - Bootcamp_**:
    - **bootcamp_id** y **modulo_id** son las **Primary Key**.
    - La columna **puntuacion** es generada aleatoriamente (números del 1 a 10).

|bootcamp_id|modulo_id|puntuacion|
|-----------|---------|----------|
|1          |1        |8         |
|1          |2        |7         |
|1          |3        |5         |
|1          |4        |5         |
|1          |5        |6         |
|...        |...      |...       |
|200        |3        |10        |
|200        |4        |2         |
|200        |5        |6         |
|200        |6        |9         |
|200        |7        |6         |


**Nota**: Para crear una tabla con dos columnas como **Primary Key**:
    
```mysql
CREATE TABLE table_name
(
 column_1 INT NOT NULL,
 column_2 INT NOT NULL,
 PRIMARY KEY (column_1, column_2)
);

```

---

- **Tabla _Asistencias_**:
    - **asistencia_id** es la **Primary Key**.
    - **estudiante_id** es una **Foreign Key** de la tabla **_Estudiantes_**.
    - **asistencia** es una columna de booleanos.
    - La primera **fecha** de cada **estudiante_id** es el inicio del bootcamp de cada estudiante.
    - La última **fecha** de cada **estudiante_id** es el final del bootcamp de cada estudiante.


|asistencia_id|estudiante_id|asistencia|fecha     |
|-------------|-------------|----------|----------|
|1            |1            |True      |2021-06-24|
|2            |1            |True      |2021-06-25|
|3            |1            |True      |2021-06-26|
|4            |1            |False     |2021-06-27|
|5            |1            |True      |2021-06-28|
|...          |...          |...       |...       |
|1159924      |7532         |True      |2032-04-26|
|1159925      |7532         |True      |2032-04-27|
|1159926      |7532         |True      |2032-04-28|
|1159927      |7532         |True      |2032-04-29|
|1159928      |7532         |True      |2032-04-30|

---

### 2. Datos en Python

Usando la librería de **random**, **datetime** y **pandas** genera datos ficticios siguiendo las especificaciones de la parte anterior.

Al finalizar esta parte deberían existir 5 **DataFrames**, uno para cada tabla.

Guarda los **DataFrames** como _csv_ o como _txt_.

### 3. Cargar datos a MySQL

Usa la librería de MySQL para cargar los datos de cada tabla en el siguiente orden:

1. Bootcamps
2. Modulos
3. Modulo-Bootcamp
4. Estudiantes
5. Asistencias

### 4. Queries

Usando la BBDD que acabamos de crear responde a las siguientes preguntas:

- ¿Que bootcamp tiene más estudiantes?
- ¿Cuantos bootcamps no tienen estudiantes?
- ¿Que estudiantes tienen más asistencias y cuales tiene menos?
- ¿Que modulo tiene mas puntuación de media y cual tiene menos puntuación de media?
- ¿Qué bootcamp tiene mayor puntuación de media?
- ¿Qué bootcamp tiene mas asistencias y cual tiene menos asistencias? Los bootcamps sin estudiantes no cuentan.
- ¿Qué día tiene el mayor número de asistencias y cual tiene el menor número de asistencias?
- ¿Cuales bootcamps le dan 10 al modulo de **Machine Learning**?
- Muestra los 10 estudiantes que tenga más asistencias (_subqueries_).


Las respuestas serán diferentes debido a la aleatoriedad de los datos.