# Ejercicio 1: Conexión a una Base de Datos Local y Repaso SQL

En el primer ejercicio, vamos a crear nuestra propia base de datos local y a practicar consultas SQL básicas. Para ello, vamos a implementar el modelo relacional de gestión de un hotel.

## 1.1 Creación de Tablas

Crea las  siguientes tablas:

* Alojamientos(<ins>IdAlojamiento</ins>, MaxPersonas*, Propietario, Ciudad)
* Reservas(<ins>IdReserva</ins>, IdAlojamiento, FechaEntrada, FechaSalida, Precio)
    - Reserva.IdAlojamiento -> Alojamiento.IdAlojamiento
* Formaliza(<ins>IdReserva</ins>, <ins>DNI</ins>)
    - Formaliza.IdReserva -> Reservas.IdReserva
    - Formaliza.DNI -> Participante.DNI
* Participantes(<ins>DNI</ins>, Nombre, Apellido, Ciudad*, FechaNacimiento*, Telefono*)

## 1.2 Inserción de Datos

Inserta los siguientes datos en la base de datos utilizando `psycopg2.extras.execute_batch`. También crea funciones de inserción de datos de forma individual para cada tabla.

In [268]:
datos_alojamientos = [(1, 4, 'Pensiones Loli', 'Madrid'), (2, None, 'Laura Gomez', 'Barcelona'),
                      (3, 2, 'Carlos Ruiz', 'Sevilla'), (4, 8, 'Ana Lopez', 'Valencia'), (5, 3, 'Maria Fernandez', 'Granada'),
                      (6, None, 'Juan Perez', 'Madrid')]

datos_reservas = [(100, 1, '2025-05-20', '2025-05-25', 900),
                  (101, 1, '2024-01-20', '2024-01-25', 400),
                  (102, 2, '2023-02-01', '2023-02-05', 500),
                  (103, 3, '2022-03-10', '2022-03-12', 200),
                  (104, 3, '2021-04-15', '2021-04-20', 800),
                  (105, 4, '2021-05-05', '2021-05-10', 300),
                  (106, 4, '2023-05-10', '2024-01-02', 100)]

datos_formaliza = [(101, "12345678A"),
                   (101, '23456789B'),
                   (102, '23456789B'),
                   (103, '34567890C'),
                   (104, "45678901D"),
                   (105, '56789012E'),
                   (105, '45678901D')]

datos_participantes = [('12345678A', 'Luis', 'Martinez', 'Madrid', '1985-07-14', '600123456'),
                       ('23456789B', 'Elena', 'Sanchez', None, None, None),
                       ('34567890C', 'Miguel', 'Garcia', 'Sevilla', None, '602345678'),
                       ('45678901D', 'Sofía', 'Lopez', None, '1995-01-30', '603456789'),
                       ('56789012E', 'Pablo', 'Hernandez', 'Granada', '2000-09-19', '604567890'),
                        ('11111111F', 'Juan Carlos', 'Redondo', None, '2005-01-30', '612345678')
                      ]

## 1.3 Consultas

Realiza las siguientes consultas:

### 1.3.1 

Escribe una función que muestre el nombre y apellido de las personas que se hayan alojado alguna vez en su misma ciudad, ordenados por apellido de manera ascendente. **Esquema: (Nombre, Apellido)**

```python
def misma_ciudad(self) -> List[Tuple[str, str]]:
    pass
```

### 1.3.2

Escribe una función que devuelva el nombre y apellido de todos los participantes con el número de reservas formalizadas (podrían ser cero), ciudades distintas que hayan visitado y suma del precio de sus reservas. **Esquema: (Nombre, Apellido, NumReservas, NumCiudades, SumaPrecios)**

```python
def informacion_reservas(self) -> List[Tuple[str, str, int, int, float]]:
    pass
```

### 1.3.3 

Escribe una función que muestre las Reservas que no tengan participantes formalizados, ordenadas de mayor a menor precio. **Esquema: (idReserva, Precio)**

```python
def reservas_no_formalizadas() -> List[Tuple[str, int]]:
    pass
```

### 1.3.4 

Escribe una función que muestre los alojamientos que no tienen reservado en una fecha concreta, su número máximo de plazas y ciudad. **Esquema: (idAlojamiento, MaxPersonas, Ciudad)**

```python
def sin_reservas(fecha: datetime.date) -> List[Tuple[str, int, str]]:
    pass
```

### 1.3.5

Escribe una consulta en lenguaje SQL que muestre la ciudad que más reservas tenga en un año concreto. **Esquema: (Ciudad, NumReservas)**

```python
def mas_reservas_anyo(anyo: int) -> List[Tuple[str, int]]:
    pass
```

## 1.4 Manipulación de Datos en Python

Utilizando consultas, crea funciones en Python que gestionen la base de datos automáticamente:

## 1.4.1 Alojamientos en Ciudad

Escribe una función `alojamientos_en_ciudad(ciudad)` que reciba una ciudad. La función debe mostrar el número de alojamientos en dicha ciudad (que podrían ser cero, en ese caso escribir que no hay alojamientos en la ciudad). Para cada alojamiento mostrar el Id de Alojamiento, su propietario y una lista de sus reservas ordenadas por fecha de entrada, indicando el número de reserva, fecha de entrada y precio. Tras mostrar las reservas para cada Alojamiento se debe mostrar el número de sus reservas (que podrían ser cero) y el total del coste de sus reservas. Un ejemplo de ejecución de `listar_Alojamientos('Madrid')` sería:


```
Número de Alojamientos de Madrid: 2
---
Alojamiento: 1 Propietario: Pensiones Loli
ID: 101 Fecha Entrada: 2024-01-20 Precio: 400
ID: 100 Fecha Entrada: 2025-05-20 Precio: 900
---
Total reservas: 2 Total Precio: 1300
---
Alojamiento: 6 Propietario: Juan Perez
---
Total reservas: 0 Total Precio: 0
---
```

## 1.4.2 Aplicación de Descuentos

Escribe una función `aplicar_descuento(propietario, fecha_inicio, fecha_fin, descuento)` que dado un propietario, un rango de fechas y un descuento, aplique el descuento sobre el precio del alojamiento si esa reserva se encuentra en los días fijados. Para poder aplicar el descuento, es necesario que la totalidad de la estancia se encuentre entre las fechas especificadas (ambas inclusive).

Por ejemplo, si aplicamos un descuento del **12,5%** entre las fechas del 01/01/2025 al 31/01/2025 a los alojamientos de `Pensiones Loli`, invocaríamos a la función con los parámetros `aplicar_descuento("Pensiones Loli", datetime.date(2025, 1, 1), datetime.date(2025, 1, 31), 12.5)`.

# Ejercicio 2: Conexión a una Base de Datos Remota

Hasta ahora, hemos trabajado sobre bases de datos que hemos definido nosotros mismos localmente. Pero, ¿cómo podemos conectarnos a bases de datos remotas y trabajar con ellas?


## 2.1 Establecer la Conexión con psycopg2, psql y/o pgAdmin

Para familiarizaros con el manejo de una base de datos remota, vamos a crear una conexión a una base de datos ya existente de estudios clínicos. Para poder acceder a ella, es necesario que os registréis en la siguiente [web](https://aact.ctti-clinicaltrials.org/users/sign_up). Los datos de la conexión son los siguientes:

```
      Hostname:  aact-db.ctti-clinicaltrials.org
      Port: 5432
      Database name:  aact
      User name:  'Username'
      Password:  'your AACT password' 
```

Cread un archivo de configuración con los datos de la conexión y probad a conectaros a la base de datos. También probad a conectaros desde `psql` y desde `pgAdmin` usando los mismos parámetros de la configuración.

## 2.2 Mostrar todas las tablas

Una vez hemos realizado la conexión a la base de datos, vamos a estudiar qué tablas se encuentran disponibles en el sistema. 

## 2.3 Describir una tabla

Una vez hemos recuperado la lista de tablas disponibles, vamos a centrarnos en la tabla `univ_als_studies`. Nuestro primer objetivo es determinar qué campos tiene esta tabla para poder extraer información de la misma.

## 2.4 Modificación de Datos

Vamos a probar qué pasa si intentamos hacer una inserción de datos en la tabla anterior. Prueba a insertar la fila `(abc, UCM)` en la tabla `univ_als_studies`. ¿Qué está ocurriendo? Comprueba en `psql` o en `pgAdmin` los permisos asociados a nuestro usuario.

## 2.5 Consultas SQL

Finalmente, vamos a probar a hacer una consulta SQL compleja. Queremos encontrar el id de todos aquellos estudios cuyos resultados preliminares fueron publicados después de 2015 y la proporción entre sujetos afectados y sujetos en riesgo del estudio sea **para todos sus eventos asociados** menor del 20% y debe tener al menos un sujeto en riesgo. Estudiad las tablas `studies` y `reported_events` para crear la consulta.

# Ejercicio 3: Migración de una Base de Datos (Opcional)

Vamos a estudiar cómo migrar los datos de una base de datos de un servidor a otro. Para ello, utilizaremos una base de datos basada en la base de datos de películas _IMDB_, la cual se encuentra disponible en el siguiente [enlace](https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/2QYZBT). 

## 3.1 Cargar la Base de Datos en el Servidor Local

El primer paso consiste en descargarse el fichero comprimido de la base de datos de la web y cargarlo en nuestro servidor local. Para ello, tenemos que crear previamente la base de datos `imdb` en nuestro servidor, ya que de lo contrario no se podrá hacer la carga. Una vez lo tengamos creado, utilizaremos el servicio `pg_restore` para cargar la bases de datos. Abre una terminal de Windows/Linux y ejecuta el siguiente comando:

```bash
pg_restore -d imdb -U postgres --clean --if-exists imdb_pg11
```

donde el flag `-d` se refiere a la base de datos, `-U` al usuario, `--clean` permite borrar objetos ya existentes y `--if-exists` restringe el borrado a aquellos objetos ya existentes.

Si el comando produce un error, muy probablemente se deba a que el método de autentificación obligue a que el usuario de la terminal se corresponde con `postgres`. En tal caso, hay dos alternativas:

1. En Linux, podemos ejecutar el comando anterior precedido con `sudo -u postgres` para ejecutar el comando `pg_restore` con el usuario `postgres`.

2. Modificar el archivo [`pg_hba.conf`](https://www.postgresql.org/docs/current/auth-pg-hba-conf.html) (archivo de configuración de autentificación) para cambiar el método de identificación del superusuario `postgres` de `peer` a `md5`. Para encontrar el archivo, basta con invocar a `show hba_file` desde `psql`. En Linux, tenemos que ejecutar el comando  `systemctl restart postgresql` para reiniciar `postgresql` con la nueva configuración. En Windows, sigue las instrucciones del siguiente [link](https://neon.tech/postgresql/postgresql-administration/restart-postgresql-windows).

## 3.2 Realiza una Modificación sobre la Base de Datos

Elimina la tabla `title` de la base de datos.

## 3.3 Crea un backup de la Base de Datos actualizada

Para crear una copia lógica de la base de datos, vamos a utilizar la herramienta `pg_dump`. La sintaxis es similar a la de `pg_restore`:

```bash
pg_dump -U postgres -Fc -d imdb -f imdb_backup
```

donde `-f` especifica el nombre del archivo que contiene la copia y el flag `-Fc` especifica que el backup se hace en modo _custom_. Si no especificamos ese flag, se generará una archivo `.sql` con todas las sentencias necesarias para reconstruir la base de datos. 

Al igual que con `pg_restore`, puede ocurrir el mismo problema de autentificación. Prueba a eliminar la base de datos con `DROP DATABASE imdb` e importar el _backup_ que hemos creado. Comprueba que efectivamente la tabla `title` no se encuentra disponible.