# Creación de Base de Datos

## Herramienta de administración de bases de datos: DBeaver

- `DBeaver` es una herramienta de base de datos multiplataforma gratuita para desarrolladores, administradores de bases de datos, analistas y todas las personas que necesiten trabajar con bases de datos. Soporta todas las bases de datos populares:` MySQL, PostgreSQL, SQLite, Oracle, DB2, SQL Server, Sybase, MS Access, Teradata, Firebird, Apache Hive, Phoenix, Presto`, etc.
- Para instalar `DBeaver` usar el instalador correspondiente del siguiente link: [(ver DBeaver)](https://dbeaver.io/download/). Para el caso de Windows el instalador a descargar aparece en la siguiente imagen:

```{figure} ./images/dbeaver_installer.png
---
name: dbeaver_installer_fig
align: center
scale: 50
---
Instalador de `DBeaver` para `Windows` y `Mac`.
```

- Siga los pasos de instalación. Procederemos ahora ahora con la instalación de `Docker` y luego retomaremos el uso de `DBeaver` para administrar la base de datos a crear.

## Instalación y uso de Docker

- `Docker` es una plataforma de software que le permite `crear, probar e implementar aplicaciones rápidamente`. `Docker` empaqueta software en unidades estandarizadas llamadas `contenedores` que incluyen todo lo necesario para que el software se ejecute, incluidas bibliotecas, herramientas de sistema, código y tiempo de ejecución. Con `Docker`, puede implementar y ajustar la escala de aplicaciones rápidamente en cualquier entorno con la certeza de saber que su código se ejecutará.

- `Docker` le proporciona una manera estándar de ejecutar su código. `Docker` es un `sistema operativo para contenedores`. De manera similar a cómo una `máquina virtual virtualiza` (elimina la necesidad de administrar directamente) el hardware del servidor, `los contenedores virtualizan el sistema operativo de un servidor`. `Docker` se instala en cada servidor y proporciona comandos sencillos que puede utilizar para crear, iniciar o detener contenedores. Para instalar `Docker` use el siguiente link ([ver Docker Installer](https://docs.docker.com/get-docker/)).

```{figure} ./images/docker_installer.png
---
name: docker_installer_fig
align: center
scale: 35
---
Instalador de `Docker` para `Windows`, `Mac` y `Linux`.
```

- Luego de instalar `Docker`, puede iniciar la aplicación, ejecutando `Docker Desktop`, el cual mantendrá ejecutando un proceso de virtualización. La siguiente será la interfaz gráfica que visualizará al ejecutar `Docker`

```{figure} ./images/docker_desktop.png
---
name: docker_desktop_fig
align: center
scale: 35
---
Aplicación `Docker Desktop` para Windows.
````

- Inicialmente utilizaremos `Docker` desde consola. Para esto abrimos una terminal de `Windows PowerShell` usando el comando `Window + R` o directamente desde su terminal buscando el logo de `Windows PowerShell`. Luego de esto vamos a `descargar el contenedor de PostgreSQL` utilizando el comando siguiente (ver [Docker PostgreSQL](https://hub.docker.com/_/postgres)). Nótese que el contenedor de `Docker` para `PostgreSQL` se llama `postgres`. 

```shell
docker pull postgres
```

- Si desea eliminar la imagen `postgres` de docker, puede usar el comando `docker rmi postgres`. En `docker hub` (ver [Docker Hub](https://hub.docker.com/)) podrás encontrar otro tipo de contenedores, por ejemplo para: `Engines, Apache, Java, C#, Python, Go`, etc,.... 

```{figure} ./images/docker_pullpostgres.png
---
name: docker_pullpostgres_fig
align: center
scale: 35
---
Consola `Windows PowerShell` para ejecutar el cliente de `Docker`.
```

- El procedimiento anterior se encargará de descargar la última versión de `PostgreSQL` en nuestro computador (`imagen de Docker`). Este es solo un proceso de instalación, el cual nos `permitirá posteriormente, ejecutar múltiples instancias del contenedor para bases de datos`.

- Para crear una base de datos vamos a necesitar como `mínimo una contraseña` para inicializarla, para esto debemos usar el flag: `POSTGRES_PASSWORD`. Podemos también asignarle un usuario a la base de datos, en caso de no hacerlo, el usuario por defecto creado por `PostgreSQL` será `postgres`. Para proceder entonces utilizamos el siguiente comando:

```shell
docker run -e POSTGRES_PASSWORD=password postgres
```

- El comando `run` ejecutará una instancia para nuestra nueva base de datos. El flag `e` es utilizado para agregar variables de entorno (ver [Docker PostgreSQL](https://hub.docker.com/_/postgres)). En este caso, vamos a utilizar la variable `POSTGRES_PASSWORD` y asignaremos a esta la contraseña deseada, en este caso, a manera de ejemplo, utilizaremos `password` como contraseña. Al final de la instancia, podrá observar un mensaje indicando que el sistema ya esta listo para aceptar conexiones. `Esta ventana la debemos de dejar ejecutándose`.

```{figure} ./images/docker_rundatabase.png
---
name: docker_rundatabase_fig
align: center
scale: 35
---
Creación de instancia para la base de datos `PostgreSQL`.
```

- En `Docker Desktop` podrá visualizar la instancia de `PostgreSQL` que el contenedor ha creado, la cual tiene un nombre que generó de forma aleatoria.

```{figure} ./images/instancia_postgresdesktop.png
---
name: instancia_postgresdesktop
align: center
scale: 35
---
Instancia de `PostgreSQL` con nombre random visualizada en `Docker Desktop`.
```

- El siguiente paso es conectarnos a la instancia de `PostgreSQL` creada por el contenedor. Para esto abrimos una nueva consola de `Windows PowerShell` para conectarnos al contenedor que se está ejecutando. Antes, verificamos cual es el nombre del contenedor (*adjetivo+nombre aleatorio*) creado desde la consola o de `Docker Desktop`

```shell
docker ps
```

- `docker ps` nos mostrará en consola los `procesos que está ejecutando nuestro contenedor`. En este caso nos aparece el único contenedor creado hasta el momento, cuyo nombre es: `vigilant_grothendieck`. Este nombre puede ser cambiado utilizando las variables de entorno.

```{figure} ./images/docker_ps.png
---
name: docker_ps_fig
align: center
scale: 35
---
Procesos siendo ejecutados por nuestro contenedor `Docker`
```

- Procedemos ahora si a conectarnos a la instancia de `PostgreSQL` creada por el contenedor. Para esto utilizaremos el siguiente comando:

```shell
docker exec -it vigilant_grothendieck bash
```

- [docker exec](https://docs.docker.com/engine/reference/commandline/exec/) se encarga de `ejecutar un comando de forma interactiva en un contenedor en ejecución`, en este caso, el contenedor para `PostgreSQL` previamente instanciado, utilizando el programa `bash` dentro del contenedor. Luego de hacerlo, podemos conectarnos a `postgres` desde el `bash` utilizando:

```shell
psql -U postgres --password
```

- `psql` es la línea de comandos de `PostgreSQL`. Por otro lado, `postgres` es el nombre de usuario que se creo por defecto al instanciar la base de datos. Usamos el flag `--password` para `agregar por consola nuestra contraseña` creada para la base de datos. Podrá observar que se ha conectado a la instancia de `PostgreSQL` y puede realizar a esta, las consultas que desee. Para salir del contenedor puede presionar `Ctrl + D`.

- Podemos crear una base de datos de prueba, para verificar que el funcionamiento de nuestro contenedor. Para eso usamos la siguiente orden:

```shell
CREATE DATABASE sql_test;
```

```{figure} ./images/sql_testdatabase.png
---
name: sql_testdatabase_fig
align: center
scale: 35
---
Consulta y creación de base de datos test, en la instancia de `PostgreSQL` en `Docker`.
````

- Ahora procederemos a estudiar como podemos `eliminar un contenedor`. Por ahora, dado que no tenemos ningún contenedor ejecutándose, al usar `docker ps` podremos notar que la lista de contenedores activos está vacía, sin embargo, si utilizamos `docker ps -a` podremos visualizar los contenedores creados, aún cuando no se están ejecutando. 

- Para eliminar contenedores creados a priori podemos utilizar el comando `docker rm` seguido del identificador del contenedor, tal como se muestra a continuación. Antes puede salir del bash de PostgreSQL presionando `Ctrl + D` dos veces. Si le arroja una respuesta de error del daemon, procedemos antes a detener el contenedor usando `docker stop vigilant_grothendieck`.

```shell
docker rm vigilant_grothendieck
```

```{figure} ./images/containers_created.png
---
name: containers_created_fig
align: center
scale: 35
---
Lista de contenedores creados por `Docker`. Eliminación de contenedor.
```

- Podemos volver a recrear lo realizado previamente, pero ahora sin necesidad de instalar el contenedor de `PostgreSQL` como se realizó al inicio, pues ya el instalador fue descargado, el cual podemos reutilizar

```{figure} ./images/docker_images.png
---
name: docker_images_fig
align: center
scale: 35
---
Imágenes de `Docker` instaladas.
```

- Ejecutemos nuevamente el contenedor de `PostgreSQL` para poder crear una nueva base de datos, ahora con mas opciones para las variables de entorno, como `usuario además de la contraseña y el nombre de la base de datos`, de tal forma que puedan ser usados para conectarse a la base de datos. El comando `-d` (*detach*) puede ser utilizado para `mantener el proceso en ejecución`

```shell
docker run --name=undatascience-postgres -e POSTGRES_USER=undatascience -e POSTGRES_PASSWORD=password -e POSTGRES_DB=undatasciencedb -d postgres
```

```{figure} ./images/postgres_name.png
---
name: postgres_name_fig
align: center
scale: 35
---
Creación de nueva base de datos nombrada `undatascience-postgres` en el contenedor de `Docker`.
```

- Si se desea eliminar el `Docker` que está en ejecución, primero debe detenerlo utilizando el comando `docker stop` seguido del nombre del contenedor y luego `docker rm`. La base de datos creada también se puede visualizar desde `Docker Desktop`.

```{figure} ./images/containernamed_dockerapp.png
---
name: containernamed_dockerapp_fig
align: center
scale: 35
---
Nueva base de datos creada administrada desde `Docker Desktop`.
```

- Podemos hacer el ejercicio de conectarnos nuevamente, de manera interactiva el nuevo contenedor creado utilizando el nombre con el que fue creado `undatascience-postgres` y ejecutar dentro de este el programa `bash`. Si el contenedor está apagado, debe iniciarse antes usando `docker start undatascience-postgres`

```shell
docker exec -it undatascience-postgres bash 
```

```{figure} ./images/start_containernamed.png
---
name: start_containernamed_fig
align: center
scale: 35
---
Inicio del contenedor mediante su nombre, ejecutando el programa `bash`. 
```



- Dentro de `bash` puede utilizar todos los atajos comúnmente usados, por ejemplo `Ctrl + L` para limpiar la consola, `Ctrl + D` para salir de la consola. Para verificar cual es la versión de `PostgreSQL` usamos el comando

```shell
psql --version
```
- El mensaje arrojado en consola será del tipo: `psql (PostgreSQL) 15.3 (Debian 15.3-1.pgdg110+1)`. Si deseamos conectarnos a la base de datos recientemente creada, utilizaremos el siguiente comando en el que utilizamos: nombre de la base de datos y la contraseña asignada previamente.

- Asignamos `nombres de usuario y base de datos`. La `contraseña será solicitada en el prompt`.

```shell
psql -U undatascience --password --db undatasciencedb
```

```{figure} ./images/database_connection_nameuserdb.png
---
name: database_connection_nameuserdb_fig
align: center
scale: 35
---
Conexión a base de datos. La contraseña es suministrada en el prompt.
```

- En caso de haber olvidado la contraseña, puede ingresar a `Docker Desktop` para recordarla y utilizarla

```{figure} ./images/credentials_postgresdb.png
---
name: credentials_postgresdb_fig
align: center
scale: 35
---
Aplicación `Docker Desktop` para verificar credenciales de bases de datos.
```

- Para verificar que estamos dentro de la base de datos que hemos creado, podemos utilizar el siguiente comando (`SELECT CURRENT_USER;`), el cual mostrará cual es el `nombre del usuario` asociado a la base de datos a la cual nos hemos conectado

```shell
SELECT CURRENT_USER;
```

```{figure} ./images/select_currentuser.png
---
name: select_currentuser_fig
align: center
scale: 35
---
Consulta a la base de datos para identificar el usuario actual.
```

- Ya dentro del bash asociado a nuestra base de datos, podemos usar comandos útiles de la consola interactiva de `PostgreSQL`

    - `\h INSERT`: Ver la ayuda con respecto a la sintaxis de nuestras consultas `SQL`, por ejemplo, el uso de `INSERT`.
    - `\dt`: Mostrará la lista de las tablas de la base de datos que tengamos seleccionada.
    - `\?`: Mostrará una lista de todos los comandos que podemos usar en la consola interactiva de `postgresql`. Presionar `q` para salir de la lista.
    - `\conninfo`: Mostrará la información de nuestra conexión activa.
    - `\l`: Muestra la lista de instancias de bases de datos creadas

- Cuando ejecutamos un contenedor (ver {numref}`postgres_name_fig`) obtenemos el puerto `5432/tcp` el cual asigna por defecto `postgres`. `Este puerto solo funciona internamente dentro del contenedor`. Si deseamos `acceder a este puerto desde fuera, necesitaremos exponerlo`. Para esto usamos el flag `-p 5432:5432`. Ahora nos podemos conectar a nuestro contenedor de `PostgreSQL` desde cualquier aplicación, por ejemplo desde `DBeaver`.

```shell
docker run --name=undatascience-name -e POSTGRES_USER=undatascience-user -e POSTGRES_PASSWORD=undatascience-password -e POSTGRES_DB=undatascience-db -p 5432:5432 -d postgres
```

```{figure} ./images/nuevo_puerto_conexion.png
---
name: nuevo_puerto_conexion_fig
align: center
scale: 35
---
Creación de contenedor con puerto expuesto para conexiones externas.
```

- Gracias a que hemos expuesto el contenedor, ahora podemos por medio de este conectarnos a la base de datos creada (`undatascience-db`) desde cualquier aplicación, por ejemplo, usando `DBeaver` el cual fue instalado al inicio de este capítulo (ver {numref}`dbeaver_installer_fig`).

- Nótese que aún sin tener instalado `PostgreSQL` en nuestro computador, podemos utilizar `DBeaver` para conectarnos a la base de datos creada en `Docker`. Para conectarnos a  la base de datos creada, por ejemplo `undatascience-db`, hacemos click en `Database -> New Database Connection` y podremos observar la siguiente imagen, en la que seleccionaremos `PostgreSQL` y luego el botón `Next`.

```{figure} ./images/dbeaver_connection_db.png
---
name: dbeaver_connection_db_fig
align: center
scale: 40
---
Conexión a la base de datos creada en `Docker`, desde la aplicación `DBeaver`.
```

- En la ventana que se abrirá, vamos a `agregar las credenciales de la base de datos creada`. Si `DBeaver` le `solicita instalar algunos drivers, haga click en descargar`, esto le permitirá contar con las bibliotecas que le permitirán realizar la conexión. 

- Para conectarnos tendremos en cuenta lo siguiente:
    - `Host`: localhost
    - `Port`: 5432
    - `Database`: undatascience-db
    - `Username`: undatascience-user
    - `Password`: undatascience-password

- Luego de ingresar las credenciales del paso anterior, puede probar la conexión utilizando el botón: `Test Connection` y luego `Finalizar` para guardar la conexión.
- Cuando realice la conexión por primera vez, podrá visualizar la siguiente imagen en la que se le solicita descargar e instalar algunos controladores necesarios para poder realizar la conexión a `PostgreSQL`

```{figure} ./images/requirements_dbeaver.png
---
name: requirements_dbeaver_fig
align: center
scale: 35
---
Solicitud para instalar controladores necesarios para la conexión a `PostgreSQL`.
```

```{figure} ./images/database_connection_test.png
---
name: database_connection_test_fig
align: center
scale: 35
---
Test de conexión a base de datos `Docker` desde `DBeaver`.
```

```{figure} ./images/database_saved_dbeaver.png
---
name: database_saved_dbeaver_fig
align: center
scale: 35
---
Base de datos guardarda en `DBeaver` disponible para ser gestionada.
```

- Podemos realizar una consulta de test, desde `DBeaver`. Por ejemplo, si seguimos la ruta: `Databases -> undatascience-db -> Schemas -> public -> Tables`, podemos realizar una consulta asociada con la creación de una tabla. Para esto, parados en `Tables` hacemos click en la parte superior sobre `SQL`. Se va a generar un script de `SQL` el cual podemos usar para realizar consultas.

- En este caso usamos la siguiente consulta: 

````shell
CREATE TABLE USERS (ID SERIAL)
````

- El script creará la tabla `users` con un `id` nombrado serial. `CREATE TABLE` es utilizado para crear una nueva tabla en la base de datos. `ID` (`identity column`) es una columna numérica en la tabla que se rellena automáticamente con un valor entero cada vez que se inserta una fila. 

- En la siguiente sección estudiaremos las consultas en mas detalle. Además usaremos la `API` de `Python` para realizar dichas consultas desde un `notebook`.

```{figure} ./images/table_users_created.png
---
name: table_users_created_fig
align: center
scale: 35
---
Creación de la tabla `users` desde el script `SQL` en `DBeaver`.
```

- Dado que la tabla ya fue creada. Podemos interactuar con esta desde la consola de `PostgreSQL` dentro de nuestro contenedor. Para visualizar las tablas creadas desde la consola de `PostgreSQL`, usamos por ejemplo el comando `\d`. Si el contenedor está apagado lo podemos iniciar usando antes `docker start undatascience-name`

```shell
docker exec -it undatascience-name bash
```

```shell
psql -U undatascience-user --db undatascience-db --password
```

```{figure} ./images/queriesto_dbcreated.png
---
name: queriesto_dbcreated_fig
align: center
scale: 35
---
Consultas a la base de datos creada. Test para verificar creación de la tabla `users`.
```

- Podemos `agregar una fila a la tabla creada` para verificar otra consulta. En este caso usamos:

```shell
INSERT INTO users VALUES (1);
```

```shell
SELECT * FROM users;
```

```{figure} ./images/rowaddedto_userstable.png
---
name: rowaddedto_userstable_fig
align: center
scale: 35
---
Fila agregada a la tabla `users` en la base de datos `undatascience-db`.
```

- Podemos visualizar desde `DBeaver` la nueva fila agregada a la tabla `lectura_database_tableusers` creada en el contenedor.

```{figure} ./images/lectura_database_tableusers.png
---
name: lectura_database_tableusers_fig
align: center
scale: 35
---
Lectura de datos agregados a la tabla `users` desde `DBeaver`.
```

- Los `contenedores` creados recuerde que `pueden ser eliminados cuantas veces usted lo desee`, para construir nuevos proyectos. Para eliminarlos primero deben detenerse. Para esto usamos los siguientes comandos

```shell
docker stop undatascience-name
```

```shell
docker rm undatascience-name
```

- También puede `eliminar la imagen creada cuando instaló PostgreSQL` en el contenedor, usando la siguiente orden

```shell
docker images
docker rmi postgres
```

- Por otro lado, es posible `exportar e importar imágenes docker` con el objetivo de ser compartida con otros usuarios. Lo único que necesita el usuario que recibe la imagen es, tener instalado `Docker` en su computadora.

- Veamos un ejemplo. Primero usando `docker ps` verificamos que nuestro contenedor objetivo ha sido iniciado. En caso contrario, puede iniciarlo usando `docker start`. Luego de ser iniciado pasamos a `exportar la imagen` usando la siguiente orden, en este caso vamos a exportar el contenedor recién creado `undatascience-name` con `ID igual a 075cf2a22e48`

````shell
docker container export 075cf2a22e48 -o undatascience-docker.tar
````
````
ls
````

- Nótese que `075cf2a22e48` corresponde al `ID` correspondiente al contenedor. Luego de ser exportado el archivo `.tar` que contiene la imagen, dentro de la carpeta donde fue creado podemos importar la imagen docker usando la siguiente orden:

````shell
docker image import undatascience-docker.tar undatascience-docker
````
````
docker images
````

````{figure} ./images/dockerimage_imported.png
---
name: dockerimage_imported_fig
align: center
scale: 35
---
Imagen `docker` importada usando la orden `docker image import`. 
````

- Podemos seguir el procedimiento realizado previamente y `ejecutar de forma interactiva el contenedor importado` usando la siguiente orden

````shell
docker run --name=undatascience-docker undatascience-docker bash
````

- Además de `Docker`, si no deseamos pagar un servidor tipo `AWS, Google, IBM,...`  para `desplegar nuestra base de datos`, podemos usar servidores gratuitos para esta tarea. Una de las opciones gratuitas mas usadas en la actualidad es `Railway` el cual revisaremos a continuación.

## Despliegue de Base de Datos en Railway

- `Railway` es una plataforma de despliegue donde puedes `proveer infraestructura, desarrollar con esa infraestructura localmente, y luego desplegar en la nube`.
- Primero que todo debe crear una cuenta en `Railway` y realizar verificación de identidad usando su cuenta de `GitHub`. De esta forma obtendrá un `plan inicial de 500 hrs` equivalente a `5 USD`.

```{figure} ./images/signup_railway.png
---
name: signup_railway_fig
align: center
scale: 35
---
Pagina inicial de `Railway`. Crear una cuenta haciendo click en `Login`
```

```{figure} ./images/signup_githubrailway.png
---
name: signup_githubrailway_fig
align: center
scale: 35
---
Autenticación de cuenta de `Railway` usando cuenta de `GitHub`.
```

- Una vez haya autenticado su cuenta de `Railway` podrá visualizar el siguiente mensaje de confirmación de activación de cuenta. En este se resumen los limites del `Trial Plan`.

```{figure} ./images/verfied_railway.png
---
name: verfied_railway_fig
align: center
scale: 45
---
Creación y verificación de cuenta de `Railway`. Autenticación por medio de cuenta de `GitHub`. 
```

- Para crear una cuenta en `GitHub` puede usar el siguiente link (ver [GitHub](https://github.com/)). Luego de haber creado y activado la cuenta, hacemos click en la opción `New Project` del `Dashboard` de `Railway`. Para esto hacer click en `Provision PostgreSQL`. Al final podrá observar la base de datos creada.

- Una vez creada la cuenta, accedemos a el `Dashboard` de `Railway` y creamos un nuevo proyecto haciendo click en `New Project`. Luego, creamos el servidor para `PostgreSQL` en `Railway`, tal como se muestra en las imágenes siguientes:

```{figure} ./images/newproject_railway.png
---
name: newproject_railway_fig
align: center
scale: 90
---
Creación de nuevo proyecto `Railway` desde el `Dashboard`.
```

```{figure} ./images/provision_postgresql.png
---
name: provision_postgresql_fig
align: center
scale: 80
---
Creación de base de datos `PostgreSQL` en `Railway`.
```

- Nótese que si hacemos click sobre la base de datos creada, podemos visualizar todas las opciones ofrecidas por `Railway`. Si hacemos click en `Connect`, podemos acceder a las credencial necesarias para conectarnos a la base de datos.

```{figure} ./images/credentials_railwaypostgres.png
---
name: credentials_railwaypostgres_fig
align: center
scale: 80
---
Credenciales de conexión a la base de datos de `PostgreSQL` en `Railway`.
```

- Si usamos las credenciales de la bases de datos creada en `Railway` podemos conectarnos a la base de datos como se muestra en la siguiente imagen, desde `DBeaver` (ver  {numref}`requirements_dbeaver_fig`).

```{figure} ./images/database_railwayconn.png
---
name: database_railwayconn_fig
align: center
scale: 35
---
Conexión a base de datos creada en `Railway`.
```

- Procederemos ahora a realizar algunas `consultas básicas a la base de datos` creada. En este caso utilizaremos la consola para consultas `SQL` de `pgAdmin`.

```{figure} ./images/sqlqueries_railwaydb.png
---
name: sqlqueries_railwaydb_fig
align: center
scale: 35
---
Consultas `SQL` pueden realizarse desde el `Dashboard` de `Railway` directamente.
```

# Introducción a consultas `SQL`

## Restauración de bases de datos `dvdrental`

- En esta sección, se proporcionará una base de datos de ejemplo de `PostgreSQL` que servirá como herramienta de aprendizaje y práctica. La base de datos utilizada es la de un `negocio de alquiler de DVD`, diseñada para demostrar las características de `PostgreSQL`. Esta base de datos contiene numerosos objetos relacionados con los procesos de negocio de la tienda de alquiler de DVD

    - 15 tables
    - 1 trigger
    - 7 views
    - 8 functions
    - 1 domain
    - 13 sequences

- Hay 15 tablas en la base de datos de alquiler de DVD:

    - `actor` - almacena los datos de los actores, incluyendo nombre y apellidos.
    - `film` - almacena datos de la película como título, año de lanzamiento, duración, clasificación, etc.
    - `film_actor` - almacena las relaciones entre películas y actores.
    - `category` - almacena los datos de las categorías de las películas.
    - `film_category` - almacena las relaciones entre películas y categorías.
    - `store` - contiene los datos de la tienda, incluido el personal de gestión y la dirección.
    - `inventory` - almacena los datos de inventario.
    - `rental` - almacena los datos de alquiler.
    - `payment` - almacena los pagos de los clientes.
    - `staff` - almacena los datos del personal.
    - `customer` - almacena los datos del cliente.
    - `address` - almacena la dirección del personal y de los clientes.
    - `city` - almacena los nombres de las ciudades.
    - `country` - almacena los nombres de los países.

- Puede descargar la base de datos ejemplo `PostgreSQL DVD Rental` a través del siguiente enlace (ver [dvdrental.tar](https://github.com/lihkir/Data/blob/main/dvdrental.tar)). Para importar esta base de datos en un servidor de `PostgreSQL` podemos utilizar el gestor de bases de datos `pgAdmin`, el cual es ampliamente usado para este tipo de tareas. Para esto, primero lo instalamos siguiendo el siguiente link (ver [pgAdmin](https://www.pgadmin.org/download/)). Una vez instalado lo iniciamos y agregamos el servidor de `Railway`.

```{figure} ./images/addnew_serverrailway.png
---
name: addnew_serverrailway_fig
align: center
scale: 35
---
Nuevo proyecto creado para el servidor `Railway`.
```

- Para crear un nuevo servidor agregamos cada una de las credenciales generadas en nuestro proyecto `PostgreSQL` de `Railway`, tal como se muestra en la siguientes figuras. Al finalizar, hacemos click en `Save` para poder visualizar el nuevo servidor creado

```{figure} ./images/nameof_serverrailway.png
---
name: nameof_serverrailway_fig
align: center
scale: 35
---
Asignamos el nombre de la base de datos creada en `Railway`
```

```{figure} ./images/connection_railwaydb.png
---
name: connection_railwaydb_fig
align: center
scale: 35
---
Credenciales para conexión a la base de datos en `Railway`.
```

```{figure} ./images/pgadmindash_connrailway.png
---
name: pgadmindash_connrailway_fig
align: center
scale: 35
---
Dashboard de `pgAdmin` con información de conexión al servidor `Railway`.
```

- Podemos realizar una primera consulta `SQL` para verificar nuestra conexión a la base de datos creada en el server `PostgreSQL`. Para esto usamos la consulta

```shell
SELECT version();
```

```{figure} ./images/firstquery_frompgadmin.png
---
name: firstquery_frompgadmin_fig
align: center
scale: 35
---
Primera consulta a la base de datos creada en `Railway`.
```

- Procedemos ahora a cargar la base de datos `DVD Rental` en nuestro servidor `Railway` por medio del gestor `pgAdmin`. Para esto, haga clic derecho en `Databases` luego en `Create/Database`.

```{figure} ./images/database_creationpgadmin.png
---
name: database_creationpgadmin_fig
align: center
scale: 35
---
Creación de base de datos para importar `DVD Rental`.
```

- Luego agregamos el nombre de la base de datos, en este caso `dvdrental`. Puede hacer click derecho sobre el nombre de la base de datos y luego seleccionar `Refresh` para actualizar cambios en la base de datos.

```{figure} ./images/adding_dvdrentalname.png
---
name: adding_dvdrentalname_fig
align: center
scale: 35
---
Agregar nombre de la base de datos a importar en `Railway`.
```

- Procedemos ahora a importa la base de datos de interés, descargada previamente (ver [dvdrental.tar](https://github.com/lihkir/Data/blob/main/dvdrental.tar)). Para esto hacemos click derecho sobre la base de datos creada `dvdrental` y luego seleccionamos la opción `Restore` para cargar el archivo `.tar`.

```{figure} ./images/restoredb_inrailway.png
---
name: restoredb_inrailway_fig
align: center
scale: 35
---
Selección de opción de restauración de base de datos `dvdrental`.
```

- Luego de esto, procedemos a cargar la dirección de ubicación para nuestro archivo `dvdvrental.tar` dentro de la opción `Filename`. Posteriormente hacemos click en `Restore`. Cuando se encuentre buscando el archivo debe seleccionar la opción `All files` para que pueda visualizar el archivo `dvdvrental.tar`.

```{figure} ./images/loadingdb_locationforpgadmin.png
---
name: loadingdb_locationforpgadmin_fig
align: center
scale: 35
---
Cargue de base de datos desde archivo `dvdrental.tar`.
```

```{figure} ./images/processcomplet_restoredb.png
---
name: processcomplet_restoredb_fig
align: center
scale: 45
---
Mensaje de carga exitosa de la base de datos `dvdrental.tar`.
```

- Podrá visualizar la base de datos creada en `Schemes/public/Tables`. Nótese que la base de datos creada cuenta con 15 tablas, cada una de estas con las especificaciones mencionadas al inicio de la presente sección.

```{figure} ./images/databasesaved_inschemes.png
---
name: databasesaved_inschemes_fig
align: center
scale: 45
---
15 Tablas han sido cargadas en la sección `Tables` en `Schemes`.
```

- Procederemos ahora a estudiar algunas consultas básicas que podemos realizar a nuestras bases de datos de prueba. En este caso iniciaremos con `SELECT`. Usaremos inicialmente la consola de consultas ofrecida por `pgAdmin`.

## Consultas SQL

### SELECT

- Cuando se trabaja con bases de datos, una tarea común es consultar datos de las tablas utilizando la sentencia `SELECT`. Esta sentencia es compleja y tiene muchas cláusulas que permiten formar consultas flexibles. Dividiremos su uso en varias partes más cortas y fáciles de entender

- `SELECT` incluye las siguientes cláusulas:

    - Utilizar el operador `DISTINCT` para seleccionar filas distintas.
    - Ordenar filas utilizando la cláusula `ORDER BY`.
    - Filtrar filas mediante la cláusula `WHERE`.
    - Seleccionar un subconjunto de filas de una tabla utilizando la cláusula `LIMIT` o `FETCH`.
    - Agrupar filas en grupos mediante la cláusula `GROUP BY`.
    - Filtrar grupos mediante la cláusula `HAVING`.
    - Unir tablas mediante las cláusulas `INNER JOIN, LEFT JOIN, FULL OUTER JOIN` y `CROSS JOIN`.
    - Realizar operaciones de conjunto utilizando `UNION, INTERSECT` y `EXCEPT`.

- En esta sección, nos centraremos en las cláusulas `SELECT` y `FROM`.

**`Sintaxis de la sentencia SELECT de PostgreSQL`**

- Empecemos con la forma básica de la sentencia `SELECT` que recupera datos de una única tabla. A continuación se ilustra la sintaxis de la sentencia `SELECT`:

```shell
SELECT
   select_list
FROM
   table_name;
```

- En primer lugar, especifique una `lista de selección que puede ser una columna o una lista de columnas de una tabla de la que desee recuperar datos`. Si especifica una lista de columnas, debe colocar una coma `(,)` entre dos columnas para separarlas. Si desea `seleccionar datos de todas las columnas de la tabla`, puede utilizar la abreviatura asterisco `(*)` en lugar de especificar todos los nombres de las columnas. La lista de selección también puede contener expresiones o valores literales. 

- En segundo lugar, especifique el nombre de la tabla desde la que desea consultar los datos después de la palabra clave `FROM`. La cláusula `FROM` es opcional. Si no consulta datos de ninguna tabla, puede omitir la cláusula `FROM` en la sentencia `SELECT`. `PostgreSQL` evalúa la cláusula `FROM` antes de la cláusula `SELECT` en la sentencia `SELECT`.

- Tenga en cuenta que las palabras clave `SQL` no distinguen entre mayúsculas y minúsculas. Esto significa que `SELECT` es equivalente a `select` o `Select`. `Por convención, utilizaremos todas las palabras clave SQL en mayúsculas para facilitar la lectura de las consultas`.

**`Ejemplos de SELECT PostgreSQL`**

- Veamos algunos ejemplos del uso de la sentencia `SELECT` de `PostgreSQL`. Vamos a utilizar la tabla `customer` en la base de datos de ejemplo para la demostración.

```{figure} ./images/customer_table.png
---
name: customer_table_fig
align: center
scale: 80
---
Estructura de la tabla `customer`.
```

- Podemos utilizar la sentencia `SELECT` para encontrar `first_name` dentro de todos los clientes de la tabla `customer`. Para esto utilizaremos la siguiente orden, la cual podemos ejecutar desde la consola de `PostgreSQL`. Observe que hemos añadido un punto y coma `(;)` al final de la sentencia `SELECT`. El punto y coma no es parte de la sentencia `SQL`. Se utiliza para indicar a `PostgreSQL` el final de una sentencia `SQL`. El punto y coma también se utiliza para separar dos sentencias `SQL`.

```shell
SELECT first_name FROM customer;
```

```{figure} ./images/selectfirstname_query.png
---
name: selectfirstname_query_fig
align: center
scale: 35
---
Consulta desde la consola de `pgAdmin` para el ejemplo: `SELECT first_name FROM customer;`.
```

**`Uso de sentencia SELECT de PostgreSQL para consultar datos de múltiples columnas`**

- Supongamos que sólo desea conocer el nombre, apellido y correo electrónico de los clientes `(first_name, last_name, email)`, puede especificar estos nombres de columna en la cláusula `SELECT` como se muestra en la siguiente consulta:

```shell
SELECT
   first_name,
   last_name,
   email
FROM
   customer;
```

```{figure} ./images/firstlastnameemail_query.png
---
name: firstlastnameemail_query_fig
align: center
scale: 45
---
Consulta desde la consola de `pgAdmin` para el ejemplo: `SELECT first_name, last_name, email FROM customer;`.
````

**` Uso de la sentencia SELECT de PostgreSQL para consultar datos de todas las columnas de una tabla`**

- La siguiente consulta utiliza la sentencia `SELECT` para seleccionar datos de todas las columnas de la tabla `customer`. En este ejemplo, utilizamos asterisco `(*)` en la cláusula `SELECT`, que es una abreviatura de todas las columnas. 

```shell
SELECT * FROM customer;
```

```{figure} ./images/allcolumnsquery_pgadmin.png
---
name: allcolumnsquery_pgadmin_fig
scale: 45
align: center
---
Consulta desde la consola de `pgAdmin` para el ejemplo: `SELECT * FROM customer;`.
```

**`Uso de la sentencia SELECT de PostgreSQL con expresiones`**

- El siguiente ejemplo utiliza la sentencia `SELECT` para `devolver los nombres completos y correos electrónicos de todos los clientes`. Utilizamos el `operador de concatenación ||` para concatenar: nombre, espacio y apellido de cada cliente.

```shell
SELECT 
   first_name || ' ' || last_name,
   email
FROM 
   customer;
```

```{figure} ./images/columnconcatenation_pgadmin.png
---
name: columnconcatenation_pgadmin_fig
align: center
scale: 35
---
Consulta desde la consola de `pgAdmin` para el ejemplo de concatenación de nombre y apellido.
```

**`Uso de la sentencia SELECT de PostgreSQL con expresiones`**

- El siguiente ejemplo utiliza la sentencia `SELECT` con una expresión. Omite la cláusula `FROM`

```shell
SELECT 5 * 3;
```

```{figure} ./images/selectexpressions_pgadmin.png
---
name: selectexpressions_pgadmin_fig
align: center
scale: 45
---
Consulta desde la consola de `pgAdmin` para el ejemplo: `SELECT 5 * 3;`.
```

### Alias

- Un alias de columna `permite asignar un nombre temporal a una columna` o a una expresión de la lista de selección de una sentencia `SELECT`. Si desea cambiar el nombre de forma permanente debe usar `RENAME COLUMN`. El alias de columna existe temporalmente durante la ejecución de la consulta. 

```shell
SELECT column_name AS alias_name
FROM table_name;
```

- En esta sintaxis, a `column_name` se le asigna un alias `alias_name`. La palabra clave `AS` es opcional, por lo que puede omitirla. Veamos algunos ejemplos utilizando la tabla `customer` de la base de datos de ejemplo. Recordemos que La siguiente consulta devuelve los nombres y apellidos de todos los clientes de la tabla `customer`

```shell
SELECT 
   first_name, 
   last_name
FROM customer;
```

- Si deseamos renombrar el encabezado `last_name`, podemos asignarle un nuevo nombre utilizando un alias de columna usando las siguientes dos opciones

```shell
SELECT 
   first_name, 
   last_name AS surname
FROM customer;
```

```shell
SELECT 
   first_name, 
   last_name AS surname
FROM customer;
```

```{figure} ./images/aliassurname_pgadmin.png
---
name: aliassurname_pgadmin_fig
align: center
scale: 45
---
Consulta desde la consola de `pgAdmin` para asignar alias en columnas de `dvdrental`.
```


**`Asignación de un alias de columna a una expresión`**

- La siguiente consulta devuelve los nombres completos de todos los clientes. Construye el nombre completo concatenando: nombre, espacio y apellido (`first_name, ' ', last_name`). Si un alias de columna contiene uno o más espacios, debe ser encerrado entre comillas dobles, como se indica en el ejemplo a continuación. Nótese que la palabra clave `AS` es opcional, por lo que puede ser omitida.

```shell
SELECT
    first_name || ' ' || last_name "full name"
FROM
    customer;
```

```{figure} ./images/columnalias_toexpression.png
---
name: columnalias_toexpression_fig
align: center
scale: 45
---
Asignación de alias a una expresión compuesta de `first_name, ' ', last_name`.
```

### ORDER BY

- Cuando se consultan datos de una tabla, la sentencia `SELECT` devuelve filas en un orden no especificado. Para ordenar las filas del conjunto de resultados, se utiliza la cláusula `ORDER BY` en la sentencia `SELECT`.

- La cláusula `ORDER BY` permite ordenar las filas devueltas por una cláusula `SELECT` en orden ascendente o descendente en función de una expresión de ordenación. A continuación se ilustra la sintaxis de la cláusula `ORDER BY`

```shell
SELECT
	select_list
FROM
	table_name
ORDER BY
	sort_expression1 [ASC | DESC],
        ...
	sort_expressionN [ASC | DESC];
```

**`Cláusula ORDER BY de PostgreSQL para ordenar filas por una columna`**

- La siguiente consulta utiliza la cláusula `ORDER BY` para ordenar los clientes por su primer nombre en orden ascendente

```shell
SELECT
	first_name,
	last_name
FROM
	customer
ORDER BY
	first_name ASC;
```

- Dado que la opción `ASC` es la predeterminada, puede omitirla en la cláusula `ORDER BY` de la siguiente manera

```shell
SELECT
	first_name,
	last_name
FROM
	customer
ORDER BY
	first_name;
```

```{figure} ./images/firstname_ascorder.png
---
name: firstname_ascorder_fig
align: center
scale: 45
---
Consulta `SQL` para orden ascendente basada en el primer nombre de los clientes.
```

**`Cláusula ORDER BY de PostgreSQL para ordenar filas por varias columnas`**

- La siguiente sentencia selecciona primer nombre y el apellido de la tabla de clientes y ordena las filas por primer nombre en orden ascendente y el apellido en orden descendente

```shell
SELECT
	first_name,
	last_name
FROM
	customer
ORDER BY
	first_name ASC,
	last_name DESC;
```

- En este ejemplo, la cláusula `ORDER BY` ordena primero las filas por los valores de la columna `first_name` y después ordena las filas ordenadas por los valores de la columna `last_name`.

```{figure} ./images/orderbytowcolumns_pgadmin.png
---
name: orderbytowcolumns_pgadmin_fig
align: center
scale: 45
---
Consulta `SQL` para ordenar dos columnas primero a ascendente seguida de la descendente.
```

**`Cláusula ORDER BY de PostgreSQL para ordenar filas por expresiones`**

- La función `LENGTH()` acepta una cadena y devuelve su longitud. La siguiente sentencia selecciona los nombres y sus longitudes. Ordena las filas por la longitud de los nombres

```shell
SELECT 
	first_name,
	LENGTH(first_name) len
FROM
	customer
ORDER BY 
	len DESC;
```

```{figure} ./images/rowsorderby_expresionpgadmin.png
---
name: rowsorderby_expresionpgadmin_fig
align: center
scale: 45
---
Filas ordenadas por columna  y expresión.
```

- Como la cláusula `ORDER BY` se evalúa después de la cláusula `SELECT`, el alias `len` de la columna está disponible y se puede utilizar en la cláusula `ORDER BY`

**`Cláusula ORDER BY de PostgreSQL y NULL`**

- En algunas bases de datos existen datos faltantes `NULL` los cuales debe ser tratados con técnicas estadísticas adecuadas. Usualmente este tipo de datos son desconocidos en el momento del registro.

- Cuando se trata de ordenar filas que contienen valores `NULL`, existe la posibilidad de establecer el orden de los `NULL` en relación con los valores no nulos utilizando las opciones `NULLS FIRST` o `NULLS LAST` en la cláusula `ORDER BY`.

```shell
ORDER BY sort_expresssion [ASC | DESC] [NULLS FIRST | NULLS LAST]
```
- La opción `NULLS FIRST` coloca `NULL` antes de otros valores no nulos y la opción `NULL LAST` coloca `NULL` después de otros valores no nulos. Vamos a crear una tabla para la demostración.

```shell
CREATE TABLE sort_demo(
	num INT
);

INSERT INTO sort_demo(num)
VALUES(1),(2),(3),(null);
```

```{figure} ./images/createtable_orderbypgadmin.png
---
name: createtable_orderbypgadmin_fig
align: center
scale: 35
---
Creación de tabla en la base de datos `dvdrental` en `Railway`.
```

- La siguiente consulta devuelve datos de la tabla `sort_demo`

```shell
SELECT num
FROM sort_demo
ORDER BY num;
```

```{figure} ./images/orderby_newcolumnint.png
---
name: orderby_newcolumnint_fig
align: center
scale: 45
---
Orden ascendente de filas en `sort_demo` por medio de la columna `num`.
```

- La cláusula `ORDER BY` ordena los valores de la columna `num` de la tabla `sort_demo` en orden ascendente. Coloca `NULL` después de otros valores. Por lo tanto, si utiliza la opción `ASC`, la cláusula `ORDER BY` utiliza por defecto la opción `NULLS LAST`. Por lo tanto, la siguiente consulta devuelve el mismo resultado

```shell
SELECT num
FROM sort_demo
ORDER BY num NULLS LAST;
```

- Para anteponer `NULL` a otros valores no nulos, se utiliza la opción `NULLS FIRST`

```shell
SELECT num
FROM sort_demo
ORDER BY num NULLS FIRST;
```

- La siguiente sentencia ordena los valores de la columna `num` de la tabla `sort_demo` en orden descendente

```shell
SELECT num
FROM sort_demo
ORDER BY num DESC;
```

- La cláusula `ORDER BY` con la opción `DESC` utiliza los `NULLS FIRST` por defecto. Para invertir el orden, puede utilizar la opción `NULLS LAST`

```shell
SELECT num
FROM sort_demo
ORDER BY num DESC NULLS LAST;
```

```{figure} ./images/orderby_nulllast_numcolumn.png
---
name: orderby_nulllast_numcolumn_fig
align: center
scale: 45
---
Opción `DESC` para ordenar filas en `sort_demo` en forma descendente, con `NULL` al final, usando la opción `NULL LAST`.
```

### SELECT DISTINCT

- La cláusula `DISTINCT` se emplea en la sentencia `SELECT` para `eliminar filas repetidas de un conjunto de resultados`. Al utilizar esta cláusula, se conserva una única fila para cada grupo de duplicados. Es posible aplicarla a una o varias columnas de la lista de selección en la sentencia `SELECT`. La sintaxis es la siguiente

````shell
SELECT
   DISTINCT column1
FROM
   table_name;
````

- En esta sentencia, se verifica si existen duplicados al evaluar los valores de la columna `"column1"`. Si se especifican `múltiples columnas`, la cláusula `DISTINCT` determinará si hay duplicados al considerar la combinación de valores de esas columnas. En resumen, la cláusula `DISTINCT` evalúa duplicados utilizando los valores de una o más columnas específicas.

````shell
SELECT
   DISTINCT column1, column2
FROM
   table_name;
````

- En esta situación, se utilizará la combinación de valores en las columnas `"columna1"` y `"columna2"` para determinar si hay duplicados. Además, `PostgreSQL` ofrece la cláusula `DISTINCT ON (expresión)` para conservar únicamente la "primera" fila de cada grupo de duplicados, siguiendo la siguiente sintaxis:

````shell
SELECT
   DISTINCT ON (column1) column_alias,
   column2
FROM
   table_name
ORDER BY
   column1,
   column2;
````

**`PostgreSQL SELECT DISTINCT`**

- Para practicar el uso de la cláusula `DISTINCT`, crearemos una tabla llamada `distinct_demo` y realizaremos inserciones de datos en ella. Para crear la tabla `distinct_demo` con tres columnas `id, bcolor` y `fcolor`, utilice la siguiente sentencia `CREATE TABLE`

````shell
CREATE TABLE distinct_demo (
	id serial NOT NULL PRIMARY KEY,
	bcolor VARCHAR,
	fcolor VARCHAR
);
````

- A continuación, utilice la sentencia `INSERT` para agregar algunas filas a la tabla `distinct_demo`

````shell
INSERT INTO distinct_demo (bcolor, fcolor)
VALUES
	('red', 'red'),
	('red', 'red'),
	('red', NULL),
	(NULL, 'red'),
	('red', 'green'),
	('red', 'blue'),
	('green', 'red'),
	('green', 'blue'),
	('green', 'green'),
	('blue', 'red'),
	('blue', 'green'),
	('blue', 'blue');
````

```{figure} ./images/distinctdemo_pgadmin.png
---
name: distinctdemo_pgadmin_fig
align: center
scale: 45
---
Tabla `distinct_demo` creada en `Railway` mediante `CREATE TABLE` e `INSERT INTO`.
```

- Posteriormente, recupera los datos de la tabla `distinct_demo` utilizando la sentencia `SELECT`.

````shell
SELECT
	id,
	bcolor,
	fcolor
FROM
	distinct_demo ;
````

**`PostgreSQL DISTINCT para una columna`**

- La siguiente sentencia selecciona valores únicos en la columna `bcolor` de la tabla `t1` y los ordena de forma alfabética utilizando la cláusula `ORDER BY`.

````shell
SELECT
	DISTINCT bcolor
FROM
	distinct_demo
ORDER BY
	bcolor;
````

```{figure} ./images/distinctbcolor_pgadmin.png
---
name: distinctbcolor_pgadmin_fig
align: center
scale: 45
---
Selección de valores únicos en la columna `bcolor` ordenados alfabéticamente.
```

**`PostgreSQL DISTINCT múltiples columnas`**

- La siguiente sentencia ejemplifica el uso de la cláusula DISTINCT en múltiples columnas.

````shell
SELECT
	DISTINCT bcolor,
	fcolor
FROM
	distinct_demo
ORDER BY
	bcolor,
	fcolor;
````

```{figure} ./images/distinctmultiplecolumn_pgadmin.png
---
name: distinctmultiplecolumn_pgadmin_fig
align: center
scale: 45
---
Selección de valores únicos con base en las columnas: `bcolor` y `fcolor`.
```

- Al incluir las columnas `bcolor` y `fcolor` en la cláusula `SELECT DISTINCT`, `PostgreSQL` combinó los valores de ambas columnas para determinar la unicidad de las filas.

### WHERE

- En esta sección estudiaremos como usar la consulta `WHERE`. La sentencia `SELECT` recupera datos de una tabla, devolviendo filas y columnas. Si deseas filtrar los resultados según una condición, puedes utilizar la cláusula `WHERE`. La forma en que se escribe la cláusula WHERE en PostgreSQL es la siguiente:

````shell
SELECT select_list
FROM table_name
WHERE condition
ORDER BY sort_expression
````

- La cláusula `WHERE` se utiliza después de la cláusula `FROM` en una sentencia `SELECT`. Su función es `filtrar las filas devueltas por la consulta en base a una condición`. La condición puede ser una `expresión booleana o una combinación de ellas` usando los operadores `AND` y `OR`. Solo las filas que cumplan con la condición se incluirán en el resultado de la consulta. Para otros operadores de comparación (ver [Funciones y operadores de comparación](https://www.postgresql.org/docs/current/functions-comparison.html))

**`Uso de la cláusula WHERE con el operador igual (=)`**

- Vamos a practicar con ejemplos de cómo utilizar la cláusula `WHERE`. Usaremos la tabla de `customer` de la base de datos de ejemplo para la demostración. La siguiente sentencia muestra cómo utilizar la cláusula `WHERE` para seleccionar clientes cuyos nombres son `Jamie`:

````shell
SELECT
	last_name,
	first_name
FROM
	customer
WHERE
	first_name = 'Jamie';
````

```{figure} ./images/wherefirstname_pgadmin.png
---
name: wherefirstname_pgadmin_fig
align: center
scale: 45
---
Uso del condicional `WHERE` para filtrar columna por operador `(=)`.
```

**`Uso de la cláusula WHERE con el operador AND`**

- En el siguiente ejemplo, se busca clientes que tengan tanto el nombre como los apellidos igual a `Jamie` y `Rice`, respectivamente. Esto se logra utilizando el operador lógico `AND` para combinar las dos expresiones booleanas.

````shell
SELECT
	last_name,
	first_name
FROM
	customer
WHERE
	first_name = 'Jamie' AND 
        last_name = 'Rice';
````

```{figure} ./images/raicejamiewhere_pgadmin.png
---
name: raicejamiewhere_pgadmin_fig
align: center
scale: 45
---
Uso de cláusula `WHERE` con el operador `AND`.
```

**`Uso de la cláusula WHERE con el operador OR`**

- En este ejemplo, se buscan clientes que tengan como apellido `Rodríguez` o como nombre `Adán`. Esto se logra utilizando el operador `OR` para combinar las dos condiciones.

````shell
SELECT
	first_name,
	last_name
FROM
	customer
WHERE
	last_name = 'Rodriguez' OR 
	first_name = 'Adam';
````

```{figure} ./images/firstlastnameor_pgadmin.png
---
name: firstlastnameor_pgadmin_fig
align: center
scale: 45
---
Ejemplo de uso de `WHERE` con el operador `OR`.
```

**`Uso de la cláusula WHERE con el operador IN`**

- `Si deseas que una cadena coincida con cualquiera de las cadenas de una lista`, puedes utilizar el operador `IN`. Por ejemplo, la siguiente sentencia selecciona clientes cuyo primer nombre puede ser `Ann, Anne o Annie`.


````shell
SELECT
	first_name,
	last_name
FROM
	customer
WHERE 
	first_name IN ('Ann','Anne','Annie');
````

```{figure} ./images/firstnameininterval_pgadmin.png
---
name: firstnameininterval_pgadmin_fig
align: center
scale: 45
---
Ejemplo de uso de cláusula `WHERE` con operador `IN`.
```

**`Uso de la cláusula WHERE con el operador LIKE`**

- Para buscar una cadena que cumpla con un patrón específico, se utiliza el operador `LIKE`. En el siguiente ejemplo, se muestran todos los clientes cuyo nombre comienza con la cadena `Ann`.

````shell
SELECT
	first_name,
	last_name
FROM
	customer
WHERE 
	first_name LIKE 'Ann%'
````

```{figure} ./images/firstnamelike_pgadmin.png
---
name: firstnamelike_pgadmin_fig
align: center
scale: 45
---
Ejemplo de cláusula `WHERE` con el operador `LIKE`.
```


**`Uso de la cláusula WHERE con el operador BETWEEN`**

- En el siguiente ejemplo, se buscan clientes cuyo `nombre comienza con la letra A y tiene entre 3 y 5 caracteres de longitud`. Esto se logra utilizando el operador `BETWEEN`. El operador `BETWEEN` devuelve verdadero si un valor se encuentra dentro de un rango de valores específico.

````shell
SELECT
	first_name,
	LENGTH(first_name) name_length
FROM
	customer
WHERE 
	first_name LIKE 'A%' AND
	LENGTH(first_name) BETWEEN 3 AND 5
ORDER BY
	name_length;
````

```{figure} ./images/whereandbetwen_pgadmin.png
---
name: whereandbetwen_pgadmin_fig
align: center
scale: 45
---
Ejemplo de uso de `WHERE` con el operador `BETWEEN`.
```

**`Uso de la cláusula WHERE con el operador no igual (<>)`**

- En este ejemplo, se buscan clientes cuyo nombre comienza con `Bra` y cuyos apellidos no son `Motley`. Tenga en cuenta que puede utilizar el operador `!=` y el operador `<>` indistintamente porque son equivalentes.

```shell
SELECT 
	first_name, 
	last_name
FROM 
	customer 
WHERE 
	first_name LIKE 'Bra%' AND 
	last_name <> 'Motley';
```

```{figure} ./images/likenotequal_pgadmin.png
---
name: likenotequal_pgadmin_fig
align: center
scale: 45
---
Ejemplo de uso de la sentencia `WHERE` con el operador `<>`.
```

- En la siguiente sección realizaremos consultas de este tipo desde `Python`, utilizando al `API` que ofrece `PostgreSQL` para esta tarea. Existen muchas mas consultas `SQL` que puede realizar, dependiendo de cual sea su objetivo. En este taller se abordaron algunas de las mas utilizadas, pero, puede encontrar mas de estas en [Queries PostgreSQL](https://www.postgresql.org/docs/current/queries.html).

# Python API for PostgreSQL

- `PostgreSQL` puede ser integrado con `Python` usando el módulo `psycopg2`. `psycopg2` es un adaptador de base de datos `PostgreSQL` para el lenguaje de programación `Python`. `psycopg2` fue escrito con el objetivo de ser muy `pequeño, rápido y estable`. No necesitas instalar este módulo por separado porque se entrega, por defecto, junto con la versión `2.5.x` de `Python` en adelante. Sin embargo, si no lo tienes instalado en tu máquina, puedes usar los siguientes comandos según tu preferencia de gestor de instalación de paquetes

```shell
pip install -U psycopg2
```

- Para aquellos que tienen instalado `Anaconda` en sus computadoras

```shell
conda install -c anaconda psycopg2
```

- Para utilizar el módulo `psycopg2`, primero debe `crear un objeto connection que represente la base de datos` y luego, opcionalmente, puede crear un objeto `cursor` que le ayudará a ejecutar todas las sentencias `SQL`.

**`APIs del módulo Python psycopg2`**

- Las siguientes son rutinas importantes del módulo `psycopg2`, que pueden satisfacer su necesidad de trabajar con la base de datos `PostgreSQL` desde su programa `Python`. Si usted está buscando una aplicación más sofisticada, entonces usted puede mirar en la documentación oficial del módulo `Python psycopg2`.

- Esta `API` abre una conexión a la base de datos `PostgreSQL`. Si la base de datos se abre con éxito, devuelve un objeto de conexión

```python
psycopg2.connect(database="testdb", user="postgres", password="cohondob", host="127.0.0.1", port="5432")
```

- Esta rutina `crea un cursor` que se utilizará durante toda la programación de la base de datos con `Python`

```python
connection.cursor()
```

- Esta rutina ejecuta una sentencia `SQL`. La sentencia `SQL` puede ser parametrizada (es decir, marcadores de posición en lugar de literales `SQL`). El módulo `psycopg2` soporta marcadores de posición utilizando el signo `%`. Por ejemplo: `cursor.execute("insert into people values (%s, %s)", (who, age))`

```python
cursor.execute(sql [, optional parameters])
```

- Esta rutina ejecuta un comando `SQL` contra todas las secuencias de parámetros o mapeos encontrados en la secuencia `SQL`

```python
cursor.executemany(sql, seq_of_parameters)
```

- Este es un atributo de solo lectura, el cual `devuelve el número total de filas de la base de datos` que han sido modificadas, insertadas o eliminadas por la última ejecución

```python
cursor.rowcount
```

- Este método `consigna la transacción actual`. Si no se llama a este método, cualquier cosa que se haya hecho desde la última llamada a `commit()` no es visible desde otras conexiones de la base de datos

```python
connection.commit()
```

- Este método `revierte cualquier cambio en la base de datos` desde la última llamada a `commit()`

```python
connection.rollback()
```

- Este método `cierra la conexión a la base de datos`. Tenga en cuenta que esto no llama automáticamente a `commit()`. `Si simplemente cierra la conexión a la base de datos sin llamar primero a `commit()`, ¡los cambios se perderán!`

```python
connection.close()
```

- Este método `obtiene la siguiente fila de un conjunto de resultados de consulta`, devolviendo una única secuencia, o `None` cuando no hay más datos disponibles

```python
cursor.fetchone()
```
`Ejemplo`

````python
# Usando while loop
cursor.execute("SELECT * FROM employees")
row = cursor.fetchone()
while row is not None:
  print(row)
  row = cursor.fetchone()

# Usando el cursor como iterator
cursor.execute("SELECT * FROM employees")
for row in cursor:
  print(row)
````

- Esta rutina `obtiene el siguiente conjunto de filas de un resultado de consulta`, devolviendo una lista. Se devuelve una lista vacía cuando no hay más filas disponibles. El método intenta obtener tantas filas como indique el parámetro de tamaño.

```python
cursor.fetchmany([size=cursor.arraysize])
```

- Esta rutina `recupera todas las filas (restantes) de un resultado de consulta`, devolviendo una lista. Se devuelve una lista vacía cuando no hay filas disponibles.

```python
cursor.fetchall()
```

```{figure} ./images/python_postgresql_api.png
---
name: python_postgresql_api_fig
align: center
scale: 90
---
Descripción del funcionamiento de la `API psycopg2`.
```

**`Conexión a la base de datos`**

- El siguiente código de `Python` muestra cómo conectarse a una base de datos existente. Para conectarse a la base de datos `PostgreSQL` y realizar consultas `SQL`, `debe conocer las credenciales de la base de datos a la que se desea conectar`. En éste caso la información de la base de datos creada la encontramos en **`Railway`**. Importamos primero las librerías necesarias para usar `psycopg2`

In [1]:
import psycopg2
from psycopg2 import Error

In [2]:
try:
    connection = psycopg2.connect(user="postgres",
                                  password="gK9I512myqydMdUy0Q2Z",
                                  host="containers-us-west-5.railway.app",
                                  port="6603",
                                  database="railway")

    cursor = connection.cursor()
    print("PostgreSQL server information")
    print(connection.get_dsn_parameters(), "\n")

    cursor.execute("SELECT version();")
    record = cursor.fetchone()
    print("You are connected to - ", record, "\n")

except (Exception, Error) as error:
    print("Error while connecting to PostgreSQL", error)
finally:
    if (connection):
        cursor.close()
        connection.close()
        print("PostgreSQL connection is closed")

PostgreSQL server information
{'user': 'postgres', 'channel_binding': 'prefer', 'dbname': 'railway', 'host': 'containers-us-west-5.railway.app', 'port': '6603', 'options': '', 'sslmode': 'prefer', 'sslcompression': '0', 'sslsni': '1', 'ssl_min_protocol_version': 'TLSv1.2', 'gssencmode': 'disable', 'krbsrvname': 'postgres', 'target_session_attrs': 'any'} 

You are connected to -  ('PostgreSQL 13.2 on x86_64-pc-linux-musl, compiled by gcc (Alpine 10.2.1_pre1) 10.2.1 20201203, 64-bit',) 

PostgreSQL connection is closed


**`Crear una tabla`**

- El siguiente programa de Python se utilizará para `crear una tabla en la base de datos` previamente creada

In [3]:
import psycopg2

connection = psycopg2.connect(user="postgres",
                                  password="gK9I512myqydMdUy0Q2Z",
                                  host="containers-us-west-5.railway.app",
                                  port="6603",
                                  database="railway")
cursor = connection.cursor()

cursor.execute('''DROP TABLE IF EXISTS company''')
cursor.execute('''CREATE TABLE company(
id SERIAL PRIMARY KEY NOT NULL,
name TEXT NOT NULL,
age INT NOT NULL,
address CHAR(50),
salary REAL);
''')
print("Table created successfully")

connection.commit()
connection.close()

Table created successfully


- Nótese en `pgAdmin` que la tabla fué creada exitosamente, dentro de la base de datos nombrada `railway`. También puede visualizar los cambios ocurridos en el dashboard de `Railway`.

```{figure} ./images/companytable_createdinrailway.png
---
name: companytable_createdinrailway
align: center
scale: 45
---
Creación de tabla en base de datos PostgreSQL en `Railway`.
```

```{figure} ./images/tablecompany_insiderailway.png
---
name: tablecompany_insiderailway_fig
align: center
scale: 45
---
Actualización de dashboard de `Railway` con la nueva tabla creada `company`.
```

**`Operación INSERT`**

- El siguiente programa de `Python` muestra cómo podemos crear registros en nuestra tabla `company` creada en el ejemplo anterior

In [4]:
import psycopg2

connection = psycopg2.connect(user="postgres",
                                  password="gK9I512myqydMdUy0Q2Z",
                                  host="containers-us-west-5.railway.app",
                                  port="6603",
                                  database="railway")
cursor = connection.cursor()

cursor.execute("INSERT INTO company (name, age, address, salary) VALUES ('Paul', 32, 'California', 20000.00 )");

cursor.execute("INSERT INTO company (name, age, address, salary) VALUES ('Allen', 25, 'Texas', 15000.00 )");

cursor.execute("INSERT INTO company (name, age, address, salary) VALUES ('Teddy', 23, 'Norway', 20000.00 )");

cursor.execute("INSERT INTO company (name, age, address, salary) \
                VALUES ('Mark', 25, 'Rich-Mond ', 65000.00 )");

connection.commit()
print("Records created successfully")
connection.close()

Records created successfully


- Observe desde `pgAdmin` que los registros han sido actualizados efectivamente, con los valores insertados en la tabla creada

```{figure} ./images/insertedvaluesin_companytable.png
---
name: insertedvaluesin_companytable_fig
align: center
scale: 45
---
Filas agregadas a la base de datos usando `INSERT INTO`.
```

```{figure} ./images/watchinginsertdatain_railwaycompanytable.png
---
name: watchinginsertdatain_railwaycompanytable_fig
scale: 45
align: center
---
Revisión de datos insertados en la tabla `company` desde `Railway`. 
```

**`Operación SELECT`**
- El siguiente programa de `Python` muestra cómo podemos obtener y mostrar registros de nuestra tabla `company` creada en el ejemplo anterior

In [5]:
import psycopg2

connection = psycopg2.connect(user="postgres",
                                  password="gK9I512myqydMdUy0Q2Z",
                                  host="containers-us-west-5.railway.app",
                                  port="6603",
                                  database="railway")
cursor = connection.cursor()

cursor.execute("SELECT id, name, address, salary from company")
rows = cursor.fetchall()

for row in rows:
    print("id = ", row[0])
    print("name = ", row[1])
    print("address = ", row[2])
    print("salary = ", row[3], "\n")

print("Operation done successfully")
connection.close()

id =  1
name =  Paul
address =  California                                        
salary =  20000.0 

id =  2
name =  Allen
address =  Texas                                             
salary =  15000.0 

id =  3
name =  Teddy
address =  Norway                                            
salary =  20000.0 

id =  4
name =  Mark
address =  Rich-Mond                                         
salary =  65000.0 

Operation done successfully


**`Operación UPDATE`**

- El siguiente código de `Python` muestra cómo podemos utilizar la sentencia `UPDATE` para actualizar cualquier registro y luego obtener y mostrar los registros actualizados de nuestra tabla `company`

In [6]:
import psycopg2

connection = psycopg2.connect(user="postgres",
                                  password="gK9I512myqydMdUy0Q2Z",
                                  host="containers-us-west-5.railway.app",
                                  port="6603",
                                  database="railway")
cursor = connection.cursor()

cursor.execute("UPDATE company set salary = 25000.00 where id = 1")
connection.commit()
print("Total number of rows updated :", cursor.rowcount)

cursor.execute("SELECT id, name, address, salary from company")
rows = cursor.fetchall()

for row in rows:
    print("id = ", row[0])
    print("name = ", row[1])
    print("address = ", row[2])
    print("salary = ", row[3], "\n")

print("Operation done successfully")
connection.close()

Total number of rows updated : 1
id =  2
name =  Allen
address =  Texas                                             
salary =  15000.0 

id =  3
name =  Teddy
address =  Norway                                            
salary =  20000.0 

id =  4
name =  Mark
address =  Rich-Mond                                         
salary =  65000.0 

id =  1
name =  Paul
address =  California                                        
salary =  25000.0 

Operation done successfully


**`Operación DELETE`**

- El siguiente código de `Python` muestra cómo podemos utilizar la sentencia `DELETE` para eliminar cualquier registro y luego obtener y mostrar los registros restantes de nuestra tabla `company`

In [7]:
import psycopg2

connection = psycopg2.connect(user="postgres",
                                  password="gK9I512myqydMdUy0Q2Z",
                                  host="containers-us-west-5.railway.app",
                                  port="6603",
                                  database="railway")
cursor = connection.cursor()

cursor.execute("DELETE from company where id = 2;")
connection.commit()
print("Total number of rows deleted :", cursor.rowcount)

cursor.execute("SELECT id, name, address, salary from company")
rows = cursor.fetchall()

for row in rows:
    print("id = ", row[0])
    print("name = ", row[1])
    print("address = ", row[2])
    print("salary = ", row[3], "\n")

print("Operation done successfully")
connection.close()

Total number of rows deleted : 1
id =  3
name =  Teddy
address =  Norway                                            
salary =  20000.0 

id =  4
name =  Mark
address =  Rich-Mond                                         
salary =  65000.0 

id =  1
name =  Paul
address =  California                                        
salary =  25000.0 

Operation done successfully


**`Importar un archivo CSV o un pandas DataFrame en PostgreSQL`**

- En éste ejemplo vamos a importar un archivo `CSV` en `PostgreSQL` utilizando la función `to_sql()` de la clase `sqlalchemy`. El `DataFrame` a usar corresponde al precio de `Ethereum` en `USD`. Vamos a importar el archivo en una tabla en nuestra base de datos y luego vamos a utilizar esta tabla para realizar un gráfico de `candlesticks`. Si desea ver los distinto tipos de variables numéricas y formatos de fechas en `PostgreSQL` ver el siguiente par de links: [Formatos numéricos](https://www.postgresql.org/docs/9.5/datatype-numeric.html), [Formatos fechas](https://www.postgresql.org/docs/9.1/datatype-datetime.html)

In [8]:
import pandas as pd

In [9]:
df_ETH = pd.read_csv("https://raw.githubusercontent.com/lihkir/Uninorte/main/AppliedStatisticMS/DataVisualizationRPython/Lectures/Python/PythonDataSets/ETH-USD.csv")
df_ETH.head()

Unnamed: 0,Date,Open,High,Low,Close,Adj Close,Volume
0,2015-08-07,2.83162,3.53661,2.52112,2.77212,2.77212,164329.0
1,2015-08-08,2.79376,2.79881,0.714725,0.753325,0.753325,674188.0
2,2015-08-09,0.706136,0.87981,0.629191,0.701897,0.701897,532170.0
3,2015-08-10,0.713989,0.729854,0.636546,0.708448,0.708448,405283.0
4,2015-08-11,0.708087,1.13141,0.663235,1.06786,1.06786,1463100.0


In [10]:
df_ETH = df_ETH.rename({'Date': 'date', 
               'Open': 'open', 
               'High': 'high', 
               'Low': 'low', 
               'Close': 'close', 
               'Adj Close': 'adj_close', 
               'Volume': 'volume'}, axis=1)
df_ETH.head()

Unnamed: 0,date,open,high,low,close,adj_close,volume
0,2015-08-07,2.83162,3.53661,2.52112,2.77212,2.77212,164329.0
1,2015-08-08,2.79376,2.79881,0.714725,0.753325,0.753325,674188.0
2,2015-08-09,0.706136,0.87981,0.629191,0.701897,0.701897,532170.0
3,2015-08-10,0.713989,0.729854,0.636546,0.708448,0.708448,405283.0
4,2015-08-11,0.708087,1.13141,0.663235,1.06786,1.06786,1463100.0


In [11]:
from sqlalchemy import create_engine
engine = create_engine('postgresql://postgres:gK9I512myqydMdUy0Q2Z@containers-us-west-5.railway.app:6603/railway')
df_ETH.to_sql('ethereum', engine, if_exists = 'replace', index=False, method='multi')

2261

```{figure} ./images/queryethedata_railway.png
---
name: queryethedata_railway_fig
align: center
scale: 35
---
Consulta `SELECT` para tabla `ethereum` creada en `Railway`. 
```

```{figure} ./images/railwayethdb_check.png
---
name: railwayethdb_check_fig
align: center
scale: 45
---
Base de datos creada en `Railway`. Verificación desde el `dashboard` de `Railway`.
```

In [12]:
import psycopg2
connection = psycopg2.connect(user="postgres",
                                  password="gK9I512myqydMdUy0Q2Z",
                                  host="containers-us-west-5.railway.app",
                                  port="6603",
                                  database="railway")
cursor = connection.cursor()
cursor.execute("SELECT * from ethereum;")
close = cursor.fetchall()
ETH_sql = pd.DataFrame(close)
display(ETH_sql.head())

cursor.execute("SELECT column_name FROM information_schema.columns WHERE table_name='ethereum';")
ETH_names = cursor.fetchall()
display(ETH_names)

print("Operation done successfully")
connection.close()

Unnamed: 0,0,1,2,3,4,5,6
0,2015-08-07,2.83162,3.53661,2.52112,2.77212,2.77212,164329.0
1,2015-08-08,2.79376,2.79881,0.714725,0.753325,0.753325,674188.0
2,2015-08-09,0.706136,0.87981,0.629191,0.701897,0.701897,532170.0
3,2015-08-10,0.713989,0.729854,0.636546,0.708448,0.708448,405283.0
4,2015-08-11,0.708087,1.13141,0.663235,1.06786,1.06786,1463100.0


[('date',),
 ('open',),
 ('high',),
 ('low',),
 ('close',),
 ('adj_close',),
 ('volume',)]

Operation done successfully


In [13]:
names_list = [name[0] for name in ETH_names]
ETH_sql.columns = names_list 
ETH_sql = ETH_sql.sort_values(by = "date")
ETH_sql.head()

Unnamed: 0,date,open,high,low,close,adj_close,volume
0,2015-08-07,2.83162,3.53661,2.52112,2.77212,2.77212,164329.0
1,2015-08-08,2.79376,2.79881,0.714725,0.753325,0.753325,674188.0
2,2015-08-09,0.706136,0.87981,0.629191,0.701897,0.701897,532170.0
3,2015-08-10,0.713989,0.729854,0.636546,0.708448,0.708448,405283.0
4,2015-08-11,0.708087,1.13141,0.663235,1.06786,1.06786,1463100.0


- Para realizar la siguiente figura necesitará instalar las siguientes librerías

```shell
pip install -U plotly
pip install -U kaleido
```

In [14]:
import plotly.graph_objects as go

fig = go.Figure(data=[go.Candlestick(x = ETH_sql.date,
                                     open = ETH_sql.open, 
                                     high = ETH_sql.high,
                                     low = ETH_sql.low, 
                                     close = ETH_sql.close)
                     ])
fig.update_layout(
    title="Ethereum USD (ETH-USD)",
    xaxis_title="Day",
    yaxis_title="ETH-USD",
    font=dict(
        family="Courier New, monospace",
        size=12,
        color="RebeccaPurple"
    )
)
fig.update_layout(xaxis_rangeslider_visible=False)

### Ejercicio de practica

- La primera tarea es poner a funcionar todo lo realziado en esta sección y entenderlo. Luego de esto creará una nueva tabla que llamaremos `links`, la cual contendrá información acerca de link de páginas web. La tabla debe ser creada siguiendo las siguientes instrucciones. En la siguiente revisaremos con detalle el significado de cada consulta `SQL`

``` mysql
CREATE TABLE links (
	id SERIAL PRIMARY KEY,
	url VARCHAR(255) NOT NULL,
	name VARCHAR(255) NOT NULL,
	description VARCHAR (255),
    last_update DATE
);
```
- Luego insertará datos a la tabla usando las siguientes ordenes. En cada caso mostrar debe mostrar el output generado por **`pgAdmin`**, así como también la actualización de **`Heroku Postgres`**

``` mysql
INSERT INTO links (url, name)
VALUES('https://www.postgresqltutorial.com','PostgreSQL Tutorial');
```

``` mysql
INSERT INTO links (url, name)
VALUES('http://www.oreilly.com','O''Reilly Media');
```

``` mysql
INSERT INTO links (url, name)
VALUES('http://www.oreilly.com','O''Reilly Media');
```

``` mysql
INSERT INTO links (url, name, last_update)
VALUES('https://www.google.com','Google','2013-06-01');
```

``` mysql
INSERT INTO links (url, name)
VALUES('http://www.postgresql.org','PostgreSQL') 
RETURNING id;
```

- Importe los datos del precio de **Cardano USD (ADA-USD)** en su base de datos **Herokus Postgres**, teniendo en cuenta lo explicado. Luego dibuje un gráfico de candlestick para la criptomoneda. En el siguiente link encontrará el **CSV** de **Cardano**: [Cardano USD (ADA-USD)](https://raw.githubusercontent.com/lihkir/Uninorte/main/AppliedStatisticMS/DataVisualizationRPython/Lectures/Python/PythonDataSets/ADA-USD.csv)