# SQL
___

SQL (por sus siglas en inglés) es un lenguaje estructurado de consultas entre datos y algo llamado _"Relational Database"_. Este último termino se refiere a una colección especifica de tablas.

Cada tabla representa una entidad y está compuesta por atributos (columnas) y elementos (renglones). Por ejemplo: _–⁠la siguiente tabla queda representada por los atributos `id`, `name`, `age` y `nationality`. Mientras que cada elemento (renglón) muestra la información personal de cada uno de los siguientes usuarios en una red:–_

|id|name|age|nationality|
|--|----|---|-----------|
|1|Jessica|22|Ireland|
|2|Gabriel|48|France|
|3|Laura|36|USA|

Hay una gran cantidad de gestores de bases de datos relacionales (_DBMS_). Uno de ellos es _PostgreSQL_. Es el más usado, es de código abierto y además nos permite realizar y gestionar objetos espaciales.

### PL/psql

Una vez instalado y configurado _PostgrSQL_ en una computadora, `PL/psql` será nuestro intermediario. Nos ayudará a interactuar con nuestro equipo y el software. En pocas palabras es la interfaz del **usuario** con **postgres**.

El comando que nos ayuda a interactuar con nuestras colecciones de basaes de datos (instancias), desde `shell` (_consola o terminal_), es `psql`. De tal modo que si lo ejecutamos recibiremos el mensaje siguiente:
```sql
psql

psql (11.1)  -- versión de postgres instalada
Type "help" for help.

postgres=#  -- usuario root de postgres.

```

_PostgreSQL_ está estructurado bajo el uso de usuarios y privilegios. Cada usuario tendrá derecho a gestionar determinadas tablas y podrá ejecutar determinadas tareas. El usuario principal (_root_) siempre es `postgres=#`. Este usuario es quién inicia en la base de datos por default.

En esta ocasión será necesario trabajar con la base de datos llamada `test` bajo un usuario nombrado del mismo modo,`test`. Para ello abrimos una terminal y ejecutar los siguientes comandos:

* `psql` para poder ingresar a postgres y crear un usuario junto con su base de datos. Si solamente ejecutamos `psql` postgres llamará al usuario _root_. Esto quiere decir que podemos hacer los cambios a las bases de datos y la creación de nuevas tablas. Tenemos todos los permisos por estar como usuario `postgres`.
* `CREATE USER test` creará el usuario `test` en el cual vivirán nuestras bases de datos.
* `CREATE DATABASE test OWNER test` creará la base de datos `test`, cuyo propietario será el usuario `test`.
* `ALTER ROLE test WITH SUPERUSER` con este comando le darémos el acceso total a nuestro usuario `test`. Podremos realizar todos los cambios necesarios dentro de la base de datos `test`.
* `CREATE SCHEMA sql` con este comando creamos esquemas (folders dentro de las bases de datos). Necesitamos crear el esquema `sql`. Será en este donde vamos a guardar todas las tablas y datos generados en los ejercicios posteriores.

La creación de bases de datos, esquemas, tablas, usuarios, etc, etc... es tarea de todos los días. Y cada quién propone la organización de los premisos, de los esquemas, número de bases en general. Así que, dependerá de las actividades vamos a desarrollar para poder llevar el control de nuestra información.

### Psycopg2

Psycopg2 es el adaptador más popular de PostgreSQL para Python, con el cual podemos convertir la interfaz de jupyter en PostgreSQL, realizando cualquier actividad como: creación, actualización y gestión de bases de datos.

Esta herramienta nos ayudará como canal para cmunicarnos desde Python con nuestras bases de datos y poder realizar cualquier tipo de consulta.

Para ello necesitamos cargar la libreriía `psycopg2`, crear el objeto `conn = psycopg2.connect("dbname=test user=postgres")` para poder conectarnos con la base de datos de nuestra elección. Luego el objeto `cur = conn.cursor()` para levantar la comunicación con la base de datos. A partir de aquí lo siguiente es construir las consultas mediante el objeto `cur.execute`. Por ejemplo: `cur.execute("CREATE TABLE test (id serial PRIMARY KEY, num integer, data varchar);")` o `cur.execute("INSERT INTO test (num, data) VALUES (%s, %s)", (100, "abc'def"))`.

Si queremos capturar la respuesta del _Query_, que hemos realizado a una base de datos, y visualizarla como _output_ en jupyter, utilizamos el objeto `cur.fetchone()`. Por ejemplo: necesitamos obtener el resultado de la consulta `cur.execute("SELECT * FROM test;")`. Entonces bastará con agregar al final del _statement_ anterior el objeto `cur.fetchone()`:

```sql
cur.execute("SELECT * FROM test;")
cur.fetchone()
(1, 100, "abc'def")
```
Para poder actualizar los cambios, a una tabla en postgres desde Python, utilizamos el objeto `conn.commit()`. Y para finalizar la comunicación con la base de datos los objetos `cur.close()` y `conn.close()` nos ayudan con esta tarea.

No es necesario memorizar cada uno de estos comandos. Solo basta con poner atención en el funcionamiento de cada uno de ellos. Así, la identificación de posibles errores en el futuro será más facil. Si se llega a la memorización de cada uno de ellos será un plus.

Para finalizar esta parte levantarémos la conección desde _Python_ hacia la base de datos `test`, creada previamente utilizando _**psycopg2**_. Para este ejercicio es necesario crear un nuevo esquema y nombrarlo como `postgis` tal cual lo hicimos en el último paso, cuando creamos la base de datos `test` junto con el usuario `test`. Para este ejercicio hay que tomar muy en cuenta los siguientes parámetros: 

* `dbname=` base de datos destino.
* `user=` usuario de la base de datos.

El parámetro `host=/tmp/` se agrega por si acaso se presenta el siguiente error como se muestra en la imágen siguiente:

<img src="error_psycopg2.png"/>

Si la conexión se realizó de manera correcta nigún mensaje de error será lanzado.

En muchas ocasiones la conección con la base de datos se interrumpe y se muestra el siguiente error:

<img src="error1.png"/>

Para solucionar este problema tendremos que reiniciar la conexión con la base de datos. Por lo cual será necesario volver a la celda, de _jupyter_, donde levantamos la conección de la base de datos.

Hasta aquí hemos visto dos diferentes formas de comunicarnos con una base de datos de _PostgreSQL_. Una de ellas y la más popular `PL/psql`. La otra mediante la librería **psycopg2** de _python_. Ambas son herramientas que por separado incluyen un manual para entender su sintaxis.