# 1.1 - SQL (Structured Query Languaje)

[Documentación](https://dev.mysql.com/doc/)



![sql](images/sql.png)


### El significado de base de datos relacional

Una base de datos relacional es un tipo de base de datos que almacena y proporciona acceso a puntos de datos relacionados entre sí. Las bases de datos relacionales se basan en el modelo relacional, una forma intuitiva y directa de representar datos en tablas. En una base de datos relacional, cada fila en una tabla es un registro con una `id` única, llamada clave primaria. Las columnas de la tabla contienen los atributos de los datos y cada registro suele tener un valor para cada atributo, lo que simplifica la creación de relaciones entre los puntos de datos.


### Estructura de las bases de datos relacionales

El modelo relacional implica que las estructuras lógicas de los datos (las tablas, las vistas y los índices) estén separadas de las estructuras de almacenamiento físico. Gracias a esta separación, los administradores de bases de datos pueden gestionar el almacenamiento físico de datos sin que eso influya en el acceso a esos datos como estructura lógica. Por ejemplo, si se cambia el nombre del archivo de una base de datos, eso no significa que vayan a cambiar también los nombres de sus tablas.

La distinción entre estructura lógica y física también se aplica a las operaciones de base de datos: acciones claramente definidas que permiten a las aplicaciones gestionar los datos y las estructuras de la base de datos. Con las operaciones lógicas, las aplicaciones pueden especificar el contenido que necesitan, mientras que las operaciones físicas determinan cómo se debe acceder a esos datos y llevan a cabo la tarea.

Para garantizar la precisión y accesibilidad continua de los datos, las bases de datos relacionales siguen ciertas reglas de integridad. Por ejemplo, una regla de integridad podría especificar que no se permite duplicar filas en una tabla, a fin de evitar que se introduzca información errónea en la base de datos.



### El modelo relacional

En los primeros años de las bases de datos, cada aplicación almacenaba datos en su propia estructura única. Cuando los desarrolladores querían crear aplicaciones para usar esos datos, tenían que conocer muy bien esa estructura de datos concreta a fin de encontrar los datos que necesitaban. Esas estructuras de datos eran poco eficaces, el mantenimiento era complicado y era difícil optimizarlas para ofrecer un buen rendimiento en las aplicaciones. El modelo de base de datos relacional se diseñó para resolver el problema causado por estructuras de datos múltiples y arbitrarias.

El modelo relacional proporcionó una forma estándar de representar y consultar datos que podía utilizarse en cualquier aplicación. Desde el principio, los desarrolladores se dieron cuenta de que la virtud principal del modelo de base de datos relacional era el uso de tablas, ya que era una forma intuitiva, eficiente y flexible de almacenar y acceder a información estructurada.

Con el tiempo, los desarrolladores comenzaron a usar el lenguaje de consulta estructurado (SQL) para escribir y hacer consultas en una base de datos: esto sería otra de las grandes virtudes de este modelo. Durante muchos años, el SQL se ha utilizado como el lenguaje para realizar consultas en bases de datos. Se basa en el álgebra relacional y proporciona un lenguaje matemático de uniformidad interna que facilita la mejora del rendimiento de todas las consultas en bases de datos. Otros métodos empleados necesitan definir consultas individuales.


### Ventajas de las bases de datos relacionales

El modelo relacional es sencillo pero muy potente, y lo utilizan organizaciones de todos los tipos y tamaños para una gran variedad de aplicaciones con datos. Las bases de datos relacionales se usan para rastrear inventarios, procesar transacciones de comercio electrónico, administrar cantidades enormes y esenciales de información de clientes y mucho más. Las bases de datos relacionales se pueden emplear para cualquier aplicación de datos en la que los puntos de datos se relacionen entre sí y deban gestionarse de forma segura, conforme a normas y de un modo uniforme.

Las bases de datos relacionales han existido desde la década de los setenta. En la actualidad, el modelo relacional sigue siendo el más aceptado para las bases de datos, gracias a todas sus virtudes.




### Uniformidad de los datos

El modelo relacional es el ideal para mantener la uniformidad de los datos en todas las aplicaciones y copias de la base de datos (llamadas instancias). Por ejemplo, cuando un cliente deposita dinero en un cajero automático y, a continuación, mira el saldo en un teléfono móvil, el cliente espera ver ese depósito reflejado inmediatamente. Las bases de datos relacionales son perfectas para este tipo de uniformidad, y garantizan que todas las instancias de una base de datos tengan los mismos datos en todo momento.

Es muy difícil que otros tipos de bases de datos mantengan este nivel de concordancia tan inmediato con grandes cantidades de datos. Algunas bases de datos recientes, como NoSQL, solo pueden suministrar una 'uniformidad final'. Según este principio, cuando la base de datos se adapta o cuando varios usuarios acceden a los mismos datos al mismo tiempo, los datos necesitan tiempo para 'actualizarse'. La uniformidad final es aceptable en algunos casos (por ejemplo, para mantener listas en un catálogo de productos), pero para operaciones comerciales críticas, como transacciones de carritos de compra, la base de datos relacional sigue siendo la referencia. 



### Compromiso y atomicidad

Las bases de datos relacionales gestionan las reglas y políticas comerciales a un nivel muy detallado, y tienen políticas estrictas sobre el compromiso (es decir, el establecimiento de un cambio en la base de datos como algo permanente). Por ejemplo, imaginemos una base de datos de inventario para rastrear tres piezas que siempre se usan juntas. Cuando se saca una pieza del inventario, las otras dos también deben salir. Si una de las tres piezas no está disponible, ninguna de ellas debe salir del inventario; las tres deben estar disponibles antes de que la base de datos establezca el compromiso. Una base de datos relacional no se comprometerá sobre una pieza hasta que pueda comprometerse sobre las tres. Esta capacidad de compromiso multifacético se llama atomicidad. La atomicidad es la clave para mantener los datos precisos y garantizar el cumplimiento de las reglas, normas y políticas de la empresa.



### Procedimientos almacenados y bases de datos relacionales

El acceso a los datos implica muchas acciones repetitivas. Por ejemplo, una consulta simple para obtener información de una tabla de datos puede necesitar repetirse cientos o miles de veces para producir el resultado deseado. Estas funciones de acceso a datos requieren algún tipo de código para acceder a la base de datos. Para los desarrolladores de aplicaciones, no es práctico tener que escribir código nuevo para estas funciones en cada nueva aplicación. Sin embargo, las bases de datos relacionales permiten procedimientos almacenados: bloques de código a los que se puede acceder con una simple llamada a la aplicación. Por ejemplo, un solo procedimiento almacenado puede proporcionar un etiquetado de registro uniforme para usuarios de múltiples aplicaciones. Los procedimientos almacenados también pueden ayudar a los desarrolladores a garantizar que ciertas funciones de datos en aplicación se implementen de una manera específica.





### Bloqueo y concurrencia de base de datos

En una base de datos pueden surgir conflictos cuando varios usuarios o aplicaciones intentan cambiar los mismos datos al mismo tiempo. Las técnicas de bloqueo y concurrencia reducen la posibilidad de conflictos y mantienen la integridad de los datos.

El bloqueo evita que otros usuarios y aplicaciones accedan a los datos mientras se están actualizando. En algunas bases de datos el bloqueo se aplica a toda la tabla, lo que influye de forma negativa en el rendimiento de la aplicación. Otras bases de datos, como las bases de datos relacionales de Oracle, aplican bloqueos en el nivel de registro y mantienen la disponibilidad de los otros registros dentro de la tabla; esto ayuda a garantizar un mejor rendimiento de la aplicación.

La concurrencia gestiona la actividad cuando varios usuarios o aplicaciones hacen llamadas a consultas al mismo tiempo y en la misma base de datos. Esta función proporciona el acceso correcto a los usuarios y aplicaciones de acuerdo con las políticas definidas para el control de datos.




### Elementos a tener en cuenta al escoger una base de datos relacional

El software utilizado para almacenar, administrar, consultar y recuperar datos guardados en una base de datos relacional se denomina sistema de gestión de bases de datos relacionales (RDBMSf). El RDBMS proporciona una interfaz entre los usuarios/aplicaciones y la base de datos, además de funciones administrativas para gestionar el acceso a los datos, así como su almacenamiento y rendimiento.

Hay varios factores a tener en cuenta al elegir entre diferentes tipos de bases de datos y productos de bases de datos relacionales. El RDBMS que escoja dependerá de las necesidades de su empresa. Piense en las siguientes preguntas:

   + **¿Necesitamos un gran nivel de precisión en los datos?** ¿El almacenamiento y la precisión de los datos se basarán en la lógica empresarial? ¿Tenemos datos con requisitos estrictos de precisión (por ejemplo, datos financieros e informes gubernamentales)?
   
   + **¿Necesitamos escalabilidad?** ¿Cuál es la escala de los datos a gestionar y cuál es el crecimiento previsto? ¿Necesitaremos un modelo de base de datos compatible con copias de bases de datos reflejadas (como instancias separadas) para permitir la escalabilidad? Si es así, ¿podrá mantener ese modelo la uniformidad de los datos en todas las instancias?
   
   + **¿Es muy importante la concurrencia?** ¿Vamos a necesitar que muchos usuarios y aplicaciones accedan de forma simultánea a los datos? ¿El software de la base de datos permite ofrecer concurrencia sin comprometer la seguridad de los datos?
   
   + **¿Qué necesitamos en términos de rendimiento y fiabilidad?** ¿Necesitamos un producto de gran rendimiento y fiabilidad? ¿Qué tipo de rendimiento necesitamos en la respuesta a las consultas? ¿Qué compromisos han adquirido los proveedores según los acuerdos de nivel de servicio (SLA) o las paradas no previstas?


### Resumen

Típicamente, en un dataset, hay registros y atributos. En una base de datos relacional, los registros se representan por filas y los atributos por columnas, que conforman una tabla. En SQL, cada tabla es una entidad diferente y cada registro de una entidad posee un identificador único, llamado `primary key`, los datos de diferentes entidades tendrán sus respectivas tablas donde cada entidad individual (registro) tiene asignado un único `id`, ésta es la `primary key` (clave primaria).

Las relaciones entre las entidades dentro de la base de datos se manejan mapeando el `id` de una tabla con el `id` de la otra tabla a través de `foreign key` (clave foránea).

Una foreign key es un campo en una tabla que identifica a otra entidad en otra tabla. La ventaja principal de almacenar de ésta manera la información es evitar la redundancia. Por ejemplo, si un jugador se va del equipo A al equipo B, solo se necesita actualizar la relación para ese jugador y nada más.


**Relaciones:**

Las entidades se pueden relacionar entre sí de varias maneras diferentes:

+ **One-to-One:** Una relación one-to-one existe cuando una entidad tiene una relación exclusiva con otra entidad y viceversa. Por ejemplo, el número de la seguridad social o el DNI es único para cada persona.

+ **One-to-Many:** Una relación one-to-many existe cuando una entidad tiene una relación exclusiva con otra entidad, pero no a la inversa. Por ejemplo, un jugador está en un equipo pero un equipo tiene varios jugadores.

+ **Many-to-Many:** Una relación many-to-many existe cuando una entidad tiene una relación con varias entidaes más y también a la inversa. Por ejemplo, una película tiene varios actores y los actores pueden interpretar en varias películas.

## Uso de SQL

**Acceso a SQL:**

Desde la terminal, escribimos:

```
mysql -u root -p 
```

Si `ZSH` no encuentra el comando: 

```
export PATH=${PATH}:/usr/local/mysql/bin/
```


$$$$
Nos pedirá el password de SQL, y si todo sale correcto veremos esto:

![terminal_sql](images/terminal_sql.png)


$$$$

Estando aquí, en la terminal de SQL, **para importar un archivo .sql**, primero debemos crear una base de datos vacía. Escribimos la query:

```mysql
create database publications;
```

```mysql
source publications.sql;
```

$$$$

Una vez hecho eso, en terminal, para rellenar con datos del archivo .sql la base de datos vacía:
```
mysql -u root -p publications < publications.sql
```

###  Workbench

![workbench](images/workbench.png)

MySQL Workbench es una herramienta visual de diseño de bases de datos que integra desarrollo de software, administración de bases de datos, diseño de bases de datos, gestión y mantenimiento para el sistema de base de datos MySQL.


Las características destacadas de MySQL Workbench:

+ General:
    + Conexión y gestión de instancia de base de datos.
    + Asistente de elementos de acción.
    + Completamente compatible con guiones escritos en Python y Lua.
    + Soporte para complementos personalizados
+ Editor de SQL:
    + Exploración de esquema de objetos.
    + Resaltado de sintaxis en SQL y analizador de declaraciones.
    + Conjuntos de resultados múltiples, editables.
    + Colecciones de fragmentos SQL.
    + Tunelización de conexión por SSH.
    + Soporte Unicode.
+ Modelado de datos:
    + Diagrama entidad relación.
    + Modelado visual con arrastrar y soltar.
    + Ingeniería inversa a guiones SQL y base de datos en vivo.
    + Ingeniería directa a guiones SQL y base de datos en vivo.
    + Sincronización de esquema.
    + Impresión de modelos.
+ Administración de base de datos:
    + Iniciar y detener instancias de base de datos.
    + Configuración de instancias.
    + Administración de cuentas en base de datos.
    + Exploración de instancias variables.
    + Exploración de ficheros de registros.
    + Exportación e importación masiva de datos.

### Queries en Workbench

Para introducir una query en Workbench tan solo es necesario escribirla en el editor de texto.
![sql_query](images/sql_query.png)

$$$$

Para que la query se ejecute es necesario darle al botón del rayo.
![sql_rayo](images/sql_rayo.png)


$$$$

La tabla resultante de la query se muestra en la parte inferior.
![sql_tabla](images/sql_tabla.png)


### ERD (Diagrama Entidades-Relaciones)

Un diagrama entidad-relación, también conocido como modelo entidad relación o ERD, es un tipo de diagrama de flujo que ilustra cómo las 'entidades', como personas, objetos o conceptos, se relacionan entre sí dentro de un sistema. Los diagramas ER se usan a menudo para diseñar o depurar bases de datos relacionales en los campos de ingeniería de software, sistemas de información empresarial, educación e investigación. También conocidos como los ERD o modelos ER, emplean un conjunto definido de símbolos, tales como rectángulos, diamantes, óvalos y líneas de conexión para representar la interconexión de entidades, relaciones y sus atributos. Son un reflejo de la estructura gramatical y emplean entidades como sustantivos y relaciones como verbos.
Ejemplo de ERD


![erd](images/erd.png)



En Workbench, para acceder al ERD o crear una nuevo, nos vamos a la opcion de Reverse/--Engineering.

![erd_engine](images/erd_engine.png)