# 1.0 - Introducción a bases de datos

![mongo_vs_sql.png](attachment:c9273d15-841f-40f1-bed5-4752c4b0a01a.png)

## Bases de datos relacionales

Una base de datos SQL es una base de datos relacional, escrita en el lenguaje de consulta estructurado SQL (Structured Query Language). Una base de datos relacional es aquella que dispone de una relación predefinida entre sus elementos, donde cada registro pueda ser identificado de forma inequívoca. Este tipo de bases de datos surgieron en los años 70 como una solución para almacenar información de acuerdo a un esquema que permite mostrar la información en forma de tablas, con columnas y filas.

Estos son los gestores de bases de datos relacionales más conocidos y utilizados:

+ Oracle
+ MySQL
+ Microsoft SQL Server
+ PostgreSQL
+ DB2

La integridad de los datos es un factor sumamente importante al momento de diseñar una base de datos de tipo relacional.

Los sistemas RDBMS (Relational Data Base Management System) se rigen por el principio **ACID**:

+ **Atomicity**: Cuando una operación se realiza sobre los datos, esta debe ser absoluta, esto quiere decir que todos los pasos deben ejecutarse sobre una sola operación, o bien no debe ejecutarse ninguno.

+ **Consistency**: Cualquier operación realizada en la base de datos debe llevarla de un estado válido a otro, todos los datos deben ser consistentes, por ejemplo en los tipos (string, numérico, boolean)

+ **Isolation**: Ninguna operación puede o debe afectar a otras.

+ **Durability**: Cualquier operación realizada en una base de datos debe ser permanente una vez es ejecutada, incluso si ocurre un fallo inesperado en el sistema, los datos deben ser almacenados en su último estado conocido.


### Ventajas

+ Está más adaptado su uso y los perfiles que las conocen son mayoritarios y más baratos.

+ Debido al largo tiempo que llevan en el mercado, estas herramientas tienen un mayor soporte y mejores suites de productos y add-ons para gestionar estas bases de datos.

+ La atomicidad de las operaciones en la base de datos. Esto es, que en estas bases de datos o se hace la operación entera o no se hace utilizando la famosa técnica del rollback.

+ Los datos deben cumplir requisitos de integridad tanto en tipo de dato como en compatibilidad.

### Desventajas

+ La atomicidad de las operaciones juega un papel crucial en el rendimiento de las bases de datos.

+ Escalabilidad, que aunque probada en muchos entornos productivos suele, por norma, ser inferior a las bases de datos NoSQL.

## Bases de datos NO relacionales

Una base de datos NoSQL o Not Only SQL es una base de datos no relacional que no cuenta con un identificador que relacione un conjunto de datos con otro. En las bases de datos No SQL la información es organizada generalmente como documentos y no requieren que los datos están estructurados para poder manipularlos. Este tipo de bases de datos no es un reemplazo para las bases de datos relacionales, más bien es una alternativa que surgió para satisfacer las necesidades de aplicaciones cada vez más complejas y que se encuentran en constante actualización.

La principal diferencia entre este tipo de bases de datos y las relacionales recae en que no necesitamos invertir tanto tiempo en diseñar una estructura ya que podemos almacenar datos no estructurados y manipularlos libremente.

Dentro de las bases de datos no relacionales también existen diferentes tipos, cada uno con un propósito diferente.

+ **Almacenamiento tipo llave-valor**: Amazon Dynamo DB o Redis son ejemplos de este tipo, son sistemas sencillos que permiten obtener el valor asociado con una llave conocida. Este tipo de almacenamiento es preferido cuando los datos no son tan complejos y la rapidez de las consultas es un factor importante.

+ **Almacenamiento Wide Column**: Esta solución está diseñada con el propósito de ser altamente escalables y manejar sin problemas cantidades masivas de datos (petabytes). Este sistema usa una variante de SQL llamada CQL para la definición y manipulación de datos, lo cual las hace familiar hasta cierto punto con los sistemas relacionales.

+ **Almacenamiento de documentos**: Son sistemas libres de esquemas donde el más popular es MongoDB, su popularidad reside en que los dos stacks más conocidos y de los cuales ya hablé anteriormente MERN y MEAN se valen de este sistema para el desarrollo del backend. Los registros individuales no requieren una estructura uniforme, pueden contener muchos tipos de valores diferentes y pueden anidarse. Esta flexibilidad los hace particularmente adecuados para administrar datos semiestructurados en sistemas distribuidos.

+ **Grafos**: Almacena los datos como una estructura de red con nodos u objetos interconectados entre si para facilitar la visualización y el análisis de los datos en tiempo real. La próxima vez que ingreses a Facebook, piensa que tu lista de amigos es una red de grafos que a su vez contienen otras redes dentro de ellos.

### Ventajas

+ La escalabilidad y su carácter descentralizado. Soportan estructuras distribuidas.

+ Suelen ser bases de datos mucho más abiertas y flexibles. Permiten adaptarse a necesidades de proyectos mucho más fácilmente que los modelos de Entidad Relación.

+ Se pueden hacer cambios de los esquemas sin tener que parar bases de datos.

+ Escalabilidad horizontal: son capaces de crecer en número de máquinas, en lugar de tener que residir en grandes máquinas.

+ Se pueden ejecutar en máquinas con pocos recursos.

+ Optimización de consultas en base de datos para grandes cantidades de datos.

### Desventajas

+ No todas las bases de datos NoSQL contemplan la atomicidad de las instrucciones y la integridad de los datos. 

+ Soportan lo que se llama consistencia eventual.

+ Problemas de compatibilidad entre instrucciones SQL. Las nuevas bases de datos utilizan sus propias características en el lenguaje de consulta y no son 100% compatibles con el SQL de las bases de datos relacionales. El soporte a problemas con las queries de trabajo en una base de datos NoSQL es más complicado.

+ Falta de estandarización. Hay muchas bases de datos NoSQL y aún no hay un estándar como sí lo hay en las bases de datos relacionales. Se presume un futuro incierto en estas bases de datos.

+ Soporte multiplataforma. Aún quedan muchas mejoras en algunos sistemas para que soporten sistemas operativos que no sean Linux.

+ Suelen tener herramientas de administración no muy usables o se accede por consola.

## Diferencias entre SQL y NoSQL 

Existen muchas diferencias entre estos dos tipos de bases de datos. Veamos las mismas teniendo en cuenta distintos factores: 

+ Rendimiento. Las bases de datos NoSQL ofrecen un mayor rendimiento que las SQL (necesitan menos recursos de hardware). 

+ Fiabilidad. Las bases de datos relacionales SQL son más fiables que las NoSQL (si un proceso tiene algún error, no se lleva a cabo). 

+ Disponibilidad. En cuanto a la disponibilidad, ambas alternativas son igual de válidas. 

+ Consistencia. La consistencia de las bases de datos NoSQL es pobre, en cambio las SQL son bases de datos muy consistentes (la consistencia es la capacidad de garantizar la integridad de los datos). 

+ Almacenamiento. Las bases de datos SQL son indicadas cuando la cantidad de datos no son extremadamente grandes, mientras que las NoSQl son ideales para manejar grandes volúmenes de datos. 

+ Escalabilidad. Las bases de datos NoSQL son escalables por lo que se pueden aumentar su capacidad fácilmente, sin embargo, las SQL pueden ser escalables, pero con un costo económico más elevado. Las bases de datos No SQL utilizan un escalado horizontal (aumentar el número de servidores) mientras que las SQL utilizan un escalado vertical (aumentar los recursos de un servidor). 

### Cuando utilizar SQL o NoSQL 

Elegir el tipo de base de datos a utilizar en un proyecto es importante ya que influye en el rendimiento y en desarrollo del mismo. Decantarse por una base de datos relacional o no relacional puede hacer que un proyecto se encuentre con problemas que impidan su correcta ejecución, añadan mucho esfuerzo o incluso aumente los costos previstos. 


### En qué casos utilizar SQL 

Cuando en un proyecto el volumen de los datos no tendrá un gran crecimiento, o este se realice de forma lenta, las bases de datos SQL. 

En proyectos donde el pico de usuarios que accedan a la base de datos esté previsto, las bases de datos relacionales funcionan de manera óptima. 

Si las necesidades de procesamiento de la base de datos requieren de un único servidor, se pueden utilizar bases de datos SQL. 



### En qué casos utilizar NoSQL 

Si el crecimiento de la base de datos se realiza de forma rápida, con grandes aumentos en poco tiempo, lo ideal es recurrir a bases de datos no relacionales NoSQL. 

Si el acceso a la base de datos puede sufrir picos altos y en múltiples ocasiones, lo mejor es optar por No SQL. 

Si las necesidades de procesamiento no se pueden prevenir, es mejor utilizar bases de datos NoSQL escalables (permiten expandirse).

### NoSQL simplifica la base de datos DevOps 

La utilización de una base de datos documental NoSQL simplifica la base de datos DevOps ya que aporta una flexibilidad de esquemas, permitiendo que los desarrolladores accedan a una base de datos estructurados, semi estructurados y no estructurados, dinámica (con cambios constantes). Los desarrolladores pueden operar directamente sobre los datos con JSON obteniendo resultados inmediatos. 

La aplicación desarrollada no depende de un ORM (modelo de programación para convertir objetos en un formato que pueda almacenarse en una base de datos relacional) y solo requiere una actualización del código de la aplicación ante cualquier cambio del esquema de la base de datos. 

La escalabilidad horizontal permite ampliar la capacidad de la base de datos si se requiere en muy poco tiempo. Esta escalabilidad coincide con uno de los objetivos DevOps, de adaptarse de forma inmediata a las necesidades de los proyectos.  

Las bases de datos no relacionales NoSQL son una gran alternativa a las relacionales SQL para muchos proyectos. Dentro del marco DevOps el uso de una base de datos documental NoSQL aporta rapidez, escalabilidad, flexibilidad y sencillez a la gestión la misma.  

### Resumen

Las bases de datos o **BBDD** son un sistema organizado de almacenamiento de información en una computadora.

- Consiste en una colección estructurada de datos que se almacenan de manera eficiente y se pueden acceder, actualizar y administrar de manera sistemática.

- Las bases de datos se utilizan para almacenar información de manera que sea fácil de buscar y recuperar, como si fuera una biblioteca electrónica donde los datos se organizan en categorías y se pueden consultar según diferentes criterios.

### RDBMS -  Relational Database Management System

Un **Sistema de Gestión de Bases de Datos Relacionales** es un tipo de sistema de base de datos que organiza la información en tablas con filas y columnas. Cada fila representa un registro único, y cada columna representa un tipo de dato específico. Los datos en un RDBMS se relacionan a través de claves o vínculos comunes.

- Los programas que controla la base de datos se llaman **"Sistema de Gestión de Bases de Datos"** o **SGBD** (DBMS en inglés). Cuando, por ejemplo, necesitamos recuperar datos de una base de datos, la petición la realizamos por medio de **SQL**, el **"Sistema de Gestión de Bases de Datos"** procesa dicha petición **SQL**, recopila los datos solicitados y nos los devuelve. Un **DBMS** es la herramienta que utilizamos para construir la estructura y manipular los datos dentro de una base de datos. Por ejemplo, **MySQL**.

![mysql01.png](attachment:8105d2e7-c002-4818-9f29-d12f6bab01f6.png)

#### Importancia de las bases de datos relacionales:

1. **Organización de datos**: Las bases de datos permiten organizar grandes cantidades de información de manera estructurada, lo que facilita el acceso, búsqueda y recuperación de datos de manera eficiente.
<br>

2. **Acceso rápido a la información**: Las bases de datos permiten acceder rápidamente a datos específicos, lo que es esencial para aplicaciones como motores de búsqueda en la web, sistemas de gestión de inventario, sistemas de reservas y más.
<br>

3. **Integridad de datos**: Los sistemas de bases de datos proporcionan mecanismos para mantener la integridad de los datos, evitando duplicados y asegurando la coherencia de la información, lo que es crucial para la toma de decisiones y la confiabilidad de la información.
<br>

4. **Relaciones entre datos**: Los sistemas de gestión de bases de datos relacionales permiten establecer relaciones entre diferentes conjuntos de datos, lo que facilita la gestión de datos interconectados, como clientes y pedidos en una tienda en línea.
<br>

5. **Seguridad de datos**: Las bases de datos ofrecen opciones para proteger los datos confidenciales mediante autenticación y autorización, lo que garantiza que solo las personas autorizadas puedan acceder a la información.
<br>

6. **Escalabilidad**: Las bases de datos pueden manejar grandes volúmenes de datos y escalarse según las necesidades, lo que es fundamental para las aplicaciones que experimentan un crecimiento constante de información.
<br>

7. **Análisis y toma de decisiones**: Las bases de datos proporcionan una base sólida para el análisis de datos y la generación de informes, lo que es esencial para la toma de decisiones informadas en los negocios y otros campos.