[![cloudevel](img/cloudevel.png)](https://www.cloudevel.com)

# Almacenamiento de datos.

## Data Store
Los **data stores** o **almacenes de datos** son sistemas informáticos diseñados para almacenar, organizar y recuperar grandes cantidades de información de manera eficiente. Se utilizan en una amplia gama de aplicaciones, desde el comercio electrónico y las redes sociales hasta la atención médica y la investigación científica.

**Tipos de Data Stores:**

La elección del data store adecuado depende de las características de los datos, las necesidades de acceso y el patrón de uso. A continuación, se presentan algunos de los tipos más comunes:

**1. Bases de datos relacionales:**

* **Estructura tabular:** Almacenan datos en tablas con filas y columnas, donde cada fila representa un registro individual y cada columna representa un atributo del registro.
* **Relaciones entre datos:** Permiten definir relaciones entre tablas mediante claves foráneas.
* **Lenguaje de consulta estructurado (SQL):** Utilizan SQL para acceder, manipular y analizar datos.
* **Ejemplos:** MySQL, PostgreSQL, Oracle Database.

**2. NoSQL:**

* **Esquema flexible:** No requieren un esquema predefinido, lo que permite almacenar datos sin estructuras rígidas.
* **Modelos de datos diversos:** Pueden almacenar datos en forma de documentos, claves-valor, grafos o series temporales.
* **Escalabilidad horizontal:** Se pueden distribuir en múltiples servidores para manejar grandes volúmenes de datos.
* **Ejemplos:** MongoDB, Cassandra, CouchDB.

**3. Almacenamiento en caché:**

* **Almacenamiento temporal de datos:** Almacenan datos de acceso frecuente para reducir la latencia y mejorar el rendimiento de las aplicaciones.
* **Velocidad de acceso rápida:** Utilizan tecnologías como la memoria caché en RAM para acceder a los datos de forma muy rápida.
* **Datos dinámicos:** Ideales para almacenar datos que cambian con frecuencia.
* **Ejemplos:** Memcached, Redis.

**4. Data Lakes:**

* **Almacenamiento de datos sin procesar:** Almacenan grandes cantidades de datos sin procesar en su formato nativo (texto, imágenes, vídeo, etc.).
* **Escalabilidad masiva:** Pueden almacenar petabytes o exabytes de datos.
* **Análisis de big data:** Facilitan el análisis de grandes conjuntos de datos sin necesidad de estructurarlos previamente.
* **Ejemplos:** Amazon S3, Microsoft Azure Data Lake Storage.

**5. Data Warehouses:**

* **Datos estructurados y organizados:** Diseñados para almacenar y analizar datos estructurados y organizados con fines de inteligencia empresarial.
* **Modelado de datos complejo:** Permiten crear modelos de datos complejos para representar relaciones entre diferentes entidades.
* **Análisis dimensional:** Facilitan el análisis dimensional y OLAP para obtener información valiosa de los datos.
* **Ejemplos:** Google BigQuery, Amazon Redshift, Snowflake.

**Arquitecturas de Data Stores:**

La **arquitectura de un data store** define cómo se organizan y gestionan los datos dentro del sistema. Algunas arquitecturas comunes incluyen:

* **Arquitectura monolítica:** Todos los componentes del data store se encuentran en un solo servidor o conjunto de servidores.
* **Arquitectura distribuida:** Los componentes del data store se distribuyen en múltiples servidores para mejorar la escalabilidad y el rendimiento.
* **Arquitectura en la nube:** El data store se ejecuta en una plataforma de nube como Amazon Web Services (AWS), Microsoft Azure o Google Cloud Platform (GCP).
* **Arquitectura híbrida:** Combina elementos de las arquitecturas monolíticas, distribuidas y en la nube.

## Productos de almacenamiento de datos en GCP

**1. Almacenamiento de objetos:**

* **Cloud Storage:** Almacena grandes cantidades de datos no estructurados (archivos, imágenes, videos) de forma escalable y con alta disponibilidad. Ideal para backups, análisis de big data y almacenamiento web.

**2. Almacenamiento de bases de datos:**

* **Cloud SQL:** Bases de datos gestionadas MySQL, PostgreSQL y SQL Server totalmente compatibles. Ideal para aplicaciones web, bases de datos relacionales y cargas de trabajo SQL.
* **Cloud Spanner:** Base de datos SQL global y distribuida con escalabilidad horizontal, alta disponibilidad y fuerte consistencia. Ideal para aplicaciones críticas que requieren alto rendimiento y confiabilidad.
* **Firestore:** Base de datos de documentos NoSQL escalable y totalmente gestionada. Ideal para aplicaciones móviles, juegos y aplicaciones web que requieren flexibilidad y escalabilidad.

**3. Almacenamiento en caché:**

* **Cloud CDN:** Red global de servidores CDN que acelera la entrega de contenido web estático (imágenes, CSS, JavaScript). Ideal para mejorar el rendimiento de sitios web y aplicaciones web.
* **Memcached:** Caché en memoria totalmente gestionada que almacena datos clave-valor de acceso rápido. Ideal para almacenar datos frecuentemente accedidos y reducir la carga en bases de datos.
* **Redis:** Caché en memoria y base de datos NoSQL de alto rendimiento. Ideal para aplicaciones que requieren almacenamiento rápido y flexible (juegos, mensajería, análisis en tiempo real).

**4. Almacenamiento de datos:**

* **BigQuery:** Almacén de datos en la nube totalmente gestionado para analizar conjuntos de datos petabyte a escala. Ideal para análisis de big data, inteligencia empresarial y creación de informes.
* **Dataproc:** Servicio de procesamiento de datos basado en Apache Spark y Hadoop para ejecutar pipelines de datos batch y streaming en clusters escalables. Ideal para análisis de big data complejos y procesamiento en tiempo real.

**5. Recursos de sistemas de archivos por bloques:**

* **Persistent Disk:** Discos duros virtuales persistentes que se adjuntan a las VM de Compute Engine. Ideal para almacenar datos de SO, aplicaciones y datos de usuario de forma persistente.
* **Local SSD:** Unidades de estado sólido locales de alto rendimiento disponibles para VM de Compute Engine. Ideal para cargas de trabajo que requieren baja latencia y alto rendimiento de E/S.
* **Cloud Storage para NFS:** Montaje de buckets de Cloud Storage como sistemas de archivos NFS. Ideal para acceder a grandes conjuntos de datos en la nube desde aplicaciones que requieren acceso a nivel de sistema de archivos.

**6. Caché de memoria:**

* **Memorystore for Memcached:** Caché en memoria totalmente gestionado basado en Memcached. Ideal para almacenar datos clave-valor de acceso rápido y reducir la latencia de las aplicaciones.
* **Memorystore for Redis:** Caché en memoria y base de datos NoSQL totalmente gestionada basada en Redis. Ideal para aplicaciones que requieren almacenamiento rápido y flexible, como juegos, mensajería y análisis en tiempo real.

<p style="text-align: center"><a rel="license" href="http://creativecommons.org/licenses/by/4.0/"><img alt="Licencia Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by/4.0/80x15.png" /></a><br />Esta obra está bajo una <a rel="license" href="http://creativecommons.org/licenses/by/4.0/">Licencia Creative Commons Atribución 4.0 Internacional</a>.</p>
<p style="text-align: center">&copy; José Luis Chiquete Valdivieso. 2024.</p>