[![cloudevel](img/cloudevel.png)](https://cloudevel.com)

# *Cloud Storage* y ```gsutil```.

* Es un servicio de almacenamiento de objetos seguro, escalable y de alto rendimiento dentro de la plataforma Google Cloud. 
* Está diseñado para almacenar y servir cualquier cantidad de datos, sin importar su formato (archivos, imágenes, videos, bases de datos, etc.).

**Características principales**

* **Durabilidad:** Google Cloud Storage garantiza una durabilidad del 99.999999999% de tus objetos, lo que significa una posibilidad extremadamente baja de perder los datos.
* **Escalabilidad:** Puedes almacenar cantidades prácticamente ilimitadas de datos y Cloud Storage se ajusta automáticamente
* **Rendimiento:** Está optimizado para ofrecer un acceso rápido y bajas latencias en la recuperación de tus objetos.
* **Seguridad:** Los datos se cifran tanto en reposo como en tránsito. Puedes controlar el acceso usando un sistema de permisos detallado.
* **Integración:** Funciona a la perfección con otros servicios de Google Cloud Platform para crear soluciones integrales.

**Casos de uso comunes**

* **Almacenamiento de archivos de respaldo:**  Guarda copias de seguridad para proteger tus datos importantes.
* **Servir contenido web:** Almacena imágenes, videos y demás elementos para tu sitio web o aplicación.
* **Big Data y análisis:** Puede usarse como base de lagos de datos (data lakes) para proyectos de inteligencia artificial y análisis a gran escala.
* **Archivo a largo plazo:** Su durabilidad y rentabilidad lo convierten en una buena opción para el almacenamiento de datos a los que no necesitas acceder con frecuencia.

* **Documentación oficial de Google Cloud Storage:** [https://cloud.google.com/storage](https://cloud.google.com/storage)

## El almacenamiento de objetos y los buckets en la nube

**El almacenamiento de objetos** es un modelo de almacenamiento en la nube que trata los datos como objetos individuales, no como parte de una jerarquía de carpetas y directorios. Cada objeto tiene un identificador único y metadatos asociados que describen el contenido. Los objetos se almacenan en grandes depósitos denominados "buckets".

**Características principales del almacenamiento de objetos:**

* **Escalabilidad:** Permite almacenar grandes cantidades de datos de forma eficiente y escalable.
* **Durabilidad:** Los datos se replican en varios servidores para garantizar su disponibilidad y resistencia a fallos.
* **Bajo costo:** Es generalmente más económico que el almacenamiento tradicional en disco.
* **Accesibilidad global:** Se puede acceder a los objetos desde cualquier lugar del mundo con una conexión a internet.
* **Simplicidad:** El modelo de almacenamiento es simple y fácil de usar.

**¿Qué son los buckets?**

Un **bucket** (o depósito) es un contenedor virtual que almacena objetos en el almacenamiento de objetos en la nube. Funciona como un repositorio central para almacenar y organizar tus datos.

**Características principales de los buckets:**

* **Jerarquía de nombres plana:** Los buckets no tienen una estructura jerárquica como las carpetas, sino que utilizan un sistema de nombres plano para organizar los objetos.
* **Metadatos:** Cada bucket puede tener metadatos asociados que describen el contenido del bucket, como su propietario o las políticas de acceso.
* **Seguridad:** Puedes controlar el acceso a los buckets y a los objetos mediante políticas de IAM (Identity and Access Management).

**Recursos adicionales:**

* [¿Qué es el almacenamiento de objetos? Casos de uso y beneficios - Google Cloud](https://cloud.google.com/learn/what-is-object-storage?hl=es-419)

https://cloud.google.com/storage/docs/how-to

### Carpetas.

https://cloud.google.com/storage/docs/folders

## Atributos.

## Clases de almacenamiento.

Para elegir la clase de almacenamiento adecuada, considera los siguientes factores:

* **Necesidades de acceso a datos:** ¿Con qué frecuencia se accede a los datos? ¿Necesitas baja latencia?
* **Ubicación de los usuarios:** ¿En qué regiones se encuentran tus usuarios?
* **Requisitos de durabilidad:** ¿Qué nivel de durabilidad necesitas para tus datos?
* **Presupuesto:** ¿Cuánto estás dispuesto a gastar en almacenamiento?

https://cloud.google.com/storage/docs/storage-classes

### Clases de almacenamiento de GCS por distribución geográfica

Google Cloud Storage (GCS) ofrece diferentes **clases de almacenamiento** que varían en términos de **replicación de datos, rendimiento y costo**. La elección de la clase adecuada depende de tus necesidades específicas de almacenamiento.

En cuanto a la **distribución geográfica**, GCS almacena los datos en **múltiples regiones** del mundo para mejorar la durabilidad, la disponibilidad y el rendimiento. Las regiones se agrupan en **zonas de disponibilidad**, que son instalaciones físicas ubicadas en la misma área geográfica.

**Clases de almacenamiento por distribución geográfica:**

**1. Regional:**

* **Replicación:** Los datos se replican en **tres zonas de disponibilidad** dentro de una región específica.
* **Rendimiento:** Ofrece alta disponibilidad y baja latencia para accesos locales.
* **Costo:** Es la opción más económica.
* **Ideal para:** Contenidos web, aplicaciones de baja latencia, análisis de datos y almacenamiento de respaldo.

**2. Multiregional:**

* **Replicación:** Los datos se replican en **múltiples regiones** dentro de la misma área geográfica (por ejemplo, Norteamérica).
* **Rendimiento:** Ofrece alta disponibilidad y buena latencia para accesos regionales.
* **Costo:** Mayor que el almacenamiento regional, pero sigue siendo rentable.
* **Ideal para:** Datos que necesitan estar disponibles en una región geográfica amplia, aplicaciones de misión crítica y cumplimiento de normativas regionales.

### Clases de almacenamiento de GCS por ciclo de vida

Además de la distribución geográfica, Google Cloud Storage (GCS) también ofrece diferentes **clases de almacenamiento** basadas en el **ciclo de vida** de los datos. Esto te permite optimizar los costos de almacenamiento en función de la frecuencia con la que se accede a los datos.

**Las clases de almacenamiento por ciclo de vida son:**

**1. Standard:**

* **Características:** Es la clase de almacenamiento predeterminada. Ofrece acceso de alta disponibilidad y baja latencia a los datos.
* **Costo:** Es la opción más costosa por GB almacenado.
* **Ideal para:** Datos a los que se accede con frecuencia, como aplicaciones web, contenido dinámico y bases de datos activas.

**2. Nearline:**

* **Características:** Diseñada para almacenar datos a los que se accede con poca frecuencia. Ofrece acceso de baja latencia dentro de la región, pero mayor latencia para accesos interregionales.
* **Costo:** Menor costo por GB almacenado que la clase Standard.
* **Ideal para:** Archivos de datos, como análisis de datos, copias de seguridad y contenido multimedia.

**3. Coldline:**

* **Características:** Diseñada para almacenar datos inactivos a los que se accede con muy poca frecuencia. Ofrece acceso de alta latencia (típicamente de varios milisegundos).
* **Costo:** El costo más bajo por GB almacenado.
* **Ideal para:** Archivos de datos inactivos, como copias de seguridad a largo plazo y datos de archivo.

**4. Archive:**

* **Características:** Similar a Coldline, pero con un acceso aún más lento y un costo aún más bajo. Los datos deben restaurarse antes de poder acceder a ellos.
* **Costo:** El costo más bajo por GB almacenado.
* **Ideal para:** Datos de archivo inactivos a los que se accede muy raramente, como datos legales, registros y copias de seguridad a largo plazo.

**Elegir la clase de almacenamiento adecuada por ciclo de vida:**

Para elegir la clase de almacenamiento adecuada por ciclo de vida, considera los siguientes factores:

* **Frecuencia de acceso:** ¿Con qué frecuencia se accede a los datos?
* **Necesidades de latencia:** ¿Qué nivel de latencia es aceptable para acceder a los datos?
* **Presupuesto:** ¿Cuánto estás dispuesto a gastar en almacenamiento?

**Recomendaciones generales:**

* **Almacena los datos a los que se accede con frecuencia en la clase Standard.**
* **Mueve los datos a los que se accede con poca frecuencia a Nearline o Coldline para reducir costos.**
* **Utiliza la clase Archive para datos inactivos a los que se accede muy raramente.**

**Recursos adicionales:**

* Documentación de GCS sobre clases de almacenamiento [https://cloud.google.com/storage/docs/storage-classes](https://cloud.google.com/storage/docs/storage-classes)
* Calculadora de precios de GCS [https://cloud.google.com/products/calculator](https://cloud.google.com/products/calculator)

## Versionamiento y reglas de ciclo de vida en GCS

**Versionamiento de objetos:**

El **versionamiento de objetos** en GCS te permite mantener un historial de cambios de los objetos almacenados en un bucket. Cada vez que se carga una nueva versión de un objeto, se crea una nueva versión con un identificador único. Esto te permite acceder a versiones anteriores del objeto si es necesario, incluso si la versión actual se ha eliminado o sobrescrito.

**Beneficios del versionamiento:**

* **Restauración de datos:** Permite restaurar un objeto a una versión anterior en caso de errores, corrupción de datos o cambios no deseados.
* **Auditoría y cumplimiento:** Facilita el seguimiento de los cambios realizados en los objetos y el cumplimiento de los requisitos de auditoría y retención de datos.
* **Experimentación:** Te permite experimentar con diferentes versiones de un objeto sin afectar la versión actual en producción.

**Habilitar el versionamiento:**

El versionamiento se habilita a nivel de bucket. Una vez habilitado, se aplica a todos los objetos nuevos que se carguen en el bucket. Los objetos existentes no se versionan automáticamente.

**Reglas de ciclo de vida:**

Las **reglas de ciclo de vida** en GCS te permiten automatizar la gestión del almacenamiento de objetos en función de su edad, acceso y otras condiciones. Puedes configurar reglas para realizar acciones como:

* **Eliminar versiones de objetos antiguas:** Elimina automáticamente las versiones de objetos que superan un cierto número de días, semanas o meses.
* **Archivar objetos a un almacenamiento de menor costo:** Mueve objetos inactivos a una clase de almacenamiento de menor costo, como Nearline o Coldline, para reducir costos.
* **Eliminar objetos inactivos:** Elimina permanentemente objetos que no se han accedido durante un período de tiempo específico.

**Beneficios de las reglas de ciclo de vida:**

* **Optimización de costos:** Reduce los costos de almacenamiento al eliminar o archivar objetos que ya no se necesitan.
* **Gestión automatizada:** Automatiza la gestión del ciclo de vida de los objetos, lo que te ahorra tiempo y esfuerzo.
* **Mejora la eficiencia del almacenamiento:** Libera espacio de almacenamiento para objetos nuevos y activos.

**Configurar reglas de ciclo de vida:**

Las reglas de ciclo de vida se configuran a nivel de bucket. Puedes crear varias reglas para aplicar diferentes acciones a diferentes tipos de objetos.

**Recursos adicionales:**

* Documentación de GCS sobre versionamiento de objetos: [https://cloud.google.com/storage/docs/object-versioning](https://cloud.google.com/storage/docs/object-versioning)
* Documentación de GCS sobre reglas de ciclo de vida: [https://cloud.google.com/storage/docs/lifecycle](https://cloud.google.com/storage/docs/lifecycle)

Espero que esta información te ayude a comprender el versionamiento y las reglas de ciclo de vida en GCS. Si tienes más preguntas, no dudes en contactarme.

## Tipos de control de acceso a buckets de GCS

Google Cloud Storage (GCS) ofrece dos mecanismos principales para controlar el acceso a los buckets:

**1. Listas de control de acceso (ACLs):**

* **Funcionamiento:** Las ACLs otorgan permisos a usuarios o grupos específicos para realizar acciones en un bucket o sus objetos.
* **Características:**
    * **Simples:** Fáciles de entender e implementar.
    * **Granulares:** Permiten controlar el acceso a nivel de objeto y bucket.
    * **Limitadas:** No escalan bien para buckets con muchos usuarios o grupos.

**2. Políticas de IAM (Identity and Access Management):**

* **Funcionamiento:** IAM es un sistema de control de acceso más robusto y escalable que utiliza roles y permisos para definir quién puede hacer qué en un bucket.
* **Características:**
    * **Escalables:** Adecuadas para buckets con muchos usuarios o grupos.
    * **Flexibles:** Permiten definir roles personalizados y granularmente.
    * **Integrables:** Se integran con otros servicios de Google Cloud Platform.

**Resumen de las diferencias:**

| Característica | ACLs | IAM |
|---|---|---|
| Simplicidad | Simples | Más complejas |
| Granularidad | Granular | Muy granular |
| Escalabilidad | Limitadas | Altamente escalables |
| Integraciones | No se integran con otros servicios de GCP | Se integran con otros servicios de GCP |

**¿Cuándo usar cada tipo?**

* **ACLs:** Recomendadas para buckets pequeños con un número limitado de usuarios o grupos que necesitan acceso granular.
* **IAM:** Recomendadas para buckets grandes o complejos con muchos usuarios o grupos, o cuando se necesita una mayor flexibilidad y escalabilidad.

**Recursos adicionales:**

* Documentación de GCS sobre IAM: [https://cloud.google.com/storage/docs/iam](https://cloud.google.com/storage/docs/iam)

**Recomendaciones adicionales:**

* **Principio de mínimo privilegio:** Otorga solo los permisos necesarios a cada usuario o grupo.
* **Auditar los accesos:** Revisa periódicamente los accesos a tus buckets para detectar posibles actividades no deseadas.
* **Utilizar IAM si es posible:** IAM es generalmente la mejor opción para controlar el acceso a buckets de GCS.

https://cloud.google.com/storage/docs/access-control

* ``` Storage Object Admin```.

## El comando ```gsutil```.

**Gsutil** es una herramienta de línea de comandos multiplataforma para interactuar con Google Cloud Storage (GCS). Te permite realizar diversas operaciones de administración de objetos y buckets, como:

**Creación y administración de buckets:**

* Crear, eliminar y listar buckets.
* Cambiar la configuración de buckets, como la ubicación de almacenamiento y las políticas de acceso.

**Subida y descarga de objetos:**

* Subir archivos locales a buckets de GCS.
* Descargar objetos de buckets de GCS a tu computadora local.
* Copiar objetos entre buckets de GCS.

**Administración de objetos:**

* Ver las propiedades de los objetos, como el tamaño, la fecha de creación y el tipo de contenido.
* Cambiar las propiedades de los objetos, como la clase de almacenamiento y las ACLs.
* Eliminar objetos.

**Otras operaciones:**

* Sincronizar directorios locales con buckets de GCS.
* Realizar búsquedas de texto completo en objetos.
* Compartir objetos con otros usuarios o grupos.

**Ventajas de usar gsutil:**

* **Facilidad de uso:** Gsutil tiene una sintaxis simple y fácil de aprender.
* **Potente:** Ofrece una amplia gama de funciones para administrar buckets y objetos.
* **Versátil:** Se puede usar en múltiples plataformas, incluyendo Windows, macOS y Linux.
* **Gratuito:** Es una herramienta de código abierto y gratuita.

**Casos de uso de gsutil:**

* **Administrar backups de datos:** Puedes usar gsutil para subir backups de tus archivos a GCS para una protección segura y confiable.
* **Alojar contenido web:** Puedes usar gsutil para almacenar y servir contenido web, como imágenes, videos y archivos HTML.
* **Analizar datos a gran escala:** Puedes usar gsutil para almacenar y procesar grandes conjuntos de datos en GCS.
* **Desarrollar aplicaciones en la nube:** Puedes usar gsutil para interactuar con GCS desde tus aplicaciones en la nube.

**En resumen, gsutil es una herramienta esencial para cualquier persona que use Google Cloud Storage. Es fácil de usar, potente y versátil, y te permite realizar una amplia gama de operaciones de administración de buckets y objetos.**

**Recursos adicionales:**

* **Documentación de Gsutil:** [https://cloud.google.com/storage/docs/gsutil](https://cloud.google.com/storage/docs/gsutil)
* **Tutoriales de Gsutil:** [https://cloud.google.com/storage/docs/tutorials](https://cloud.google.com/storage/docs/tutorials)
* **Referencia de la línea de comandos de Gsutil:** [se quitó una URL no válida]

Espero que esta información te ayude a comprender mejor qué es gsutil y cómo puedes usarlo para administrar tus datos en Google Cloud Storage. Si tienes más preguntas, no dudes en contactarme.


```
gsutil <subcomando> <ruta1> <ruta2> 
```


https://cloud.google.com/storage/docs/quickstart-gsutil

### Creación de un ```bucket```.

```
gsutil mb gs://<nombre>
```

**Nota:** Los nombre de los buckets son globales, por lo que es necesario utilizar nombre que no estén ocupados.

In [None]:
gsutil mb gs://tercera-generacion-jlcv-1

* El siguiiente *bucket* se creó durante la sesión del grupo de estudio y no es necesario crearlo.

In [None]:
gsutil mb gs://tercera-generacion-demo-sye

### Copiar desde y hacia un bucket.

```
gsutil cp <elemento local> gs://<bucket de destino>/
```

```
gsutil cp gs://<bucket de origen>/<elemento>  <directorio local>
```

```
gsutil cp gs://<bucket de origen>/<elemento>  gs://<bucket destino>/<elemento>
```

Opciones:


* ```-r``` permite realizar operaciones de copia de forma recursiva.

In [None]:
gsutil cp -r ~/Documentos/Pythonista/Disenos/logo_pythonista gs://tercera-generacion-demo-sye

In [None]:
gsutil cp gs://tercera-generacion-demo-sye/logo_pythonista/pythonista-logo.png gs://tercera-generacion-jlcv-1/

### Listado de elementos.

In [None]:
gsutil ls

In [None]:
gsutil ls gs://tercera-generacion-jlcv-1

In [None]:
gsutil ls gs://tercera-generacion*

In [None]:
gsutil ls gs://tercera-generacion-demo-sye/logo_pythonista

In [None]:
gsutil ls gs://tercera-generacion-demo-sye/logo_pythonista/*.png

### Mover elementos.

```
gsutil mv gs://<bucket de origen>/<objeto de origen> gs://<bucket de destino>/<objeto de destino>
```

In [None]:
gsutil ls gs://tercera-generacion-jlcv-1/

In [None]:
gsutil mv gs://tercera-generacion-jlcv-1/pythonista-logo.png gs://tercera-generacion-jlcv-1/logo.png

In [None]:
gsutil ls gs://tercera-generacion-jlcv-1/

### Eliminar elementos.

In [None]:
gsutil rm gs://tercera-generacion-jlcv-1/logo.png

In [None]:
gsutil ls gs://tercera-generacion-jlcv-1/

### Tamaño de un bucket.

In [None]:
gsutil du gs://tercera-generacion-demo-sye/

In [None]:
gsutil du -h gs://tercera-generacion-demo-sye/

### Gestión de prevención de acceso público.

Argumentos:

* ```get``` obtiene la información del objeto.
* ```set``` asigna la propiedad del objeto.

Posibles valores:

* ```unspecified```
* ```enforced```

In [None]:
gsutil pap get gs://tercera-generacion-jlcv-1/

In [None]:
gsutil pap set enforced gs://tercera-generacion-jlcv-1/

In [None]:
gsutil pap get gs://tercera-generacion-jlcv-1/

### Deifnición de la clase de almacenamiento.

* ```get``` obtiene la información del objeto.
* ```set``` asigna la propiedad indicada al objeto.
   * ```STANDARD```
   * ```NEARLINE```
   * ```COLDLINE```
   * ```ARCHIVE```

In [None]:
gsutil defstorageclass get gs://tercera-generacion-jlcv-1/

In [None]:
gsutil defstorageclass set NEARLINE gs://tercera-generacion-jlcv-1/

In [None]:
gsutil defstorageclass get gs://tercera-generacion-jlcv-1/

In [None]:
gsutil defstorageclass set STANDARD gs://tercera-generacion-jlcv-1/

### Sincronización.

In [None]:
gsutil -m rsync /home/josech/Documentos/Pythonista/Disenos/logo_pythonista gs://tercera-generacion-demo-sye/logo_pythonista

### Gestión del ciclo de vida de los buckets.

* ```get```
* ```set```

In [None]:
gsutil lifecycle get gs://tercera-generacion-jlcv-1/

### Despliegue del estado de un objeto.

In [None]:
gsutil stat gs://tercera-generacion-demo-sye/logo_pythonista/Saludos.txt

### Versionamiento.

* ```get```
* ```set```

In [None]:
gsutil versioning get gs://tercera-generacion-demo-sye/

### Gestión de identidad y acceso.

In [None]:
gsutil iam get gs://tercera-generacion-jlcv-1/

### Listas de control de acceso (*ACL*).

```
gsutil acl <subcomando>
```

* ```set```
* ```get```
* ```ch```

In [None]:
gsutil acl get gs://tercera-generacion-jlcv-1/

### *URLs* firmadas.

https://cloud.google.com/storage/docs/access-control/signed-urls

### Seguimiento de eventos.

<p style="text-align: center"><a rel="license" href="http://creativecommons.org/licenses/by/4.0/"><img alt="Licencia Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by/4.0/80x15.png" /></a><br />Esta obra está bajo una <a rel="license" href="http://creativecommons.org/licenses/by/4.0/">Licencia Creative Commons Atribución 4.0 Internacional</a>.</p>
<p style="text-align: center">&copy; José Luis Chiquete Valdivieso. 2021.</p>