# 1 - Azure Blob Storage

<br>
<br>

<img src="https://raw.githubusercontent.com/Hack-io-AI/ai_images/main/azure.png" style="width:400px;"/>

<h1>Tabla de Contenidos<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#1---¿Qué-es-Azure-Blob?" data-toc-modified-id="1---¿Qué-es-Azure-Blob?-1">1 - ¿Qué es Azure Blob?</a></span></li><li><span><a href="#2---Primeros-pasos" data-toc-modified-id="2---Primeros-pasos-2">2 - Primeros pasos</a></span></li><li><span><a href="#3---CRUD" data-toc-modified-id="3---CRUD-3">3 - CRUD</a></span><ul class="toc-item"><li><span><a href="#3.1---Crear" data-toc-modified-id="3.1---Crear-3.1">3.1 - Crear</a></span></li><li><span><a href="#3.2---Leer" data-toc-modified-id="3.2---Leer-3.2">3.2 - Leer</a></span></li><li><span><a href="#3.3---Actualizar" data-toc-modified-id="3.3---Actualizar-3.3">3.3 - Actualizar</a></span></li><li><span><a href="#3.4---Borrar" data-toc-modified-id="3.4---Borrar-3.4">3.4 - Borrar</a></span></li></ul></li></ul></div>

## 1 - ¿Qué es Azure Blob?

Azure Blob Storage es un servicio de almacenamiento de objetos de Microsoft Azure que permite almacenar grandes cantidades de datos no estructurados, como imágenes, vídeos, documentos y cualquier tipo de archivo binario o texto. "Blob" es un acrónimo de Binary Large Object, que se refiere a datos que no tienen una estructura fija.

**Características principales de Azure Blob Storage**:

1. Tipos de blobs:

    + Block blobs: Están diseñados para almacenar datos de texto y archivos binarios grandes, como imágenes o vídeos. Son ideales para cargas y descargas eficientes.
    
    + Append blobs: Se utilizan para almacenar datos que necesitan ser añadidos de forma secuencial, como registros de logs.
    
    + Page blobs: Son ideales para escenarios de acceso aleatorio, como discos de máquinas virtuales.

<br>

2. Escalabilidad. Permite almacenar petabytes de datos y manejar millones de solicitudes por segundo para leer o escribir datos.

<br>

3. Acceso global. Los datos almacenados en Blob Storage pueden ser accedidos desde cualquier lugar a través de HTTP/HTTPS mediante URLs o integraciones con APIs.

<br>

4. Clases de acceso y almacenamiento:

    + Hot: Para datos a los que se accede frecuentemente.
    
    + Cool: Para datos a los que se accede de manera poco frecuente, pero que aún necesitan acceso rápido.
    
    + Archive: Para datos que se acceden rara vez y pueden tolerar tiempos de acceso mayores.

<br>

5. Seguridad. Cifrado de datos en reposo y en tránsito. Control de acceso granular mediante Azure Active Directory (AAD) y Shared Access Signatures (SAS).

<br>

6. Integración con otros servicios. Compatible con servicios de análisis, inteligencia artificial y aprendizaje automático de Azure, como Azure Data Factory, Azure Databricks y Azure Synapse Analytics.


<br>

**Casos de uso comunes**:

+ Almacenamiento de archivos estáticos: Ideal para sitios web, aplicaciones móviles o APIs.

+ Backup y restauración: Copias de seguridad y recuperación de datos.

+ Archivos multimedia: Almacenamiento de grandes volúmenes de contenido de vídeo, audio o imágenes.

+ Big Data: Recolección y almacenamiento de grandes volúmenes de datos para análisis.

+ Azure Blob Storage es una opción poderosa y versátil para cualquier aplicación que requiera un almacenamiento escalable y de alta disponibilidad para datos no estructurados.


<br>

Para usar Azure Blob en Python debemos ejecutar el siguiente comando:
```bash
pip install azure-storage-blob
```


## 2 - Primeros pasos

Lo primero que tenemos que hacer es crear una cuenta de Azure:

https://azure.microsoft.com/es-es/

<br>
<br>

<img src="https://raw.githubusercontent.com/Hack-io-AI/ai_images/main/azure1.png" style="width:600px;"/>

Desde tenemos que crear un nuevo disco de almacenamiento:

<br>
<br>

<img src="https://raw.githubusercontent.com/Hack-io-AI/ai_images/main/azure2.png" style="width:600px;"/>

Es posible que tengamos que dar acceso al usuario, aunque por defecto tenemos al administrador de la cuenta como usuario:

<br>
<br>

<img src="https://raw.githubusercontent.com/Hack-io-AI/ai_images/main/azure3.png" style="width:600px;"/>

En el apartado de `Seguridad y redes > Clave de acceso` tenemos la `cadena de conexión` que necesitamos para conectarnos al disco. Este string de conexión la guardamos en el archivo `.env` para usarla de manera segura en nuestro código:

<br>
<br>

<img src="https://raw.githubusercontent.com/Hack-io-AI/ai_images/main/azure4.png" style="width:600px;"/>

Podemos crear un contenedor de archivos y subir los archivos de manera manual a través de la propia interfaz de Azure, vamos a ver cómo hacerlo con Python.

## 3 - CRUD

Recordemos que CRUD representa las cuatro operaciones básicas que se pueden realizar en cualquier sistema de almacenamiento de datos. Estas operaciones son:

+ **Create (Crear)**: Agregar nuevos datos al sistema.

+ **Read (Leer)**: Recuperar o consultar datos existentes.

+ **Update (Actualizar)**: Modificar datos existentes.

+ **Delete (Eliminar)**: Borrar datos del sistema.

In [1]:
# primero importamos la string de conexión

import os                           # libreria del sistema operativo
from dotenv import load_dotenv      # carga variables de entorno 


load_dotenv()

AZURE_BLOB_STRING = os.getenv('AZURE_BLOB_STRING')

In [2]:
# importamos e iniciamos el cliente de conexión

from azure.storage.blob import BlobServiceClient


cliente = BlobServiceClient.from_connection_string(AZURE_BLOB_STRING)

In [3]:
# definimos el nombre del contenedor

CONTENEDOR = 'test'

### 3.1 - Crear

In [4]:
def create_blob(blob: str, data: str) -> None:
    """
    Función para crear un contenedor y subir un blob al contenedor.
    
    Params:
    blob: string con el nombre del blob
    data: string con los datos a escribir
    """
    
    global cliente, CONTENEDOR
    
    try:
        # cliente para el contenedor
        contenedor = cliente.get_container_client(CONTENEDOR)
        
        
        # crear el contenedor si no existe
        if not contenedor.exists():
            contenedor.create_container()
            print(f'Contenedor "{CONTENEDOR}" creado.')
            
            
        # subir el blob, si no existe lo crea, ademása si existe se sobreescribe
        cliente_blob = contenedor.get_blob_client(blob)
        
        cliente_blob.upload_blob(data, overwrite=True)
        
        print(f'Blob "{blob}" creado correctamente.')
    
    # si surge un error se hace el print
    except Exception as e:
        print(f'Error al crear el blob: {e}')

In [5]:
# nombre archivo y datos

nombre_blob = 'prueba.txt'

datos = 'Hola, este es un ejemplo de Azure Blob Storage.'

In [6]:
create_blob(nombre_blob, datos)

Blob "prueba.txt" creado correctamente.


También podemos subir un archivo que tengamos en local:

In [7]:
def upload_file_to_blob(blob: str, ruta: str) -> None:
    """
    Sube un archivo local a Azure Blob Storage.
    
    Params:
    blob: string con el nombre del blob, nombre del archivo en Azure
    ruta: string con la ruta al archivo que subimos
    """
    
    global cliente, CONTENEDOR
    
    
    try:
        # cliente para el contenedor
        contenedor = cliente.get_container_client(CONTENEDOR)

        # crear el contenedor si no existe
        if not contenedor.exists():
            contenedor.create_container()
            print(f'Contenedor "{CONTENEDOR}" creado.')
            

        # cliente para el blob
        cliente_blob = contenedor.get_blob_client(blob)

        # leer el archivo y subirlo al blob, sobreescribe si existe
        with open(ruta, 'rb') as f:
            cliente_blob.upload_blob(f, overwrite=True)
            
            print(f'Archivo "{ruta}" subido al blob "{blob}" en el contenedor "{CONTENEDOR}".')
    
    
    # si surge un error se hace el print
    except Exception as e:
        print(f'Error al subir el archivo al blob: {e}')


In [8]:
# nombre blob y ruta

nombre_blob = 'prueba2.txt'

ruta = 'prueba2.txt'

In [9]:
upload_file_to_blob(nombre_blob, ruta)

Archivo "prueba2.txt" subido al blob "prueba2.txt" en el contenedor "test".


### 3.2 - Leer

In [10]:
def read_blob(blob: str) -> str:
    """
    Leer el contenido de un blob.
    
    Params:
    blob: string con el nombre del blob, nombre del archivo en Azure
    
    Returns:
    string con el contenido del archivo txt (como ejemplo)
    """
    
    global cliente, CONTENEDOR
    
    
    try:
        # cliente del blob
        cliente_blob = cliente.get_blob_client(container=CONTENEDOR, blob=blob)
        
        # descargar contenido
        data = cliente_blob.download_blob().readall()

        return data.decode('utf-8')
    
    
    # si surge un error se hace el print
    except Exception as e:
        print(f'Error al leer el blob: {e}')
        
    

In [11]:
# test 1

read_blob('prueba.txt')

'Hola, este es un ejemplo de Azure Blob Storage.'

In [12]:
# test 2

read_blob('prueba2.txt')

'hola que tal?'

### 3.3 - Actualizar

In [13]:
def update_blob(blob: str, datos: str) -> None:
    """
    Actualizar el contenido de un blob, se sobrescribe con la función create_blob.
    
    Params:
    blob: string con el nombre del blob
    data: string con los datos a sobreescribir
    """
    
    global create_blob
    
    
    try:
        create_blob(blob, datos)
        print(f'Blob "{blob}" actualizado correctamente.')
        
        
    except Exception as e:
        print(f'Error al actualizar el blob: {e}')


In [14]:
# nombre archivo y datos

nombre_blob = 'prueba.txt'

datos = 'Ahora, este archivo ha sido actualizado en Azure.'

In [15]:
update_blob(nombre_blob, datos)

Blob "prueba.txt" creado correctamente.
Blob "prueba.txt" actualizado correctamente.


In [16]:
read_blob(nombre_blob)

'Ahora, este archivo ha sido actualizado en Azure.'

### 3.4 - Borrar

In [17]:
def delete_blob(blob: str) -> None:
    """
    Eliminar un blob del contenedor.
    
    Params:
    blob: string con el nombre del blob
    """
    
    global cliente, CONTENEDOR
    
    try:
        cliente_blob = cliente.get_blob_client(container=CONTENEDOR, blob=blob)
        cliente_blob.delete_blob()
        print(f'Blob "{blob}" eliminado correctamente.')
        
        
    except Exception as e:
        print(f'Error al eliminar el blob: {e}')

In [18]:
nombre_blob = 'prueba.txt'

delete_blob(nombre_blob)

Blob "prueba.txt" eliminado correctamente.
