# Interactuando con el almacenamiento de objetos de Amazon S3


En este laboratorio, trabajarás con el Almacenamiento de Objetos de AWS y Amazon S3. Crearás un bucket S3, consultarás datos del bucket y trabajarás con versionado de objetos en S3. Cargarás en el bucket S3 datos estructurados de un archivo CSV, datos semiestructurados de un archivo JSON y datos no estructurados de un archivo de imagen. También interactuarás con el bucket S3 a través de la consola de administración de AWS y programáticamente utilizando `boto3` (el Kit de Desarrollo de Software (SDK) de AWS para Python).

*Nota*: El laboratorio contiene enlaces a recursos externos. Siempre puedes echar un vistazo a estos recursos durante la sesión de laboratorio, pero no se espera que abras y leas cada enlace durante la sesión de laboratorio. Si deseas profundizar en tu comprensión, puedes revisar los recursos enlazados después de que hayas terminado con el laboratorio.

Para abrir el cuaderno de soluciones, sigue estos pasos:
- Ve al menú principal y selecciona `Archivo -> Preferencias -> Configuración`.
- Haz clic en `Editor de Texto` a la izquierda, luego desplázate hacia abajo hasta la sección `Excluir archivos`.
- Elimina la línea `**/C2_W1_Lab_3_S3_Solution.ipynb`. El archivo ahora aparecerá en el explorador.
- Puedes cerrar la pestaña `Configuración`.


# Tabla de Contenidos
- [ 1 - Importar Paquetes](#1)
- [ 2 - Explorar el Conjunto de Datos](#2)
- [ 3 - Crear un Bucket de S3](#3)
  - [ Ejercicio 1](#ex01)
- [ 4 - Subir y Consultar Datos](#4)
  - [ 4.1 - Datos Estructurados](#4-1)
  - [ 4.2 - Datos Semiestructurados](#4-2)
    - [ Ejercicio 2](#ex02)
    - [ Ejercicio 3](#ex03)
  - [ 4.3 - Datos No Estructurados](#4-3)
    - [ Ejercicio 4](#ex04)
- [ 5 - Eliminar el Bucket](#5)


<a id='1'></a>
## 1 - Importar paquetes

Importemos los paquetes requeridos para este laboratorio.


In [1]:
import boto3
import json
import subprocess

from typing import Any, Dict
from IPython.display import HTML

<a id='2'></a>
## 2 - Explorar el conjunto de datos


En este laboratorio, se te proporcionan tres archivos de datos que puedes encontrar en la carpeta `data`. Aquí está la estructura de la carpeta `data`:

```bash
.
└── data/
    ├── csv/
         └── ratings_ml_training_dataset.csv
    ├── images/
    |    ├── v1/
    |    |    └── AWS-Logo.png
    |    └── v2/ 
    |    |    └── AWS-Logo.png
    └── json/
         └── delivery-stream-one-record.json
```


Puedes ver que hay tres subcarpetas (csv, imágenes y json). Cada subcarpeta contiene un formato de datos diferente:
- la subcarpeta csv contiene datos estructurados, almacenados en un archivo `.csv`. Estos datos consisten en el conjunto de datos de entrenamiento que se utilizó en el laboratorio de la Semana 4 del Curso 1 para entrenar el modelo del sistema de recomendación;
- la subcarpeta json contiene datos semiestructurados almacenados en un archivo `.json`;
- la subcarpeta de imágenes contiene datos no estructurados, que consisten en dos versiones del logotipo de AWS.

Subirás estos diferentes tipos de datos a un bucket de S3 que crearás en este laboratorio. Aquí tienes un resumen rápido de la terminología de almacenamiento de objetos de AWS:
- Un [bucket](https://docs.aws.amazon.com/AmazonS3/latest/userguide/UsingBucket.html) es un contenedor para objetos almacenados en Amazon S3.
- Un objeto es un archivo y cualquier metadato que describa ese archivo. Tiene un identificador único, también conocido como clave del objeto.
El almacenamiento de objetos permite el almacenamiento de cualquier objeto; puedes almacenar no solo datos estructurados, sino también datos no estructurados y semiestructurados.

Para cargar tus datos en Amazon S3, primero necesitas crear un bucket de S3 en una de las regiones de AWS. Y esto es lo que vas a hacer programáticamente en el próximo ejercicio. Pero antes de eso, verifica que no haya buckets de S3 en tu cuenta. Ejecuta el siguiente código para obtener la URL a la consola de AWS.


*Nota*: Por razones de seguridad, la URL para acceder a la consola de AWS caducará cada 15 minutos, pero cualquier recurso de AWS que hayas creado seguirá estando disponible durante el período de 2 horas. Si necesitas acceder a la consola después de 15 minutos, vuelve a ejecutar esta celda de código para obtener un nuevo enlace activo.


In [None]:
with open('../.aws/aws_console_url', 'r') as file:
    aws_url = file.read().strip()

HTML(f'<a href="{aws_url}" target="_blank">GO TO AWS CONSOLE</a>')

Ahora haz clic en el enlace de arriba para acceder a la consola de AWS y buscar **S3**. Deberías ver que aún no se han creado buckets en tu cuenta.

*Nota:* Si ves la ventana como en la siguiente captura de pantalla, haz clic en el enlace **logout**, cierra la ventana y vuelve a hacer clic en el enlace de la consola.

![AWSLogout](images/AWSLogout.png)


<a id='3'></a>
## 3 - Crear un Bucket de S3


<a id='ex01'></a>
### Ejercicio 1

Para crear un bucket S3, necesitas especificar el nombre del bucket y la región para tu bucket. En este laboratorio, la región está configurada en `us-east-1`. En cuanto al nombre del bucket, los nombres de los buckets deben ser globalmente únicos para evitar colisiones con buckets que otros estudiantes podrían estar creando o trabajando al mismo tiempo. Para garantizar la singularidad del nombre del bucket, utilizarás el ID de cuenta de AWS de Vocareum para incluirlo en el nombre del bucket.


In [5]:
# AWS_ACCOUNT_ID = subprocess.run(['aws', 'sts', 'get-caller-identity', '--query', 'Account', '--output', 'text'], capture_output=True, text=True).stdout.strip()
# BUCKET_NAME = f'de-c2w1lab3-{AWS_ACCOUNT_ID}'
AWS_DEFAULT_REGION = 'us-east-1'

Para crear el bucket programáticamente en Python usando boto3, puedes utilizar el método `S3` [`create_bucket()`](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/s3/client/create_bucket.html) que requiere un objeto Cliente (como se explica en el laboratorio de DynamoDB).

La siguiente función `create_s3_bucket()` consiste en los pasos necesarios para crear el bucket S3 (instanciando un objeto Cliente y luego llamando al método `create_bucket()`). La función recibe como entrada el nombre del bucket y la región.


In [2]:
def create_s3_bucket(bucket_name:str , region: str):
    
    # Create an S3 client
    s3_client = boto3.client('s3', region_name=region)

    # Create the S3 bucket
    try:
        s3_client.create_bucket(Bucket=bucket_name)
        print(f"S3 bucket '{bucket_name}' created successfully in region '{region}'.")
    except Exception as e:
        print(f"An error occurred: {e}")

In [6]:
BUCKET_NAME = 'de-emi-181325975426'  # Replace with your actual bucket name

In [16]:
s3_client = boto3.client('s3', region_name=AWS_DEFAULT_REGION,
                         endpoint_url='https://s3.amazonaws.com',  # 🔹 Cualquier valor
aws_access_key_id="ASIASUN66Z6BP4ADEOOX",       # 🔹 Cualquier valor
aws_secret_access_key="72JmcA1oOMCiptSbJk+2wIragWFBLRjoZV3ZPeZ"  # 🔹 Cualquier valor
)


In [17]:
session = boto3.Session()
credentials = session.get_credentials()
print(credentials.access_key)
print(credentials.secret_key)

AttributeError: 'NoneType' object has no attribute 'access_key'

In [18]:
s3_client.create_bucket(Bucket=BUCKET_NAME)

ClientError: An error occurred (InvalidAccessKeyId) when calling the CreateBucket operation: The AWS Access Key Id you provided does not exist in our records.

In [9]:
create_s3_bucket(bucket_name=BUCKET_NAME, region=AWS_DEFAULT_REGION)

An error occurred: Unable to locate credentials


Puedes verificar que el bucket ha sido creado utilizando la herramienta `aws cli`. Para listar los buckets creados en tu cuenta, puedes usar el siguiente comando:
`aws s3 ls`

Puedes ejecutar el comando en la terminal o puedes ejecutarlo en este cuaderno pero necesitas agregar un signo de exclamación `!` al principio del comando. Esto te permite ejecutar comandos de shell en una celda de código.


In [None]:
!aws s3 ls

Para enumerar los objetos almacenados dentro de un bucket, puedes usar el comando `aws s3 ls <nombre-de-tu-bucket>`. Si ejecutas este comando ahora, no se mostrará ningún resultado ya que el bucket todavía está vacío.


In [None]:
!aws s3 ls $BUCKET_NAME

También puedes inspeccionar el bucket S3 en la Consola de AWS. Busca **S3**. Verás el bucket con el nombre que proporcionaste. Puedes verificar que el bucket está vacío simplemente haciendo clic en él.


<a id='4'></a>
## 4 - Subir y Consultar Datos


<a id='4-1'></a>
### 4.1 - Datos Estructurados

En esta sección del laboratorio, subirás datos estructurados al bucket S3 y luego los consultarás.

**Subir el archivo CSV**

Primero verifica el archivo `data/csv/ratings_ml_training_dataset.csv`. Cada fila en este conjunto de datos consiste en los detalles de un producto que fue comprado por un usuario dado. La fila también contiene los detalles del usuario y qué calificaciones proporcionaron a ese producto (el mismo conjunto de datos que se utilizó en el laboratorio de la Semana 4 del Curso 1 para entrenar el sistema de recomendación). Aquí está la estructura de esta tabla:

![schema_after_ETL](images/schema_after_ETL.png "Conjunto de datos de calificaciones")

Para subir este archivo CSV al bucket de forma programática, puedes usar el método S3 [upload_file()](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/s3/client/upload_file.html). Este método espera tres argumentos: la ruta del archivo fuente que deseas subir (Filename), el nombre del bucket al que deseas subir (Bucket) y la clave u nombre del objeto (Key). El último argumento especifica cómo deseas etiquetar el objeto o archivo subido dentro del bucket, este nombre debe identificar de forma única el objeto subido.

La siguiente función `upload_file_to_s3()` consiste en los pasos necesarios para subir el archivo al bucket de S3 (instanciando un objeto Cliente y luego llamando al método `upload_file()`). La función toma como entrada la ruta al archivo local a subir, el nombre del bucket y la clave del objeto.


In [None]:
def upload_file_to_s3(local_file_path: str, bucket_name: str, object_key: str) -> None:
    """Uploads a local file to S3 using boto3

    Args:
        local_file_path (str): Local file path
        BUCKET_NAME (str): Bucket name
        object_key (str): the key name, which should uniquely identifies the uploaded object in the bucket
    """
    # Create an S3 client
    s3_client = boto3.client('s3')

    # Upload the file to S3
    try:
        s3_client.upload_file(local_file_path, bucket_name, object_key)
        print(f"File {local_file_path} uploaded to s3://{bucket_name}/{object_key} successfully.")
    except Exception as e:
        print(f"Error uploading file to S3: {e}")

In [None]:
# Define the local file path, and object key
local_file_path = 'data/csv/ratings_ml_training_dataset.csv'
object_key = 'csv/ratings_ml_training_dataset.csv'

# Upload the file to S3
upload_file_to_s3(local_file_path, BUCKET_NAME, object_key)

Puedes verificar que el archivo está en el bucket ya sea revisando el contenido a través de la consola de AWS o programáticamente también utilizando `boto3` o incluso el `aws cli`. Ve a la consola de AWS y verifica que hay una nueva carpeta en tu bucket que contiene el archivo csv que acabas de subir.

*Nota*: recuerda de la clase que el almacenamiento de objetos tiene una estructura plana. Cuando utilizas el delimitador `/` en el nombre del objeto o clave, como en este ejemplo: `object_key = 'csv/ratings_ml_training_dataset.csv'`, estás incluyendo un prefijo de nombre de clave que es utilizado por S3 para agrupar objetos dentro del bucket. La consola utiliza el término `carpeta` porque este agrupamiento de objetos puede ser análogo a una carpeta en un sistema de archivos regular. Puedes aprender más sobre las claves de objetos [aquí](https://docs.aws.amazon.com/AmazonS3/latest/userguide/object-keys.html).

Si ejecutas el siguiente comando ya sea en la terminal o en la celda del notebook, también puedes verificar que el archivo que subiste está allí. Recuerda que si lo ejecutas en una terminal, debes omitir el signo de exclamación al principio.


In [None]:
!aws s3 ls $BUCKET_NAME/csv/

**Consultar los datos**

Puede consultar los datos de sus archivos csv utilizando AWS Athena. Esto es algo que ha hecho en laboratorios anteriores como en la Tarea C1W2 y seguirá haciéndolo en futuros laboratorios. En general, AWS Athena permite consultar datos en diferentes formatos, como parquet, tsv, csv, etc. Como seguirá consultando datos con Athena en futuros laboratorios, para este laboratorio en particular solo se le dirigirá a alguna documentación que puede leer para tener algunas ideas al respecto:

- [Consulta de datos desde la consola de AWS](https://builtin.com/articles/aws-architecture-athena-query-csv-table-stored-s3)
- [Consulta de datos desde múltiples fuentes en el foro de AWS](https://repost.aws/questions/QUeZq3d77YQ8-9EPtDDBe6RQ/query-data-from-multiple-sources-in-s3-on-athena)
- [Uso de delimitadores en la documentación de AWS](https://docs.aws.amazon.com/athena/latest/ug/lazy-simple-serde.html)


<a id='4-2'></a>
### 4.2 - Datos Semiestructurados

Ahora trabajarás con datos semiestructurados, en particular con un archivo JSON. Subirás el archivo ubicado en `data/json/delivery-stream-one-record.json`. Este archivo consiste en los datos obtenidos a partir de las transformaciones realizadas a los datos de transmisión en el laboratorio de la Semana 4 del Curso 1. Puedes abrirlo para verificar su estructura.


<a id='ex02'></a>
### Ejercicio 2

Completa el código a continuación para cargar el archivo ubicado en `data/json/delivery-stream-one-record.json` al bucket de S3 utilizando la misma función utilizada para el archivo CSV anterior. Pero ahora en el bucket de S3, apunta a una nueva carpeta `json`, dando el mismo nombre al archivo (es decir, la clave del objeto debería comenzar con "json")


In [None]:
### START CODE HERE ### (~ 3 lines of code)
# Define the local file path, and S3 key
local_file_path_json = 'data/json/delivery-stream-one-record.json' # @REPLACE EQUALS None
object_key_json = 'json/delivery-stream-one-record.json' # @REPLACE EQUALS None

# Upload the file to S3
upload_file_to_s3(local_file_path_json, BUCKET_NAME, object_key_json) # @REPLACE upload_file_to_s3(None, None, None)
### END CODE HERE ###

<a id='ex03'></a>
### Ejercicio 3

Verifique nuevamente que el archivo haya sido cargado utilizando la herramienta `aws cli`. Complete el comando apuntando a la carpeta correspondiente donde se ha cargado el archivo JSON.


In [None]:
### START CODE HERE ### (~ 1 line of code)
!aws s3 ls $BUCKET_NAME/json/ # @REPLACE !aws None None None/None/
### END CODE HERE ###

También puedes verificar visualmente en la consola de AWS que el archivo JSON se ha creado en el bucket. Ahora, en lugar de consultar el archivo JSON, lo descargarás utilizando el método `S3` [download_file()](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/s3/client/download_file.html), que se llama en la siguiente función proporcionada.


In [None]:
def download_object_from_s3(bucket_name: str, object_key: str, local_file_path: str) -> None:
    """Downloads object from S3 using boto3

    Args:
        bucket_name (str): Bucket name
        object_key (str): Object key in S3.
        local_file_path (str): Path in the local file system to put the downloaded object.
    """
    # Create an S3 client
    s3_client = boto3.client('s3')
    
    try:
        # Download the file to a local directory
        s3_client.download_file(bucket_name, object_key, local_file_path)
    except Exception as e:
        print(f"Error downloading or printing JSON file: {e}")


Ejecuta la siguiente celda para crear una carpeta `downloads` en tu sistema de archivos local, y luego llama a la función `download_object_from_s3` para descargar el archivo JSON desde tu bucket de S3.


In [None]:
!mkdir 'downloads'
local_file_path = './downloads/delivery-stream-one-record.json'

download_object_from_s3(bucket_name=BUCKET_NAME, object_key=object_key_json, local_file_path=local_file_path)

Una vez que el archivo haya sido descargado, puedes leer su contenido desde el sistema de archivos local:


In [None]:
with open(local_file_path, 'r') as file:    
    json_content = json.loads(file.read())
    print(json_content)

Ahora puedes trabajar con este objeto en particular si necesitas hacer alguna transformación.


<a id='4-3'></a>
### 4.3 - Datos no Estructurados

Finalmente, trabajarás con datos no estructurados. Subirás una imagen al bucket y, esta vez, la descargarás desde un navegador (para mostrarte las diversas formas en que puedes descargar objetos de un bucket de S3). Por defecto, un bucket de S3 y sus objetos son privados. Para poder descargar objetos de S3 desde un navegador, tendrás que realizar algunas modificaciones en el bucket para hacer que algunos de sus objetos estén disponibles para lectura pública.

Primero, necesitas configurar el bucket para aceptar políticas públicas y Listas de Control de Acceso (ACL) públicas. Para hacerlo, utilizarás el método `S3 put_public_access_block`. Para entender qué espera este método como argumentos, consulta la siguiente [documentación](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/s3/client/put_public_access_block.html).

Ejecuta las siguientes dos celdas para cambiar la configuración de acceso del bucket de S3.


In [None]:
def s3_public_access_setup(bucket_name: str, public_access_block_configuration: Dict[str, Any]) -> None:
    """Sets public access configuration for S3 bucket

    Args:
        bucket_name (str): Bucket name
        public_access_block_configuration (Dict[str, Any]): Configuration for public access
    """
    
    s3_client = boto3.client('s3')
    
    # Update the bucket's public access settings
    s3_client.put_public_access_block(
        Bucket=bucket_name,
        PublicAccessBlockConfiguration=public_access_block_configuration
    )

In [None]:
# Define the public access settings  
public_access_configuration = {
    'BlockPublicAcls': False,
    'IgnorePublicAcls': False,
    'BlockPublicPolicy': False,
    'RestrictPublicBuckets': False
}

s3_public_access_setup(bucket_name=BUCKET_NAME, 
                       public_access_block_configuration=public_access_configuration)

Acabas de modificar el bucket para que ahora acepte reglas de acceso público a sus objetos. Ahora adjuntarás una política al bucket para permitir que cualquier persona en Internet tenga acceso de lectura a los objetos cuya clave comience con `images/`. ("Una política es un objeto en AWS que, cuando se asocia con una identidad o recurso, define sus permisos", [referencia](https://docs.aws.amazon.com/IAM/latest/UserGuide/introduction_access-management.html). Aprenderás más sobre las políticas en la siguiente lección o puedes consultar la documentación [aquí](https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies.html)).

Para adjuntar la política mencionada al bucket de S3, utilizarás el método `put_bucket_policy()` de `S3`, definirás los detalles de la política y pasarás la política a `S3 put_bucket_policy()`. Ejecuta las siguientes tres celdas para adjuntar la política adecuada al bucket de S3.


In [None]:
def s3_put_bucket_policy(bucket_name: str, policy: Dict[str, Any]) -> None:
    """Allows to put bucket policies

    Args:
        bucket_name (str): Bucket name
        policy (Dict[str, Any]): Bucket policy
    """
    
    s3_client = boto3.client('s3')
    response = s3_client.put_bucket_policy(Bucket=bucket_name, Policy=json.dumps(policy))
    return response

In [None]:
policy = { 
    "Version": "2012-10-17", 
    "Statement": [
        {
            "Effect": "Allow",
            "Principal": "*",
            "Action": "s3:GetObject",
            "Resource": f"arn:aws:s3:::{BUCKET_NAME}/images/*"
        }
    ]
}


Esta política permite que cualquier persona (`"Principal": "*"`) utilice el método `S3 GetObject` en `{BUCKET_NAME}/images/`, es decir, para recuperar objetos almacenados en su cubo S3 y cuyo clave/nombre comienza con `images/`. Puede obtener más información sobre dicha política [aquí](https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies.html#access_policies-json).


In [None]:
response = s3_put_bucket_policy(bucket_name=BUCKET_NAME, policy=policy) 
print(response)

<a id='ex04'></a>
### Ejercicio 4

Ahora, vamos a subir la imagen ubicada en `data/images/v1/`.


In [None]:
local_file_path_image_v1 = 'data/images/v1/AWS-Logo.png'
object_key_image = 'images/AWS-Logo.png'

upload_file_to_s3(local_file_path_image_v1, BUCKET_NAME, object_key_image)

Verifique que la imagen haya sido cargada. Complete el comando a continuación. Recuerde apuntar a la carpeta correcta en S3 para listar solo el archivo que acaba de cargar.


In [None]:
### START CODE HERE ### (~ 1 line of code)
!aws s3 ls $BUCKET_NAME/images/ # @REPLACE !aws None None None/None/
### END CODE HERE ###

Ve al panel de control de AWS y busca **S3**. En tu bucket, haz clic en imágenes y luego en el nombre de la imagen que acabas de subir. Verás una opción llamada `URL del objeto`. Si la copias y la pegas en una nueva pestaña del navegador, deberías poder descargar el archivo.

<img src="images/object_url.png" width="500">


Veamos cómo funciona la versión de cubo. Primero necesitas habilitar esta función en tu cubo llamando al método `S3` [put_bucket_versioning()](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/s3/client/put_bucket_versioning.html) y activando la versión.


In [None]:
def configure_bucket_versioning(bucket_name: str, versioning_config: Dict[str, str]) -> Dict[Any, Any]:
    
    s3_client = boto3.client('s3')

    # Enable bucket versioning
    response = s3_client.put_bucket_versioning(
        Bucket=bucket_name,
        VersioningConfiguration=versioning_config
    )

    return response


In [None]:
versioning_config = {'Status': 'Enabled'}

response = configure_bucket_versioning(bucket_name=BUCKET_NAME, 
                                       versioning_config=versioning_config)
print(response)

Ahora vamos a subir la segunda versión del logo de AWS ubicado en `data/images/v2/AWS-Logo.png` y usar la misma clave u nombre de objeto que usaste para la imagen anterior:


In [None]:
local_file_path_image_v2 = 'data/images/v2/AWS-Logo.png'
object_key_image = 'images/AWS-Logo.png'

upload_file_to_s3(local_file_path_image_v2, BUCKET_NAME, object_key_image)

Hasta ahora, has enumerado el contenido del bucket utilizando la herramienta `aws cli`. También puedes enumerar el contenido en Python utilizando `S3` [list_objects_v2()](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/s3/client/list_objects_v2.html).


In [None]:
def list_objects_in_folder(bucket_name: str, prefix_key: str):
    # Create an S3 client
    s3_client = boto3.client('s3')

    # Use list_objects_v2 to list objects in the specified folder
    response = s3_client.list_objects_v2(
        Bucket=bucket_name,
        Prefix=prefix_key
    )

    # Check if objects were found
    if 'Contents' in response:
        # Print each object's key
        print("Objects with a key that starts with '{}':".format(prefix_key))
        for obj in response['Contents']:
            print(obj['Key'])
    else:
        print("No objects found in folder '{}'.".format(prefix_key))

In [None]:
list_objects_in_folder(bucket_name=BUCKET_NAME, prefix_key='images')

Este método solo muestra los archivos cuya clave comienza con un prefijo particular, pero no puedes ver nada acerca de sus versiones. Para eso, usemos el método [`S3 list_object_versions()`](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/s3/client/list_object_versions.html) en su lugar.


In [None]:
def list_object_versions(bucket_name: str, prefix_key: str) -> None:
    # Create an S3 client
    s3_client = boto3.client('s3')

    # List object versions
    response = s3_client.list_object_versions(Bucket=bucket_name, Prefix=prefix_key)

    # Process the response to get object versions
    for version in response.get('Versions', []):
        print("Object Key:", version['Key'])
        print("Object Version Id:", version['VersionId'])
        print("Is Latest:", version['IsLatest'])
        print("Last Modified:", version['LastModified'])
        print()

list_object_versions(bucket_name=BUCKET_NAME, prefix_key='images/')

Ahora, regresa al bucket de S3 en la consola de AWS y busca el archivo que acabas de subir. Obtén su URL de objeto para descargar la nueva versión del archivo.


<a id='5'></a>
## 5 - Eliminar el Bucket

Para eliminar el bucket, es necesario asegurarse de que esté vacío antes del proceso de eliminación. Y para eso, hay dos métodos que puedes utilizar: `S3` [delete_object()](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/s3/client/delete_object.html) y `S3` [delete_bucket()](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/s3/client/delete_bucket.html).

En la siguiente celda, se proporciona una función que hace uso de `S3 delete_object()` y `S3 delete_bucket()`. Esta función toma como entrada el parámetro booleano `delete_objects`; este parámetro booleano se utiliza para indicar si el bucket está vacío o no. Si el bucket contiene objetos, entonces la función primero elimina los objetos y luego el bucket. De lo contrario, la función elimina directamente el bucket. Ten en cuenta que debes eliminar todas las versiones de los objetos. La eliminación de versiones es necesaria solo si has habilitado el control de versiones del bucket. Además, la función también elimina los marcadores de eliminación. Estos son marcadores de posición que se crean después de eliminar objetos en un bucket habilitado para versiones. Puedes obtener más información sobre ellos [aquí](https://www.learnaws.org/2022/10/04/aws-s3-delete-marker/#what-is-an-aws-s3-delete-marker).

**Nota:** Es importante tener en cuenta que cuando estás trabajando con buckets de S3 en entornos reales y de producción, NO DEBES eliminarlos ni eliminar los objetos dentro de ellos a menos que estés completamente seguro de lo que estás haciendo. Asegúrate de que el bucket/objetos ya no sean utilizados por ningún proceso aguas arriba o aguas abajo. Esto es algo que debes hacer con precaución y después de hablar con los propietarios del bucket/objeto, las partes interesadas y otros propietarios de procesos que puedan depender de la información alojada en ese bucket.


In [None]:
def s3_delete_bucket(bucket_name: str, delete_objects: bool) -> Dict[Any, Any]:
    s3_client = boto3.client('s3')
    
    if delete_objects:
        # List all versions of all objects in the bucket
        response = s3_client.list_object_versions(Bucket=bucket_name)
        
        # Delete all object versions
        for version in response.get('Versions', []):
            key = version['Key']
            version_id = version['VersionId']
            s3_client.delete_object(Bucket=bucket_name, Key=key, VersionId=version_id)
        
        # Delete all delete markers
        for delete_marker in response.get('DeleteMarkers', []):
            key = delete_marker['Key']
            version_id = delete_marker['VersionId']
            s3_client.delete_object(Bucket=bucket_name, Key=key, VersionId=version_id)        
    
    # Delete the bucket
    response = s3_client.delete_bucket(
        Bucket=bucket_name
    )

    return response

response = s3_delete_bucket(bucket_name=BUCKET_NAME, delete_objects=True)
print(response)

Finalmente, verifica que el bucket ya no existe.


In [None]:
!aws s3 ls

¡Bien hecho! Aprendiste cómo trabajar con Amazon S3, como por ejemplo cómo crear buckets de S3, subir archivos a buckets de S3 y entender algunas de sus características como la versión.
