In [9]:
#**Autor:** Félix Cárdenas  
#**Fecha de creación:** 2024-05-08  
#**Versión:** 1.0.0
### Descripción:
#Notebook para crear el bucket `raw` en MinIO, donde se almacenarán los archivos crudos del proyecto de datos odontológicos#


In [None]:
# Librerías estándar y externas
import os
from dotenv import load_dotenv
import boto3
from botocore.exceptions import ClientError

# Cargar variables desde .env
load_dotenv("/home/jovyan/.env")

# ----------------------------
# Parámetros de entorno
# ----------------------------
MINIO_ENDPOINT = os.getenv("MINIO_ENDPOINT")
MINIO_ACCESS_KEY = os.getenv("MINIO_ROOT_USER")
MINIO_SECRET_KEY = os.getenv("MINIO_ROOT_PASSWORD")

# Buckets desde el .env
BUCKET_RAW = os.getenv("MINIO_BUCKET_RAW")
BUCKET_REFINADO = os.getenv("MINIO_BUCKET_REFINADO")
BUCKET_CALIDAD = os.getenv("MINIO_BUCKET_CALIDAD")
BUCKET_EXPORTACION = os.getenv("MINIO_BUCKET_EXPORTACION")


MINIO_ENDPOINT: http://minio:9000
BUCKET_RAW: raw
BUCKET_REFINADO: refinado
BUCKET_CALIDAD: calidad
BUCKET_EXPORTACION: exportacion


In [None]:
# ----------------------------
# Función genérica para crear un bucket
# ----------------------------
def crear_bucket(bucket_name: str) -> None:
    """
    Crea un bucket en MinIO si no existe.
    """
    s3 = boto3.client(
        "s3",
        endpoint_url=MINIO_ENDPOINT,
        aws_access_key_id=MINIO_ACCESS_KEY,
        aws_secret_access_key=MINIO_SECRET_KEY
    )

    try:
        s3.head_bucket(Bucket=bucket_name)
        print(f"✅ El bucket '{bucket_name}' ya existe.")
    except ClientError as e:
        error_code = int(e.response["Error"]["Code"])
        if error_code == 404:
            s3.create_bucket(Bucket=bucket_name)
            print(f"🆕 Bucket '{bucket_name}' creado.")
        else:
            print(f"Error al verificar o crear bucket '{bucket_name}': {e}")



In [20]:
# ----------------------------
# Función para crear todos los buckets
# ----------------------------
def crear_buckets_requeridos() -> None:
    """
    Crea todos los buckets definidos en las variables de entorno.
    """
    buckets = [BUCKET_RAW, BUCKET_REFINADO, BUCKET_CALIDAD, BUCKET_EXPORTACION]

    for bucket in buckets:
        if bucket:
            crear_bucket(bucket)
        else:
            print("⚠️ Variable de entorno de bucket no definida.")

In [22]:
#Ejecución
crear_buckets_requeridos()

✅ El bucket 'raw' ya existe.
✅ El bucket 'refinado' ya existe.
✅ El bucket 'calidad' ya existe.
✅ El bucket 'exportacion' ya existe.
