In [1]:
from pymongo import MongoClient, ASCENDING
import random
from pymongo.errors import DuplicateKeyError, BulkWriteError #Para manejar errores de duplicidad y de operación de escritura masiva
from datetime import datetime, timedelta

client = MongoClient("mongodb://admin:admin123@mongo:27017/")
db = client["data"]

In [2]:
colections_clean = [
    "usuarios", 
    "destinos", 
    "hoteles", 
    "reservas"
]

# Se verifica que la conexión 'db' exista antes de proceder
if 'db' in locals() and db is not None:
    for n in colections_clean:
        try:
            collection = db[n]
            # Usamos count_documents para saber cuántos había antes de borrar
            count_before = collection.count_documents({})
            if count_before > 0:
                result = collection.delete_many({})
                print(f"✅ La colección '{n}' fue limpiada. Cantidad de documentos eliminados: {result.deleted_count}")
            else:
                print(f"La colección '{n}' ya estaba vacía.")
        
        except Exception as e:
            print(f"❌ ERROR al limpiar la colección '{n}': {e}")
            
    print("\nLimpieza completada. La base de datos está lista para la carga de nuevos datos.")
else:
    print("❌ No se pudo realizar la limpieza porque no se encontró una conexión a la base de datos ('db').")

✅ Colección 'usuarios' limpiada. Documentos eliminados: 50
✅ Colección 'destinos' limpiada. Documentos eliminados: 16
✅ Colección 'hoteles' limpiada. Documentos eliminados: 125
✅ Colección 'reservas' limpiada. Documentos eliminados: 150

Limpieza completada. La base de datos está lista para la carga de nuevos datos.


CARGA DE USUARIOS, DESTINOS, HOTELES, ACTIVIDADES DE FORMA MASIVA EN MONGO DB

In [3]:
# Datos para la carga
names = ["Juan", "María", "Carlos", "Ana", "Pedro", "Sofía", "Pablo", "Laura", "Diego", "Valeria", "Gael", "Emilia", "Facundo", "Catalina", "Lucas", "Julieta", "Martín", "Valentina", "Mateo", "Camila"]
last_names = ["Gómez", "Rodríguez", "Fernández", "López", "Martínez", "Díaz", "Pérez", "González", "Sánchez", "Romero", "Alvarez", "Ruiz", "Torres", "Flores", "Benítez"]
destination_cities = ["Buenos Aires", "Córdoba", "Jujuy", "Rosario", "Mendoza", "Tucumán", "La Plata", "Mar del Plata", "Salta", "Santa Fe", "Corrientes", "Neuquén", "Bahía Blanca","Bariloche", "Saladillo", "Ushuaia"]
hotel_suffixes = ["Resort", "Suites", "Inn", "Boutique", "Palace", "Plaza", "Grand Hotel", "Hotel"]
types_activities = ["Aventura", "Gastronómico", "Cultural", "Rural"]
activities = {
    "Aventura": ["Senderismo", "Canotaje", "Tirolesa", "Rappel", "Mountain Bike"],
    "Gastronómico": ["Ruta de vinos/cervezas", "Clase de cocina local", "Degustación de quesos", "Mercado de alimentos"],
    "Cultural": ["Visita a museos", "Recorrido histórico", "Teatro/Espectáculo", "Galería de arte"],
    "Rural": ["Día de campo en estancia", "Cabalgata", "Visita a granjas", "Recolección de frutos"]
}

In [4]:
# Generación e Inserción de Usuarios
def generate_dni():
    """Genera un numero de 8 digitos para el DNI."""
    # Genera un número entre 10,000,000 y 99,999,999 y lo convierte a string
    return str(random.randint(1000000, 99999999))

def generate_phone():
    """Genera un numero de telefono con formato argentino +549."""
    area_code = random.randint(11, 3894)  # Código de área ficticio
    phone_num = random.randint(1000000, 9999999) # Número de 7 dígitos
    return f"+549{area_code}{phone_num}"


users_data = []
NUM_USERS = 50

for i in range(1, NUM_USERS + 1):
    age = random.randint(18, 60)

    user = {
        "id": i,
        "name": random.choice(names),
        "last_name": random.choice(last_names),
        "age": age,
        "DNI": generate_dni(),
        "phone": generate_phone()
    }
    users_data.append(user)

try:
    result = db.usuarios.insert_many(users_data)
    print(f"✅ Se han insertado {len(result.inserted_ids)} documentos.")
except Exception as e:
    print(f"❌ Ocurrió un error durante la inserción: {e}")

✅ Se han insertado 50 documentos.


In [5]:
# Generacion e Insercion de los destinos
try:
    # Se crea un indice unico para la ciudad para evitar duplicados
    db.destinos.create_index([("city", ASCENDING)], unique=True)
except Exception:
    pass

destination_data = []
MAX_PRICE = 3000000
MIN_PRICE = 50000

for city in destination_cities:
    price = random.randint(MIN_PRICE, MAX_PRICE)
    tipos_actividad_para_ciudad = []
    
    for tipo_act in types_activities:
        possible_activities = activities.get(tipo_act, [])
        if possible_activities:
            # Se decide cuantas actividades de este tipo se van a agregar
            num_activities_to_select = random.randint(1, len(possible_activities))
            specific_activities = random.sample(possible_activities, k=num_activities_to_select)
            activities_with_price = [
                {"nombre": name, "precio": random.randint(5000, 35000)}
                for name in specific_activities
            ]
            # Se agrega el bloque completo a la lista de actividades de la ciudad
            tipos_actividad_para_ciudad.append({
                "tipo": tipo_act,
                "actividades": activities_with_price
            })

    destination = {
        "city": city,
        "price": price,
        "tipos_actividad": tipos_actividad_para_ciudad # Se agregan las actividades
    }
    destination_data.append(destination)

try:
    # Se limpia la coleccion antes de insertar
    db.destinos.delete_many({})
    result = db.destinos.insert_many(destination_data)
    print(f"✅ Se han insertado {len(result.inserted_ids)} destinos con sus actividades integradas.")

except Exception as e:
    print(f"❌ Ocurrió un error durante la inserción de destinos: {e}")

✅ Se han insertado 16 destinos con sus actividades integradas.


In [6]:
# Generacion e Insercion de Hoteles
lista_de_servicios = [
    "WiFi Gratuito", 
    "Pileta", 
    "SPA", 
    "Gimnasio", 
    "Restaurante", 
    "Servicio de Habitación", 
    "Estacionamiento Gratuito",
    "Bar",
    "Admite Mascotas",
    "Recepción 24 horas"
]

hotel_id = 1
hotels_data = []
for city in destination_cities:
    num_hotels = random.randint(5, 10) 
    for i in range(1, num_hotels + 1):
        name_suffix = random.choice(hotel_suffixes)
        stars = random.randint(3, 5)
        if stars == 3:
            price_per_night = random.randint(45000, 120000)
        elif stars == 4:
            price_per_night = random.randint(70000, 200000)
        else:
            price_per_night = random.randint(100000, 500000)
        
        num_servicios = random.randint(4, 8)
        servicios_seleccionados = random.sample(lista_de_servicios, k=num_servicios)
        
        hotel = {
            "hotel_id": hotel_id,
            "city": city,
            "name": f"{city} {name_suffix} {i}",
            "stars": stars,
            "price_per_night": price_per_night,
            "available_rooms": random.randint(5, 50),
            "servicios": sorted(servicios_seleccionados) # <-- ¡Aquí agregamos el nuevo campo!
        }
        hotels_data.append(hotel)
        hotel_id += 1

print(f"✅ Se generaron un total de {len(hotels_data)} documentos de hoteles con sus servicios.")

try:
    db.hoteles.delete_many({})
    result = db.hoteles.insert_many(hotels_data)
    print(f"✅ Se han insertado {len(result.inserted_ids)} hoteles en la colección 'hoteles'.")
except Exception as e:
    print(f"❌ Ocurrió un error durante la inserción de hoteles: {e}")

✅ Se generaron un total de 117 documentos de hoteles con sus servicios.
✅ Se han insertado 117 hoteles en la colección 'hoteles'.


In [7]:
#Recuperar Datos Necesarios (version actualizada)
try:
    user_ids = [doc['id'] for doc in db.usuarios.find({}, {"id": 1, "_id": 0})]
    hotel_data = list(db.hoteles.find({}, {"hotel_id": 1, "city": 1, "name": 1, "price_per_night": 1, "_id": 0}))
    destinos_con_actividades = list(db.destinos.find({}))

except Exception as e:
    print(f"❌ ERROR: No se pudieron recuperar los datos base (usuarios/hoteles/destinos). Asegúrate de que las colecciones existan. {e}")
    client.close()
    exit()

if not user_ids or not hotel_data or not destinos_con_actividades:
    print("❌ ERROR: Una o más colecciones están vacías. No se pueden generar reservas.")
    client.close()
    exit()

In [8]:
# Generacion e Insercion de Reservas
def get_activities_for_city(city_name):
    """
    Devuelve una lista plana de todas las actividades para una ciudad dada,
    leyendo desde la lista de destinos.
    """
    # Encuentra el documento del destino para la ciudad
    doc = next((d for d in destinos_con_actividades if d['city'] == city_name), None)
    if not doc:
        return []
    
    all_activities = []
    # Itera sobre los tipos de actividad para construir una lista plana
    for tipo in doc.get('tipos_actividad', []):
        all_activities.extend(tipo['actividades'])
        
    return all_activities

def generate_random_date(start_days=10, end_days=365):
    """Genera una fecha aleatoria dentro de un rango futuro."""
    start_date = datetime.now() + timedelta(days=start_days)
    random_days = random.randint(0, end_days)
    return start_date + timedelta(days=random_days)

reservas_data = []
NUM_RESERVAS = 150

for i in range(1, NUM_RESERVAS + 1):
    chosen_hotel = random.choice(hotel_data)
    chosen_user_id = random.choice(user_ids)
    
    city = chosen_hotel['city']
    hotel_name = chosen_hotel['name']
    hotel_price = chosen_hotel['price_per_night']
    hotel_id = chosen_hotel['hotel_id']

    check_in = generate_random_date()
    check_out = check_in + timedelta(days=random.randint(2, 7))
    num_nights = (check_out - check_in).days
    
    all_city_activities = get_activities_for_city(city)
    
    activities_in_reserva = []
    if all_city_activities:
        k_activities = random.randint(1, min(3, len(all_city_activities)))
        activities_in_reserva = random.sample(all_city_activities, k=k_activities)

    total_cost = num_nights * hotel_price
    
    reserva = {
        "reserva_id": i,
        "user_id": chosen_user_id,
        "hotel_id": hotel_id,
        "hotel_name": hotel_name,
        "destino_ciudad": city,
        "check_in": check_in.strftime("%Y-%m-%d"),
        "check_out": check_out.strftime("%Y-%m-%d"),
        "noches": num_nights,
        "costo_total": round(total_cost, 2),
        "actividades_reservadas": activities_in_reserva
    }
    reservas_data.append(reserva)

print(f"✅ Se generó un total de {len(reservas_data)} documentos de reservas.")

try:
    db.reservas.delete_many({}) # Limpia la colección antes de insertar
    result = db.reservas.insert_many(reservas_data)
    print(f"✅ Se han insertado {len(result.inserted_ids)} reservas en la colección 'reservas'.")
except Exception as e:
    print(f"❌ Ocurrió un error durante la inserción de reservas: {e}")

✅ Se generó un total de 150 documentos de reservas.
✅ Se han insertado 150 reservas en la colección 'reservas'.


In [9]:
client.close()