In [2]:
from neo4j import GraphDatabase
import redis
from pymongo import MongoClient, ASCENDING
import random
from pymongo.errors import DuplicateKeyError, BulkWriteError #Para manejar errores de duplicidad y de operación de escritura masiva
from datetime import datetime, timedelta

driver = GraphDatabase.driver("bolt://neo4j:7687", auth=("neo4j", "neo4j123"))
client = MongoClient("mongodb://admin:admin123@mongo:27017/")
db = client["data"]
r = redis.Redis(host="redis", port=6379, password="redis123", decode_responses=True)

CARGA DE USUARIOS, DESTINOS, HOTELES, ACTIVIDADES DE FORMA MASIVA EN MONGO DB

In [3]:
# Datos
names = ["Juan", "María", "Carlos", "Ana", "Pedro", "Sofía", "Pablo", "Laura", "Diego", "Valeria", "Gael", "Emilia", "Facundo", "Catalina", "Lucas", "Julieta", "Martín", "Valentina", "Mateo", "Camila"]
last_names = ["Gómez", "Rodríguez", "Fernández", "López", "Martínez", "Díaz", "Pérez", "González", "Sánchez", "Romero", "Alvarez", "Ruiz", "Torres", "Flores", "Benítez"]
destination_cities = ["Buenos Aires", "Córdoba", "Rosario", "Mendoza", "Tucumán", "La Plata", "Mar del Plata", "Salta", "Santa Fe", "Corrientes", "Neuquén", "Bahía Blanca","Bariloche", "Saladillo"]
hotel_suffixes = ["Resort", "Suites", "Inn", "Boutique", "Palace", "Plaza", "Grand Hotel", "Hotel"]
types_activities = ["Aventura", "Gastronómico", "Cultural", "Rural"]
activities = {
    "Aventura": ["Senderismo", "Canotaje", "Tirolesa", "Rappel", "Mountain Bike"],
    "Gastronómico": ["Ruta de vinos/cervezas", "Clase de cocina local", "Degustación de quesos", "Mercado de alimentos"],
    "Cultural": ["Visita a museos", "Recorrido histórico", "Teatro/Espectáculo", "Galería de arte"],
    "Rural": ["Día de campo en estancia", "Cabalgata", "Visita a granjas", "Recolección de frutos"]
}

In [4]:
# Generación e Inserción de Usuarios

def generate_dni():
    """Genera un número de 8 dígitos para el DNI."""
    # Genera un número entre 10,000,000 y 99,999,999 y lo convierte a string
    return str(random.randint(1000000, 99999999))

def generate_phone():
    """Genera un número de teléfono con formato argentino +549."""
    area_code = random.randint(11, 3894)  # Código de área ficticio
    phone_num = random.randint(1000000, 9999999) # Número de 7 dígitos
    return f"+549{area_code}{phone_num}"


users_data = []
NUM_USERS = 50

for i in range(1, NUM_USERS + 1):
    age = random.randint(18, 60)

    user = {
        "id": i,
        "name": random.choice(names),
        "last_name": random.choice(last_names),
        "age": age,
        "DNI": generate_dni(),
        "phone": generate_phone()
    }
    users_data.append(user)

try:
    result = db.usuarios.insert_many(users_data)
    print(f"✅ Se han insertado {len(result.inserted_ids)} documentos.")
except Exception as e:
    print(f"❌ Ocurrió un error durante la inserción: {e}")

✅ Se han insertado 50 documentos.


In [5]:
# Generación e Inserción de los destinos

try:
    db.destinos.create_index([("city", ASCENDING)], unique=True)
except Exception:
    # Si el índice ya existe no pasa nada
    pass
destination_data = []
MAX_PRICE = 300000
MIN_PRICE = 50000

for cities in destination_cities:
    # Genera un precio aleatorio, redondeado
    price = random.randint(MIN_PRICE, MAX_PRICE)
    
    destination = {
        "city": cities,
        "price": price, #lOS DESTINOS LLEVAN PRECIO?
    }
    destination_data.append(destination)

try:
    # Usamos ordered=False para que la inserción continúe si encuentra un duplicado
    result = db.destinos.insert_many(destination_data, ordered=False)
    
    # Contamos cuántos se insertaron realmente
    inserted_count = len(result.inserted_ids)
    skipped_count = len(destination_data) - inserted_count
    
    if inserted_count > 0:
        print(f"✅ Se han insertado {inserted_count} destinos nuevos.")
    if skipped_count > 0:
        print(f"⚠️ Se ignoraron {skipped_count} destinos que ya existían (por duplicidad).")
    elif inserted_count == 0 and skipped_count == 0:
         print("⚠️ No se generaron datos para insertar.")

except DuplicateKeyError as e:
    # Si todos fallan (lo cual es raro con ordered=False), podemos atrapar el error aquí
    print(f"❌ Error fatal de duplicidad: {e}")
# Reemplaza 'Exception as e' con 'BulkWriteError as e'
except BulkWriteError as e: 
    # Aquí puedes extraer la información de cuántos fallaron vs. cuántos funcionaron
    print(f"⚠️ Se insertaron algunos datos, pero algunos fallaron por duplicidad.")

✅ Se han insertado 14 destinos nuevos.


In [6]:
# Generación e Inserción de Hoteles

hotels_data = []
for city in destination_cities:
    num_hotels = random.randint(5, 10) 
    for i in range(1, num_hotels + 1):
        name_suffix = random.choice(hotel_suffixes)
        
        # Genera una calificación (estrellas) entre 3 y 5
        stars = random.randint(3, 5)
        
        # Genera un precio por noche (entre 20000 y 80000 ARS)
        if stars == 3:
            price_per_night = random.randint(45000, 120000)
        elif stars == 4:
            price_per_night = random.randint(70000, 200000)
        else:
            price_per_night = random.randint(100000, 500000)
        
        hotel = {
            "city": city,
            "name": f"{city} {name_suffix} {i}", # Nombre único por bucle
            "stars": stars,
            "price_per_night": price_per_night,
            "available_rooms": random.randint(5, 50)
        }
        hotels_data.append(hotel)

print(f"✅ Se generaron un total de {len(hotels_data)} documentos de hoteles.")

# --- Inserción Masiva ---
try:
    # 3. Insertamos todos los hoteles generados
    result = db.hoteles.insert_many(hotels_data)
    print(f"✅ Se han insertado {len(result.inserted_ids)} hoteles en la colección 'hoteles'.")
except Exception as e:
    print(f"❌ Ocurrió un error durante la inserción de hoteles: {e}")

✅ Se generaron un total de 103 documentos de hoteles.
✅ Se han insertado 103 hoteles en la colección 'hoteles'.


In [7]:
# Generación e Inserción de Actividades

activities_volumen = []
for city in destination_cities:
    activities_data = {
        "city": city,
        "tipos_actividad": []
    }
    
    # Selecciona un subconjunto aleatorio de 3 a 5 tipos de actividad para la ciudad
    select_types = random.sample(types_activities, k=random.randint(3, len(types_activities)))
    
    for t in select_types:
        # 2. Por cada tipo, selecciona 2 o 3 actividades específicas al azar
        possible_activities = activities.get(t, [])
        num_activities = random.randint(2, 3)
        
        # Asegura no seleccionar más actividades de las que hay disponibles
        num_activities = min(num_activities, len(possible_activities))
        
        # Elige las actividades específicas
        specific_activities = random.sample(possible_activities, k=num_activities)
        
        # Agrega el objeto tipo_actividad al documento de la ciudad
        activities_data["tipos_actividad"].append({
            "tipo": t,
            "actividades": specific_activities
        })
        
    activities_volumen.append(activities_data)

print(f"✅ Se generaron {len(activities_volumen)} documentos de actividades, uno por ciudad.")

# --- Inserción Masiva ---
# Aquí no usamos ordered=False porque es una inserción limpia (un documento por ciudad)
try:
    result = db.actividades.insert_many(activities_volumen)
    print(f"✅ Se han insertado {len(result.inserted_ids)} documentos en la colección 'actividades'.")
except Exception as e:
    print(f"❌ Ocurrió un error durante la inserción de actividades: {e}")

✅ Se generaron 14 documentos de actividades, uno por ciudad.
✅ Se han insertado 14 documentos en la colección 'actividades'.


In [8]:
#Recuperar Datos Necesarios
try:
    user_ids = [doc['id'] for doc in db.usuarios.find({}, {"id": 1, "_id": 0})]
    hotel_data = list(db.hoteles.find({}, {"_id": 1, "city": 1, "name": 1, "price_per_night": 1}))
    actividades_data = list(db.actividades.find({}))
except Exception as e:
    print(f"❌ ERROR: No se pudieron recuperar los datos base (usuarios/hoteles/actividades). Asegúrate de que las colecciones existan. {e}")
    client.close()
    exit()

if not user_ids or not hotel_data or not actividades_data:
    print("❌ ERROR: Una o más colecciones están vacías. No se pueden generar reservas.")
    client.close()
    exit()

In [14]:
def get_activities_for_city(city_name):
    """Devuelve una lista plana de todas las actividades para una ciudad dada."""
    # Encuentra el documento de actividades para la ciudad
    doc = next((a for a in actividades_data if a['city'] == city_name), None)
    if not doc:
        return []
    
    all_activities = []
    # Itera sobre los tipos de actividad para construir una lista plana
    for tipo in doc['tipos_actividad']:
        all_activities.extend(tipo['actividades'])
        
    return all_activities

def generate_random_date(start_days=10, end_days=365):
    """Genera una fecha aleatoria dentro de un rango futuro."""
    start_date = datetime.now() + timedelta(days=start_days)
    random_days = random.randint(0, end_days)
    return start_date + timedelta(days=random_days)

# Generación e Inserción de Reservas
reservas_data = []
NUM_RESERVAS = 150 # Número total de reservas a generar

for i in range(1, NUM_RESERVAS + 1):
    # Selecciona un hotel y un usuario al azar
    chosen_hotel = random.choice(hotel_data)
    chosen_user_id = random.choice(user_ids)
    
    # Datos del hotel
    city = chosen_hotel['city']
    hotel_name = chosen_hotel['name']
    hotel_price = chosen_hotel['price_per_night']
    hotel_id = chosen_hotel['_id'] # Usamos el _id de MongoDB para el hotel

    # Fechas
    check_in = generate_random_date()
    check_out = check_in + timedelta(days=random.randint(2, 7)) # Estancia de 2 a 7 días
    num_nights = (check_out - check_in).days
    
    # Selecciona Actividades para la Reserva
    all_city_activities = get_activities_for_city(city)
    
    # Selecciona entre 1 y 3 actividades para el usuario (si hay disponibles)
    activities_in_reserva = []
    if all_city_activities:
        k_activities = random.randint(1, min(3, len(all_city_activities)))
        activities_in_reserva = random.sample(all_city_activities, k=k_activities)

    # Cálculo del costo total del hotel
    total_cost = num_nights * hotel_price
    
    reserva = {
        "reserva_id": i,
        "user_id": chosen_user_id,             # ID del usuario que reserva
        "hotel_id": hotel_id,                  # _id del hotel reservado
        "hotel_name": hotel_name,
        "destino_ciudad": city,
        "check_in": check_in.strftime("%Y-%m-%d"),
        "check_out": check_out.strftime("%Y-%m-%d"),
        "noches": num_nights,
        "costo_total": round(total_cost, 2),
        "actividades_reservadas": activities_in_reserva # Arreglo de actividades
    }
    reservas_data.append(reserva)

print(f"✅ Se generó un total de {len(reservas_data)} documentos de reservas.")

try:
    result = db.reservas.insert_many(reservas_data)
    print(f"✅ Se han insertado {len(result.inserted_ids)} reservas en la colección 'reservas'.")
except Exception as e:
    print(f"❌ Ocurrió un error durante la inserción de reservas: {e}")

✅ Se generó un total de 150 documentos de reservas.
❌ Ocurrió un error durante la inserción de reservas: Cannot use MongoClient after close


In [15]:
# Borrar los volumenes
# Lista de las colecciones que se quieren limpiar
colections_clean = [
    "usuarios", 
    "destinos", 
    "hoteles", 
    "actividades", 
    "reservas"
]

for n in colections_clean:
    try:
        collection = db[n]
        result = collection.delete_many({})
        print(f"✅ Colección '{n}' limpiada. Documentos eliminados: {result.deleted_count}")
        
    except Exception as e:
        print(f"❌ ERROR al limpiar la colección '{n}': {e}")
        
# Cierra la conexión después de la limpieza
client.close()
print("\nLimpieza completada.")

❌ ERROR al limpiar la colección 'usuarios': Cannot use MongoClient after close
❌ ERROR al limpiar la colección 'destinos': Cannot use MongoClient after close
❌ ERROR al limpiar la colección 'hoteles': Cannot use MongoClient after close
❌ ERROR al limpiar la colección 'actividades': Cannot use MongoClient after close
❌ ERROR al limpiar la colección 'reservas': Cannot use MongoClient after close

Limpieza completada.


In [12]:
#Cerrar la conexión
client.close()