In [1]:
from neo4j import GraphDatabase
from pymongo import MongoClient
import random

# --- 1. CONEXIONES ---

# Conexión a MongoDB
mongo_client = MongoClient("mongodb://admin:admin123@mongo:27017/")
db = mongo_client["data"]
db.command("ping")
print("✅ Conexión a MongoDB establecida.")

# Conexión a Neo4j
neo_uri = "bolt://neo4j:7687"
neo_user = "neo4j"
neo_pass = "neo4j123"
driver = GraphDatabase.driver(neo_uri, auth=(neo_user, neo_pass))
with driver.session() as session:
    session.run("RETURN 1")
print("✅ Conexión a Neo4j establecida.")

# --- FUNCIÓN CYPER ---
def run_cypher(query, parameters=None):
    """Ejecuta una consulta Cypher y devuelve los resultados como lista de diccionarios."""
    with driver.session() as session:
        result = session.run(query, parameters)
        return result.data()

# Limpiar Neo4j
run_cypher("MATCH (n) DETACH DELETE n")
print("\n✅ Base de datos Neo4j limpiada.")


✅ Conexión a MongoDB establecida.
✅ Conexión a Neo4j establecida.

✅ Base de datos Neo4j limpiada.


In [2]:
# --- 2. CARGA DE DATOS DESDE MONGODB (LECTURA ÚNICA) ---

# Cargar datos
users_data = list(db.usuarios.find({}, {"_id": 0, "id": 1, "name": 1, "last_name": 1}))
destinos_data = list(db.destinos.find({}, {"_id": 0, "city": 1, "price": 1}))
reservas_data = list(db.reservas.find({}, {"_id": 0, "user_id": 1, "destino_ciudad": 1}))

In [3]:
# --- 3. PROCESAMIENTO Y CARGA MASIVA DE NODOS  ---

# i. Nodos Usuario
if users_data:
    user_params = []
    id_to_name = {}
    juan_id = None
    for user in users_data:
        full_name = f"{user['name']} {user['last_name']}"
        user_params.append({
            "id": user['id'],
            "nombre": full_name
        })
        id_to_name[user['id']] = full_name
        if user['name'].lower().startswith("juan") and juan_id is None: # Usar startswith para ser flexible
            juan_id = user['id']

    # Carga masiva de usuarios
    run_cypher("""
    UNWIND $props AS prop
    MERGE (u:Usuario {id: prop.id})
    SET u.nombre = prop.nombre
    """, {"props": user_params})
    print(f"✅ Cargados {len(user_params)} nodos Usuario en Neo4j.")
else:
    id_to_name = {}
    print("❌ No se encontraron datos de usuarios para cargar.")


# ii. Nodos Destino
if destinos_data:
    dest_params = []
    city_to_id = {}
    for i, dest in enumerate(destinos_data, 1):
        city = dest.get("city", f"Destino_{i}")
        dest_params.append({
            "destino_id": i,
            "city": city,
            "price": dest.get("price", 0.0)
        })
        city_to_id[city] = i
    
    # Carga masiva de destinos
    run_cypher("""
    UNWIND $props AS prop
    MERGE (d:Destino {destino_id: prop.destino_id})
    SET d.city = prop.city, d.price = prop.price
    """, {"props": dest_params})
    print(f"✅ Cargados {len(dest_params)} nodos Destino en Neo4j.")
else:
    city_to_id = {}
    print("❌ No se encontraron datos de destinos para cargar.")


✅ Cargados 50 nodos Usuario en Neo4j.
✅ Cargados 16 nodos Destino en Neo4j.


In [4]:
# --- 4. CARGA MASIVA DE RELACIONES ---

# i. Relaciones VISITO
if reservas_data and city_to_id:
    visito_params = []
    for res in reservas_data:
        dest_id = city_to_id.get(res.get("destino_ciudad"))
        if dest_id:
            visito_params.append({
                "user_id": res["user_id"],
                "destino_id": dest_id
            })
    
    # Carga masiva de relaciones VISITO
    run_cypher("""
    UNWIND $props AS prop
    MATCH (u:Usuario {id: prop.user_id})
    MATCH (d:Destino {destino_id: prop.destino_id})
    MERGE (u)-[:VISITO]->(d)
    """, {"props": visito_params})
    print(f"✅ Cargadas {len(visito_params)} relaciones VISITO en Neo4j.")
else:
    print("❌ No se encontraron datos de reservas o destinos válidos para crear relaciones VISITO.")


# ii. Relaciones AMIGO_DE 
print("\n--- Creando relaciones AMIGO_DE ---")
user_ids = [u['id'] for u in users_data]
amigo_de_relations = []
total_relations_target = 20

if juan_id and juan_id in user_ids and destinos_data:
    other_user_id = random.choice([uid for uid in user_ids if uid != juan_id])
    forced_destino_id = random.choice(list(city_to_id.values()))
    
    # 1.1. Forzar AMIGO_DE Juan
    amigo_de_relations.append({"u1": juan_id, "u2": other_user_id})
    
    # 1.2. Forzar VISITO compartido
    run_cypher("""
    MATCH (d:Destino {destino_id: $destino_id})
    MATCH (u1:Usuario {id: $u1})
    MATCH (u2:Usuario {id: $u2})
    MERGE (u1)-[:VISITO]->(d)
    MERGE (u2)-[:VISITO]->(d)
    """, {"u1": juan_id, "u2": other_user_id, "destino_id": forced_destino_id})
    
    forced_destino_city = next((d['city'] for d in destinos_data if city_to_id.get(d['city']) == forced_destino_id), "Destino Desconocido")
    remaining_relations = total_relations_target - 1
else:
    remaining_relations = total_relations_target


# 2. Generar las relaciones AMIGO_DE restantes aleatoriamente
existing_pairs = set([(min(r['u1'], r['u2']), max(r['u1'], r['u2'])) for r in amigo_de_relations])

for _ in range(remaining_relations):
    if len(user_ids) < 2: break
    while True:
        u1, u2 = random.sample(user_ids, 2)
        pair = (min(u1, u2), max(u1, u2))
        if pair not in existing_pairs:
            amigo_de_relations.append({"u1": u1, "u2": u2})
            existing_pairs.add(pair)
            break

# 3. Carga masiva de relaciones AMIGO_DE
if amigo_de_relations:
    run_cypher("""
    UNWIND $props AS prop
    MATCH (u1:Usuario {id: prop.u1})
    MATCH (u2:Usuario {id: prop.u2})
    MERGE (u1)-[:AMIGO_DE]-(u2)
    """, {"props": amigo_de_relations})

# iii. Relaciones FAMILIAR_DE (10 relaciones aleatorias)
print("\n--- Creando relaciones FAMILIAR_DE ---")
familiar_de_relations = []
if len(user_ids) >= 2:
    for _ in range(10):
        u1, u2 = random.sample(user_ids, 2)
        familiar_de_relations.append({"u1": u1, "u2": u2})

# Carga masiva de relaciones FAMILIAR_DE
if familiar_de_relations:
    run_cypher("""
    UNWIND $props AS prop
    MATCH (u1:Usuario {id: prop.u1})
    MATCH (u2:Usuario {id: prop.u2})
    MERGE (u1)-[:FAMILIAR_DE]-(u2)
    """, {"props": familiar_de_relations})

print("✅ Carga en Neo4j completada: Nodos y relaciones creadas.")

# --- 5. CERRAR CONEXIONES (SIN EXCEPCIONES) ---
driver.close()
mongo_client.close()
print("\n✅ Conexiones cerradas.")

✅ Cargadas 150 relaciones VISITO en Neo4j.

--- Creando relaciones AMIGO_DE ---

--- Creando relaciones FAMILIAR_DE ---
✅ Carga en Neo4j completada: Nodos y relaciones creadas.

✅ Conexiones cerradas.
