In [1]:
from neo4j import GraphDatabase
from pymongo import MongoClient, ASCENDING
import redis
import matplotlib.pyplot as plt
import pandas as pd
import random
import sys
import json

# Configuracion del gráfico
plt.rcParams.update({'figure.figsize': (10, 6)})

# Conexiones

# MongoDB 
client = MongoClient("mongodb://admin:admin123@mongo:27017/")
db = client["data"]

# Neo4j
neo_uri = "bolt://neo4j:7687"
driver = GraphDatabase.driver(neo_uri, auth=("neo4j", "neo4j123"))

# Redis
r = redis.Redis(host="redis", port=6379, password="redis123", decode_responses=True)

# Definicion ID's aleatorios
USUARIO_OBJETIVO_ID = random.randint(1, 50) 
USER_ID_OBJETIVO = random.randint(1, 50) 

# --------------------------------------------------------
def run_cypher(query, parameters=None):
    """Ejecuta una consulta Cypher y devuelve los resultados como lista de diccionarios."""
    with driver.session() as session:
        return session.run(query, parameters).data()

In [None]:
# Punto 2.a.
print("\n--- Usuarios que visitaron 'Bariloche' ---")
if db is not None:
    # 1. Encontrar todas las reservas para "Bariloche" y obtener los IDs de usuario (sin repetir)
    user_ids_en_bariloche = db.reservas.distinct("user_id", {"destino_ciudad": "Bariloche"})
    
    if user_ids_en_bariloche:
        # 2. Buscar en la colección de usuarios aquellos cuyos IDs están en la lista que encontramos
        usuarios_encontrados = db.usuarios.find(
            {"id": {"$in": user_ids_en_bariloche}},
            {'_id': 0, 'id': 1, 'name': 1, 'last_name': 1} # Proyección para mostrar solo campos relevantes
        )
        
        print(f"Se encontraron {len(user_ids_en_bariloche)} usuarios que visitaron Bariloche:")
        for usuario in usuarios_encontrados:
            print(f"  - ID: {usuario['id']}, Nombre: {usuario['name']} {usuario['last_name']}")
    else:
        print("No se encontraron reservas para el destino 'Bariloche'.")

In [None]:
# Punto 2.b.
print("\n--- Amigos de Juan y destinos compartidos ---")
query_b = """
MATCH (j:Usuario) WHERE j.nombre STARTS WITH 'Juan' 
MATCH (j)-[:AMIGO_DE]-(f:Usuario)
MATCH (j)-[:VISITO]->(d:Destino)<-[:VISITO]-(f)
RETURN j.nombre AS nombre_de_juan, f.nombre AS nombre_del_amigo, d.city AS destino_compartido
"""
result_b = run_cypher(query_b) 
if result_b:
    for record in result_b:
        print(f" - {record['nombre_de_juan']} es amigo de {record['nombre_del_amigo']} y visitaron {record['destino_compartido']}")
else:
    print("No se encontro a ningun Juan con destino compartido.")

In [None]:
# Punto 2.c.
print ("Sugerir destinos para un usuario que no haya visitado él ni sus amigos")
nombre_result = run_cypher(f"MATCH (u:Usuario {{id: {USUARIO_OBJETIVO_ID}}}) RETURN u.nombre AS Nombre")
USUARIO_OBJETIVO_NOMBRE = nombre_result[0]['Nombre'] if nombre_result else f"ID {USUARIO_OBJETIVO_ID} (No encontrado)"

query_c = f"""
MATCH (u:Usuario {{id: {USUARIO_OBJETIVO_ID}}})
// Encuentra todos los destinos visitados por el usuario O sus amigos
MATCH (u)-[:VISITO|AMIGO_DE*2]->(d_visitado:Destino) 
WITH collect(DISTINCT d_visitado.city) AS DestinosAExcluir

// Encuentra destinos que no estan en la lista de exclusión.
MATCH (d_sugerido:Destino)
WHERE NOT d_sugerido.city IN DestinosAExcluir
RETURN d_sugerido.city AS DestinoSugerido
"""
result_c = run_cypher(query_c) 
print(f"Destinos sugeridos para {USUARIO_OBJETIVO_NOMBRE} con ID {USUARIO_OBJETIVO_ID}:")
if result_c:
    for record in result_c:
        print(f"  - {record['DestinoSugerido']}")
else:
    print("No hay destinos para sugerir.")

In [None]:
# Punto 2.d & e.
print(f"\n--- Hoteles en destinos recomendados para el Usuario con ID {USER_ID_OBJETIVO}) ---")

query_d = f"""
MATCH (u:Usuario {{id: {USER_ID_OBJETIVO}}})
MATCH (u)-[:AMIGO_DE]-(f:Usuario)-[:VISITO]->(d:Destino)
WHERE NOT (u)-[:VISITO]->(d)
RETURN DISTINCT d.city as ciudad_recomendada
"""
ciudades_recomendadas = [r['ciudad_recomendada'] for r in run_cypher(query_d)]

if not ciudades_recomendadas:
    print(f"No hay destinos recomendados para el usuario {USER_ID_OBJETIVO}.")
else:
    hoteles_data = list(db.hoteles.find(
        {"city": {"$in": ciudades_recomendadas}},
        {"_id": 0, "name": 1, "city": 1}
    ))
    
    if hoteles_data:
        nombres_hoteles_unicos = set()
        for hotel in hoteles_data:
            parts = hotel['name'].split()
            nombre_limpio = ' '.join(parts[:-1]) if parts and parts[-1].isdigit() else hotel['name']
            nombres_hoteles_unicos.add(nombre_limpio)
            
        print(f"Hoteles recomendados en: {', '.join(ciudades_recomendadas)}")
        print("-----------------------------------------------------------------")
        for nombre_hotel in sorted(list(nombres_hoteles_unicos)):
            print(f" - {nombre_hotel}")
    else:
        print("No se encontraron hoteles para estas ciudades.")


In [None]:
# Punto 2.f.
print("\n--- Reservas en proceso con detalles del usuario ---")
if r and db is not None:
    
    # 1. Obtenemos todas las claves de reservas temporales desde Redis
    claves_reservas_temp = r.keys("temp_reserva:*")
    
    if not claves_reservas_temp:
        print("No se encontraron reservas temporales.")
    else:
        # 2. Recolectamos todos los IDs de usuario y las reservas de Redis
        user_ids_a_buscar = set()
        reservas_temporales = []
        for clave in claves_reservas_temp:
            reserva = r.hgetall(clave)
            reservas_temporales.append(reserva)
            # Añadimos el ID de usuario al conjunto para buscarlo después en MongoDB
            # El set se encarga de que no haya IDs duplicados
            user_ids_a_buscar.add(int(reserva['user_id']))
            
        # 3. Buscamos en MongoDB TODOS los usuarios necesarios en UNA SOLA CONSULTA
        # Esto es mucho más eficiente que hacer una consulta por cada reserva
        usuarios_encontrados = db.usuarios.find(
            {"id": {"$in": list(user_ids_a_buscar)}}
        )
        
        # Creamos un "mapa" para acceder fácilmente a los datos de cada usuario por su ID
        mapa_usuarios = {user['id']: user for user in usuarios_encontrados}

        print(f"Se encontraron {len(reservas_temporales)} reservas temporales, te muestro las primeras 10:")
        # 4. Iteramos sobre las reservas que guardamos y mostramos la información combinada
        num = 1
        for i, reserva in enumerate(reservas_temporales):
            user_id = int(reserva.get('user_id', 0))
            
            # Buscamos los detalles del usuario en nuestro mapa
            detalles_usuario = mapa_usuarios.get(user_id)
            
            if detalles_usuario:
                nombre_completo = f"{detalles_usuario.get('name')} {detalles_usuario.get('last_name')}"
            else:
                nombre_completo = "Usuario no encontrado"

            print(f"\n  Reserva en proceso #{i+1}")
            print(f"    - ID de Usuario: {user_id}")
            print(f"    - Nombre completo: {nombre_completo}")
            print(f"    - Hotel: {reserva.get('hotel_name')}")
            print(f"    - Check-in: {reserva.get('check_in')}")
            print(f"    - Check-out: {reserva.get('check_out')}")

            if num > 10:
                break
            else:
                num += 1

else:
    print("❌ Para ejecutar esta consulta, se requiere una conexión activa tanto a Redis como a MongoDB.")

In [None]:
# Punto 2.g.
print("\n--- Usuarios conectados actualmente ---")
if r and db is not None:
    
    # 1. Obtenemos los IDs de los usuarios activos desde el Set de Redis
    usuarios_conectados_ids_str = r.smembers("usuarios_activos")
    
    if not usuarios_conectados_ids_str:
        print("No hay usuarios conectados en este momento.")
    else:
        # 2. Convertimos los IDs (que Redis devuelve como strings) a números enteros
        user_ids_a_buscar = [int(uid) for uid in usuarios_conectados_ids_str]
        
        # 3. Buscamos en MongoDB TODOS los usuarios necesarios en UNA SOLA CONSULTA
        usuarios_encontrados = db.usuarios.find(
            {"id": {"$in": user_ids_a_buscar}},
            {'_id': 0, 'id': 1, 'name': 1, 'last_name': 1} # Proyección para optimizar
        )
        
        print(f"✅ Se encontraron {len(user_ids_a_buscar)} usuarios conectados:")
        # 4. Iteramos sobre los resultados de MongoDB y mostramos la información
        for usuario in usuarios_encontrados:
            print(f" - ID: {usuario['id']}, Nombre completo: {usuario['name']} {usuario['last_name']}")

else:
    print("❌ Para ejecutar esta consulta, se requiere una conexión activa tanto a Redis como a MongoDB.")

In [None]:
# Punto 2.h.
print("\n--- Destinos con precio inferior a $100.000 ---\n")
if db is not None:
    # Operador '$lt' (less than) para buscar precios menores a 100000
    destinos_baratos = db.destinos.find({"price": {"$lt": 100000}})
    
    resultados = list(destinos_baratos)
    if resultados:
        for destino in resultados:
            print(f" - {destino['city']}: ${destino['price']:,}") # Formateamos el precio
    else:
        print("No se encontraron destinos con precio inferior a $100.000.")

In [None]:
# Punto 2.i.
print("\n--- Hoteles en 'Jujuy' ---")
if db is not None:
    destino_a_buscar = "Jujuy"
    hoteles_encontrados = list(db.hoteles.find({"city": destino_a_buscar}))
    
    if hoteles_encontrados:
        print(f"Se encontraron {len(hoteles_encontrados)} hoteles en {destino_a_buscar}:")
        for hotel in hoteles_encontrados:
            print(f" - {hotel['name']} ({hotel['stars']} estrellas)")
    else:
        # Si no encontramos nada, damos una respuesta útil
        print(f"No se encontraron hoteles para '{destino_a_buscar}'.")

In [None]:
# Punto 2.j.
print("\n--- Cantidad de hoteles por destino ---")
if db is not None:
    destino_elegido = input ("Para que destino quieres buscar la cantidad de Hoteles: ")
    
    # count_documents es la forma más eficiente de solo contar
    cantidad_hoteles = db.hoteles.count_documents({"city": destino_elegido})
    
    print(f"En '{destino_elegido}' hay un total de {cantidad_hoteles} hoteles.")

In [None]:
# Punto 2.k.
print("\n--- Actividades de 'Aventura' en 'Ushuaia' ---")
pipeline = [
    # 1. Filtra para encontrar solo el documento de la ciudad "Ushuaia"
    {
        "$match": {
            "city": "Ushuaia"
        }
    },
    # 2. "Desenrosca" el array 'tipos_actividad' para poder filtrar por su contenido
    {
        "$unwind": "$tipos_actividad"
    },
    # 3. Filtra nuevamente para quedarte solo con el tipo "Aventura"
    {
        "$match": {
            "tipos_actividad.tipo": "Aventura"
        }
    },
    # 4. Proyecta (muestra) únicamente la lista de actividades que quieres ver
    {
        "$project": {
            "_id": 0,  # Oculta el campo _id
            "actividades": "$tipos_actividad.actividades"
        }
    }
]

# Ejecutar la agregación
resultado = list(db.destinos.aggregate(pipeline))

# Imprimir el resultado
if resultado:
    # El resultado es una lista, extraemos el primer (y único) elemento
    actividades_de_aventura = resultado[0]['actividades']
    print("Actividades de Aventura en Ushuaia:")
    for act in actividades_de_aventura:
        print(f"- Nombre: {act['nombre']}, Precio: ${act['precio']}")
else:
    print("No se encontraron actividades de Aventura para Ushuaia.")

In [None]:
# Punto 2.l.
print("\n--- Cantidad de reservas concretadas por usuario ---")
if db is not None:
    # Pipeline de agregación para contar reservas y unir con datos de usuario
    pipeline = [
        # Etapa 1: Agrupar por user_id y contar las reservas (igual que antes)
        {
            "$group": {
                "_id": "$user_id",
                "cantidad_reservas": {"$sum": 1}
            }
        },
        # Etapa 2: Unir ("lookup") con la colección 'usuarios'
        {
            "$lookup": {
                "from": "usuarios", # La otra colección
                "localField": "_id", # El campo de esta colección (reservas)
                "foreignField": "id", # El campo de la otra colección (usuarios)
                "as": "datos_usuario" # Nombre del nuevo campo que contendrá los datos unidos
            }
        },
        # Etapa 3: "Desenroscar" el array de datos_usuario para acceder a él fácilmente
        {
            "$unwind": "$datos_usuario"
        },
        # Etapa 4: Ordenar los resultados de mayor a menor
        {
            "$sort": {
                "cantidad_reservas": -1
            }
        }
    ]
    
    resultados_agregacion = list(db.reservas.aggregate(pipeline))
    
    if resultados_agregacion:
        for item in resultados_agregacion:
            # Construimos el nombre completo desde los datos del usuario
            nombre_completo = f"{item['datos_usuario']['name']} {item['datos_usuario']['last_name']}"
            
            # Imprimimos en el formato que solicitaste
            print(f"Nombre completo: {nombre_completo}")
            print(f"                 ID: {item['_id']}, Cantidad de Reservas: {item['cantidad_reservas']}\n") # Se agrega \n para un espacio extra
    else:
        print("No se encontraron reservas para agregar.")

In [None]:
# Punto m.i, ii, iii
# --- ESTADÍSTICAS Y GRÁFICOS ---
print("\n-------------------------------------------------------------------------------------------------------- ESTADISTICAS Y GRAFICOS --------------------------------------------------------------------------------------------------------\n")

# 1. Destino más visitado
print("\n-------------------------------------------------------------------------------------------------------- Destino mas Visitado --------------------------------------------------------------------------------------------------------\n")
query_destino = """
MATCH (u:Usuario)-[:VISITO]->(d:Destino)
RETURN d.city AS Destino, count(u) AS TotalVisitas
ORDER BY TotalVisitas DESC
LIMIT 10
"""
result_destino = run_cypher(query_destino)

if result_destino:
    df_destino = pd.DataFrame(result_destino)
    
    # Detección de Empates
    max_visitas = df_destino['TotalVisitas'].max()
    top_destinos = df_destino[df_destino['TotalVisitas'] == max_visitas]['Destino'].tolist()
    estadistica_top = (
        f"Destinos más visitados (Empate con {max_visitas} visitas): {', '.join(top_destinos)}"
        if len(top_destinos) > 1 
        else f"Destino más visitado: {top_destinos[0]} con {max_visitas} visitas."
    )

    # Gráfico de barras vertical
    plt.figure(figsize=(10, 6))
    plt.bar(df_destino['Destino'], df_destino['TotalVisitas'], color='skyblue')
    plt.ylabel('Total de Visitas')
    plt.xlabel('Destino')
    plt.title('Top 10 Destinos Más Visitados (Neo4j)')
    plt.xticks(rotation=45, ha='right') 
    plt.grid(axis='y', linestyle='--', alpha=0.6)
    plt.tight_layout()
    plt.show() # 
    print(estadistica_top)
else:
    print("No hay datos de visitas para generar la estadistica.")

# 2. Hotel por Precio 
print("\n-------------------------------------------------------------------------------------------------------- Listado de Hoteles por Precio ---------------------------------------------------------------------------------------------------\n")
PRECIO_KEY = "price_per_night"

hoteles_todos = list(db.hoteles.find(
    {}, {"_id": 0, "name": 1, "city": 1, PRECIO_KEY: 1}
).sort(PRECIO_KEY, 1))

if hoteles_todos:
    for hotel in hoteles_todos:
        parts = hotel['name'].split()
        hotel['name_clean'] = ' '.join(parts[:-1]) if parts and parts[-1].isdigit() else hotel['name']
        hotel['label'] = f"{hotel['name_clean']} ({hotel['city']})"
    
    df_hotel = pd.DataFrame(hoteles_todos)
    hotel_mas_barato = hoteles_todos[0]
    
    # Gráfico de Barras Horizontal (ordenado de menor a mayor precio)
    MAX_SHOWN_BARS = 30
    df_to_plot = df_hotel.head(MAX_SHOWN_BARS)
    df_invertido = df_to_plot[::-1]

    plt.figure(figsize=(12, 10))
    plt.barh(df_invertido['label'], df_invertido[PRECIO_KEY], color='lightcoral')
    plt.ylabel('Hotel (Ciudad)')
    plt.xlabel('Precio por Noche ($)')
    plt.title(f'Precios de Hoteles Ordenados (De Menor a Mayor Precio, Mostrando Top {len(df_to_plot)})')
    plt.grid(axis='x', linestyle='--', alpha=0.6)
    plt.tight_layout()
    plt.show() # 
    
    print("\n--- Estadisticas ---")
    print(f"Número total de hoteles procesados: {len(hoteles_todos)}")
    print(f"Hotel más barato: {hotel_mas_barato['name_clean']} en {hotel_mas_barato['city']} por ${hotel_mas_barato[PRECIO_KEY]:.2f}.")
else:
    print("No se encontraron hoteles para generar la estadistica.")

# 3. Actividad más popular 
print("\n-------------------------------------------------------------------------------------------------------- Actividad mas Popular --------------------------------------------------------------------------------------------------------\n")


pipeline_actividad = [
    {"$unwind": "$actividades_reservadas"}, 
    {"$group": {"_id": "$actividades_reservadas", "TotalReservas": {"$sum": 1}}},
    {"$sort": {"TotalReservas": -1}},
    {"$limit": 5}
]

top_actividades = list(db.reservas.aggregate(pipeline_actividad))

if top_actividades:
    df_actividad = pd.DataFrame(top_actividades)
    df_actividad.rename(columns={'_id': 'Actividad'}, inplace=True)
    
    # Gráfico de anillo
    plt.figure(figsize=(8, 8))
    plt.pie(df_actividad['TotalReservas'], 
            labels=df_actividad['Actividad'], 
            autopct='%1.1f%%', 
            startangle=90, 
            wedgeprops=dict(width=0.4), 
            colors=plt.cm.Paired.colors)
    
    plt.title('Distribucion de Reservas de Actividades (Top 5)')
    plt.tight_layout()
    plt.show() # 
    
    print(f"Actividad más popular: {df_actividad.iloc[0]['Actividad']} con {df_actividad.iloc[0]['TotalReservas']} reservas.")
else:
    print("No se encontraron actividades en la colección 'reservas'.")

In [None]:
try:
    driver.close()
    client.close()
    print("\n✅ Conexiones cerradas.")
except Exception as e:
    print(f"Error al cerrar conexiones: {e}")