# Notebook de Carga de Datos iniciales

Este notebook esta destinado a la carga inicial de los datos en los distintas base de datos

## Importación de librerias

In [5]:
# Limpia todas las variables existentes
%reset -f

# Habilita autoreload para recargar automáticamente todos los módulos
%load_ext autoreload
%autoreload 2

from pathlib import Path
from db_connections import client,db_neo4j,db_redis
from src import mongo,neo4j,utils,redis
from pymongo.errors import ConnectionFailure
from src.utils import procesar_csv
from datetime import datetime
import os
import pandas as pd


The autoreload extension is already loaded. To reload it, use:
  %reload_ext autoreload


## Conexión con bases de datos

In [6]:
# =====================
# TEST DE CONEXIONES
# =====================

#Conecto con MongoDB
try:
    client.admin.command("ping")  # fuerza conexión al servidor
    print("✅ Conexión a MongoDB verificada.")
except ConnectionFailure as e:
    print(f"❌ Falló la conexión: {type(e).__name__} - {e}")

#Conecto con Neo4j
try:
    db_neo4j.verify_connectivity()
    print("✅ Conexión a Neo4j verificada.")
except Exception as e:
    print(f"❌ Error de conexión: {type(e).__name__} - {e}")

#Conecto con Redis
try:
    db_redis.ping()
    print("✅ Conexión a Redis verificada.")
except Exception as e:
    print(f"❌ Error de conexión: {type(e).__name__} - {e}")

✅ Conexión a MongoDB verificada.
✅ Conexión a Neo4j verificada.
✅ Conexión a Redis verificada.


## Limpieza previa

In [7]:
# --- LIMPIAR DATOS EXISTENTES EN TODAS LAS BASES ---

print("\nLimpiando datos existentes...")

# --- MONGO ---
nombre_base = "clase"
client.drop_database(nombre_base)
print("   ✓ Base de datos Mongo eliminada")

# --- REDIS ---
db_redis.flushdb()
print("   ✓ Base de datos Redis limpiada")

# --- NEO4J ---
with db_neo4j.session() as session:
    session.run("MATCH (n) DETACH DELETE n")
print("   ✓ Nodos y relaciones de Neo4j eliminados")

print("\n Todos los datos fueron limpiados correctamente.")



Limpiando datos existentes...
   ✓ Base de datos Mongo eliminada
   ✓ Base de datos Redis limpiada
   ✓ Nodos y relaciones de Neo4j eliminados

 Todos los datos fueron limpiados correctamente.


## Carga de Datos

In [8]:

#-------------------------
# Archivos y colecciones
#-------------------------
nombre_base = "clase"
nombre_colecciones = ["usuarios", "destinos", "hoteles", "reservas", "actividades"]
nombre_archivos = ["usuarios.csv", "destinos.csv", "hoteles.csv", "reservas.csv", "actividades.csv"]

# -------------------------------------------------------------
# PROCESAMIENTO PRINCIPAL
# -------------------------------------------------------------
for nombre_archivo, nombre_coleccion in zip(nombre_archivos, nombre_colecciones):
    df = procesar_csv(nombre_archivo)
    if df is None:
        continue

    mongo.insertar_en_mongo(nombre_base, nombre_coleccion, df)
    redis.insertar_en_redis(nombre_coleccion, df)
    neo4j.crear_nodos_neo4j(nombre_coleccion, df)

    if nombre_coleccion == "reservas":
        neo4j.crear_relaciones_visito(df)

# -------------------------------------------------------------
# RELACIONES ENTRE USUARIOS
# -------------------------------------------------------------
neo4j.crear_relaciones_usuarios()

print("\n🚀 Proceso completado correctamente.")

✅ Se insertaron 60 documentos en 'usuarios'.
✅ Colección usuarios creada e insertada en MongoDB.
✅ Se registran 15 usuarios conectados en Redis.
✅ Nodos de Usuario creados exitosamente en Neo4j.
✅ Se insertaron 37 documentos en 'destinos'.
✅ Colección destinos creada e insertada en MongoDB.
✅ Nodos de Destino creados exitosamente en Neo4j.
✅ Se insertaron 117 documentos en 'hoteles'.
✅ Colección hoteles creada e insertada en MongoDB.
✅ Se insertaron 1685 documentos en 'reservas'.
✅ Colección reservas creada e insertada en MongoDB.
✅ Se insertaron 404 reservas temporales en Redis.
✅ Relaciones VISITO creadas exitosamente en Neo4j.
✅ Se insertaron 111 documentos en 'actividades'.
✅ Colección actividades creada e insertada en MongoDB.
✅ Relaciones entre usuarios creadas exitosamente en Neo4j.

🚀 Proceso completado correctamente.


In [None]:
#-------------------------
# Archivos y colecciones
#-------------------------
nombre_base = "clase"
nombre_colecciones = ["usuarios", "destinos", "hoteles", "reservas", "actividades"]
nombre_archivos = ["usuarios.csv", "destinos.csv", "hoteles.csv", "reservas.csv", "actividades.csv"]

for nombre_archivo, nombre_coleccion in zip(nombre_archivos, nombre_colecciones):
    ruta = Path("fuentes") / nombre_archivo
    df = utils.lectura_csv(ruta)
    
    if df is not None and not df.empty:
        mongo.crear_coleccion(nombre_base, nombre_coleccion, recrear=True)       
        filas = df.to_dict(orient="records")
        
        # MongoDB: Usuarios, Destinos, Hoteles, Reservas, Actividades

        if nombre_coleccion == "reservas":
            df_filtrado = df[df["estado"].notna() & (df["estado"].astype(str).str.strip() != "")]
            mongo.insertar_muchos_coleccion(nombre_base, nombre_coleccion, df_filtrado.to_dict(orient="records"))
        else:
            mongo.insertar_muchos_coleccion(nombre_base, nombre_coleccion, filas)

        # Redis: usuarios conectados

        if nombre_coleccion == "usuarios":
            conectados = redis.guardar_usuarios_conectados(df, 15)
            print(f"✅ Se registran {conectados} usuarios conectados")
        
        # Neo4j: Solo para usuarios y destinos
        
        filas = df.to_dict(orient="records") #se pisa nuevamente filas porque Mongo le agrega _id y generar error para Neo4j

        if nombre_coleccion in ["usuarios", "destinos"]:
            nombre_nodo = "Usuario" if nombre_coleccion == "usuarios" else "Destino"
            campo_clave = "usuario_id" if nombre_nodo == "Usuario" else "destino_id"

            with db_neo4j.session() as session:
                for fila in filas: # Recorro  y agrego
                    session.execute_write(neo4j.crear_nodo, nombre_nodo, campo_clave, fila)
                print(f"✅ Nodos de {nombre_nodo} creados exitosamente")
        
        # Neo4j: relaciones VISITO entre Usuario y Destino

        if nombre_coleccion == "reservas":
            HOY = datetime.today().date()   
            with db_neo4j.session() as session: 
                for fila in filas: 
                    estado = str(fila.get("estado", "")).strip()
                    fecha = fila.get("fecha_reserva")

                    # Solo si el estado es Confirmada o Pagada y fecha <= hoy
                    if estado in ["Confirmada", "Pagada"] and fecha <= str(HOY):
                        session.execute_write(
                            neo4j.crear_relacion_unidireccional,
                            "Usuario", "usuario_id", fila["usuario_id"],
                            "Destino", "destino_id", fila["destino_id"],
                            "VISITO")                   
            print("✅ Relaciones VISITO creadas exitosamente")

            # Redis: reservas temporales (sin estado - en carrito)
            
            df_reservas_temporales = df[df["estado"].isna()]
            resultado = redis.carga_masiva_reservas_temporales(df_reservas_temporales)
            print(f"✅ Se insertaron {resultado} reservas temporales")

# Neo4j: Relaciones entre usuarios

ruta_relaciones = Path("fuentes") / "usuarios_relaciones.csv"
df_usuarios_relaciones = utils.lectura_csv(ruta_relaciones)

if df_usuarios_relaciones is not None and not df_usuarios_relaciones.empty:
    with db_neo4j.session() as session: 
        filas = df_usuarios_relaciones.to_dict(orient="records")
        for fila in filas:
            session.execute_write(
                neo4j.crear_relacion_bidireccional,
                "Usuario", "usuario_id", fila["usuario1"],
                "Usuario", "usuario_id", fila["usuario2"],
                fila["tipo"]
            )
        print("✅ Relaciones entre usuarios creadas exitosamente")

## Verificación de la carga

### MongoDB

##### Cantidad de documentos existentes en cada colección

In [None]:
for i in range (len(nombre_colecciones)):
    cantidad=mongo.contar_documentos(nombre_base,nombre_colecciones[i])
    print(f"La cantidad de documentos de la coleccion {nombre_colecciones[i]} es {cantidad}")

### Neo4j

In [None]:
df_nodos = neo4j.consulta(db_neo4j, """
    MATCH (n)
    RETURN labels(n)[0] AS tipo_nodo, COUNT(*) AS cantidad
""")

df_relaciones = neo4j.consulta(db_neo4j, """
    MATCH ()-[r]->()
    RETURN type(r) AS tipo_relacion, COUNT(*) AS cantidad
""")

print("Nodos por tipo:")
print(df_nodos.to_string(index=False))

print("\nRelaciones por tipo:")
print(df_relaciones.to_string(index=False))


### Redis

##### Cantidad y Vista Previa de Usuarios Conectados

In [None]:
claves = db_redis.keys("usuario:*:sesion")
print(f"Cantidad de usuarios conectados {len(claves)}\n")
print("Se imprimen los primeros 5:")
for clave in claves[:5]:
    usuario_id = clave.split(":")[1]
    estado = db_redis.get(clave)
    tiempo_restante = db_redis.ttl(clave)
    print(f"Usuario {usuario_id} → sesión: {estado} | TTL: {tiempo_restante} segundos")

##### Cantidad y Vista Previa de Reservas en Carrito

In [None]:
claves = db_redis.keys("reserva_temp:*")
print(f"Cantidad de reservas temporales {len(claves)}\n")
print("Se imprimen las primeras 5:")
for clave in claves[:5]:
    datos = db_redis.hgetall(clave)
    tiempo_restante = db_redis.ttl(clave)
    print(f"{clave}: {datos} | TTL: {tiempo_restante} segundos")

## Generamos algunas búsquedas en caché

In [None]:
#Borrar redis
#db_redis.flushdb()


consultas = [
    ("hoteles", {"ciudad": "La Plata"}),
    ("destinos", {"tipo": "Playa", "ciudad": "La Rioja"}),
    ("hoteles", {"nombre": "Familia Galiano S.L. Hotel"}),
    ("actividades", {"tipo": "relax"})
]

for tipo, filtro in consultas:
    resultado = redis.obtener_cache(tipo, filtro)
    if resultado is None:
        cursor = mongo.obtener_cursor("clase",nombre_coleccion=tipo,filtro=filtro,proyeccion={"_id":0})
        resultado = list(cursor)
        if resultado:
            redis.guardar_en_cache(tipo,filtro,resultado,ttl=10)   

print("✅ Caché de búsqueda creado")

### Vista del caché de búsqueda para lo guardado

In [None]:
for tipo, filtro in consultas:
    resultados = redis.obtener_cache(tipo, filtro)
    if resultados:
        for resultado in resultados:
            print(resultado)
    else:
        print(f"No existe información en caché para la búsqueda {filtro} en {tipo}")