In [1]:
# 5_loading_mongodb.py
import pandas as pd
from pymongo import MongoClient
from pathlib import Path
import os

# 1️⃣ Definir rutas
database_path = Path.cwd().parent / "database"
input_file = database_path / "pacientes_clean.csv"

# 2️⃣ Verificar que el archivo limpio exista
if not input_file.exists():
    print(f"⚠️ No se encontró el archivo {input_file}")
    print("💡 Ejecuta primero el script '4_proceso_etl.py' para generar los datos limpios.")
    exit()

# 3️⃣ Leer los datos limpios
df = pd.read_csv(input_file)
print(f"📖 Archivo leído correctamente: {len(df)} registros")

# 4️⃣ Conexión a MongoDB
# Puedes usar tu propia cadena de conexión (por ejemplo desde MongoDB Atlas)
MONGO_URI = os.getenv("MONGO_URI", "mongodb://localhost:27017")
DB_NAME = "SaludDigital_2025"
COLLECTION = "pacientes"

try:
    client = MongoClient(MONGO_URI)
    db = client[DB_NAME]
    collection = db[COLLECTION]
    print(f"✅ Conectado a MongoDB -> Base de datos: {DB_NAME}, Colección: {COLLECTION}")
except Exception as e:
    print("❌ Error al conectar con MongoDB:", e)
    exit()

# 5️⃣ Preparar los datos para inserción
records = df.to_dict(orient="records")

# 6️⃣ Insertar registros
if records:
    collection.delete_many({})  # Limpia la colección antes de insertar (opcional)
    result = collection.insert_many(records)
    print(f"📦 Insertados {len(result.inserted_ids)} documentos en MongoDB.")
else:
    print("⚠️ No hay registros para insertar.")

# 7️⃣ Cerrar la conexión
client.close()
print("🔒 Conexión con MongoDB cerrada correctamente.")


📖 Archivo leído correctamente: 1000 registros
✅ Conectado a MongoDB -> Base de datos: SaludDigital_2025, Colección: pacientes
📦 Insertados 1000 documentos en MongoDB.
🔒 Conexión con MongoDB cerrada correctamente.
