### Fase 5 – Carga en MongoDB
### Crear base de datos SaludDigital_2025 y colección pacientes
### Insertar los registros limpios desde CSV.

In [1]:
import pandas as pd
from pymongo import MongoClient

# 1️⃣ Conexión a MongoDB local
client = MongoClient("mongodb://localhost:27017/")

# 2️⃣ Crear base de datos y colección
db = client["SaludDigital_2025"]
collection = db["pacientes"]

# 3️⃣ Eliminar registros previos (para evitar duplicados)
collection.delete_many({})
print("🧹 Colección 'pacientes' vaciada antes de insertar nuevos datos.")

# 4️⃣ Leer datos limpios
df = pd.read_csv("../database/pacientes_clean.csv")

# 5️⃣ Insertar datos en MongoDB
data = df.to_dict(orient="records")
collection.insert_many(data)
print("✅ Datos insertados en MongoDB correctamente.")

🧹 Colección 'pacientes' vaciada antes de insertar nuevos datos.
✅ Datos insertados en MongoDB correctamente.


In [2]:

# 6️⃣ Mostrar algunos registros de ejemplo
print("\n📋 Primeros registros:")
for doc in collection.find({}, {"_id": 0, "id_paciente": 1, "nombre": 1, "distrito": 1, "servicio": 1}).limit(5):
    print(doc)


📋 Primeros registros:
{'id_paciente': 'P0001', 'nombre': 'Luis Pérez', 'distrito': 'Magdalena', 'servicio': 'Traumatología'}
{'id_paciente': 'P0002', 'nombre': 'Carmen Flores', 'distrito': 'Cajamarca', 'servicio': 'Traumatología'}
{'id_paciente': 'P0003', 'nombre': 'Carmen Flores', 'distrito': 'Cajamarca', 'servicio': 'General'}
{'id_paciente': 'P0004', 'nombre': 'Carmen Flores', 'distrito': 'Encañada', 'servicio': 'Odontología'}
{'id_paciente': 'P0005', 'nombre': 'Diego Ramos', 'distrito': 'Encañada', 'servicio': 'Traumatología'}


In [3]:

# 7️⃣ Contar total de documentos
total = collection.count_documents({})
print(f"\n📊 Total de registros en la colección: {total}")


📊 Total de registros en la colección: 3000


In [4]:
# 8️⃣ Consultar pacientes del distrito 'Baños del Inca'
print("\n🏥 Pacientes de Baños del Inca:")
for doc in collection.find({"distrito": "Baños del Inca"}, {"_id": 0, "nombre": 1, "servicio": 1}).limit(5):
    print(doc)


🏥 Pacientes de Baños del Inca:
{'nombre': 'Carmen Flores', 'servicio': 'Traumatología'}
{'nombre': 'Luis Pérez', 'servicio': 'Ginecología'}
{'nombre': 'Carmen Flores', 'servicio': 'Pediatría'}
{'nombre': 'Carlos Ruiz', 'servicio': 'General'}
{'nombre': 'Luis Pérez', 'servicio': 'Ginecología'}
