🧩 Fase 5 – Carga en MongoDB
Crear base de datos SaludDigital_2025 y colección pacientes
Insertar los registros limpios desde CSV.

In [1]:
import pandas as pd
from pymongo import MongoClient

# 1️⃣ Conectar a MongoDB
client = MongoClient("mongodb://localhost:27017/")

# 2️⃣ Definir base de datos y colección
db = client["SaludDigital_2025"]
collection = db["pacientes"]

# 3️⃣ Leer el archivo CSV limpio
df = pd.read_csv('../database/pacientes_clean.csv')

# 4️⃣ Convertir DataFrame a diccionario
data = df.to_dict(orient="records")

# 5️⃣ Insertar datos en MongoDB
if data:
    collection.insert_many(data)
    print(f"✅ {len(data)} registros insertados en MongoDB correctamente.")
else:
    print("⚠️ No hay datos para insertar.")

# 6️⃣ Confirmar colección creada
print("📁 Base de datos:", db.name)
print("📚 Colección:", collection.name)



✅ 2999 registros insertados en MongoDB correctamente.
📁 Base de datos: SaludDigital_2025
📚 Colección: pacientes


## ✅ A. Mostrar todos los documentos
Imprimir cada documento completo (cada fila del CSV convertido a JSON) almacenado en la colección préstamos.

In [4]:
from pymongo import MongoClient

# 1️⃣ Conectar con MongoDB
client = MongoClient("mongodb://localhost:27017/")

# 2️⃣ Seleccionar base de datos y colección
db = client["SaludDigital_2025"]
collection = db["pacientes"]

# 3️⃣ Mostrar todos los documentos
print("📋 Visualizar datos insertados en MongoDB (colección 'pacientes'):\n")
for doc in collection.find():
    print(doc)


📋 Visualizar datos insertados en MongoDB (colección 'pacientes'):

{'_id': ObjectId('68f27ae82e86bde930acfde1'), 'id_paciente': 'P00176', 'nombre': 'Miguel Mendoza', 'edad': 13.0, 'sexo': 'ND', 'distrito': 'Surco', 'servicio': 'Cardiología', 'fecha_atencion': '2021-01-27', 'monto': 871.25}
{'_id': ObjectId('68f27ae82e86bde930acfde2'), 'id_paciente': 'P02212', 'nombre': 'Ana Torres', 'edad': 28.0, 'sexo': 'ND', 'distrito': 'Desconocido', 'servicio': 'Emergencia', 'fecha_atencion': '2025-09-15', 'monto': 550.05}
{'_id': ObjectId('68f27ae82e86bde930acfde3'), 'id_paciente': 'P00242', 'nombre': 'José Flores', 'edad': 41.0, 'sexo': 'F', 'distrito': 'Desconocido', 'servicio': 'Rayos X', 'fecha_atencion': '2024-12-31', 'monto': 463.93}
{'_id': ObjectId('68f27ae82e86bde930acfde4'), 'id_paciente': 'P01022', 'nombre': 'María Castillo', 'edad': 30.0, 'sexo': 'F', 'distrito': 'Miraflores', 'servicio': 'Vacunación', 'fecha_atencion': '2024-04-13', 'monto': 113.47}
{'_id': ObjectId('68f27ae82e86bde93

## ✅ B. Mostrar solo los primeros registros
🔹 Ideal para no saturar la consola.

In [5]:
from pymongo import MongoClient

# 1️⃣ Conectar con MongoDB
client = MongoClient("mongodb://localhost:27017/")

# 2️⃣ Seleccionar base de datos y colección
db = client["SaludDigital_2025"]
collection = db["pacientes"]

# 3️⃣ Mostrar solo los primeros registros (campos seleccionados)
print("📋 Mostrando algunos registros de la colección 'pacientes':\n")
for doc in collection.find({}, {"_id": 0, "id_paciente": 1, "nombre": 1, "edad": 1, "monto": 1}).limit(10):
    print(doc)

📋 Mostrando algunos registros de la colección 'pacientes':

{'id_paciente': 'P00176', 'nombre': 'Miguel Mendoza', 'edad': 13.0, 'monto': 871.25}
{'id_paciente': 'P02212', 'nombre': 'Ana Torres', 'edad': 28.0, 'monto': 550.05}
{'id_paciente': 'P00242', 'nombre': 'José Flores', 'edad': 41.0, 'monto': 463.93}
{'id_paciente': 'P01022', 'nombre': 'María Castillo', 'edad': 30.0, 'monto': 113.47}
{'id_paciente': 'P01961', 'nombre': 'SIN NOMBRE', 'edad': 73.0, 'monto': 827.46}
{'id_paciente': 'P01126', 'nombre': 'María Ramos', 'edad': 19.0, 'monto': 509.27}
{'id_paciente': 'P00666', 'nombre': 'SIN NOMBRE', 'edad': 19.0, 'monto': 463.93}
{'id_paciente': 'P00011', 'nombre': 'Lucía Castillo', 'edad': 52.0, 'monto': 563.63}
{'id_paciente': 'P00055', 'nombre': 'María Ramos', 'edad': 75.0, 'monto': 108.86}
{'id_paciente': 'P02954', 'nombre': 'María Pérez', 'edad': 47.0, 'monto': 463.93}


## ✅ C. Consultar solo algunos campos
Por ejemplo, mostrar solo el número de cuenta y saldo:


In [6]:
from pymongo import MongoClient

# 1️⃣ Conectar con MongoDB
client = MongoClient("mongodb://localhost:27017/")

# 2️⃣ Seleccionar base de datos y colección
db = client["SaludDigital_2025"]
collection = db["pacientes"]

# 3️⃣ Consultar y mostrar solo algunos campos
print("📋 Consultando campos seleccionados (id_paciente, nombre, servicio, monto):\n")
for doc in collection.find({}, {"_id": 0, "id_paciente": 1, "nombre": 1, "servicio": 1, "monto": 1}):
    print(doc)


📋 Consultando campos seleccionados (id_paciente, nombre, servicio, monto):

{'id_paciente': 'P00176', 'nombre': 'Miguel Mendoza', 'servicio': 'Cardiología', 'monto': 871.25}
{'id_paciente': 'P02212', 'nombre': 'Ana Torres', 'servicio': 'Emergencia', 'monto': 550.05}
{'id_paciente': 'P00242', 'nombre': 'José Flores', 'servicio': 'Rayos X', 'monto': 463.93}
{'id_paciente': 'P01022', 'nombre': 'María Castillo', 'servicio': 'Vacunación', 'monto': 113.47}
{'id_paciente': 'P01961', 'nombre': 'SIN NOMBRE', 'servicio': 'Rayos X', 'monto': 827.46}
{'id_paciente': 'P01126', 'nombre': 'María Ramos', 'servicio': 'Odontología', 'monto': 509.27}
{'id_paciente': 'P00666', 'nombre': 'SIN NOMBRE', 'servicio': 'Odontología', 'monto': 463.93}
{'id_paciente': 'P00011', 'nombre': 'Lucía Castillo', 'servicio': 'Cardiología', 'monto': 563.63}
{'id_paciente': 'P00055', 'nombre': 'María Ramos', 'servicio': 'Sin servicio', 'monto': 108.86}
{'id_paciente': 'P02954', 'nombre': 'María Pérez', 'servicio': 'Otro', '

## ✅ D. Consultar con filtro (condición WHERE)

In [7]:
from pymongo import MongoClient

# 1️⃣ Conectar con MongoDB
client = MongoClient("mongodb://localhost:27017/")

# 2️⃣ Seleccionar base de datos y colección
db = client["SaludDigital_2025"]
collection = db["pacientes"]

# 3️⃣ Definir la consulta (filtro)
# 🔹 $gt significa "mayor que"
consulta = {"monto": {"$gt": 500}}

# 4️⃣ Ejecutar la consulta mostrando solo algunos campos
print("📋 Pacientes con monto mayor a 500:\n")
for doc in collection.find(consulta, {"_id": 0, "id_paciente": 1, "nombre": 1, "monto": 1}):
    print(doc)


📋 Pacientes con monto mayor a 500:

{'id_paciente': 'P00176', 'nombre': 'Miguel Mendoza', 'monto': 871.25}
{'id_paciente': 'P02212', 'nombre': 'Ana Torres', 'monto': 550.05}
{'id_paciente': 'P01961', 'nombre': 'SIN NOMBRE', 'monto': 827.46}
{'id_paciente': 'P01126', 'nombre': 'María Ramos', 'monto': 509.27}
{'id_paciente': 'P00011', 'nombre': 'Lucía Castillo', 'monto': 563.63}
{'id_paciente': 'P01346', 'nombre': 'Miguel Gómez', 'monto': 983.05}
{'id_paciente': 'P02548', 'nombre': 'José Torres', 'monto': 523.42}
{'id_paciente': 'P00819', 'nombre': 'Javier Mendoza', 'monto': 547.92}
{'id_paciente': 'P02021', 'nombre': 'Javier Ramos', 'monto': 731.93}
{'id_paciente': 'P02858', 'nombre': 'José Mendoza', 'monto': 728.63}
{'id_paciente': 'P01239', 'nombre': 'José Mendoza', 'monto': 634.81}
{'id_paciente': 'P02432', 'nombre': 'Carlos Fernández', 'monto': 504.86}
{'id_paciente': 'P00854', 'nombre': 'Miguel Mendoza', 'monto': 982.68}
{'id_paciente': 'P02211', 'nombre': 'Ana Vargas', 'monto': 72

## ✅ E. Contar cuántos documentos hay en total

In [8]:
from pymongo import MongoClient

# 1️⃣ Conectar con MongoDB
client = MongoClient("mongodb://localhost:27017/")

# 2️⃣ Seleccionar base de datos y colección
db = client["SaludDigital_2025"]
collection = db["pacientes"]

# 3️⃣ Contar todos los documentos
total = collection.count_documents({})

print("📊 Total de registros en la colección 'pacientes':", total)


📊 Total de registros en la colección 'pacientes': 2999
