# Carga de datos en MongoDB

In [2]:
# Fase 5: Integración con MongoDB
import pandas as pd
from pymongo import MongoClient

client = MongoClient("mongodb://localhost:27017/")
db = client["SaludDigital_2025"]
collection = db["pacientes"]

df = pd.read_csv('../database/pacientes_clean.csv')
data = df.to_dict(orient="records")
collection.insert_many(data)
print("Datos insertados en MongoDB correctamente.")

# A. Mostrar todos los documentos
print("Visualizar datos insertados en MongoDB.")
for doc in collection.find():
    print(doc)

# B. Mostrar solo los primeros registros (ejemplo: primeros 5)
for doc in collection.find().limit(5):
    print(doc)

# C. Consultar solo algunos campos (ej: id_paciente y monto)
for doc in collection.find({}, {"_id": 0, "id_paciente": 1, "monto": 1}):
    print(doc)

# D. Consultar con filtro (ej: monto > 300)
consulta = {"monto": {"$gt": 300}}
for doc in collection.find(consulta, {"_id": 0, "id_paciente": 1, "monto": 1}):
    print(doc)

# E. Contar cuántos documentos hay en total
print("Total de registros:", collection.count_documents({}))

# F. Buscar por distrito específico
consulta = {"Distrito": "Miraflores"}
for doc in collection.find(consulta):
    print(doc)

# G. Consultar solo pacientes con un servicio específico
consulta = {"servicio": "Odontología"}
for doc in collection.find(consulta):
    print(doc)

Datos insertados en MongoDB correctamente.
Visualizar datos insertados en MongoDB.
{'_id': ObjectId('68f278c6005c787bb0588b3d'), 'id_paciente': 'P001', 'nombre': 'Paciente Juan ', 'edad': 15, 'sexo': 'M', 'Distrito': 'Miraflores', 'servicio': 'Dermatología', 'fecha_atencion': '2024-11-15', 'monto': 403.98}
{'_id': ObjectId('68f278c6005c787bb0588b3e'), 'id_paciente': 'P002', 'nombre': 'Paciente Luis García', 'edad': 72, 'sexo': 'F', 'Distrito': 'Callao', 'servicio': 'Pediatría', 'fecha_atencion': '2020-04-14', 'monto': 270.5643042867182}
{'_id': ObjectId('68f278c6005c787bb0588b3f'), 'id_paciente': 'P003', 'nombre': 'Paciente Maria García', 'edad': 86, 'sexo': 'M', 'Distrito': 'Miraflores', 'servicio': 'Pediatría', 'fecha_atencion': '2020-05-24', 'monto': 158.02}
{'_id': ObjectId('68f278c6005c787bb0588b40'), 'id_paciente': 'P004', 'nombre': 'Paciente Juan Pérez', 'edad': 88, 'sexo': 'M', 'Distrito': 'Surco', 'servicio': 'Cardiología', 'fecha_atencion': '2022-08-30', 'monto': 404.19}
{'_i