## Generando datos aleatorios de pacientes

In [1]:
from pathlib import Path
import csv
import random
from datetime import datetime, timedelta

#  Ruta del archivo
data_path = Path.cwd() / "../data"
csv_file = data_path / "pacientes.csv"

#  Opciones de datos
sexo = ["M", "F"]
distrito = ["San Isidro", "Miraflores", "Surco", "La Molina", "Lince", "Callao", "San Juan de Lurigancho"]
servicio = ["Consulta General", "Emergencia", "Pediatría", "Ginecología", "Odontología", "Cardiología"]

nombres = ["Juan", "María", "Carlos", "Ana", "Luis", "Carmen", "Jorge", "Lucía", "Pedro", "Sofía",
           "Miguel", "Elena", "Diego", "Valeria", "Andrés", "Isabel", "Fernando", "Gabriela",
           "Alberto", "Marta", "Ricardo", "Patricia", "Santiago", "Natalia", "Javier", "Lorena",
           "Roberto", "Verónica", "Héctor", "Daniela", "Raúl", "Claudia", "Álvaro", "Silvia"]

apellidos = ["García", "Martínez", "Rodríguez", "López", "Hernández", "Pérez", "Sánchez", "Ramírez",
             "Cruz", "Flores", "Gómez", "Díaz", "Torres", "Vargas", "Rojas", "Castillo", "Jiménez", "Morales",
             "Silva", "Mendoza", "Ortiz", "Navarro", "Romero", "Suárez", "Ramos", "Vega", "Cabrera", "Soto", "Delgado",
             "Castro", "Guerrero", "Campos", "Acosta", "Alfaro", "Robles"]

#  Funciones auxiliares
def generar_fecha():
    inicio = datetime(2024, 1, 1)
    fin = datetime(2025, 1, 1)
    delta = fin - inicio
    fecha_random = inicio + timedelta(days=random.randint(0, delta.days))
    return fecha_random.strftime("%d/%m/%Y")

def generar_nombre_completo():
    nombre = random.choice(nombres)
    apellido = random.choice(apellidos)
    return f"{nombre} {apellido}"

def valor_con_na(valor_func, probabilidad_na=0.05):
    return valor_func() if random.random() > probabilidad_na else "NA"

def valor_lista_con_na(lista, probabilidad_na=0.05):
    return random.choice(lista) if random.random() > probabilidad_na else "NA"

# Generar registros
registros = []
for i in range(1, 3001):
    id_paciente = f"P{i:04}"
    nombre = valor_con_na(generar_nombre_completo, 0.03)
    edad = valor_con_na(lambda: random.randint(8, 90), 0.04)
    sexo_paciente = valor_lista_con_na(sexo, 0.05)
    distrito_paciente = valor_lista_con_na(distrito, 0.05)
    servicio_solicitado = valor_lista_con_na(servicio, 0.05)
    fecha_atencion = valor_con_na(generar_fecha, 0.02)
    monto_pagado = valor_con_na(lambda: round(random.uniform(50, 1000), 2), 0.06)

    registros.append([
        id_paciente,
        nombre,
        edad,
        sexo_paciente,
        distrito_paciente,
        servicio_solicitado,
        fecha_atencion,
        monto_pagado
    ])

#  Escribir CSV
with open(csv_file, mode="w", newline="", encoding="utf-8") as file:
    writer = csv.writer(file)
    writer.writerow(["id_paciente", "nombre", "edad", "sexo", "distrito", "servicio", "fecha_atencion", "monto"])
    writer.writerows(registros)


print(f"Archivo generado correctamente en: {csv_file.resolve()}")
print(f"Total de registros: {len(registros)}")


Archivo generado correctamente en: C:\Users\balfa\Documents\SaludDigitalB_E1\data\pacientes.csv
Total de registros: 3000
