# Generando  los datos de los pacientes

In [2]:
#Fase 3: Generar 3000 registros de pacientes con campos nulos/NA
from pathlib import Path
import csv
import random
from datetime import datetime, timedelta

#1. Crear carpeta "data" si no existe
data_path = Path.cwd() / "../data"
data_path.mkdir(parents=True, exist_ok=True)

#2. Definir archivo CSV
csv_file = data_path / "pacientes.csv"

#3. Listas base de datos simulados
servicios = ["Odontología", "Pediatría", "Cardiología", "Dermatología", "NA"]
distritos = ["Miraflores", "Surco", "San Isidro", "La Molina", "Lince", "Callao", "Cajamarca"]
sexos = ["M", "F", "NA"]

#4. Generar fecha aleatoria
def generar_fecha():
    inicio = datetime(2020, 1, 1)
    fin = datetime(2025, 1, 1)
    delta = fin - inicio
    fecha_random = inicio + timedelta(days=random.randint(0, delta.days))
    return fecha_random.strftime("%Y-%m-%d")

#5. Generar 3000 registros simulados (incluyendo nulos/NA)
registros = []
for i in range(1, 3001):
    id_paciente = f"P{str(i).zfill(3)}"
    nombre = f"Paciente {random.choice(['Ana', 'Luis', 'Maria', 'Juan', ''])} {random.choice(['Torres', 'Pérez', 'García', ''])}"  # Posibles vacíos
    edad = random.randint(1, 90) if random.random() > 0.05 else None  # 5% nulos
    sexo = random.choice(sexos)
    distrito = random.choice(distritos)
    servicio = random.choice(servicios)
    fecha_atencion = generar_fecha() if random.random() > 0.05 else ""  # 5% vacíos
    monto = round(random.uniform(50, 500), 2) if random.random() > 0.05 else None  # 5% nulos
    registros.append([id_paciente, nombre, edad, sexo, distrito, servicio, fecha_atencion, monto])

#6. Escribir en el archivo CSV
with open(csv_file, mode="w", newline="", encoding="utf-8") as file:
    writer = csv.writer(file)
    writer.writerow(["id_paciente", "nombre", "edad", "sexo", "Distrito", "servicio", "fecha_atencion", "monto"])
    writer.writerows(registros)

print(f"Archivo generado correctamente en: {csv_file}")
print(f"Total de registros: {len(registros)}")

Archivo generado correctamente en: c:\Users\MilderGonzalez\documents\SaludDigitalA_2025\scripts\..\data\pacientes.csv
Total de registros: 3000
