#🐍 Script: Generar_Data_Pacientes.csv

In [3]:
from pathlib import Path
import csv
import random
from datetime import datetime, timedelta

# 1️⃣ Crear carpeta "data" si no existe
data_path = Path.cwd() / "../data"
data_path.mkdir(parents=True, exist_ok=True)

# 2️⃣ Definir archivo CSV
csv_file = data_path / "pacientes.csv"

# 3️⃣ Listas base para generar datos
nombres = ["Ana", "Luis", "María", "Carlos", "Sofía", "José", "Lucía", "Miguel", "Carmen", "Andrés"]
apellidos = ["Torres", "Pérez", "Gómez", "Rojas", "Fernández", "Díaz", "Ramírez", "Castro", "Salazar", "Cabrera"]
sexos = ["M", "F"]
distritos = ["Miraflores", "Surco", "San Isidro", "La Molina", "Cajamarca", "Callao", "Lince", "Jesús María"]
servicios = ["Odontología", "Pediatría", "Cardiología", "Traumatología", "Dermatología", "Ginecología", "Oftalmología"]

# 4️⃣ Generar fecha aleatoria entre 2020 y 2025
def generar_fecha():
    inicio = datetime(2020, 1, 1)
    fin = datetime(2025, 12, 31)
    delta = fin - inicio
    fecha_random = inicio + timedelta(days=random.randint(0, delta.days))
    return fecha_random.strftime("%Y-%m-%d")

# 5️⃣ Generar 3000 registros con algunos valores nulos
registros = []
for i in range(1, 3001):
    id_paciente = f"P{i:04d}"
    nombre = f"{random.choice(nombres)} {random.choice(apellidos)}"
    edad = random.randint(1, 90)
    sexo = random.choice(sexos)

    # 10% de probabilidad de dejar nulo el distrito
    distrito = random.choice(distritos) if random.random() > 0.1 else None
    # 8% de probabilidad de dejar nulo el servicio
    servicio = random.choice(servicios) if random.random() > 0.08 else None
    # 5% de probabilidad de dejar nulo el monto
    monto = random.randint(50, 500) if random.random() > 0.05 else None

    fecha_atencion = generar_fecha()

    registros.append([id_paciente, nombre, edad, sexo, distrito, servicio, fecha_atencion, monto])

# 6️⃣ Escribir en el archivo CSV
with open(csv_file, mode="w", newline="", encoding="utf-8") as file:
    writer = csv.writer(file)
    writer.writerow(["id_paciente", "nombre", "edad", "sexo", "distrito", "servicio", "fecha_atencion", "monto"])
    writer.writerows(registros)

print(f"✅ Archivo 'pacientes.csv' generado correctamente en: {csv_file}")
print(f"📊 Total de registros: {len(registros)}")
print("⚠️ Se han introducido valores nulos aleatorios en 'distrito', 'servicio' y 'monto'.")


✅ Archivo 'pacientes.csv' generado correctamente en: c:\Users\fchav\documents\SaludDigitalB_E1\scripts\..\data\pacientes.csv
📊 Total de registros: 3000
⚠️ Se han introducido valores nulos aleatorios en 'distrito', 'servicio' y 'monto'.
