## 🧩 Fase 3 – Generación de Datos Aleatorios
Generar un archivo CSV (pacientes.csv) con 3000 registros simulados, que incluya campos nulos, NA, entre otros

In [2]:
from pathlib import Path
import csv
import random
from datetime import datetime, timedelta

# Crear carpeta "data" si no existe
data_path = Path.home() / "Documents" / "SaludDigital_E1" / "data"
data_path.mkdir(parents=True, exist_ok=True)

# Definir archivo CSV
csv_file = data_path / "atenciones.csv"

# Listas base de datos simulados
nombres = ["Luis", "María", "José", "Ana", "Carlos", "Lucía", "Pedro", "Sofía", "Miguel", "Valeria"]
sexos = ["M", "F"]
distritos = ["San Isidro", "Miraflores", "Surco", "La Molina", "Lince", "Callao", "Cajamarca"]
servicios = ["Consulta médica", "Odontología", "Pediatría", "Ginecología", "Laboratorio", "Emergencia"]
valores_nulos = ["", "NA", "null", "N/D"]

# Generar fecha aleatoria
def generar_fecha():
    inicio = datetime(2015, 1, 1)
    fin = datetime(2025, 1, 1)
    delta = fin - inicio
    fecha_random = inicio + timedelta(days=random.randint(0, delta.days))
    return fecha_random.strftime("%d/%m/%Y")

# Función para insertar nulos aleatoriamente
def posiblemente_nulo(valor, probabilidad=0.1):
    return random.choice(valores_nulos) if random.random() < probabilidad else valor

# Crear registros simulados
registros = []
for i in range(1, 3001):
    id_paciente = f"P{str(i).zfill(5)}"
    nombre = posiblemente_nulo(random.choice(nombres))
    edad = posiblemente_nulo(random.randint(1, 99))
    sexo = posiblemente_nulo(random.choice(sexos))
    distrito = posiblemente_nulo(random.choice(distritos))
    servicio = posiblemente_nulo(random.choice(servicios))
    fecha_atencion = posiblemente_nulo(generar_fecha())
    monto = posiblemente_nulo(round(random.uniform(20, 500), 2))
    registros.append([id_paciente, nombre, edad, sexo, distrito, servicio, fecha_atencion, monto])

# Escribir en el archivo CSV
with open(csv_file, mode="w", newline="", encoding="utf-8") as file:
    writer = csv.writer(file)
    writer.writerow(["id_paciente", "nombre", "edad", "sexo", "distrito", "servicio", "fecha_atencion", "monto"])
    writer.writerows(registros)

print(f"Archivo generado correctamente en: {csv_file}")
print(f"Total de registros: {len(registros)}")

Archivo generado correctamente en: C:\Users\ALEXANDER\Documents\SaludDigital_E1\data\atenciones.csv
Total de registros: 3000
