# Script para generar datos sintéticos (Python)

In [None]:
from sqlalchemy import create_engine

def load_data_postgresql(pdf):
    try:
        conn_string = 'postgresql+psycopg2://usuario:contraseña@localhost:5432/nombre_basedatos'
        engine = create_engine(conn_string)
        print('Loading...')
        print(pdf)
        pdf.to_sql('clientes_atendidos', engine, if_exists='replace', index=False)
        print('Loaded!!')
    except NameError:
        print('Exception..')

In [None]:
import pandas as pd
import random
from datetime import datetime, timedelta

# Función para generar fechas aleatorias
def random_date(start, end):
    return start + timedelta(days=random.randint(0, (end - start).days))

# Generar clientes atendidos
clientes_ids = [f"C{i:04d}" for i in range(1, 10001)]
nombres_clientes = [f"Cliente {i}" for i in range(1, 10001)]
fechas_atencion = [random_date(datetime(2025, 3, 1), datetime(2025, 4, 1)) for _ in range(10000)]
servicios = ["Servicio A", "Servicio B", "Servicio C"]
df_clientes = pd.DataFrame({
    "cliente_id": clientes_ids,
    "nombre_cliente": nombres_clientes,
    "fecha_atencion": fechas_atencion,
    "servicio": [random.choice(servicios) for _ in range(10000)]
})

# Guardar como CSV
df_clientes.to_csv("./clientes_atendidos.csv", index=False)

# Generar facturas emitidas (~95% de los clientes)
facturas_ids = [f"F{i:03d}" for i in range(1, 9501)]
clientes_facturados = clientes_ids[:9500]
fechas_facturas = [random_date(datetime(2025, 3, 5), datetime(2025, 4, 5)) for _ in range(9500)]
montos = [round(random.uniform(50, 500), 2) for _ in range(9500)]
estados_pago = ["Cobrado", "Pendiente"]
df_facturas = pd.DataFrame({
    "factura_id": facturas_ids,
    "cliente_id": clientes_facturados,
    "fecha_factura": fechas_facturas,
    "monto": montos,
    "estado_pago": [random.choice(estados_pago) for _ in range(9500)]
})
df_facturas.to_csv("./facturas_emitidas.csv", index=False)

print("Datos generados.")

In [None]:
# Cargar datos clientes atendidos en PostgreSQL
load_data_postgresql(df_clientes)