In [1]:
import pandas as pd
import numpy as np
import requests
from random import randint, uniform, choice
from datetime import datetime, timedelta
from faker import Faker
fake = Faker('es_CL')

# Contadores para IDs personalizados
contador_libros = 1
contador_empleados = 1
contador_asistencias = 1
contador_pagos = 1
contador_ventas = 1
contador_contratos = 1
contador_clientes = 1
contador_pedidos = 1
contador_proveedores = 1

############################ IDs ############################
def generar_id(prefix, contador):
    return f"{prefix}{contador:03d}"

############################ números de teléfono ############################
def generar_telefono():
    return f"+56 9 {randint(10000000, 99999999)}"

############################ fechas de pago y asistencia ############################
def generar_fecha(inicio="2024-09-20", dias_max=30):
    inicio_date = datetime.strptime(inicio, "%Y-%m-%d")
    delta = timedelta(days=randint(0, dias_max))
    return inicio_date + delta

############################r horas de entrada y salida ############################
def generar_horas_trabajo():
    hora_entrada_base = datetime.strptime("09:30", "%H:%M")
    variacion_entrada = timedelta(minutes=randint(-10, 30))
    hora_entrada = hora_entrada_base + variacion_entrada
    horas_trabajadas = uniform(8, 10)
    hora_salida = hora_entrada + timedelta(hours=horas_trabajadas)
    return hora_entrada.time(), hora_salida.time(), round(horas_trabajadas, 2)

############################ libros reales ############################
def generar_libros(n):
    global contador_libros
    libros = []
    url = "https://www.googleapis.com/books/v1/volumes?q=subject:fiction&maxResults=40"
    
    response = requests.get(url)
    data = response.json()

    for item in data.get('items', [])[:n]:
        volume_info = item['volumeInfo']
        libro = {
            'ISBN': volume_info.get('industryIdentifiers', [{}])[0].get('identifier', fake.isbn13()),
            'LibroID': generar_id('L', contador_libros),
            'Título': volume_info.get('title', 'Título desconocido'),
            'Autor': ', '.join(volume_info.get('authors', ['Autor desconocido'])),
            'Editorial': volume_info.get('publisher', 'Editorial desconocida'),
            'Categoría': 'Ficción',
            'CostoVenta': round(uniform(5000, 30000), 2),
            'Stock': randint(1, 100),
            'CostoCompra': round(uniform(4000, 25000), 2)
        }
        libros.append(libro)
        contador_libros += 1
    return pd.DataFrame(libros)

def generar_empleados(n):
    global contador_empleados
    empleados = []
    posiciones = ['Cajero', 'Gerente', 'Vendedor', 'Administrador', 'Limpieza']
    for _ in range(n):
        empleado = {
            'EmpleadoID': generar_id('E', contador_empleados),
            'Nombre': fake.first_name(),
            'Apellido': fake.last_name(),
            'Teléfono': generar_telefono(),
            'Dirección': fake.address(),
            'Posición': choice(posiciones)
        }
        empleados.append(empleado)
        contador_empleados += 1
    return pd.DataFrame(empleados)

############################# contratos ############################
def generar_contratos(n):
    global contador_contratos
    contratos = []
    for _ in range(n):
        contrato = {
            'ContratoID': generar_id('C', contador_contratos),
            'HorasSemanalesMínimas': randint(30, 45),
            'FechaInicio': fake.date_this_decade(),
            'FechaTérmino': fake.date_this_decade() if uniform(0, 1) > 0.7 else None
        }
        contratos.append(contrato)
        contador_contratos += 1
    return pd.DataFrame(contratos)

############################# clientes ############################
def generar_clientes(n):
    global contador_clientes
    clientes = []
    for _ in range(n):
        cliente = {
            'Rut': fake.unique.random_number(digits=8, fix_len=True),
            'Nombre': fake.first_name(),
            'Apellido': fake.last_name(),
            'Teléfono': generar_telefono()
        }
        clientes.append(cliente)
        contador_clientes += 1
    return pd.DataFrame(clientes)

############################# asistencias ############################
def generar_asistencias(empleados_df, dias_max=30):
    global contador_asistencias
    asistencias = []
    for _, row in empleados_df.iterrows():
        for _ in range(randint(1, 5)):
            asistencia_id = generar_id('A', contador_asistencias)
            contador_asistencias += 1
            empleado_id = row["EmpleadoID"]
            fecha = generar_fecha(dias_max=dias_max)
            hora_ingreso, hora_salida, horas_trabajadas = generar_horas_trabajo()
            estado = "Presente" if horas_trabajadas >= 8 else "Permiso"
            asistencias.append([asistencia_id, empleado_id, fecha.date(), hora_ingreso, hora_salida, horas_trabajadas, estado])
    return pd.DataFrame(asistencias, columns=["AsistenciaID", "EmpleadoID", "Fecha", "HoraIngreso", "HoraSalida", "HorasTrabajadas", "Estado"])

############################# ventas ############################
def generar_ventas(empleados_df, libros_df, n_ventas=50):
    global contador_ventas
    ventas = []
    vendedores = empleados_df[empleados_df["Posición"] == "Vendedor"]["EmpleadoID"].tolist()
    for _ in range(n_ventas):
        venta_id = generar_id('V', contador_ventas)
        contador_ventas += 1
        vendedor_id = choice(vendedores)
        libro_id = choice(libros_df["LibroID"].tolist())
        cantidad = randint(1, 3)
        ventas.append([venta_id, vendedor_id, libro_id, cantidad])
    return pd.DataFrame(ventas, columns=["VentaID", "EmpleadoID", "LibroID", "Cantidad"])

#############################r pagos ############################
def generar_pagos(empleados_df, ventas_df):
    global contador_pagos
    pagos = []
    for _, row in empleados_df.iterrows():
        pago_id = generar_id('P', contador_pagos)
        contador_pagos += 1
        empleado_id = row["EmpleadoID"]
        sueldo_base = randint(500000, 1500000)
        horas_extra = round(uniform(0, 2), 2)
        ajuste_economico = round(sueldo_base * uniform(0.001, 0.01), 2)
        
        # incentivos para vendedores si tienen más de 20 ventas
        incentivo = 0
        if row["Posición"] == "Vendedor":
            ventas_vendedor = ventas_df[ventas_df["EmpleadoID"] == empleado_id]["Cantidad"].sum()
            if ventas_vendedor > 20:
                incentivo = 50000
        
        total_pago = sueldo_base + (horas_extra * (sueldo_base / 160)) + ajuste_economico + incentivo
        fecha_pago = generar_fecha(dias_max=30)
        pagos.append([pago_id, empleado_id, sueldo_base, horas_extra, ajuste_economico, incentivo, round(total_pago, 2), fecha_pago.date()])
    return pd.DataFrame(pagos, columns=["PagoID", "EmpleadoID", "Sueldo", "HorasExtra", "AjusteEconómico", "Incentivo", "TotalPago", "FechaPago"])

############################# pedidos ############################
def generar_pedidos(n):
    global contador_pedidos
    pedidos = []
    for _ in range(n):
        pedido = {
            'PedidoID': generar_id('PD', contador_pedidos),
            'FechaPedido': fake.date_this_year(),
            'EstadoPago': choice(['Confirmado', 'Pendiente', 'Cancelado'])
        }
        pedidos.append(pedido)
        contador_pedidos += 1
    return pd.DataFrame(pedidos)

############################ proveedores ##########################
def generar_proveedores(n):
    global contador_proveedores
    proveedores = []
    for _ in range(n):
        proveedor = {
            'ProveedorID': generar_id('PR', contador_proveedores),
            'Nombre': fake.company(),
            'Teléfono': fake.phone_number(),
            'País': fake.country(),
            'Ciudad': fake.city(),
            'PersonaContacto': fake.name(),
            'Dirección': fake.address(),
            'Correo': fake.email()
        }
        proveedores.append(proveedor)
        contador_proveedores += 1
    return pd.DataFrame(proveedores)

######################### Generar los datos ###########################
libros_df = generar_libros(5)
empleados_df = generar_empleados(5)
contratos_df = generar_contratos(5)
clientes_df = generar_clientes(5)
ventas_df = generar_ventas(empleados_df, libros_df, n_ventas=50)
asistencias_df = generar_asistencias(empleados_df, dias_max=30)
pagos_df = generar_pagos(empleados_df, ventas_df)
pedidos_df = generar_pedidos(5)
proveedores_df = generar_proveedores(5)

################## Mostrar el head de los datyaframes ##########################
print(libros_df.head())
print(empleados_df.head())
print(asistencias_df.head())
print(pagos_df.head())
print(ventas_df.head())
print(proveedores_df.head())


            ISBN LibroID                              Título  \
0     1559707887    L001                Agamemnon's Daughter   
1     0810114844    L002                   The Twelve Chairs   
2  9780553902549    L003  Journey to the Center of the Earth   
3     0553144316    L004                        Future Shock   
4  9781524761356    L005                    Ready Player Two   

                          Autor                      Editorial Categoría  \
0                 Ismail Kadare              Arcade Publishing   Ficción   
1  Ilʹi︠a︡ Ilʹf, Evgeniĭ Petrov  Northwestern University Press   Ficción   
2                   Jules Verne                         Bantam   Ficción   
3                 Alvin Toffler        New York : Bantam Books   Ficción   
4                  Ernest Cline               Ballantine Books   Ficción   

   CostoVenta  Stock  CostoCompra  
0     8765.40    100     16683.06  
1     5909.60    100     20263.58  
2    20474.32     83     10962.12  
3     8180.44 

In [2]:
# Guardar los dataframes en csv
libros_df.to_csv('libros.csv', index=False, encoding='utf-8-sig')
empleados_df.to_csv('empleados.csv', index=False, encoding='utf-8-sig')
contratos_df.to_csv('contratos.csv', index=False, encoding='utf-8-sig')
clientes_df.to_csv('clientes.csv', index=False, encoding='utf-8-sig')
ventas_df.to_csv('ventas.csv', index=False, encoding='utf-8-sig')
asistencias_df.to_csv('asistencias.csv', index=False, encoding='utf-8-sig')
pagos_df.to_csv('pagos.csv', index=False, encoding='utf-8-sig')
pedidos_df.to_csv('pedidos.csv', index=False, encoding='utf-8-sig')
proveedores_df.to_csv('proveedores.csv', index=False, encoding='utf-8-sig')

print("Archivos CSV generados gloriosamente")


Archivos CSV generados exitosamente.
