In [12]:
import random
import string
import datetime
import itertools
import pandas as pd

# Configuración de cantidades
N_CLIENTES = 10
N_EQUIPOS = 5
N_EMPLEADOS = 30
N_PROYECTOS = 5
N_TAREAS = 200
N_ASIGNACIONES = 100
N_ESTADISTICAS = 20
N_INCIDENTES = 120

# Generadores básicos
def random_email(name):
    dominios = ['gmail.com', 'outlook.com', 'empresa.com']
    return f'{name.lower()}{random.randint(1,99)}@{random.choice(dominios)}'

def random_phone():
    return f'+52{random.randint(2220000000, 2299999999)}'

def random_industria():
    return random.choice(['Fintech', 'Educación', 'Salud', 'Retail', 'Transporte'])

def random_nombre():
    return ''.join(random.choices(string.ascii_uppercase, k=6))

def random_equipo():
    return f'Equipo_{random.choice(string.ascii_uppercase)}'

def random_estado_tarea():
    return random.choice(['PENDIENTE', 'EN_PROGRESO', 'EN_REVISION', 'COMPLETADA', 'BLOQUEADA'])

def random_estado_proyecto():
    return random.choice(['ACTIVO', 'CANCELADO', 'EN_PRUEBAS', 'EN_PLANEACION', 'FINALIZADO', 'PAUSADO'])

def random_prioridad():
    return random.choice(['BAJA', 'MEDIA', 'ALTA', 'CRITICA'])

def random_tipo_proyecto():
    return random.choice(['WEB', 'MOVIL', 'ESCRITORIO', 'EMBEBIDO'])

def random_fecha(base=datetime.date.today()):
    return base - datetime.timedelta(days=random.randint(1,1000))

# Crear clientes
clientes = []
for i in range(1, N_CLIENTES+1):
    nombre = random_nombre()
    clientes.append([
        i,
        nombre,
        random_email(nombre),
        random_phone(),
        random_industria(),
        round(random.uniform(50000, 200000), 2)
    ])

clientes_df = pd.DataFrame(clientes, columns=['idCliente','Nombre','Email','Telefono','Industria','MetricaClienteInicial'])

# Crear equipos
equipos = []
for i in range(1, N_EQUIPOS+1):
    equipos.append([
        i,
        random_equipo(),
        random.choice([0,1])
    ])
equipos_df = pd.DataFrame(equipos, columns=['idEquipo','Nombre','Activo'])

# Crear empleados (siempre ligados a un equipo)
empleados = []
for i in range(1, N_EMPLEADOS+1):
    nombre = random_nombre()
    empleados.append([
        i,
        nombre,
        random_email(nombre),
        round(random.uniform(8000,22000), 2),
        round(random.uniform(100,300), 2),
        random.randint(1,N_EQUIPOS)
    ])
empleados_df = pd.DataFrame(empleados, columns=['idEmpleado','Nombre','Email','Salario','SalarioxHora','Equipo_idEquipo'])

# Estadísticas del proyecto
estadisticas = []
for i in range(1, N_ESTADISTICAS+1):
    estadisticas.append([
        i,
        random_fecha(),
        random.randint(5,100),
        random.randint(0,25),
        round(random.uniform(10,100), 2),
        round(random.uniform(500, 20000), 2)
    ])
estadisticas_df = pd.DataFrame(estadisticas, columns=['idEstadistica','Fecha','Tareas_completadas','Tareas_pendientes','Horas_trabajadas','Costo_diario'])

# Proyectos
proyectos = []
for i in range(1, N_PROYECTOS+1):
    fecha_inicio = random_fecha()
    duracion_estimada = random.randint(30, 180)  # duración del proyecto en días
    fecha_fin_estimada = fecha_inicio + datetime.timedelta(days=duracion_estimada)
    desviacion = random.randint(-10, 20)  # días que puede adelantarse o retrasarse la fecha real
    fecha_fin_real = fecha_fin_estimada + datetime.timedelta(days=desviacion)

    proyectos.append([
        i,
        f'Proyecto_{random_nombre()}',
        random.choice(['Sistema web de ventas','App móvil','ERP','Control escolar','Dashboard BI']),
        random_tipo_proyecto(),
        fecha_inicio,
        fecha_fin_estimada,
        fecha_fin_real,
        random_estado_proyecto(),
        round(random.uniform(50000,350000),2),
        round(random.uniform(50000,350000),2),
        random.randint(1,N_CLIENTES),
        random.randint(1,N_ESTADISTICAS),
        round(random.uniform(50000,350000),2),
        random.choice([0,1])
    ])

proyectos_df = pd.DataFrame(proyectos, columns=[
    'idProyecto','Nombre','Descripcion','Tipo',
    'Fecha_inicio','Fecha_fin_estimada','Fecha_fin_real','Estado',
    'Presupuesto','Costo_real','Cliente_idCliente','Estadisticas_Proyecto_idEstadistica',
    'MetricaClienteFinal','CertificacionSeguridad'
])

# Tareas
tareas = []
for i in range(1, N_TAREAS+1):
    fecha_creacion = random_fecha()
    duracion_estimada = random.randint(5, 30)  # duración de la tarea en días
    fecha_fin_estimada = fecha_creacion + datetime.timedelta(days=duracion_estimada)
    desviacion = random.randint(-3, 5)  # días que puede adelantarse o retrasarse la fecha real
    fecha_fin_real = fecha_fin_estimada + datetime.timedelta(days=desviacion)

    tareas.append([
        i,
        'Tarea_'+random_nombre(),
        'Implementar '+random.choice(['frontend','backend','API','deploy','test','analytics']),
        fecha_creacion,
        fecha_fin_estimada,
        fecha_fin_real,
        random_estado_tarea(),
        random_prioridad(),
        random.randint(5,120),
        random.choice([0,1]),
        random.choice([0,1])
    ])

tareas_df = pd.DataFrame(tareas, columns=[
    'idTarea','Titulo','Descripcion','Fecha_creacion',
    'Fecha_fin_estimada','Fecha_fin_real','Estado',
    'Prioridad','Horas_estimadas','EsAutomatizacion','EsReutilizado'
])

# Asignaciones de tareas modificado 
tareas_empleados = list(itertools.product(range(1, N_TAREAS+1), range(1, N_EMPLEADOS+1)))
random.shuffle(tareas_empleados)
tareas_empleados = tareas_empleados[:N_ASIGNACIONES]
asignaciones = []

for i, (tarea, empleado) in enumerate(tareas_empleados, start=1):
    asignaciones.append([
        i,  # idAsignacion
        tarea,
        empleado,
        random_fecha(),
        random.randint(5,120),   # Horas estimadas
        random.randint(5,120),   # Horas reales
        random.randint(1,N_PROYECTOS)  # Proyecto
    ])
    
asignaciones_df = pd.DataFrame(asignaciones, columns=[
    'idAsignacion','Tarea_idTarea','Empleado_idEmpleado','Fecha_asignacion',
    'Horas_estimadas','Horas_reales','Proyecto_idProyecto'
])

# Incidentes
incidentes = []
for i in range(1, N_INCIDENTES+1):
    incidentes.append([
        i,
        random.randint(1,N_PROYECTOS),
        random_fecha(),
        random.choice(['BAJA','MEDIA','ALTA','CRITICA']),
        random.choice(['CERRADO']),
        random.randint(1,N_TAREAS),
        round(random.uniform(100,2500), 2)
    ])
incidentes_df = pd.DataFrame(incidentes, columns=[
    'idIncidente','Proyecto_idProyecto','Fecha_reporte','Severidad',
    'Estado','idTarea','CostoCorreccion'
])

# Guardar dataframes como CSV (puedes cambiar por .sql o insert)
#clientes_df.to_csv("sintetico_clientes.csv", index=False)
#equipos_df.to_csv("sintetico_equipos.csv", index=False)
#empleados_df.to_csv("sintetico_empleados.csv", index=False)
#estadisticas_df.to_csv("sintetico_estadisticas.csv", index=False)
#proyectos_df.to_csv("sintetico_proyectos.csv", index=False)
#tareas_df.to_csv("sintetico_tareas.csv", index=False)
#asignaciones_df.to_csv("sintetico_asignaciones.csv", index=False)
#incidentes_df.to_csv("sintetico_incidentes.csv", index=False)

print("Datos sintéticos generados correctamente.")


Datos sintéticos generados correctamente.


In [6]:
!pip install sqlalchemy mysql-connector-python pandas




[notice] A new release of pip is available: 25.0.1 -> 25.3
[notice] To update, run: python.exe -m pip install --upgrade pip


In [13]:
from sqlalchemy import create_engine

user = "root"
password = "13mysql22"
host = "localhost"
database = "db_gestion"

engine = create_engine(
    f"mysql+mysqlconnector://{user}:{password}@{host}:3306/{database}"
)
clientes_df.to_sql('cliente', con=engine, if_exists='append', index=False)
equipos_df.to_sql('equipo', con=engine, if_exists='append', index=False)
empleados_df.to_sql('empleado', con=engine, if_exists='append', index=False)
estadisticas_df.to_sql('estadisticas_proyecto', con=engine, if_exists='append', index=False)
proyectos_df.to_sql('proyecto', con=engine, if_exists='append', index=False)
tareas_df.to_sql('tarea', con=engine, if_exists='append', index=False)
asignaciones_df.to_sql('asignacion_tarea', con=engine, if_exists='append', index=False)
incidentes_df.to_sql('incidente', con=engine, if_exists='append', index=False)


120