In [4]:
# Uso del Pip install para poder importar la librería faker
!pip install faker

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


In [5]:
# Importar librería pandas para manejar y analizar datos
import pandas as pd
# Importar librería uuid para crear identificadores únicos.
import uuid
# Importar librería random para generar datos aleatorios.
import random
# Importar el paquete faker para generar datos fasos.
from faker import Faker
# Importar la librería datetime para manejar fechas.
import datetime
from datetime import date

In [6]:
# Delimitación del rango del número de elementos.
num_usuario = 5000

In [7]:
#Instanciación faker
faker = Faker()

In [8]:
# Una lista de 6 características para la entidad permiso
atributos = [
    "Id_perm",
    "entidad_perm",
    "tipo_perm",
    "fecha_asigna_perm",
    "fecha_caduca_perm", 
    "Status_perm" 
]

In [9]:
# arreglo con valores para atributo entidad
entidad =[
    "Permisos",
    "Roles",
    "Personal",
    "Departamento",
    "Misil",
    "Componente",
    "Pieza",
    "Proveedor",
    "Parametro"
]


In [10]:
# arreglo con valores para atributo tipo
tipo = [
    "Lectura",
    "Escritura"
]

In [11]:
# arreglo con valores para atributo estado
status = [
    "Vigente",
    "Caducado"
]

In [12]:
# Creación de un DF para las 6 características de la entidad permiso
df = pd.DataFrame(columns = atributos)

In [14]:
# Generar un identificador por cada permiso
def idp_gen(n):
    """
    Función para crear la id única
    ...
    Parametro
    n : int
        corresponde al numero indicador del registro correspondiente 
    
    Return
    ------
    "PERM-"+str(n+1) : str
        se crea las identificaciones únicas para los permisos
    """
    return "PERM-"+str(n+1)

In [15]:
df['Id_perm'] = [idp_gen(i) for i in range(num_usuario)]

In [16]:
# Determinar la entidad a la que pertenece cada permiso
def entidad_gen():
    """
    Función para asignar una entidad para el permiso
    ...
    
    Return
    ------
    random.choice(entidad) : str
        generación de la entidad para su asignación en el registro
    """
    return random.choice(entidad)

In [17]:
df['entidad_perm'] = [entidad_gen() for i in range(num_usuario)]

In [18]:
# Determinar el tipo de permiso 
def tipo_gen():
    """
    Función para asignar el tipo de permiso
    ...
    
    Return
    ------
    random.choice(tipo) : str
        generación del tipo de permiso aleatorio
    """
    return random.choice(tipo)

In [19]:
df['tipo_perm'] = [tipo_gen() for i in range(num_usuario)]

In [20]:
# Generar una fecha de asignación de permiso a cada registro
def fechAsig_gen():
    """
    Función para crear fecha de asignación del permiso
    ...
    
    Return
    ------
    faker.date_between('-10y') : obj datetime.date
        generación de una fecha entre 10 años antes hasta la fecha actual
    """
    return faker.date_between('-10y')

In [21]:
df['fecha_asigna_perm'] = [fechAsig_gen() for i in range(num_usuario)]

In [22]:
# Determinar una fecha de caducidad de permiso de cada registro
def fechCad_gen(fecha):
    """
    Función para crear fecha de caducidad
    ...
    
    Parametro
    ---------
    fecha : obj Datetime.date
        variable que corresponde a la fecha de asignación del permiso
    
    Return
    ------
    caduca: str
        generación de una fecha con rango de 10 años antes y despues dela fecha actual
    """
    #asignación de objeto con fecha con rango de 10 años antes y despues de fecha actual
    caduca = faker.date_this_decade(True, True)
    #bucle para asegurar que la fecha inicio sea menor a la fecha caduca
    while (caduca <= fecha):
        caduca = faker.date_this_decade(True, True) #genera nueva fecha que cumpla con condicional
    return caduca

In [23]:
df['fecha_caduca_perm'] = [fechCad_gen(i) for i in df["fecha_asigna_perm"]]

In [24]:
# Determinar el estado en que se encuentra cada permiso
def status_gen(fecha):
    """
    Función para la generación de estado del permiso
    ...
    
    Parametros
    ----------
    fecha : obj datetime.date
        fecha correspondiente a la caducidad
    
    Return
    ------
    status[0] :  str
        envía la cadena correspondiente al indice 0 del arreglo status
        
    status[1] : str
        envia la cadena que está en el indice 1 del arreglo status
    """
    #formato de fecha
    frmt = "%Y-%m-%d"
    #Asignación de fecha actual en tipo objeto date
    now = date.today()
    #Fecha actual conseguida
    stime = datetime.datetime.strptime(str(fecha), frmt)
    #Fecha actual
    now1 = datetime.datetime.strptime(str(now), frmt)
    #indicador entero basado en el calculo de edad
    ind = int((stime-now1).days/365.25)
    #asignación de estado de acuerdo al indicador
    if (ind>0):
        return status[0]
    else:
        return status[1]

In [25]:
df['Status_perm'] = [status_gen(i) for i in df["fecha_caduca_perm"]]

In [26]:
# Guardar el conjunto de datos
df.to_csv('dataset_Permisos.csv')

In [27]:
# Mostrar el conjunto de datos
pd.read_csv('dataset_Permisos.csv', index_col=0)

Unnamed: 0,Id_perm,entidad_perm,tipo_perm,fecha_asigna_perm,fecha_caduca_perm,Status_perm
0,PERM-1,Personal,Lectura,2022-02-14,2027-07-18,Vigente
1,PERM-2,Proveedor,Escritura,2016-07-24,2020-12-21,Caducado
2,PERM-3,Personal,Escritura,2018-03-22,2023-09-18,Caducado
3,PERM-4,Componente,Lectura,2018-09-21,2022-10-03,Caducado
4,PERM-5,Permisos,Lectura,2022-07-06,2025-02-06,Vigente
...,...,...,...,...,...,...
4995,PERM-4996,Pieza,Lectura,2016-02-10,2024-04-20,Vigente
4996,PERM-4997,Componente,Lectura,2019-12-17,2027-09-07,Vigente
4997,PERM-4998,Parametro,Escritura,2014-02-10,2027-05-22,Vigente
4998,PERM-4999,Misil,Lectura,2019-11-03,2026-12-19,Vigente
