In [1]:
# Uso del Pip install para poder importar la librería faker
!pip install faker

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting faker
  Downloading Faker-16.8.1-py3-none-any.whl (1.7 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.7/1.7 MB[0m [31m18.8 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: faker
Successfully installed faker-16.8.1


In [2]:
# Importar librería pandas para manejar y analizar datos
import pandas as pd
# Importar librería uuid para crear identificadores únicos.
import uuid
# Importar librería random para generar datos aleatorios.
import random
# Importar el paquete faker para generar datos fasos.
from faker import Faker
# Importar la librería datetime para manejar fechas.
import datetime
from datetime import date

In [3]:
# Delimitación del rango del número de elementos.
num_permiso = 5000

In [4]:
#Instanciación faker
faker = Faker()

In [5]:
# Una lista de 6 características para la entidad permiso
atributos = [
    "var_id_perm",
    "var_entidad_perm",
    "var_tipo_perm",
    "dt_fecha_asigna_perm",
    "dt_fecha_caduca_perm", 
    "var_status_perm" 
]

In [6]:
# arreglo con valores para atributo entidad
entidad =[
    "Permisos",
    "Roles",
    "Personal",
    "Departamento",
    "Misil",
    "Componente",
    "Pieza",
    "Proveedor",
    "Parametro"
]


In [7]:
# arreglo con valores para atributo tipo
tipo = [
    "Lectura",
    "Escritura"
]

In [8]:
# arreglo con valores para atributo estado
status = [
    "Vigente",
    "Caducado"
]

In [9]:
# Creación de un DF para las 6 características de la entidad permiso
df = pd.DataFrame(columns = atributos)

In [10]:
# Generar un identificador por cada permiso
def idp_gen(n):
    """
    Función para crear la id única
    ...
    Parametro
    n : int
        corresponde al numero indicador del registro correspondiente 
    
    Return
    ------
    "PERM-"+str(n+1) : str
        se crea las identificaciones únicas para los permisos
    """
    return "PERM "+str(n+1)

In [11]:
df['var_id_perm'] = [idp_gen(i) for i in range(num_permiso)]

In [12]:
# Determinar la entidad a la que pertenece cada permiso
def entidad_gen():
    """
    Función para asignar una entidad para el permiso
    ...
    
    Return
    ------
    random.choice(entidad) : str
        generación de la entidad para su asignación en el registro
    """
    return random.choice(entidad)

In [13]:
df['var_entidad_perm'] = [entidad_gen() for i in range(num_permiso)]

In [14]:
# Determinar el tipo de permiso 
def tipo_gen():
    """
    Función para asignar el tipo de permiso
    ...
    
    Return
    ------
    random.choice(tipo) : str
        generación del tipo de permiso aleatorio
    """
    return random.choice(tipo)

In [15]:
df['var_tipo_perm'] = [tipo_gen() for i in range(num_permiso)]

In [16]:
# Generar una fecha de asignación de permiso a cada registro
def fechAsig_gen():
    """
    Función para crear fecha de asignación del permiso
    ...
    
    Return
    ------
    faker.date_between('-5y') : obj datetime.date
        generación de una fecha entre 10 años antes hasta la fecha actual
    """
    return faker.date_between('-5y')

In [17]:
df['dt_fecha_asigna_perm'] = [fechAsig_gen() for i in range(num_permiso)]

In [18]:
# Determinar una fecha de caducidad de permiso de cada registro
def fechCad_gen(fecha):
    """
    Función para crear fecha de caducidad
    ...
    
    Parametro
    ---------
    fecha : obj Datetime.date
        variable que corresponde a la fecha de asignación del permiso
    
    Return
    ------
    caduca: str
        generación de una fecha con rango de 10 años antes y despues dela fecha actual
    """
    #asignación de objeto con fecha con rango de 10 años antes y despues de fecha actual
    caduca = faker.date_this_decade(True, True)
    #bucle para asegurar que la fecha inicio sea menor a la fecha caduca
    while (caduca <= fecha):
        caduca = faker.date_this_decade(True, True) #genera nueva fecha que cumpla con condicional
    return caduca

In [19]:
df['dt_fecha_caduca_perm'] = [fechCad_gen(i) for i in df["dt_fecha_asigna_perm"]]

In [20]:
# Determinar el estado en que se encuentra cada permiso
def status_gen(fecha):
    """
    Función para la generación de estado del permiso
    ...
    
    Parametros
    ----------
    fecha : obj datetime.date
        fecha correspondiente a la caducidad
    
    Return
    ------
    status[0] :  str
        envía la cadena correspondiente al indice 0 del arreglo status
        
    status[1] : str
        envia la cadena que está en el indice 1 del arreglo status
    """
    #formato de fecha
    frmt = "%Y-%m-%d"
    #Asignación de fecha actual en tipo objeto date
    now = date.today()
    #Fecha actual conseguida
    stime = datetime.datetime.strptime(str(fecha), frmt)
    #Fecha actual
    now1 = datetime.datetime.strptime(str(now), frmt)
    #indicador entero basado en el calculo de edad
    ind = int((stime-now1).days/365.25)
    #asignación de estado de acuerdo al indicador
    if (ind>0):
        return status[0]
    else:
        return status[1]

In [21]:
df['var_status_perm'] = [status_gen(i) for i in df["dt_fecha_caduca_perm"]]

In [22]:
# Guardar el conjunto de datos
df.to_csv('dataset_Permisos.csv')

In [23]:
# Mostrar el conjunto de datos
pd.read_csv('dataset_Permisos.csv', index_col=0)

Unnamed: 0,var_id_perm,var_entidad_perm,var_tipo_perm,dt_fecha_asigna_perm,dt_fecha_caduca_perm,var_status_perm
0,PERM 1,Departamento,Escritura,2019-06-28,2021-12-09,Caducado
1,PERM 2,Roles,Escritura,2020-12-19,2025-08-31,Vigente
2,PERM 3,Roles,Lectura,2018-05-12,2028-11-20,Vigente
3,PERM 4,Misil,Escritura,2021-04-09,2028-09-16,Vigente
4,PERM 5,Roles,Lectura,2019-05-27,2024-09-24,Vigente
...,...,...,...,...,...,...
4995,PERM 4996,Pieza,Lectura,2019-04-23,2021-09-17,Caducado
4996,PERM 4997,Departamento,Lectura,2020-02-05,2026-04-06,Vigente
4997,PERM 4998,Permisos,Escritura,2021-12-10,2027-05-29,Vigente
4998,PERM 4999,Roles,Lectura,2022-03-31,2025-07-05,Vigente
