# Conjunto de datos para la entidad "Departamentos"

In [1]:
# Uso del Pip install para poder importar la librería faker
!pip install faker

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting faker
  Downloading Faker-16.8.1-py3-none-any.whl (1.7 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.7/1.7 MB[0m [31m20.1 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: faker
Successfully installed faker-16.8.1


In [2]:
# Importar librería pandas para manejar y analizar datos
import pandas as pd
# Importar librería uuid para crear identificadores únicos.
import uuid
# Importar librería random para generar datos aleatorios.
import random
# Importar el paquete faker para generar datos fasos.
from faker import Faker

In [3]:
# Delimitación del rango del número de elementos.
num_departamento = 5000

In [19]:
# Una lista de 4 características de la entidad departamento
features = [
    "var_id_dept",
    "var_nombre_dept",
    "var_tipo_dept",
    "var_descripcion_dept",
    "var_status_dept"
]
# Creación de un DF para estas características
df = pd.DataFrame(columns=features)

In [20]:
# Generar un id para cada departamento
def idm_gen(n):
    """
    Función que se encarga de crear un id unico con nomenclatura básica
    ...
    
    Parametros
    ----------
    n : int
        representa el numero de indice correspondiente al registro
    
    Return
    ------
    "DPTO "+str(n+1) : str
        nomenclatura única de identificación del departamento correspondiente
    """
    return "DPTO "+str(n+1)

In [21]:
df['var_id_dept'] = [idm_gen(i) for i in range(num_departamento)]

In [22]:
# Nombre de departamento
var_nombre_dept = ["Departamento de Propulsión",
                   "Departamento de Armamento",
                   "Departamento de Comunicación",
                   "Departamento de Crontrol",
                   "Departamento de Estructura",
                   "Departamento de Carga Explosiva",
                   "Departamento de Guía",
                   "Departamento de Administración"]

In [24]:
df['var_nombre_dept'] = random.choices(
    var_nombre_dept, 
    weights=(12,13,12,13,12,13,12,13), 
    k=num_departamento
)
"""
Con la lista generada de las opciones de nombres de departamento, se proporciona la
función de opciones pesos para cada función y la cantidad de opciones hacer representadas
por "k". Por consiguiente, se asignó al atributo de "var_nombre_dept" del marco de datos.
"""

'\nCon la lista generada de las opciones de nombres de departamento, se proporciona la\nfunción de opciones pesos para cada función y la cantidad de opciones hacer representadas\npor "k". Por consiguiente, se asignó al atributo de "var_nombre_dept" del marco de datos.\n'

In [25]:
# tipo de departamento
var_tipo_dept = ["DOD",
                 "Nasa"]

In [26]:
df['var_tipo_dept'] = random.choices(
    var_tipo_dept, 
    weights=(25,25), 
    k=num_departamento
)
"""
Con la lista generada de las opciones de tipos de departamento, se proporciona la
función de opciones pesos para cada función y la cantidad de opciones hacer representadas
por "k". Por consiguiente, se asignó al atributo de "var_tipo_dept" del marco de datos.
"""

'\nCon la lista generada de las opciones de tipos de departamento, se proporciona la\nfunción de opciones pesos para cada función y la cantidad de opciones hacer representadas\npor "k". Por consiguiente, se asignó al atributo de "var_tipo_dept" del marco de datos.\n'

In [27]:
# Descripción del proveedor
import string
import random
bio=[]
length_of_string = 20
random.seed()
for i in range(0, num_departamento):
  bio=(''.join(random.SystemRandom().choice(string.ascii_letters + string.digits) for i in range(length_of_string)))
  df.var_descripcion_dept[i] =bio

In [28]:
# Estado del departamento
Status_dept = ["Activo", "Inactivo"]

df['var_status_dept']= random.choices(
    Status_dept, 
    weights=(45,55), 
    k=num_departamento
)
"""
Con la lista generada de las opciones de estados, se proporciona la
función de opciones pesos para cada función y la cantidad de opciones hacer representadas
por "k". Por consiguiente, se asignó al atributo de "var_status_dept" del marco de datos.
"""

'\nCon la lista generada de las opciones de estados, se proporciona la\nfunción de opciones pesos para cada función y la cantidad de opciones hacer representadas\npor "k". Por consiguiente, se asignó al atributo de "var_status_dept" del marco de datos.\n'

In [29]:
# Guardar el conjunto de datos
df.to_csv('dataset_departamento.csv')

In [30]:
# Mostrar el conjunto de datos
pd.read_csv('dataset_departamento.csv', index_col=0) 

Unnamed: 0,var_id_dept,var_nombre_dept,var_tipo_dept,var_descripcion_dept,var_status_dept
0,DPTO 1,Departamento de Administración,DOD,g40z53PKgWsVmeskziUf,Inactivo
1,DPTO 2,Departamento de Guía,Nasa,sW0irQC4MoIeOxRKSH8u,Inactivo
2,DPTO 3,Departamento de Crontrol,Nasa,Ec7I68JNDz85Vn7BzZXG,Activo
3,DPTO 4,Departamento de Armamento,DOD,Q3DB69FsIJ2IDZpHEdcD,Activo
4,DPTO 5,Departamento de Estructura,DOD,3NqOQl2baK5eQ7SR0nr8,Activo
...,...,...,...,...,...
4995,DPTO 4996,Departamento de Crontrol,Nasa,KmCek3jG6Z1O5431eaDF,Activo
4996,DPTO 4997,Departamento de Guía,Nasa,nrkzhxr79Pm4k6VZ9DeB,Inactivo
4997,DPTO 4998,Departamento de Propulsión,Nasa,qK0sceJlwTOi7SfsDusn,Activo
4998,DPTO 4999,Departamento de Comunicación,Nasa,XVndNV1JapiN45mYk1j0,Inactivo
