# Conjunto de datos para la entidad "Departamentos"

In [16]:
# Uso del Pip install para poder importar la librería faker
!pip install faker

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


In [98]:
# Importar librería pandas para manejar y analizar datos
import pandas as pd
# Importar librería uuid para crear identificadores únicos.
import uuid
# Importar librería random para generar datos aleatorios.
import random
# Importar el paquete faker para generar datos fasos.
from faker import Faker

In [110]:
# Delimitación del rango del número de elementos.
num_departamento = 5000

In [122]:
# Una lista de 4 características del departamento
features = [
    "id",
    "name",
    "institution",
    "kind"
]
# Creación de un DF para estas características
df = pd.DataFrame(columns=features)

In [123]:
# Id del Departamento
df['id'] = [uuid.uuid4().hex for i in range(num_departamento)]
"""
Uso de la biblioteca uuid para generar una cadena aleatoria de caracteres 5000 veces.
Por consigiente, se lo asigna al atributo ID en el marco de datos.
"""

'\nUso de la biblioteca uuid para generar una cadena aleatoria de caracteres 5000 veces.\nPor consigiente, se lo asigna al atributo ID en el marco de datos.\n'

In [124]:
"""
En caso de desear asegurarse de que no se repitieron las ID,
puede realizar una verificación simple en el marco de datos con lo siguiente:
"""
print(df['id'].nunique()==num_departamento)

True


In [125]:
# Tipo de departamento
kind = ["Propulsion", "Armament", "Communication"]

In [126]:
df['kind'] = random.choices(
    kind, 
    weights=(25,25,25), 
    k=num_departamento
)
"""
Con la lista generada de las opciones de tipos de departamento, se proporciona la
función de opciones pesos para cada función y la cantidad de opciones hacer representadas
por "k". Por consiguiente, se asignó al atributo de "kind" del marco de datos.
"""

'\nCon la lista generada de las opciones de tipos de departamento, se proporciona la\nfunción de opciones pesos para cada función y la cantidad de opciones hacer representadas\npor "k". Por consiguiente, se asignó al atributo de "kind" del marco de datos.\n'

In [127]:
# Institución a la que pertenece el departamento
institution = ["Nasa", "DoD"]

In [128]:
df['institution'] = random.choices(
    institution, 
    weights=(45,55), 
    k=num_departamento
)
"""
Con la lista generada de las opciones de institución, se proporciona la función
de opciones pesos para cada función y la cantidad de opciones hacer representadas
por "k". Por consiguiente, se asignó al atributo de "institution" del marco de datos.
"""

'\nCon la lista generada de las opciones de institución, se proporciona la función\nde opciones pesos para cada función y la cantidad de opciones hacer representadas\npor "k". Por consiguiente, se asignó al atributo de "institution" del marco de datos.\n'

In [129]:
# Nombre del Departamento
# Creación de instancias de falsificador
faker = Faker()

def name_gen(institution):
    """
    Genera rápidamente un nombre de departamento
    """
    faker.nic_handle()
        
    return faker.nic_handle()
    
# Generación de nombres para cada departamento
df['name'] = ['Department '+name_gen(i) for i in df['institution']]

In [130]:
# Guardar el conjunto de datos
df.to_csv('dataset_departamento.csv')

In [131]:
# Mostrar el conjunto de datos
pd.read_csv('dataset_departamento.csv', index_col=0) 

Unnamed: 0,id,name,institution,kind
0,db2a4ebc91b64118afa1d41c5d5720cb,Department BPM19-FAKE,DoD,Propulsion
1,308a3264af35430d86813445b4cc77a3,Department DKWD131-FAKE,Nasa,Propulsion
2,3abec39a13c34084adc49061e836ba68,Department ELU54774-FAKE,Nasa,Communication
3,ad96ca4b2cb64f1dae66cc998bc38176,Department RHIX36-FAKE,Nasa,Communication
4,15029bc3da8444c480e134aa060e14cd,Department FTR69-FAKE,DoD,Armament
...,...,...,...,...
4995,5423b653c6fd42329ca22e652de7f501,Department GN992-FAKE,DoD,Communication
4996,c84cf14faf1944829ef001e1c89be1b0,Department DGD4-FAKE,Nasa,Communication
4997,fa4a528bdfdf4f469df7a31aa1e03699,Department RI16222-FAKE,DoD,Propulsion
4998,adc578118e244ef4a230a28a0803622a,Department OC54145-FAKE,DoD,Armament
