# Conjunto de datos para la entidad "Departamentos"

In [1]:
# Uso del Pip install para poder importar la librería faker
!pip install faker

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting faker
  Downloading Faker-15.3.4-py3-none-any.whl (1.6 MB)
[K     |████████████████████████████████| 1.6 MB 6.1 MB/s 
Installing collected packages: faker
Successfully installed faker-15.3.4


In [2]:
# Importar librería pandas para manejar y analizar datos
import pandas as pd
# Importar librería uuid para crear identificadores únicos.
import uuid
# Importar librería random para generar datos aleatorios.
import random
# Importar el paquete faker para generar datos fasos.
from faker import Faker

In [3]:
# Delimitación del rango del número de elementos.
num_departamento = 5000

In [4]:
# Una lista de 4 características de la entidad departamento
features = [
    "Id_depar",
    "nombre_depar",
    "Institucion_depar",
    "Tipo_depar"
]
# Creación de un DF para estas características
df = pd.DataFrame(columns=features)

In [8]:
# Generar un id para cada departamento
def idm_gen(n):
    """
    Función que se encarga de crear un id unico con nomenclatura básica
    ...
    
    Parametros
    ----------
    n : int
        representa el numero de indice correspondiente al registro
    
    Return
    ------
    "MSL--"+str(n+1) : str
        nomenclatura única de identificación del departamento correspondiente
    """
    return "DPTO-"+str(n+1)

In [9]:
df['Id_depar'] = [idm_gen(i) for i in range(num_departamento)]

In [10]:
# Tipo de departamento
Tipo_depar = ["Propulsion", "Armament", "Communication"]

In [11]:
df['Tipo_depar'] = random.choices(
    Tipo_depar, 
    weights=(25,25,25), 
    k=num_departamento
)
"""
Con la lista generada de las opciones de tipos de departamento, se proporciona la
función de opciones pesos para cada función y la cantidad de opciones hacer representadas
por "k". Por consiguiente, se asignó al atributo de "Tipo_depar" del marco de datos.
"""

'\nCon la lista generada de las opciones de tipos de departamento, se proporciona la\nfunción de opciones pesos para cada función y la cantidad de opciones hacer representadas\npor "k". Por consiguiente, se asignó al atributo de "Tipo_depar" del marco de datos.\n'

In [12]:
# Institución a la que pertenece el departamento
Institucion_depar = ["Nasa", "DoD"]

In [14]:
df['Institucion_depar'] = random.choices(
    Institucion_depar, 
    weights=(45,55), 
    k=num_departamento
)
"""
Con la lista generada de las opciones de institución, se proporciona la función
de opciones pesos para cada función y la cantidad de opciones hacer representadas
por "k". Por consiguiente, se asignó al atributo de "institution_depar" del marco de datos.
"""

'\nCon la lista generada de las opciones de institución, se proporciona la función\nde opciones pesos para cada función y la cantidad de opciones hacer representadas\npor "k". Por consiguiente, se asignó al atributo de "institution_depar" del marco de datos.\n'

In [15]:
# Nombre del Departamento
# Creación de instancias de falsificador
faker = Faker()

def name_gen(institution):
    """
    Genera rápidamente un nombre de departamento
    """
    faker.nic_handle()
        
    return faker.nic_handle()
    
# Generación de nombres para cada departamento
df['nombre_depar'] = ['Department '+name_gen(i) for i in df['Institucion_depar']]

In [16]:
# Guardar el conjunto de datos
df.to_csv('dataset_departamento.csv')

In [17]:
# Mostrar el conjunto de datos
pd.read_csv('dataset_departamento.csv', index_col=0) 

Unnamed: 0,Id_depar,nombre_depar,Institucion_depar,Tipo_depar
0,DPTO-1,Department KRM53542-FAKE,DoD,Propulsion
1,DPTO-2,Department YWUQ519-FAKE,Nasa,Propulsion
2,DPTO-3,Department XE1651-FAKE,Nasa,Armament
3,DPTO-4,Department SZ951-FAKE,DoD,Propulsion
4,DPTO-5,Department PXJ3395-FAKE,DoD,Propulsion
...,...,...,...,...
4995,DPTO-4996,Department PQ238-FAKE,Nasa,Armament
4996,DPTO-4997,Department MNL4-FAKE,DoD,Armament
4997,DPTO-4998,Department RX19-FAKE,DoD,Propulsion
4998,DPTO-4999,Department LLAP52-FAKE,Nasa,Armament
