# Conjunto de datos para la entidad "Componentes"

In [10]:
# Uso del Pip install para poder importar la librería faker
!pip install faker

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


In [11]:
# Importar librería pandas para manejar y analizar datos
import pandas as pd
# Importar librería uuid para crear identificadores únicos.
import uuid
# Importar librería random para generar datos aleatorios.
import random
# Importar el paquete faker para generar datos fasos.
from faker import Faker

In [12]:
# Delimitación del rango del número de elementos.
num_componentes = 5000

In [13]:
# Una lista de 3 características para la entidad componente
features = [
    "var_id_com",
    "var_nombre_com",
    "var_tipo_com",
    "var_status_com"
]
# Creación de un DF para estas características
df = pd.DataFrame(columns=features)

In [14]:
# Generar Identificadores para cada componente
def idm_gen(n):
    """
    Función que se encarga de crear un id unico con nomenclatura básica
    ...
    
    Parametros
    ----------
    n : int
        representa el numero de indice correspondiente al registro
    
    Return
    ------
    "COMPT "+str(n+1) : str
        nomenclatura única de identificación del misil correspondiente
    """
    return "COMPT "+str(n+1)

In [15]:
df['var_id_com'] = [idm_gen(i) for i in range(num_componentes)]

In [16]:
# Tipo de componente
Tipo_com = ["Electronics",
            "Chemistry",
            "other"]

In [17]:
df['var_tipo_com'] = random.choices(
    Tipo_com, 
    weights=(35,35,30), 
    k=num_componentes
)
"""
Con la lista generada de las opciones de tipos de componente, se proporciona la
función de opciones pesos para cada función y la cantidad de opciones hacer representadas
por "k". Por consiguiente, se asignó al atributo de "var_tipo_com" del marco de datos.
"""

'\nCon la lista generada de las opciones de tipos de componente, se proporciona la\nfunción de opciones pesos para cada función y la cantidad de opciones hacer representadas\npor "k". Por consiguiente, se asignó al atributo de "var_tipo_com" del marco de datos.\n'

In [18]:
# Nombre del componente
# Creación de instancias de falsificador
faker = Faker()

def name_gen(institution):
    """
    Genera rápidamente un nombre del componente
    """
    faker.nic_handle()
        
    return faker.nic_handle()
    
# Generación de nombres para cada componente
df['var_nombre_com'] = ['Compt '+name_gen(i) for i in df['var_tipo_com']]

In [20]:
# Estado del departamento
Status_com = ["Completo", "Incompleto"]

df['var_status_com']= random.choices(
    Status_com, 
    weights=(45,55), 
    k=num_componentes
)
"""
Con la lista generada de las opciones de estados, se proporciona la
función de opciones pesos para cada función y la cantidad de opciones hacer representadas
por "k". Por consiguiente, se asignó al atributo de "var_status_dept" del marco de datos.
"""

'\nCon la lista generada de las opciones de estados, se proporciona la\nfunción de opciones pesos para cada función y la cantidad de opciones hacer representadas\npor "k". Por consiguiente, se asignó al atributo de "var_status_dept" del marco de datos.\n'

In [21]:
# Guardar el conjunto de datos
df.to_csv('dataset_componentes.csv')

In [22]:
# Mostrar el conjunto de datos
pd.read_csv('dataset_componentes.csv', index_col=0) 

Unnamed: 0,var_id_com,var_nombre_com,var_tipo_com,var_status_com
0,COMPT 1,Compt LGR2349-FAKE,Electronics,Completo
1,COMPT 2,Compt FXI5-FAKE,other,Incompleto
2,COMPT 3,Compt DE758-FAKE,Electronics,Completo
3,COMPT 4,Compt YE1285-FAKE,Electronics,Incompleto
4,COMPT 5,Compt XRZ2144-FAKE,Chemistry,Incompleto
...,...,...,...,...
4995,COMPT 4996,Compt YYN195-FAKE,Chemistry,Completo
4996,COMPT 4997,Compt CH639-FAKE,Chemistry,Incompleto
4997,COMPT 4998,Compt AEE25126-FAKE,Electronics,Incompleto
4998,COMPT 4999,Compt SPW215-FAKE,other,Incompleto
