In [36]:
"""

Importación de librerías y módulos requeridos para la generación de datos
Pandas es una librería utilizada para el análisis de datos
Faker es una librería que permite generar datos sintéticos o falsos
uuid es una librería que permite crear id's
numpy es una librería que permite gestionar matrices multidimensionales, y utilizar funciones matematicas
random es una librería que permite generar números aleatorios
datetime es una librería que permite crear horas y fechas
Factory es un módulo de la librería faker que permite crear un objeto de tipo Faker y agregar el idioma regional que se desea utilizar

"""
#Instalar librería Faker para la generación de datos sintéticos
!pip install Faker
import pandas as pd
from faker import Faker
import uuid
import numpy as np
import random
import datetime
from faker import Factory
# Cambiar la traducción de los datos sintéticos generados con la librería Faker
fake = Factory.create("es-ES")

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


In [37]:
"""
Creación de dataframes utilizando la librería pandas
DataFrame es un método que recibe uno o más parámetros según sea necesario. 

Parámetros:
--------------------------------------------------------------------------

columns:
    Columnas del dataframe a crear

Retorno:
--------------------------------------------------------------------------
    Se retorna un archivo de tipo dataframe de dos dimensiones.
"""
# Crear el dataframe con 7 columnas
df = pd.DataFrame(columns=[
    "id_cupo",
    "fecha_aceptacion_cupo",
    "hora_aceptacion_cupo",
    "descripcion_cupo",
    "tipo_cupo",
    "estado_cupo"
])

In [38]:
"""
UUID1 permite generar un ID único a partir de una secuencia de números y el tiempo actual.

Parámetros:
------------------------------------------------------------------------------------------
    No se envió parámetros

Retorno: 
------------------------------------------------------------------------------------------
    Secuencia de número de 14-bits
"""
# Asignar a una variable la cantidad de datos a generar
numeroDatosSinteticos = 5000
# Generar los 5000 IDs para los datos sintéticos y guardarlos en la columna del DataFrame
df.id_cupo = [uuid.uuid1() for i in range(numeroDatosSinteticos)]

In [39]:
"""

date_between es un módulo de la librería Faker que permite seleccionar una fecha al azar entre un rango de fechas determinadas.

Parámetros:
------------------------------------------------------------------------------------------
    Fecha_inicio: Fecha de inicio del rango 
    Fecha_fin: Fecha de fin del rango

Retorno: 
------------------------------------------------------------------------------------------
    Fecha de tipo datetime

"""
# Ciclo for para generar las fechas sintéticas
for i in range(numeroDatosSinteticos):
  # Generar una fecha entre enero 01 de 2021 y enero 01 de 2023
  fecha_cupo = fake.date_between(datetime.date(2021, 1, 1), datetime.date(2023, 1, 1))
  # Guardar la fecha en el DataFrame
  df.fecha_aceptacion_cupo[i]=fecha_cupo

In [40]:
"""

Choice es un módulo de la librería NumPy que permite seleccionar, de entre varias opciones, un valor al azar con una probabilidad determinada

Parámetros:
------------------------------------------------------------------------------------------
    estadoOpciones: Valores que puede tomar el estado

Retorno: 
------------------------------------------------------------------------------------------
    Cadena de caracteres que incluye el estado del cupo


"""
#Crear las opciones de estado
cupoOpciones = ["Activo", "Inactivo"]
# Generar los estados sintéticos
for i in range(numeroDatosSinteticos):
  # Seleccionar de forma aleatoria uno de los estados
  cupo = random.choice(cupoOpciones)
  # Guardar el estado en el DataFrame
  df.estado_cupo[i]=cupo

In [41]:
"""

Choice es un módulo de la librería NumPy que permite seleccionar, de entre varias opciones, un valor al azar con una probabilidad determinada

Parámetros:
------------------------------------------------------------------------------------------
    tipo_cupoOpciones: Valores que puede tomar el tipo de cupo

Retorno: 
------------------------------------------------------------------------------------------
    Cadena de caracteres que incluye el tipo de cupo

"""
#Crear las opciones de tipo de cupo
tipo_cupoOpciones = ["NIVELACION", "PRIMER NIVEL"]
# Ciclo for para generar los estados sintéticos
for i in range(numeroDatosSinteticos):
  # Seleccionar de forma aleatoria uno de los tipos de cupo
  tipo_cupo = random.choice(tipo_cupoOpciones)
  # Guardar el estado en el DataFrame
  df.tipo_cupo[i]=tipo_cupo

In [42]:
"""

Paragraph es un módulo de la librería Faker que permite generar párrafos con una o más oraciones sintéticas

Parámetros:
------------------------------------------------------------------------------------------
    nb_sentences: El número de oraciones que se desea generar.

Retorno: 
------------------------------------------------------------------------------------------
    Cadena de caracteres que incluye la descripción de la carrera en formato de Lorem Ipsum

"""
# Generar las descripciones sintéticas
for i in range(numeroDatosSinteticos):
  # Generar un párrafo con tres oraciones
  descripcion = fake.paragraph(nb_sentences=3)
  # Guardar el estado en el DataFrame
  df.descripcion_cupo[i]=descripcion

In [43]:
"""

Time es un módulo de la librería Faker que permite una hora al azar

Parámetros:
------------------------------------------------------------------------------------------
    No se enviaron parámetros

Retorno: 
------------------------------------------------------------------------------------------
    Cadena de caracteres que incluye hora generada

"""
# Generar las horas sintéticas
for i in range(numeroDatosSinteticos):
  # Generar una hora sintética y guardarlo en una variable
  hora_cupo = fake.time()
  # Guardar la variable en el DataFrame
  df.hora_aceptacion_cupo[i]=hora_cupo

In [45]:
# Crear el CSV a partir del DataFrame
df.to_csv('cupos.csv')