**ENTIDAD Carrera**

In [None]:
"""

Importación de librerías y módulos requeridos para la generación de datos
Pandas es una librería utilizada para el análisis de datos
Faker es una librería que permite generar datos sintéticos o falsos
uuid es una librería que permite crear id's
numpy es una librería que permite gestionar matrices multidimensionales, y utilizar funciones matematicas
random es una librería que permite generar números aleatorios
datetime es una librería que permite crear horas y fechas
Factory es un módulo de la librería faker que permite crear un objeto de tipo Faker y agregar el idioma regional que se desea utilizar

"""
#Instalar librería Faker para la generación de datos sintéticos
!pip install Faker
import pandas as pd
from faker import Faker
import uuid
import numpy as np
import random
import datetime
from faker import Factory
# Cambiar la traducción de los datos sintéticos generados con la librería Faker
fake = Factory.create("es-ES")

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting Faker
  Downloading Faker-15.3.4-py3-none-any.whl (1.6 MB)
[K     |████████████████████████████████| 1.6 MB 11.5 MB/s 
Installing collected packages: Faker
Successfully installed Faker-15.3.4


In [None]:
"""
Creación de dataframes utilizando la librería pandas
DataFrame es un método que recibe uno o más parámetros según sea necesario. 

Parámetros:
--------------------------------------------------------------------------

columns:
    Columnas del dataframe a crear

Retorno:
--------------------------------------------------------------------------
    Se retorna un archivo de tipo dataframe de dos dimensiones.
"""
# Crear el dataframe con 7 columnas
df = pd.DataFrame(columns=[
    "Id_Car",
    "Nombre_Car",
    "Descrip_Car",
    "Estado_Car",
    "Fecha_Vigencia_Car",
    "Modalidad_Car",
    "Jornada_Car",

])

In [None]:
"""
UUID1 permite generar un ID único a partir de una secuencia de números y el tiempo actual.

Parámetros:
------------------------------------------------------------------------------------------
   No se envió parámetros

Retorno: 
------------------------------------------------------------------------------------------
    Secuencia de número de 14-bits
"""
# Asignar a una variable la cantidad de datos a generar
numeroDatosSinteticos = 5000
# Generar los 5000 IDs para los datos sintéticos y guardarlos en la columna del DataFrame
df.Id_Car = [uuid.uuid1() for i in range(numeroDatosSinteticos)]

In [None]:
"""
UUID1 permite generar un ID único a partir de una secuencia de números y el tiempo actual.

Parámetros:
------------------------------------------------------------------------------------------
    No se envió parámetros

Retorno: 
------------------------------------------------------------------------------------------
    Secuencia de número de 14-bits

Job es un módulo de la librería Faker que permite generar el nombre de una profesión.

Parámetros:
------------------------------------------------------------------------------------------
    No se envió parámetros

Retorno: 
------------------------------------------------------------------------------------------
    Cadena de caracteres que incluye el nombre de la profesión

Choice es un módulo de la librería NumPy que permite seleccionar, de entre varias opciones, un valor al azar con una probabilidad determinada

Parámetros:
------------------------------------------------------------------------------------------
    Nombre de las profesiones: "Ingenieria", "Licenciatura", "Tecnologia"
    Probabilidad de seleccionar un valor: p = [1/3, 1/3,1/3]

Retorno: 
------------------------------------------------------------------------------------------
    Cadena de caracteres que incluye el tipo de carrera

"""

# Generar los nombres de carrera
for i in range(numeroDatosSinteticos):
  # Generar datos sintéticos para el del nombre de la carrera, con una probabilidad de 1/3 para cada uno
  nombre_carrera = np.random.choice(["Ingeniería", "Licenciatura", "Tecnología"], p=[1/3, 1/3,1/3])
  # Crear el nombre de carrera utilizando fake.job para generar una profesión sintética
  carrera = nombre_carrera + " en " + fake.job()
  # Guardar los nombres de carrera en el DataFrame
  df.Nombre_Car[i] = carrera

In [None]:
"""

Paragraph es un módulo de la librería Faker que permitegenerar párrafos con una o más oraciones sintéticas

Parámetros:
------------------------------------------------------------------------------------------
    nb_sentences: El número de oraciones que se desea generar.

Retorno: 
------------------------------------------------------------------------------------------
    Cadena de caracteres que incluye la descripción de la carrera en formato de Lorem Ipsum

"""
# Generar las descripciones sintéticas
for i in range(numeroDatosSinteticos):
  # Crear un párrafo con tres oraciones
  descripcion = fake.paragraph(nb_sentences=3)
  #Guardar la descripción en el DataFrame
  df.Descrip_Car[i]=descripcion

In [None]:
"""

Choice es un módulo de la librería NumPy que permite seleccionar, de entre varias opciones, un valor al azar con una probabilidad determinada

Parámetros:
------------------------------------------------------------------------------------------
    estadoOpciones: Valores que puede tomar el estado

Retorno: 
------------------------------------------------------------------------------------------
    Cadena de caracteres que incluye el estado de la carrera


"""
#Crear las opciones de estado
estadoOpciones = ["Activo", "Inactivo"]
# Generar los estados sintéticos
for i in range(numeroDatosSinteticos):
  # Seleccionar de forma aleatoria uno de los estados
  estado = random.choice(estadoOpciones)
  # Guardar el estado en el DataFrame
  df.Estado_Car[i]=estado

In [None]:
"""

Choice es un módulo de la librería NumPy que permite seleccionar, de entre varias opciones, un valor al azar con una probabilidad determinada

Parámetros:
------------------------------------------------------------------------------------------
    modalidadOpciones: Valores que puede tomar la modalidad

Retorno: 
------------------------------------------------------------------------------------------
    Cadena de caracteres que incluye la modalidad de la carrera


"""
# Crear las opciones de modalidad que existen
modalidadOpciones = ["Presencial", "Distancia", "En linea"]
# Generar sintéticamente el tipo de modalidad para cada carrera
for i in range(numeroDatosSinteticos):
  # Elegir una modalidad al azar de entre las opciones
  modalidad = random.choice(modalidadOpciones)
  # Guardar el valor en el DataFrame
  df.Modalidad_Car[i]=modalidad

In [None]:
"""

Choice es un módulo de la librería NumPy que permite seleccionar, de entre varias opciones, un valor al azar con una probabilidad determinada

Parámetros:
------------------------------------------------------------------------------------------
    jornadaOpciones: Valores que puede tomar la jornada

Retorno: 
------------------------------------------------------------------------------------------
    Cadena de caracteres que incluye la jornada de la carrera


"""
# Crear las opciones de jornada que existen
jornadaOpciones = ["Intensiva", "Matutina", "Vespertina", "En linea"]
# Generar sintéticamente el tipo de jornada para cada carrera
for i in range(numeroDatosSinteticos):
  # Elegir una jornada al azar de entre las opciones
  jornada = random.choice(jornadaOpciones)
  # Guardar el valor en el DataFrame
  df.Jornada_Car[i]=jornada

In [None]:
"""

date_between es un módulo de la librería Faker que permite seleccionar una fecha al azar entre un rango de fechas determinadas.

Parámetros:
------------------------------------------------------------------------------------------
    Fecha_inicio: Fecha de inicio del rango 
    Fecha_fin: Fecha de fin del rango

Retorno: 
------------------------------------------------------------------------------------------
    Fecha de tipo datetime

"""
# Crear las fechas de inicio de vigencia de carrera que existen
for i in range(numeroDatosSinteticos):
  # Generar sintéticamente la fecha de vigencia de la carrera
  fecha_inicio_vigencia_carrera = fake.date_between(datetime.date(1940, 1, 1), datetime.date(1980, 1, 1))
  # Guardar el valor en el DataFrame
  df.Fecha_Vigencia_Car[i]=fecha_inicio_vigencia_carrera

In [None]:
# Crear el CSV a partir del DataFrame
df.to_csv('carreras.csv')