## Mino App: Explorando el Futuro Laboral en Colombia

**Objetivo principal**

*Mino App* es la herramienta que busca permitirle a los estudiantes que cursaran una carrera universitaria, profesionales y aquellos interesados en comprender y navegar con éxito el complejo mercado laboral colombiano.

**Resultado esperado:**

1. **Presentación de Análisis:** Se presentará análisis sobre las habilidades más demandadas en el mercado laboral colombiano, tanto habilidades blandas como duras.

2. **Exploración de Carreras:** Los usuarios podrán explorar la popularidad de diversas carreras en Colombia. Esto les permitirá tomar decisiones informadas sobre su futuro académico y profesional.

3. **Identificación de Carreras Afines:** La aplicación identificará las carreras relacionadas con puestos específicos en el mercado laboral, facilitando a los usuarios la comprensión de las trayectorias profesionales y las oportunidades de crecimiento en diferentes campos.

4. **Índice de Retorno de Inversión:** *Mino App* proporcionará un índice que evaluará el retorno de inversión de diferentes carreras, ofreciendo a los usuarios una perspectiva clara sobre la viabilidad financiera de sus opciones educativas y profesionales.

5. **Indicadores Integrados:** Los usuarios tendrán acceso a indicadores que combinan la popularidad, el salario promedio y el retorno de inversión de diversas carreras, brindando una evaluación completa de las oportunidades profesionales disponibles.

6. **Chatbot de Orientación:** Se implementará un chatbot interactivo que ayudará a los usuarios en la selección de la carrera, proporcionando orientación personalizada y respuestas a preguntas frecuentes.

Para este primer acercamiento se considerarán unicamente 
** Herramientas y Fuentes de datos **

- API de Google Trenda
- API scraper de datos de Linked IN
- Fuente de datos de SNIES
- API de wikipedia (Obtener datos básicos del enfoque de la carrera)

# Ejericio conexión a base de datos

In [20]:
import pandas as pd
import psycopg2
from sqlalchemy import create_engine

# Parámetros de conexión a la base de datos
dbname = 'programas'
user = 'postgres'
password = 'Paula2023'
host = 'localhost'  # o la dirección IP de tu servidor PostgreSQL
port = '5433'  # El puerto por defecto de PostgreSQL es 5432

# Nombre del archivo CSV
csv_file = 'prog.csv'

# Nombre de la tabla en la base de datos
table_name = 'pograms'

# Cargar el archivo CSV en un DataFrame de pandas
df = pd.read_csv(csv_file, encoding='latin1', delimiter=';')


  df = pd.read_csv(csv_file, encoding='latin1', delimiter=';')


In [23]:
# Intentar conectar a la base de datos
try:
    # Crear un motor de base de datos SQLAlchemy para conectar a PostgreSQL
    engine = create_engine(f'postgresql://{user}:{password}@{host}:{port}/{dbname}')

    # Utilizar el método to_sql de pandas para cargar los datos del DataFrame en la tabla de PostgreSQL
    df.to_sql(table_name, engine, if_exists='replace', index=False)

    print("Datos cargados exitosamente en la tabla PostgreSQL.")

except Exception as e:
    print("Error al conectar a la base de datos o cargar los datos:", e)

Datos cargados exitosamente en la tabla PostgreSQL.


In [22]:
df

Unnamed: 0,CODIGO_INSTITUCION_PADRE,CODIGO_INSTITUCION,NOMBRE_INSTITUCION,ESTADO_INSTITUCION,CARACTER_ACADEMICO,SECTOR,REGISTRO_UNICO,CODIGO_SNIES_DEL_PROGRAMA,CODIGO_ANTERIOR_ICFES,NOMBRE_DEL_PROGRAMA,...,MODALIDAD,NUMERO_CREDITOS,NUMERO_PERIODOS_DE_DURACION,PERIODICIDAD,SE_OFRECE_POR_CICLOS_PROPEDEUT,PERIODICIDAD_ADMISIONES,PROGRAMA_EN_CONVENIO,DEPARTAMENTO_OFERTA_PROGRAMA,MUNICIPIO_OFERTA_PROGRAMA,COSTO_MATRICULA_ESTUD_NUEVOS
0,1101,1101,UNIVERSIDAD NACIONAL DE COLOMBIA,Activa,Universidad,Oficial,,19.0,"1,10147E+20",ADMINISTRACION DE EMPRESAS,...,Presencial,164.0,10.0,Semestral,No,Semestral,N,Bogota,Bogota,
1,1101,1101,UNIVERSIDAD NACIONAL DE COLOMBIA,Activa,Universidad,Oficial,,13.0,"1,10143E+20",ANTROPOLOGIA,...,Presencial,122.0,9.0,Semestral,No,Semestral,N,Bogota,Bogota,
2,1101,1101,UNIVERSIDAD NACIONAL DE COLOMBIA,Activa,Universidad,Oficial,,30.0,"1,10147E+20",ARQUITECTURA,...,Presencial,179.0,10.0,Semestral,No,Semestral,N,Bogota,Bogota,
3,1101,1101,UNIVERSIDAD NACIONAL DE COLOMBIA,Activa,Universidad,Oficial,,2497.0,"1,10147E+20",ARTES PLASTICAS,...,Presencial,166.0,10.0,Semestral,No,Semestral,N,Bogota,Bogota,
4,1101,1101,UNIVERSIDAD NACIONAL DE COLOMBIA,Activa,Universidad,Oficial,,31.0,"1,10146E+20",BIOLOGIA,...,Presencial,163.0,10.0,Semestral,No,Semestral,N,Bogota,Bogota,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
28860,9936,9936,CORPORACION UNIVERSITARIA AUTONOMA DEL NORTE,Activa,Institucion Universitaria/Escuela Tecnologica,Privado,,110347.0,110347,DERECHO,...,Presencial,164.0,10.0,Semestral,No,Semestral,N,Norte de Santander,San Jose de Cucuta,3430128.0
28861,9936,9936,CORPORACION UNIVERSITARIA AUTONOMA DEL NORTE,Activa,Institucion Universitaria/Escuela Tecnologica,Privado,,109755.0,109755,ESPECIALIZACION EN INTERVENCION COMUNITARIA,...,Presencial,24.0,2.0,Semestral,No,Semestral,N,Norte de Santander,San Jose de Cucuta,5013264.0
28862,9936,9936,CORPORACION UNIVERSITARIA AUTONOMA DEL NORTE,Activa,Institucion Universitaria/Escuela Tecnologica,Privado,,108960.0,108960,TRABAJO SOCIAL,...,Presencial,144.0,8.0,Semestral,No,Semestral,N,Norte de Santander,San Jose de Cucuta,3337778.0
28863,,,,,,,,,,,...,,,,,,,,,,


In [35]:
# hacer solicitud a la base de datos select * from programas limit 10;
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)
cur = conn.cursor()
cur.execute("SELECT * FROM pograms LIMIT 20;")
rows = cur.fetchall()
print(tabulate(rows, headers=[desc[0] for desc in cur.description]))

  CODIGO_INSTITUCION_PADRE    CODIGO_INSTITUCION  NOMBRE_INSTITUCION                ESTADO_INSTITUCION    CARACTER_ACADEMICO    SECTOR    REGISTRO_UNICO      CODIGO_SNIES_DEL_PROGRAMA  CODIGO_ANTERIOR_ICFES    NOMBRE_DEL_PROGRAMA                                 TITULO_OTORGADO                              ESTADO_PROGRAMA    JUSTIFICACION    JUSTIFICACION_DETALLADA    RECONOCIMIENTO_DEL_MINISTERIO      RESOLUCION_DE_APROBACION  FECHA_DE_RESOLUCION    FECHA_EJECUTORIA      VIGENCIA_ANOS  FECHA_DE_REGISTRO_EN_SNIES    CINE_F_2013_AC_CAMPO_AMPLIO                            CINE_F_2013_AC_CAMPO_ESPECIFIC                                                                                     CINE_F_2013_AC_CAMPO_DETALLADO                                                                                     AREA_DE_CONOCIMIENTO                           NUCLEO_BASICO_DEL_CONOCIMIENTO                   NIVEL_ACADEMICO    NIVEL_DE_FORMACION    MODALIDAD      NUMERO_CREDITOS    NUMERO_PERIODOS_DE_DURA

In [68]:
cur.execute("""SELECT "AREA_DE_CONOCIMIENTO", COUNT(*) AS "Cantidad_de_Programas"
FROM pograms
GROUP BY "AREA_DE_CONOCIMIENTO";
""")
rows = cur.fetchall()
print(tabulate(rows, headers=[desc[0] for desc in cur.description]))

AREA_DE_CONOCIMIENTO                             Cantidad_de_Programas
---------------------------------------------  -----------------------
Ingenieria; arquitectura; urbanismo y afines                      6059
                                                                     2
Matematicas y ciencias naturales                                   710
Sin clasificar                                                    3235
Agronomia; veterinaria y afines                                    692
Bellas artes                                                      1187
Ciencias de la educacion                                          3103
Ciencias de la salud                                              2066
Ciencias sociales y humanas                                       4030
Economia; administracion; contaduria y afines                     7781


In [67]:
cur.execute("""
SELECT "NOMBRE_DEL_PROGRAMA", 
       TO_CHAR(AVG("COSTO_MATRICULA_ESTUD_NUEVOS"), 'FM9999999990') AS "PROMEDIO_COSTO_MATRICULA"
FROM pograms
WHERE "DEPARTAMENTO_OFERTA_PROGRAMA" = 'Bogota '
GROUP BY "NOMBRE_DEL_PROGRAMA"
ORDER BY "NOMBRE_DEL_PROGRAMA";
""")
rows = cur.fetchall()
print(tabulate(rows, headers=[desc[0] for desc in cur.description]))

NOMBRE_DEL_PROGRAMA                                                                                                                                                                                                       PROMEDIO_COSTO_MATRICULA
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------  --------------------------
ADMINISTRACION
ADMINISTRACION AGROPECUARIA                                                                                                                                                                                                                5936650
ADMINISTRACION AMBIENTAL                                                                                                                                                                                                                   4846757
ADMINISTRACIO

In [73]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)
cur = conn.cursor()

# Ejecutar consulta SQL para calcular la proporción de programas de pregrado presenciales y virtuales por departamento
cur.execute("""
SELECT "DEPARTAMENTO_OFERTA_PROGRAMA",
       COUNT(CASE WHEN "MODALIDAD" = 'Presencial' THEN 1 END) AS "Pregrados_Presenciales",
       COUNT(CASE WHEN "MODALIDAD" = 'Virtual' THEN 1 END) AS "Pregrados_Virtuales",
       COUNT(*) AS "Total_Pregrados",
       ROUND(COUNT(CASE WHEN "MODALIDAD" = 'Presencial' THEN 1 END) * 100.0 / COUNT(*), 2) AS "Proporción_Presenciales (%)",
       ROUND(COUNT(CASE WHEN "MODALIDAD" = 'Virtual' THEN 1 END) * 100.0 / COUNT(*), 2) AS "Proporción_Virtuales (%)"
FROM pograms
WHERE "NIVEL_ACADEMICO" = 'Pregrado'
GROUP BY "DEPARTAMENTO_OFERTA_PROGRAMA"
ORDER BY "DEPARTAMENTO_OFERTA_PROGRAMA";
""")

# Obtener los resultados de la consulta
rows = cur.fetchall()

# Imprimir los resultados en formato tabular
print(tabulate(rows, headers=[desc[0] for desc in cur.description]))



DEPARTAMENTO_OFERTA_PROGRAMA                                Pregrados_Presenciales    Pregrados_Virtuales    Total_Pregrados    Proporción_Presenciales (%)    Proporción_Virtuales (%)
--------------------------------------------------------  ------------------------  ---------------------  -----------------  -----------------------------  --------------------------
Amazonas                                                                        12                      0                 12                         100                           0
Antioquia                                                                     2176                    120               2429                          89.58                        4.94
Arauca                                                                          37                      0                 37                         100                           0
Archipielago de San Andres; Providencia y Santa Catalina                        39    