## Proyecto despliegue de soluciones analíticas (DSA)
### 2025-15
### Grupo 28

## 1. Problema que abordan y contexto

La Clasificación única de Ocupaciones para Colombia (CUOC) es un listado de ocupaciones estandarizadas en donde se organizan y clasifican todos los empleos (cargos u oficios) que se desarrollan dentro del mercado laboral colombiano. Esta clasificación permite organizar los empleos en distintos niveles desde gerencial hasta obreros u otros. Esta clasificación es una herramienta que permite fortalecer la infraestructura estadística, la cual permite estandarizar la producción de estadísticas oficiales bajo los principios de calidad, coherencia y comparabilidad (DANE 2025). Por otro lado, según el artículo 2.2.6.2.6.9 del decreto 654 de 2021 se menciona que todos los usuarios que utilicen información relacionada con ocupaciones deberán implementar esta clasificación, con esto, se busca desarrollar una herramienta que permita mejorar el uso de la clasificación para el Servicio Público de Empleo (SPE), uno de los actores que usan información ocupacional. 

Con base en lo anterior se propone desarrollar una herramienta que permita conocer las 5 ocupaciones que mejor se ajustan al perfil laboral solicitado por el empleador, esto con el fin de que, desde el Servicio Público de Empleo, se puede llevar a cabo una implementación de la CUOC de forma dinámica entre los empleadores y los prestadores, quienes son los encargados de la intermediación laboral.

El desarrollo de esta herramienta parte de los registros de la Unidad Administrativa Especial del Servicio Público de Empleo (UAESPE) y la información de descripción de cada ocupación CUOC que se encuentra en la página del Departamento Administrativo Nacional de Estadística (DANE). Desde la UAESPE se obtiene la información del perfil laboral solicitado por los empleadores y desde el DANE se obtiene descripción de las ocupaciones CUOC, de tal forma que, a modo de insumo, se evalúe un modelo de recomendación en donde se pueda identificar cuáles son las ocupaciones más afines a estos perfiles. Una vez se estime el modelo se podrá desarrollar la disponibilización de la herramienta en la web para que los empleadores o prestadores hagan uso de este al ingresar el perfil laboral y se retornen las 5 ocupaciones más afines a ese perfil. Esta herramienta permita mejorar la captura de datos al momento de registro de la oferta de empleo por parte del empleador, estandarizando así el cargo solicitado por medio de las recomendaciones dadas por la herramienta, dando así un incentivo al uso e implementación de esta clasificación hacia los prestadores autorizados por el SPE y los registros administrativos de la UAESPE.

## 2. Pregunta de negocio y alcance del proyecto.

Dado el problema mencionado en el punto anterior, se busca dar respuesta a la siguiente pregunta de negocio ¿Cómo se podría dar una implementación y uso de la CUOC en el Servicio Público de Empleo? Ante esta pregunta se propone desarrollar una herramienta que, al interactuar con esta, se pueda conocer de forma fácil e inmediata las ocupaciones más afines al perfil solicitado por el empleador. Esta herramienta se desarrollará en 3 etapas: 1. Consulta, verificación y estandarización de datos; 2. Desarrollo, evaluación y ajuste del modelo de recomendación 3. Disponibilización de la herramienta y pruebas funcionales. Con respecto al tiempo, esta se planea desarrollar en 2 meses, teniendo como entregas una herramienta disponibilizada en la web, documento de metodología de construcción de la herramienta y los informes de avances o anomalías del proyecto. Se plantea esta herramienta como uso directo para los prestadores autorizados por el SPE, en donde al momento de registrar la oferta de empleo que solicita el empleador, estos podrán consultar, según el perfil laboral solicitado, los cargos ocupacionales CUOC que estén más relacionados con ese perfil. Una vez se adapte esta herramienta tendrá impactos en la evaluación de hojas de vida (al tener cargos ya definidos y estandarizados), y fortalecimiento de los registros administrativos de la UAESPE, los cuales sirven para toma de decisiones de política pública.

## 3. Descripción del conjunto de datos a emplear.

Los datos a usar fueron suministrados por la UAESPE, entidad la cual captura la información de ofertas laborales por medio de su sistema de información SISE (Sistema de Información del Servicio de Empleo). La data solicitada hace referencia a las ofertas de empleo que se registraron por medio de los prestadores que usan el SISE como plataforma para realizar el proceso de gestión de hoja de vida y ofertas de empleo. Los registros de ofertas de empleo que provienen del SISE presentan información como: titulo de la oferta de empleo, descripción de la oferta de empleo, nivel educativo solicitado, experiencia laboral solicitada, entre otros. Sin embargo, para el proyecto se pide la información de titulo de la oferta de empleo, descripción de la oferta de empleo, cargo equivalente 1 según el SISE, codigo del cargo equivalente 1 según la CUOC, cargo equivalente 2 según el SISE, codigo del cargo equivalente 2 según la CUOC y la fecha de creación.

Se seleccionaron estas variables debido a que el insumo principal de la herramienta sera texto (solo la descripción en un principio) y se toma el cargo de la cuoc para tener un ejercicio supervizado añadiendo a esta base la información de descripción de este cargo ocupacional según los datos de la cuoc del DANE. La base de ofertas de empleo presenta 2.857.045 con 8 columnas

## 4. Exploración de datos

In [1]:
# cargar paquetes necesarios
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

In [5]:
base= pd.read_csv('Ofertas_proyecto_U_DSA202515.csv', sep=';')
base.info()

Unnamed: 0,Titulo_vacante,Descripcion,Minimo_nivel_estudio,Cargo_CUOC_1,Cargo_SISE_1,Cargo_CUOC_2,Cargo_SISE_2,Fecha_creacion_proceso
0,APRENDIZ TECNICO O TECNOLOGO AUXILIAR ADMINIST...,Importante empresa busca para su equipo de tra...,Técnica Laboral,436000,Asistente administrativo,131000,Auxiliar administrativo,2021-11-18
1,APRENDIZ TECNICO O TECNOLOGO AUXILIAR ADMINIST...,Importante empresa busca para su equipo de tra...,Técnica Laboral,436000,Asistente administrativo,131000,Auxiliar administrativo,2021-12-03
2,PRACTICANTE TECNICO O TECNOLOGO AUXILIAR ADMIN...,Empresa en Latinoamerica en Servicios de Asist...,Técnica Laboral,436000,Asistente administrativo,131000,Auxiliar administrativo,2022-02-01
3,AGENTE CALL CENTER VENTAS,Gran Multinacional de telecomunicaciones requi...,Media(10-13),42220,Asesor call center,33220,Asesor comercial ventas no técnicas,2020-05-13
4,AGENTE CALL CENTER VENTAS,Gran Multinacional de telecomunicaciones requi...,Técnica Laboral,42220,Asesor call center,33220,Asesor comercial ventas no técnicas,2020-05-13
...,...,...,...,...,...,...,...,...
2857040,VIGILANTE,Garantizar la custodia y proteccion de los bie...,Ninguno,54142,Vigilante,54142,Guardia de seguridad,2024-09-12
2857041,VIGILANTE,Garantizar la custodia y proteccion de los bie...,Básica Secundaria(6-9),54142,Vigilante,54142,Guardia de seguridad,2024-11-16
2857042,AUXILIAR GENERAL,Somos una importante empresa prestadora de ser...,Ninguno,94120,Auxiliar de cocina,91120,Auxiliar servicios generales aseo y cafetería,2025-05-13
2857043,AUXILIAR GENERAL,Somos una importante empresa prestadora de ser...,Ninguno,94120,Auxiliar de cocina,91120,Auxiliar servicios generales aseo y cafetería,2025-07-03


In [12]:
cuoc= pd.read_excel('PerfilesOcupacionales-Excel-CUOC-2025.xlsx', sheet_name='Descripción', nrows=681,header=1)
cuoc

Unnamed: 0,Código del Gran Grupo,Código de la Ocupación,Nombre de la Ocupación,Descripción de la Ocupación
0,0,1100,Oficiales de las Fuerzas Militares,"Planean, organizan, comandan y ejecutan la imp..."
1,0,2100,Suboficiales de las Fuerzas Militares,Supervisan y comandan las operaciones de las F...
2,0,3100,Otros miembros de las Fuerzas Militares,Actúan y apoyan unidades de combate en operaci...
3,1,11110,Directores formuladores y ejecutores de políti...,"Definen, formulan y orientan la política del p..."
4,1,11120,Directores del gobierno / Directoras del gobierno,Asesoran al gobierno sobre cuestiones normativ...
...,...,...,...,...
675,9,96250,Recolectores de dinero y surtidores de máquina...,Reabastecen máquinas de venta automática con a...
676,9,96260,Lectores de medidores / Lectoras de medidores,"Observan, anotan, registran y verifican datos ..."
677,9,96291,Auxiliares de servicios de recreación y deporte,Ayudan a clientes a encontrar asiento o ubicac...
678,9,96292,Ayudantes de mecánica y servicio automotriz,Ayudan a trabajadores a realizar labores senci...


## 5. Diseño prototipo maqueta

Con base en la funcionalidad de la herramienta, se propone inicialmente el siguiente prototipo en donde consta de unos campos de ingreso: descripción del perfil laboral a solicitar por el empleador y nivel educativo solicitado; y unos campos de salida que son los 5 cargos más relevantes a ese perfil laboral solicitado.

## 6. Reporte de trabajo de equipo

Con base en el cronograma y etapas del proyecto cada uno de los integrantes se les asignará las siguientes actividades:

- Verny Mendoza: Planteamiento del problema, captura de datos, preprocesamiento y estandarización inicial, propuesta de modelo de recomendación
- David Castiblanco: Exploración de datos, propuesta de modelo de recomendación
- Tatiana Cardenas: Diseño del prototipo de la maqueta (mockup), propuesta de modelo de recomendación
- Homan Zarta: disponibilización de la herramienta en la web, propuesta de modelo de recomendación

Estas actividades pueden desarrollarse en conjunto o de forma individual, de tal forma que se puedan apoyar cada uno de los integrantes.


## Bibliografía
- Departamento Administrativo Nacional de Estadística (DANE). (2025). *Clasificación Única de Ocupaciones para Colombia - CUOC*. Gobierno de Colombia. https://www.dane.gov.co/files/sen/nomenclatura/cuoc/documento-clasificacion-unica-ocupaciones-colombia-CUOC-2025.pdf