In [1]:
import pandas as pd

In [5]:
# Lee el archivo CSV especificando el delimitador principal como ';'
db_candidates = pd.read_csv('DB_Candidates.txt', delimiter=';')

# Selecciona solo las columnas 'Tech Skills' y 'Soft Skills' para aplicar la expresión regular
db_candidates[['Tech Skills', 'Soft Skills']] = db_candidates[['Tech Skills', 'Soft Skills']].apply(lambda x: x.str.split(r'[,]'))

# Ahora db_candidates contiene el DataFrame con los datos correctamente leídos y separados


In [6]:
db_candidates

Unnamed: 0,Nombre,Apellido,Tech Skills,Soft Skills,Idioma,Disponibilidad Horaria,Perfil Psicológico
0,Juan,Bataller,"[Python, Pandas, NumPy]","[Trabajo en equipo, Liderazgo]",B2,Full Time,Extrovertido
1,María,Gómez,[Java],"[Comunicación, Pensamiento creativo]",C1,Part Time,Introvertido
2,Pedro,López,"[JavaScript, React]","[Liderazgo, Colaboración]",A2,Horario de mañana,Analítico
3,Luisa,Rodríguez,"[PHP, Laravel]","[Organización, Iniciativa]",B1,Horario vespertino,Creativo
4,Carlos,Martínez,"[C++, C]","[Proactividad, Trabajo bajo presión]",A1,Flexibilidad Horaria,Racional
5,Daniela,Sánchez,"[Ruby, Rails]","[Adaptación al cambio, Negociación]",C2,Full Time,Idealista
6,Jorge,Ruiz,"[iOS, Swift]","[Orientación a resultados, Gestión del tiempo]",B2,Part Time,Realista
7,Lucía,Díaz,[Android],"[Iniciativa, Colaboración]",C1,Horario de mañana,Soñador
8,Pablo,Muñoz,"[Node.js, Express]","[Negociación, Trabajo en equipo]",A1,Horario vespertino,Altruista
9,Laura,Jiménez,"[DevOps, Docker, Kubernetes]","[Gestión del tiempo, Comunicación]",C2,Flexibilidad Horaria,Servicial


In [7]:
db_candidates.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 56 entries, 0 to 55
Data columns (total 7 columns):
 #   Column                  Non-Null Count  Dtype 
---  ------                  --------------  ----- 
 0   Nombre                  56 non-null     object
 1   Apellido                56 non-null     object
 2   Tech Skills             56 non-null     object
 3   Soft Skills             56 non-null     object
 4   Idioma                  56 non-null     object
 5   Disponibilidad Horaria  56 non-null     object
 6   Perfil Psicológico      56 non-null     object
dtypes: object(7)
memory usage: 3.2+ KB


El siguiente código realiza una clasificación y puntuación de los candidatos que se encuentran en db_candidates, de acuerdo a los requerimientos presentes en la solicitud.

In [8]:
def buscar_candidatos(db_candidates, solicitud):
    # Asignar puntuación por habilidades técnicas
    puntuacion_tecnica = db_candidates['Tech Skills'].apply(lambda x: sum(habilidad in x for habilidad in solicitud['Tech Skills']))
    
    # Asignar puntuación por habilidades blandas
    puntuacion_blanda = db_candidates['Soft Skills'].apply(lambda x: sum(habilidad in x for habilidad in solicitud['Soft Skills']))
    
    # Asignar puntuación por idiomas
    ranking_niveles = {'A1': 1, 'A2': 2, 'B1': 3, 'B2': 4, 'C1': 5, 'C2': 6}
    puntuacion_idioma = db_candidates['Idioma'].apply(lambda x: ranking_niveles[x] >= ranking_niveles[solicitud['Idioma'][0]])
    
    # Asignar puntuación por disponibilidad horaria
    puntuacion_horaria = db_candidates['Disponibilidad Horaria'].apply(lambda x: sum(disponibilidad in x for disponibilidad in solicitud['Disponibilidad Horaria']))

    # Asignar puntuación por perfil psicológico
    puntuacion_perfil = db_candidates['Perfil Psicológico'].apply(lambda x: sum(perfil in x for perfil in solicitud['Perfil Psicológico']))
    
    # Calcular puntuación total
    puntuacion_total = puntuacion_tecnica + puntuacion_blanda + puntuacion_idioma + puntuacion_horaria + puntuacion_perfil
    
    return puntuacion_total

In [9]:
solicitud = {
    'Tech Skills': ['Data Science', 'Python'],
    'Soft Skills': ['Comunicación', 'Trabajo en equipo'],
    'Idioma': ['C1'],
    'Disponibilidad Horaria': ['Full Time'],
    'Perfil Psicológico': ['Creativo']
}

puntuacion = buscar_candidatos(db_candidates, solicitud)
candidatos_seleccionados = puntuacion.nlargest(5)
print(candidatos_seleccionados)

52    4
0     3
23    3
35    3
46    3
dtype: int64


In [10]:
puntuacion = buscar_candidatos(db_candidates, solicitud)
puntuacion.name = 'puntuacion'
candidatos_seleccionados = puntuacion.nlargest(5).index

# Convertir el índice en una columna normal
db_candidates_indexed = db_candidates.reset_index()

# Unir las series `puntuacion` y `db_candidates_indexed`
db_candidates_indexed = db_candidates_indexed.join(puntuacion)

# Seleccionar las filas deseadas
listado_candidatos_selecc = db_candidates_indexed.set_index(['index']).loc[candidatos_seleccionados].set_index(['Apellido', 'Nombre'])

print(listado_candidatos_selecc)

                                   Tech Skills  \
Apellido Nombre                                  
Sánchez  José              [Java, Python, SQL]   
Bataller Juan          [Python, Pandas, NumPy]   
López    Francisco  [Data Science, TensorFlow]   
Díaz     Juana                          [.NET]   
Pérez    Juan             [Python, SQL, Excel]   

                                          Soft Skills Idioma  \
Apellido Nombre                                                
Sánchez  José       [Trabajo en equipo, Comunicación]     B2   
Bataller Juan          [Trabajo en equipo, Liderazgo]     B2   
López    Francisco       [Proactividad, Comunicación]     C1   
Díaz     Juana            [Comunicación, Creatividad]     C1   
Pérez    Juan       [Trabajo en equipo, Proactividad]     B2   

                   Disponibilidad Horaria Perfil Psicológico  puntuacion  
Apellido Nombre                                                           
Sánchez  José                   Part Time         

In [11]:
listado_candidatos_selecc

Unnamed: 0_level_0,Unnamed: 1_level_0,Tech Skills,Soft Skills,Idioma,Disponibilidad Horaria,Perfil Psicológico,puntuacion
Apellido,Nombre,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
Sánchez,José,"[Java, Python, SQL]","[Trabajo en equipo, Comunicación]",B2,Part Time,Creativo,4
Bataller,Juan,"[Python, Pandas, NumPy]","[Trabajo en equipo, Liderazgo]",B2,Full Time,Extrovertido,3
López,Francisco,"[Data Science, TensorFlow]","[Proactividad, Comunicación]",C1,Horario de mañana,Analítico,3
Díaz,Juana,[.NET],"[Comunicación, Creatividad]",C1,Full Time,Introvertido,3
Pérez,Juan,"[Python, SQL, Excel]","[Trabajo en equipo, Proactividad]",B2,Full Time,Analítico,3


In [12]:
print('Requerimientos de la Solicitud', solicitud)

Requerimientos de la Solicitud {'Tech Skills': ['Data Science', 'Python'], 'Soft Skills': ['Comunicación', 'Trabajo en equipo'], 'Idioma': ['C1'], 'Disponibilidad Horaria': ['Full Time'], 'Perfil Psicológico': ['Creativo']}


In [13]:
solicitud

{'Tech Skills': ['Data Science', 'Python'],
 'Soft Skills': ['Comunicación', 'Trabajo en equipo'],
 'Idioma': ['C1'],
 'Disponibilidad Horaria': ['Full Time'],
 'Perfil Psicológico': ['Creativo']}

La siguiente versión restringe la elección de los candidatos a aquellos que al menos cumplen con uno de los requerimientos de Tech Skills, y cuyo nivel de idioma no difiere en menos de 2 valores respecto del nivel requerido. Caso contrario, el candidato no es tenido en cuenta aunque cumpla con el resto de los requisitos.

In [22]:
def buscar_candidatos(db_candidates, solicitud):
    # Verificar si los candidatos cumplen con al menos una habilidad técnica
    cumple_tecnica = db_candidates['Tech Skills'].apply(lambda x: any(habilidad in x for habilidad in solicitud['Tech Skills']))
    
    # Verificar si los candidatos cumplen con el nivel de idioma dentro del rango permitido
    ranking_niveles = {'A1': 1, 'A2': 2, 'B1': 3, 'B2': 4, 'C1': 5, 'C2': 6}
    cumple_idioma = db_candidates['Idioma'].apply(lambda x: abs(ranking_niveles[x] - ranking_niveles[solicitud['Idioma'][0]]) <= 2)
    
    # Filtrar candidatos válidos que cumplen con al menos una habilidad técnica y tienen un nivel de idioma dentro del rango
    candidatos_validos = db_candidates[cumple_tecnica & cumple_idioma]

    if candidatos_validos.empty:
        return None  # No hay candidatos que cumplan con los requisitos

    # Asignar puntuación por habilidades técnicas
    puntuacion_tecnica = db_candidates['Tech Skills'].apply(lambda x: sum(habilidad in x for habilidad in solicitud['Tech Skills']))

    # Asignar puntuación por habilidades blandas
    puntuacion_blanda = candidatos_validos['Soft Skills'].apply(lambda x: sum(habilidad in x for habilidad in solicitud['Soft Skills']))
    
    # Asignar puntuación por idiomas
    puntuacion_idioma = db_candidates['Idioma'].apply(lambda x: ranking_niveles[x] >= ranking_niveles[solicitud['Idioma'][0]])

    # Asignar puntuación por disponibilidad horaria
    puntuacion_horaria = candidatos_validos['Disponibilidad Horaria'].apply(lambda x: sum(disponibilidad in x for disponibilidad in solicitud['Disponibilidad Horaria']))

    # Asignar puntuación por perfil psicológico
    puntuacion_perfil = candidatos_validos['Perfil Psicológico'].apply(lambda x: sum(perfil in x for perfil in solicitud['Perfil Psicológico']))
    
    # Calcular puntuación total considerando las habilidades técnicas y de idioma
    # puntuacion_total = (cumple_tecnica.astype(int) + cumple_idioma.astype(int)) * (puntuacion_tecnica + puntuacion_blanda + puntuacion_idioma + puntuacion_horaria + puntuacion_perfil)
    puntuacion_total = (puntuacion_tecnica + puntuacion_blanda + puntuacion_idioma + puntuacion_horaria + puntuacion_perfil)
    return puntuacion_total

In [23]:
puntuacion = buscar_candidatos(db_candidates, solicitud)
puntuacion.name = 'puntuacion'
candidatos_seleccionados = puntuacion.nlargest(5).index

# Convertir el índice en una columna normal
db_candidates_indexed = db_candidates.reset_index()

# Unir las series `puntuacion` y `db_candidates_indexed`
db_candidates_indexed = db_candidates_indexed.join(puntuacion)

# Seleccionar las filas deseadas
listado_candidatos_selecc = db_candidates_indexed.set_index(['index']).loc[candidatos_seleccionados].set_index(['Apellido', 'Nombre'])

print(listado_candidatos_selecc)

                                         Tech Skills  \
Apellido Nombre                                        
Sánchez  José                    [Java, Python, SQL]   
Bataller Juan                [Python, Pandas, NumPy]   
López    Francisco        [Data Science, TensorFlow]   
Pérez    Juan                   [Python, SQL, Excel]   
Álvarez  Matías     [Data Science, Machine Learning]   

                                          Soft Skills Idioma  \
Apellido Nombre                                                
Sánchez  José       [Trabajo en equipo, Comunicación]     B2   
Bataller Juan          [Trabajo en equipo, Liderazgo]     B2   
López    Francisco       [Proactividad, Comunicación]     C1   
Pérez    Juan       [Trabajo en equipo, Proactividad]     B2   
Álvarez  Matías          [Colaboración, Proactividad]     C2   

                   Disponibilidad Horaria Perfil Psicológico  puntuacion  
Apellido Nombre                                                           
Sánchez 

In [24]:
listado_candidatos_selecc

Unnamed: 0_level_0,Unnamed: 1_level_0,Tech Skills,Soft Skills,Idioma,Disponibilidad Horaria,Perfil Psicológico,puntuacion
Apellido,Nombre,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
Sánchez,José,"[Java, Python, SQL]","[Trabajo en equipo, Comunicación]",B2,Part Time,Creativo,4.0
Bataller,Juan,"[Python, Pandas, NumPy]","[Trabajo en equipo, Liderazgo]",B2,Full Time,Extrovertido,3.0
López,Francisco,"[Data Science, TensorFlow]","[Proactividad, Comunicación]",C1,Horario de mañana,Analítico,3.0
Pérez,Juan,"[Python, SQL, Excel]","[Trabajo en equipo, Proactividad]",B2,Full Time,Analítico,3.0
Álvarez,Matías,"[Data Science, Machine Learning]","[Colaboración, Proactividad]",C2,Part Time,Analítico,2.0


In [21]:
solicitud

{'Tech Skills': ['Data Science', 'Python'],
 'Soft Skills': ['Comunicación', 'Trabajo en equipo'],
 'Idioma': ['C1'],
 'Disponibilidad Horaria': ['Full Time'],
 'Perfil Psicológico': ['Creativo']}