# Automatización de la Matriz de Requerimientos para el Plan Anual de Capacitación
Esta libreta automatiza la lectura de archivos de evaluación de desempeño y genera una matriz que indica qué trabajadores necesitan capacitación en qué temas.

## <b>Importación de librerías </b>>

Importamos las librerías necesarias para manipular archivos Excel, manejar rutas y procesar los datos. En total, se subierón 55 archivos.

In [22]:
import pandas as pd 
import glob
import numpy as np
import os
# Ruta de la carpeta donde están los archivos csv
carpeta = r"C:\Users\mflor\Downloads\Datos"
# Obtener la lista de archivos csv en la carpeta
archivos= glob.glob(os.path.join(carpeta,"**", "*.csv"), recursive=True)


In [24]:
print(len(archivos))

55


En la siguiente línea de código se muestran todos los archivos que se procesaran.

In [21]:
archivos

['C:\\Users\\mflor\\Downloads\\Datos\\Ana Laura Rodríguez Hernández.csv',
 'C:\\Users\\mflor\\Downloads\\Datos\\Calidadnocapturado.csv',
 'C:\\Users\\mflor\\Downloads\\Datos\\Copy of MATRIZ DE COMPETENCIAS  DNC- MANTTO ELECTRONICO.csv',
 'C:\\Users\\mflor\\Downloads\\Datos\\Cristofer Espinosa Lopez.csv',
 'C:\\Users\\mflor\\Downloads\\Datos\\DAMARIZ SUZETH CELESTINO HERNÁNDEZ.csv',
 'C:\\Users\\mflor\\Downloads\\Datos\\Daniel Luna Miranda 2.csv',
 'C:\\Users\\mflor\\Downloads\\Datos\\DANIEL LUNA MIRANDA.csv',
 'C:\\Users\\mflor\\Downloads\\Datos\\Enrique Alvarez.csv',
 'C:\\Users\\mflor\\Downloads\\Datos\\finanzas.csv',
 'C:\\Users\\mflor\\Downloads\\Datos\\GEOVANNI ARÉVALO NÚÑEZ.csv',
 'C:\\Users\\mflor\\Downloads\\Datos\\IyS1.csv',
 'C:\\Users\\mflor\\Downloads\\Datos\\IyS2.csv',
 'C:\\Users\\mflor\\Downloads\\Datos\\ManttoS1.csv',
 'C:\\Users\\mflor\\Downloads\\Datos\\ManttoS2.csv',
 'C:\\Users\\mflor\\Downloads\\Datos\\ManttoS3.csv',
 'C:\\Users\\mflor\\Downloads\\Datos\\ManttoS4.c

Los archivos cargados se guardan en tablas (dataframes). A continuación, se muestra el formato de los archivos. 

La primera columna contiene los temas, 
en el encabezado se encuentra la nomina del trabajador y al lado de las nominas, la modalidad del tema. Para saber si el tema necesita ser cubierto, nos interesa la tercera columna correspondiente a la nomina del trabajador. Esta contiene claves (0,1,2,3)

- 3: Indica urgencia ALTA- Agregar al PAC  actual y programar entrenamiento  en  los primeros 4 meses (CSR´S, SGC, SGA, Regulatorios)
- 2 : Indica urgencia MEDIA- Agregar al PAC  y programar en los primeros 8 meses (COMPETENCIAS DE DESARROLLO)
- 1: Indica urgencia BAJA- Agregar al PAC y Programar dentro de los 12 meses 
- 0: CUBIERTO- Competencia cubierta 

(PAC significa Plan Anual de Capacitación)

### Formato de los archivos cargados
![Archivo Limpio](DNC2.png)

In [24]:
#lista de dataframes
dataframes = [pd.read_csv(archivo,encoding='utf-8',low_memory=False) for archivo in archivos]

## <b>Limpieza de los datos </b>

Antes de generar la matriz de requerimientos de capacitación, es fundamental asegurarse de que los archivos de entrada tengan el formato adecuado para evitar errores en el procesamiento.

Primero, se verifica que existan las columnas clave: taller y curso, ya que contienen la información necesaria para identificar si un trabajador asistió a una capacitación.

Después, se realiza una conversión de celdas vacías. Es común que algunos archivos contengan valores nulos (NaN). Para prevenir errores durante el análisis, estos valores se reemplazan por cadenas vacías (""), lo cual permite trabajar con los datos de manera más consistente.



In [26]:
#Lidiar con valores nulos
i=1
for tabla in dataframes:
    # Verificar si las columnas 'Curso' y 'Taller' existen antes de hacer la conversión
    if 'Curso' in tabla.columns:
        tabla["Curso"] = tabla["Curso"].fillna("").astype(str)
    else:
        print("Columna 'Curso' no encontrada en el DataFrame %i"%i)
        print("La ubicación del archivo es %s"%archivos[i-1])

    if 'Taller' in tabla.columns:
        tabla["Taller"] = tabla["Taller"].fillna("").astype(str)
    else:
        print("Columna 'Taller' no encontrada en el DataFrame")
    i+=1

## Ejemplo 

En la siguiente línea del código se muestra el formato de los 55 archivos analizados. En el encabezado se muestra el número de nomina, mientras que del lado izquierdo se muestra el tema. Esta tabla evalua el rendimiento del  trabajor.


In [29]:
dataframes[0]

Unnamed: 0,Tema,761268.0,761268.1,761268.2,776169.0,776169.1,776169.2,769466.0,769466.1,769466.2,773190.0,773190.1,773190.2,774233.0,774233.1,774233.2,Curso,Taller
0,Conocimiento y aplicación de las herramientas ...,3,1,2,3,1,2,3,1,2,3,1,2,3,1,2,,
1,Conocimiento e Interpretación de planos y GD&T,3,1,2,3,1,2,3,1,2,3,1,2,3,1,2,,
2,Competencia en IATF 16949 (Formación),3,1,2,3,1,2,3,1,2,3,1,2,3,1,2,,
3,Certificación en VDA 6.3,2,1,1,2,1,1,3,1,2,3,1,2,2,1,1,,
4,Conocimiento y aplicación de Problem Solving V...,3,1,2,3,1,2,3,1,2,3,1,2,3,1,2,,
5,Conocimiento del producto y proceso de manufac...,3,2,1,3,2,1,3,2,1,3,2,1,3,2,1,,
6,Conocimiento de requisitos específicos del cli...,3,1,2,3,1,2,3,1,2,3,1,2,3,1,2,,
7,Competencia en auditoria DTLD,2,1,1,2,1,1,3,1,2,3,1,2,2,1,1,,
8,Conocimiento y aplicación de Herramientas de S...,3,2,1,3,2,1,3,2,1,3,2,1,3,2,1,,
9,"Conocimiento e interpretación de CQI-11, CQI-1...",3,1,2,3,1,2,3,1,2,3,1,2,3,1,2,,


### <b>Agrupación de temas por equivalencia de contenido<b>

Se identificó que ciertos cursos o temas, aunque tienen nombres distintos, abordan los mismos contenidos o competencias. Por lo tanto, se agruparon bajo una categoría común para evitar duplicidad y facilitar la interpretación de los datos.

In [175]:
diccionario_temas = {
    #"Core Tools": "Core Tools",
    "Core ToolsAPQP":"Core Tools - APQP 3ra Edición",
    "Core ToolsPPAP": "Core Tools - PPAP 4ta Edición",
    "PLC_HMI": ["PLC / HMI","PLC, HMI"],
    "IATF": "IATF",
    "registros_calidad":"Uso de las hojas de liberación y registros de calidad",
    "AMEF": "AMEF",
    "VDA": "VDA",
    "Legislacion":"legislacion mexicana aplicable a procesos y actividades de hitachi", #antes STPS
    "TPM": ["TPM","Administracion de mantenimiento (TPM) Kpis, controles, estrategias, metodologias."],#antes de kpi
    "CRS (Requerimientos Especificos del Cliente)": ["CRS (Requerimientos Especificos del Cliente)", "Conocimiento en requerimientos específicos de cliente","Requerimientos de clientes","requerimientos específicos de cliente"],
    #antes CQI12,CQI11
    "SPC": ["SPC", "estadistico",'estadístico', 'Manejo estadistico de datos','control de proceso'],
    "Estadistica": "Estadística descriptiva e inferencial",
    "alturas":"alturas",
    "montacargas":"montacargas",
    "electricidad": ["electricidad", "subestacion","Fundamentos Eléctricos Baja Tensión (480, 200,110 VCA)"],
    "Conocimientos en electronica de control":"Conocimientos en electrónica de control",
    #"Auditorías electrónicas y fiscalización":"Auditorías electrónicas y fiscalización",
    #"Principios básicos de control electrico": "Principios básicos de control electrico",
    "Soldadura":["Trabajos de corte y soldadura", "Soldadura Industrial","Conocimiento basicos de soldadura y su aplicacion, por arco electrico,aplicación de TIG y MIG"],
    "NOM_2": "NOM-002 SEMARNAT limites maximos permisibles en descargas de aguas",
    "STPS": "STPS",
    "Torno": "Conocimientos en el uso de maquinas y herramientas convencionales(torno,fresadora,rectificadora,etc)para elaboración de piezas mecanicas",
    "termicos":"termicos",
    "Gestion_Calidad": ["Conocimiento en sistemas de calidad", "Sistema Gestion Calidad", "sistemas de calidad"],
    #"registros_calidad":"Uso de las hojas de liberación y registros de calidad",
    "APQP":["APQP (Planificación avanzada de la calidad del producto)","APQP 3era Edición Mar 2024"],
    "Absodex":  "Absodex",
    "confinado":"Trabajos en espacios confinados",
    "Celda_Hull":"Interpretacion de Celda Hull",
    "filtarción":"filtarción",
    "corrosion": "Fundamentos de corrosión",
    "AIAG 16949": "AIAG 16949",
    "ISO 14000": "ISO 14000",
    "Control inventarios": ["Control inventarios","inventarios"],
    "Lean Manufacturing": "Lean Manufacturing",
    "Almacenaje": "almacen",
    "Manejo de Control Sinumerik 840d": "Manejo de Control Sinumerik 840d",
    "Conocimiento de tipos de sensores": "Conocimiento de tipos de sensores",
    "Maint": "Maint",
    "Logística y Cadena de Suministros": "Logística y Cadena de Suministros",
    "Carta Porte": "Carta Porte",
    "CTPAT & OEA": ["CTPAT & OEA","Certificación CTPAT / OEA"],
    "lubricacion":"lubricación",
    "contrabando":"contrabando",
    "ComercioE":["Reglas Generales de Comercio Exterior","Reglas Generales de Comercio Exterior: Actualización y cumplimiento"],

    "Despacho":"despacho",
    "INCOTERMS": "INCOTERMS",
    "CalculoE":"Cálculo de contribuciones al Comercio Exterior",
    "termografia":"termografia",
    "InterpretaciónM":["Interpretación de planos mecánicos","interpretacion de planos"],
    "Conocimiento del producto": "Conocimiento del producto",
    "dibujoT":"Conocimiento e interpretación de diseños mecánicos(dibujo tecnico)",
    "Solid Works":["Conocimientos basicos en software de diseño solid Works","Solid Works", "Solidworks"],
    "equipos_de_medición": ["Manejo de equipos de medición", "medicion"],
    "aduanal":["Glosa e identificadores del pedimento aduanal","Negociación con Agentes Aduanales y Transportes","Glosa e identificadores del pedimento aduanal", "Glosa y llenado de pedimento"],
    "GestionRC":"Gestion de riesgos y cumplimientos",
    "PlanificacionEyT":"Planificación estrategica y toma de decisiones",
    "Presupuestación_y_Control_de_Costos": ["Presupuestación y Control de Costos","Analisis de Costos","Costos Estándar"],
    "MSA": "MSA",
    "PPAP": ["PPAP 4A. EDICIÓN","PPAP (Proceso de Aprobación de Piezas de Producción)","PPAP 4ta Edición Mar 2006"],
    #CQI ´S (9,11,12 y 15)
    "DG&T": ["DG&T", "DG", "GD", "Tolerancias Geométricas"],
    "CQI-8": ["CQI-8", "CQI8", "CQI 8", "CQI- 8", "CQI -8", "CQI - 8"],
    "CQI-9": ["CQI-9", "CQI9", "CQI 9", "CQI- 9", "CQI -9", "CQI - 9"],
    "CQI-11": ["CQI-11", "CQI11", "CQI 11", "CQI- 11", "CQI -11", "CQI - 11"],
    "CQI-12": ["CQI-12", "CQI12", "CQI 12", "CQI- 12", "CQI -12", "CQI - 12"],
    "CQI-14": ["CQI-14", "CQI14", "CQI 14", "CQI- 14", "CQI -14", "CQI - 14"],
    "CQI-15": ["CQI-15", "CQI15", "CQI 15", "CQI- 15", "CQI -15", "CQI - 15"],
    #"CQI-19": ["CQI-19", "CQI19", "CQI 19", "CQI- 19", "CQI -19", "CQI - 19"],
    "CQI-20": ["CQI-20", "CQI20", "CQI 20", "CQI- 20", "CQI -20", "CQI - 20"],
    "Instructores": ["Instructor interno","instructores","instructor"],
    "Measure Link": "Measure Link",
    "Entendimiento de Plan de Control": ["Entendimiento de Plan de Control","Control plan", "Plan de Control 1era edición Ene 2024"],
    "gagetrak": "gagetrak",
    "ILUO": "ILUO",
    "Administracion de recursos": "Administracion de recursos",
    "Uso de Portales de Clientes": ["Uso de Portales de Clientes","Conocimiento y manejo de portales de clientes apartado de capacidades","Portales de Clientes"],
    "14001": "14001",
    "Sigma": "Sigma",
    "SGC": "SGC",
    "Ingles": ["Ingles","Idioma inglés", "inglés"],
    "Aston-G": "Aston-G",
    "GQUICS": "GQUICS",
    "CSF Stellantis": "CSF Stellantis",
    "CSF Nissan": "Nissan",
    "CSR Mazda": "Mazda",
    "CSR Ford": ["CSR Ford","csr's ford"],
    "CSF Toyota": "CSF Toyota",
    "8 DS": ["8 DS", "8D","fallas", "Herramientas de solución de problemas","solucion de problemas",
            "resolucion de problemas","analisis y solucion de problemas"],
    "Normas metrologia": ["Normas metrologia","normas aplicables para laboratorios de metrologia.",
                          "normas aplicables para laboratorios de metrologia"],


    "PFMEA": "PFMEA",
    #"Analisis de Costos":"Analisis de Costos",
    "Habilidades de negociacion":"Habilidades de negociacion",
    "LOTO":"LOTO",
    "camaras":["camaras","sistemas de vision y escaners"],
    "sustancias":["sustancias","quimic"],
    #"Auditorías electrónicas y fiscalización": "Auditorías electrónicas y fiscalización",
    "emergencia":["incendio","gestion de la atencion a emergencias","primeros auxilios uso de dea",
    "introduccion a rescate"],

    "hidraulica_neumatica_mecanica":["neumatica / hidraulica","Neumatica/Hidraulica", "mecanica,hidraulica,neumatica", 
                                     "Conocimientos de mecanica", "Conocimiento en sistemas hidráulicos / neumaticos", "Hidraulica/Neumatica"],
    "Floor Management":["Floor Managment","floor management"],
    "Manejo de personal":["Manejo de personal","administracion de personal"],
    "Conocimiento en sistemas de produccion":["Conocimiento en sistemas de produccion","sistemas de produccion"],
    "AnalisisInst":"Análisis instrumental (AA, ICP, HPLC, FTIR, etc.)",
    "Panasonic":"Panasonic",
    "Denso":"Denso",
    "FANUC":"FANUC",
    "KUKA":"KUKA",
    "IAI_Yamaha":["IAI y Yamaha","IAI"],
    "Correcto_analisis":"Correcto análisis, auditoría y correcciones del Sistema de Control de",
    "CAMPA":"CAMPA",

    "ISO 31000":"ISO 31000",
    "ISO 9000":"ISO 9000:2015",
    "ISO 19011":"ISO 19011:2018",
    "ISO 9001": "ISO 9001:2015",
    "Conocimiento en la aplicación de las Interpretaciones Sancionadas":"Conocimiento en la aplicación de las Interpretaciones Sancionadas",
    
    "immex":"immex",
    "anexo 24":"anexo 24",
    "tiempo": ["coordinacion de actividades","administracion del tiempo"],
    #"coordinacion de actividades":"coordinacion de actividades",
    "iso 4500":["iso 4500:2018","iso 4500"],
    "nfpa 70e":"nfpa 70e",
    "siemens y allen bradley":["manejo de software plc siemens y allen bradley","allen bradley"],
    "prensas kistler":"conocimiento de servo prensas kistler",
    "conocimiento manejos  de robots staubli":["conocimiento manejos  de robots staubli","staubli"],
    "autocad":"autocad",
    "calculo de valor de contenido regional":"calculo de valor de contenido regional",
    "calculo oee":["calculo oee",'oee'],
   
    
    "ansi b11.19":"ansi b11.19",
    "sistema stop_safe start":"sistema stop / safe start",#*
    #"instructores":"instructores",#*
    "tratamiento de aguas residuales":"tratamiento de aguas residuales",
    "descarbonizacion":"descarbonizacion 2030",
    "economia circular":"economia circular",
    "gases":"calculos de gases de efecto invernadero ( coa's , lau)",
    "audi_lison":"audi - lison",
    "FORD_EDDL":"ford - eddl, gpp, cmms",
    "excelencia operacional": "excelencia operacional",
    "control y manejo de indicadores kpi": ["control y manejo de indicadores kpi",'kpi'],
    "finanzas para no financieros": "finanzas para no financieros",
    "habilidades gerenciales y de negociacion":["habilidades gerenciales","Habilidades de negociacion"],
    "cash2":["conocimiento de p&l (profit and loss) file","cash flow training"],
    "capacidad de las lineas": "capacidad de las lineas",
    "manejo y ejecucion de wms":"manejo y ejecucion de wms",
    "caracteristicas especiales del proceso y producto":"caracteristicas especiales del proceso y producto",
    "vsm mixel model":"vsm mixel model",
    "creating level pull":"creating level pull",
    "conocimiento de equipos de alta presion maximator":["conocimiento de equipos de alta presion maximator","maximator"],
    "sga training":"sga training",
    "Excel":"excel",
    "Aqua pro":"Aqua pro",
    #
    "maquina":"Interpretación de diagramas y manuales de maquina",
    "mejoras":"Desarrollo e implementación de mejoras",
    "gruas":"Manejo de gruas viajeras",
    '4ms':'4ms',
    "csr's honda":"csr's honda",
    "job observation":"job observation",
    "csr's subaru": "csr's subaru"


    


    
    
}
len(diccionario_temas)

148

La siguiente función encuentra la clave correspondiente que agrupara los temas, utilizando el diccionario anterior.

In [178]:
from unidecode import unidecode  # Para eliminar acentos

In [180]:
def encontrar_nuevo_indice(texto):
    texto = unidecode(str(texto).strip().lower())  # Asegurar que el valor es string y normalizar
    # Condición especial para "Core Tools"
    if "core tools" in texto and ("edición" not in texto and "edicion" not in texto):
        return "Core Tools"

    for clave, valores in diccionario_temas.items():
        if isinstance(valores, list):  # Si hay una lista de sinónimos
            for valor in valores:
                valor_normalizado = unidecode(valor.strip().lower())  # Normalizar cada valor
                if valor_normalizado in texto:
                    return clave
        else:  # Si es un único valor
            valor_normalizado = unidecode(valores.strip().lower())  # Normalizar el valor único
            if valor_normalizado in texto:
                return clave
    return texto  # Si no hay coincidencia, se deja el mismo índice

## <b>Agrupar los temas de cada archivo cargado<b>

Utilizando la función anterior los temas de cada archivo se reemplaza por la clave correspondiente.

In [187]:

for tabla in dataframes:
    temas=list(tabla.Tema)
    tabla.Tema = tabla.Tema.map(encontrar_nuevo_indice)
    #print(tabla)

## <b>Cargar la tabla de Requerimientos y Plan Anual de Capacitacion<b>

Esta tabla contiene como encabezados las claves o nombres de los temas de capacitación y utiliza como índice la nómina de los trabajadores.
El objetivo es identificar, para cada trabajador, si necesita revisar o capacitarse en un tema específico.
Para ello, si un trabajador requiere capacitación en un tema, la celda correspondiente se marcará con una "x"; en caso contrario, la celda se deja en blanco (o NaN).

In [190]:
Principal=pd.read_csv(r'C:\Users\mflor\Downloads\Principal2.csv',index_col=0,encoding='utf-8')
Principal

Unnamed: 0_level_0,Core Tools,Core ToolsAPQP,Core ToolsPPAP,PLC_HMI,IATF,AMEF,VDA,SPC,Estadistica,alturas,...,Excel,Aqua pro,TPM,maquina,mejoras,gruas,4ms,csr's honda,job observation,csr's subaru
nominas,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
776532,,,,,,,,,,,...,,,,,,,,,,
770479,,,,,,,,,,,...,,,,,,,,,,
763354,,,,,,,,,,,...,,,,,,,,,,
775239,,,,,,,,,,,...,,,,,,,,,,
861202,,,,,,,,,,,...,,,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
762375,,,,,,,,,,,...,,,,,,,,,,
761244,,,,,,,,,,,...,,,,,,,,,,
772870,,,,,,,,,,,...,,,,,,,,,,
774254,,,,,,,,,,,...,,,,,,,,,,


## <b>Buscar las nominas de los trabajadores que tienen una necesidad de capacitación en uno de los temas que son curso o  taller<b>

En este bloque se procesa cada uno de los 55 archivos cargados (dataframes) para identificar los temas (cursos o talleres) en los que cada trabajador requiere capacitación.

In [195]:

nominas=[]
for tabla in dataframes:
    #Se determina la posición de la columna llamada "Curso" para usarla como referencia en la tabla.
    columna_curso_idx = tabla.columns.get_loc("Curso")
    columna_curso_idx
    Filtrar filas con necesidad de capacitación:
    #Se seleccionan las filas donde en las columnas "Curso" o "Taller" aparece una "x" (sin importar mayúsculas o minúsculas), 
    #lo que indica que el tema es un curso o taller activo para el trabajador.
    indices_x = list(tabla[(tabla["Curso"].str.lower()== "x") | (tabla["Taller"].str.lower() == "x")].index)
    indices_x
    #print(tabla.Curso.dtypes,tabla.Taller.dtypes)
    # Ademas se busca si un trabajador tiene un numero distinto de 0 en la tercer columna correspondiente a su nomina. Si esto sucede 
    # el trabajador requiere capacitación.
    for indice in indices_x: 
            for i in range(3, columna_curso_idx, 3):#columna
                # Obtener el valor de la tercera columna 
                valor = tabla.iloc[indice,i]
                # Si el valor obtenido es diferente de 0 y no vacio indica que el trabajador requiere capacitación. 
                #En este caso, se crea una lista con pares [Tema, Nómina] que vinculan al trabajador con el tema que debe revisar.
                if isinstance(valor, (int, float, np.number)) and valor != 0 and pd.notnull(valor):
                    nominas.append([tabla.Tema[indice], float(tabla.columns[i])])

In [197]:
len(nominas)

2785

In [199]:
nominas

[['AMEF', 773143.2],
 ['AMEF', 765736.2],
 ['AMEF', 776477.2],
 ['AMEF', 761870.2],
 ['AMEF', 764984.2],
 ['AMEF', 773752.2],
 ['AMEF', 776206.2],
 ['AMEF', 773751.2],
 ['Entendimiento de Plan de Control', 773143.2],
 ['Entendimiento de Plan de Control', 765736.2],
 ['Entendimiento de Plan de Control', 776477.2],
 ['Entendimiento de Plan de Control', 761870.2],
 ['Entendimiento de Plan de Control', 764984.2],
 ['Entendimiento de Plan de Control', 773752.2],
 ['Entendimiento de Plan de Control', 776206.2],
 ['Entendimiento de Plan de Control', 773751.2],
 ['IATF', 776477.2],
 ['IATF', 761870.2],
 ['IATF', 773752.2],
 ['IATF', 776206.2],
 ['IATF', 773751.2],
 ['SPC', 773143.2],
 ['SPC', 765736.2],
 ['SPC', 776477.2],
 ['SPC', 761870.2],
 ['SPC', 764984.2],
 ['SPC', 773752.2],
 ['SPC', 776206.2],
 ['SPC', 773751.2],
 ['ILUO', 773752.2],
 ['ILUO', 776206.2],
 ['ILUO', 773751.2],
 ['8 DS', 773143.2],
 ['8 DS', 765736.2],
 ['8 DS', 776477.2],
 ['8 DS', 761870.2],
 ['8 DS', 764984.2],
 ['8 DS

In [201]:
# Convertir los valores flotantes a enteros
nominas = [[nombre, int(valor)] for nombre, valor in nominas]

In [203]:
nominas

[['AMEF', 773143],
 ['AMEF', 765736],
 ['AMEF', 776477],
 ['AMEF', 761870],
 ['AMEF', 764984],
 ['AMEF', 773752],
 ['AMEF', 776206],
 ['AMEF', 773751],
 ['Entendimiento de Plan de Control', 773143],
 ['Entendimiento de Plan de Control', 765736],
 ['Entendimiento de Plan de Control', 776477],
 ['Entendimiento de Plan de Control', 761870],
 ['Entendimiento de Plan de Control', 764984],
 ['Entendimiento de Plan de Control', 773752],
 ['Entendimiento de Plan de Control', 776206],
 ['Entendimiento de Plan de Control', 773751],
 ['IATF', 776477],
 ['IATF', 761870],
 ['IATF', 773752],
 ['IATF', 776206],
 ['IATF', 773751],
 ['SPC', 773143],
 ['SPC', 765736],
 ['SPC', 776477],
 ['SPC', 761870],
 ['SPC', 764984],
 ['SPC', 773752],
 ['SPC', 776206],
 ['SPC', 773751],
 ['ILUO', 773752],
 ['ILUO', 776206],
 ['ILUO', 773751],
 ['8 DS', 773143],
 ['8 DS', 765736],
 ['8 DS', 776477],
 ['8 DS', 761870],
 ['8 DS', 764984],
 ['8 DS', 773752],
 ['8 DS', 776206],
 ['8 DS', 773751],
 ['apqp (planificacion a

In [205]:
#Finalmente, se llena la Matriz de Requerimientos y Plan Anual de Capacitación (Principal), que contiene los temas (columnas) y las nóminas (índices), 
#se convierte a tipo object para permitir almacenar valores no numéricos, como la marca "x"
Principal = Principal.astype(object)
for nombre, valor in nominas:
    if valor in Principal.index and nombre in Principal.columns:
        #Para cada par [Tema, Nómina] detectado previamente, se marca con "x" la celda correspondiente en la matriz Principal para indicar que el
        #trabajador identificado por la nómina requiere capacitación en ese tema.
        Principal.loc[valor, nombre] = "x"


In [207]:
Principal.to_csv('DNCterminado.csv', sep=',')

In [209]:
Principal

Unnamed: 0_level_0,Core Tools,Core ToolsAPQP,Core ToolsPPAP,PLC_HMI,IATF,AMEF,VDA,SPC,Estadistica,alturas,...,Excel,Aqua pro,TPM,maquina,mejoras,gruas,4ms,csr's honda,job observation,csr's subaru
nominas,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
776532,x,,,,x,,x,,,,...,,,,,,,,,,
770479,,,,,x,,x,,,,...,,,,,,,,,,
763354,x,,,,x,x,x,x,,,...,,,,,,,,,,
775239,x,,,,x,,,,,,...,,,,,,,,,,
861202,x,,,,x,,x,,,,...,,,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
762375,,,,,,,,,,,...,,,,,,,,,,
761244,,,,,,,,,,,...,,,,,,,,,,
772870,,,,,,,,,,,...,,,,,,,,,,
774254,,,,,,,,,,,...,,,,,,,,,,
