In [2]:
import pandas as pd
from sqlalchemy import create_engine, text

In [4]:
# Import .csv file
df = pd.DataFrame(pd.read_excel('./PADRON+CATALOGO  GENERAL JULIO 2024-sin-duplicidad.xlsx'))

# Eliminar columnas
df.drop(columns=[
    'NUM.',
    'NOMBRE DE LA PARTIDA',
    'NUM DE UBICACIÓN FINAL',
    'UNIDAD DE SALIDA',
    'UNIDAD A CARGO',
    'APELLIDO PATERNO',
    'APELLIDO MATERNO',
    'NOMBRES',
    'RFC',
    'CURP',
    'CANTIDAD'
], inplace=True)

# Cambiar el nombre de varias columnas
df.rename(columns={
    'F.F': 'fuente_financiamiento_id',
    'ESTATUS': 'estatus_bien_fisico',
    'NUM. PARTIDA': 'partida_id',
    'NUMERO ECONOMICO': 'numero_economico',
    'NUMERO INVENTARIO': 'numero_inventario',
    'FECHA ENTRADA': 'fecha_entrada',
    'NUM DE UNIDAD DE SALIDA': 'unidad_salida_id',
    'NUM DE UNIDAD A CARGO': 'unidad_cargo_id',
    'RESGUARDANTE': 'nombre_completo',
    'NUMERO DE RESGUARDO': 'numero_resguardo',
    'NUMERO DE SALIDA': 'numero_salida',
    'SUBDESCRIPCION': 'subdescripcion',
    'DESCRIPCIÓN DEL BIEN': 'descripcion_del_bien',
    'MARCA': 'marca',
    'MODELO': 'modelo',
    'SERIE': 'serie',
    'FACTURA': 'factura',
    'PEDIDO': 'pedido',
    'FECHA ADQ.': 'fecha_factura',
    'IMPORTE': 'importe',
    'OBSERVACIÓN': 'observaciones',
    'UBICACIÓN FINAL': 'ubicacion_final',
    'RECURSO': 'regimen'
}, inplace=True)

df['fecha_entrada'] = pd.to_datetime(
    df['fecha_entrada'],
    dayfirst=True,
    errors='coerce'
)

df['fecha_factura'] = pd.to_datetime(
    df['fecha_factura'],
    dayfirst=True,
    errors='coerce'
)

# Convertir 'columna1' a float, forzando errores a NaN
df['estatus_bien_fisico'] = pd.to_numeric(df['estatus_bien_fisico'], errors='coerce')
df['importe'] = pd.to_numeric(df['importe'], errors='coerce')



In [5]:
#INPUT YOUR OWN CONNECTION STRING HERE
conn_string = "postgresql://desarrollo:salud2024@localhost:3000/departamento_inventario"
#perform to_sql test and print result
db = create_engine(conn_string)
conn = db.connect()

# Crear una conexión
with db.connect() as conn:
    # Realizar la consulta para obtener los IDs
    result = conn.execute(text('SELECT id, nombre FROM "Unidad"'))    
    # Crear una lista con los IDs
    unidades = {row[1]: row[0] for row in result}
    
    result = conn.execute(text('SELECT id, nombre FROM "Unidad"'))
    unidades2 = {row[0]: row[1] for row in result}
    # Crear una lista con las fuentes de financiamiento
    result = conn.execute(text('SELECT id, nombre FROM "FuenteFinanciamiento"'))
    ffs = {row[1]: row[0] for row in result}
    
    result = conn.execute(text('SELECT id, numero FROM "Partida"'))
    partidas = [(row[1], row[0]) for row in result]

unidades_dict = {
    '1': "SECRETARIO DE SALUD",
    '2': "SECRETARIA PARTICULAR",
    '2.1': "CENTRO DE RECEPCION DE CORRESPONDENCIA Y DOCUMENTACION",
    '2.2': "DEPARTAMENTO DE DIFUSION INSTITUCIONAL",
    '3': "SECRETARIA TECNICA",
    '4': "ORGANO INTERNO DE CONTROL",
    '4.1': "DEPARTAMENTO DE AUDITORIA",
    '4.2': "DEPARTAMENTO DE QUEJAS",
    '4.3': "DEPARTAMENTO DE RESPONSABILIDADES",
    '4.4': "DEPARTAMENTO DE CONTROL INTERNO Y MEJORA DE LA GESTION PUBLICA",
    '5': "UNIDAD DE ATENCION CIUDADANA",
    '6': "UNIDAD DE ADMINISTRACION Y FINANZAS",
    '6.1': "DIRECCION DE ENLACE OPERATIVO Y DE SEGUIMIENTO",
    '6.1.1': "DEPARTAMENTO DE APOYO OPERATIVO",
    '6.1.2': "DEPARTAMENTO DE SEGUIMIENTO",
    '6.1.3': "ENLACE DE SERVICIOS DE SALUD CON EL INSABI",
    '6.2': "DIRECCION DE FINANZAS",
    '6.2.1': "SUBDIRECCION DE TESORERIA Y CONTABILIDAD",
    '6.2.1.1': "DEPARTAMENTO DE GLOSA",
    '6.2.1.2': "DEPARTAMENTO DE CONTABILIDAD",
    '6.2.1.3': "DEPARTAMENTO DE TESORERIA",
    '6.2.2': "SUBDIRECCION DE PRESUPUESTO",
    '6.2.2.1': "DEPARTAMENTO DE PRESUPUESTO",
    '6.3': "DIRECCION DE RECURSOS HUMANOS",
    '6.3.1': "SUBDIRECCION DE SEGUIMIENTO Y CONTROL",
    '6.3.1.1': "DEPARTAMENTO DE RELACIONES LABORALES",
    '6.3.1.2': "DEPARTAMENTO DE CONTROL Y PAGO DE NOMINAS",
    '6.3.1.3': "DEPARTAMENTO DE OPERACIÓN",
    '6.3.2': "SUBDIRECCION DE SEGUIMIENTO Y NORMATIVIDAD",
    '6.3.2.1': "DEPARTAMENTO DE AUDITORIA Y NORMATIVIDAD",
    '6.3.2.2': "DEPARTAMENTO DE CONTROL Y ENLACE",
    '6.4': "DIRECCION DE INFRAESTRUCTURA",
    '6.4.1': "DEPARTAMENTO DE PRECIOS UNITARIOS",
    '6.4.2': "DEPARTAMENTO DE CONSERVACION Y SUPERVISION",
    '6.4.3': "DEPARTAMENTO DE MANTENIMIENTO DE EQUIPOS",
    '6.5': "DIRECCION DE RECURSOS MATERIALES",
    '6.5.1': "SUBDIRECCION DE RECURSOS MATERIALES",
    '6.5.1.1': "DEPARTAMENTO DE ADQUISICIONES",
    '6.5.1.2': "DEPARTAMENTO DE CONTROL DE ABASTO",
    '6.5.1.3': "AREA DE INVENTARIOS",
    '6.5.1.4': "BODEGA DE PROCESO DE BAJA",
    '6.5.1.5': "BODEGA DE ALMACEN DE INVENTARIOS",
    '6.5.2': "SUBDIRECCION DE SERVICIOS GENERALES",
    '6.5.2.1': "DEPARTAMENTO DE SERVICIOS GENERALES",
    '6.6': "DIRECCION DE PLANEACION",
    '6.6.1': "DEPARTAMENTO DE ORGANIZACIÓN Y MODERNIZACION ADMINISTRATIVA",
    '6.6.2': "DEPARTAMENTO DE ESTADISTICA",
    '6.6.3': "DEPARTAMENTO DE GESTION Y SEGUIMIENTO PRESUPUESTAL",
    '6.6.4': "DEPARTAMENTO DE POLITICAS Y PROGRAMACION",
    '6.6.5': "DEPARTAMENTO DE INFORMATICA",
    '7': "UNIDAD DE TRANSPARENCIA",
    '8': "UNIDAD DE APOYO JURIDICO",
    '8.1': "DEPARTAMENTO DERECHOS HUMANOS",
    '8.2': "DEPARTAMENTO LABORAL",
    '8.3': "DEPARTAMENTO CIVIL",
    '8.4': "DEPARTAMENTO PENAL",
    '8.5': "DEPARTAMENTO DE CONTRATOS Y CONVENIOS",
    '8.6': "DEPARTAMENTO ADMINISTRATIVO",
    '9': "UNIDAD DE TECNOLOGIAS DE LA INFORMACION Y COMUNICACIÓN",
    '9.1': "DEPARTAMENTO DE SUPERVISION Y PROYECTOS DE TECNOLOGIAS DE LA INFORMACION Y COMUNNICACION",
    '9.2': "DEPARTAMENTO DE TELECOMUNICACIONES Y REDES",
    '9.3': "DEPARTAMENTO DE INNOVACION Y DESARROLLO DE SOFTWARE EN SALUD",
    '9.4': "DEPARTAMENTO DE SERVICIOS DE TECNOLOGIAS DE LA INFORMACION",
    '10': "SUBSECRETARIA DE SERVICIOS DE SALUD",
    '10.1': "DIRECCION DEL SISTEMA ESTATAL DE URGENCIAS",
    '10.1.1': "DEPARTAMENTO DE ATENCION PREHOSPITALARIA",
    '10.1.2': "DEPARTAMENTO DE PREVENCION DE LESIONES Y ACCIDENTES",
    '10.1.3': "DEPARTAMENTO DE ATENCION A DESASTRES Y HOSPITAL SEGURO",
    '10.2': "DIRECCION DE CALIDAD Y EDUCACION EN SALUD",
    '10.2.1': "DEPARTAMENTO DE CONTROL DE LA FORMACION DE RECURSOS HUMANOS EN SALUD",
    '10.2.2': "DEPARTAMENTO DE GESTION DE CAPACITACION EN SALUD",
    '10.2.3': "DEPARTAMENTO DE INVESTIGACION",
    '10.2.4': "DEPARTAMENTO DE MONITOREO Y MEDICION DE CALIDAD EN SALUD",
    '10.2.5': "DEPARTAMENTO DE MEJORAS CONTINUA EN SALUD",
    '10.3': "UNIDAD DE ENFERMERIA",
    '10.3.1': "DEPARTAMENTO DE ATENCION PRIMARIA EN ENFERMERIA",
    '10.3.2': "DEPARTAMENTO DE DESARROLLO DE PERSONAL DE ENFERMERIA",
    '10.3.3': "DEPARTAMENTO DE ATENCION ESPECIALIZADA EN ENFERMERIA",
    '10.4': "DIRECCION DE SALUD PSICOSOCIAL",
    '10.4.1': "DEPARTAMENTO DE SALUD MENTAL",
    '10.4.2': "DEPARTAMENTO DE PREVENCION Y CONTROL DE ADICCIONES",
    '10.5': "DIRECCION DE ATENCION MEDICA",
    '10.5.1': "SUBDIRECCION DE ATENCION PRIMARIA A LA SALUD",
    '10.5.1.1': "DEPARTAMENTO DE SUPERVISION DE ATENCION PRIMARIA A LA SALUD",
    '10.5.1.2': "DEPARTAMENTO DE ESTOMATOLOGIA",
    '10.5.1.3': "DEPARTAMENTO DE GESTION Y DESARROLLO DE PRIMER NIVEL",
    '10.5.1.4': "DEPARTAMENTO DE FORTALECIMIENTO A LA ATENCION MEDICA",
    '10.5.2': "SUBDIRECCION DE ATENCION PRIMARIA A LA SALUD",
    '10.5.3': "SUBDIRECCION DE ATENCION MEDICA ESPECIALIZADA",
    '10.5.3.1': "DEPARTAMENTO DE GESTION Y DESARROLLO EN SALUD DE SEGUNDO NIVEL Y TERCER NIVEL",
    '10.5.3.2': "DEPARTAMENTO DE SUPERVISION INTEGRAL DE SEGUNDO Y TERCER NIVEL",
    '10.5.3.3': "DEPARTAMENTO DE TRABAJO SOCIAL",
    '10.5.3.4': "DEPARTAMENTO DE INGENIERIA BIOMEDICA",
    '10.6': "UNIDAD DE LA RED DE LABORATORIOS CLINICOS",
    '10.7': "UNIDAD DE ANALISIS DE DAÑOS A LA SALUD DE PRIORIDAD ESTATAL",
    '11': "SUBSECRETARIA DE SALUD PUBLICA",
    '11.1': "DIRECCION DE PROGRAMAS PREVENTIVOS",
    '11.1.1': "DEPARTAMENTO DE MEDICINA PREVENTIVA",
    '11.1.2': "DEPARTAMENTO DE SALUD REPRODUCTIVA",
    '11.1.3': "DEPARTAMENTO DE VECTORES Y ZOONOSIS",
    '11.1.4': "DEPARTAMENTO DE EPIDEMIOLOGIA",
    '11.1.5': "DEPARTAMENTO DE TUBERCULOSIS Y VIH/SIDA",
    '11.1.6': "DEPARTAMENTO DE CANCER DE LA MUJER",
    '11.1.7': "DEPARTAMENTO DE PROMOCION A LA SALUD",
    '11.2': "DIRECCION DE PROTECCION CONTRA RIESGOS SANITARIOS",
    '11.2.1': "DEPARTAMENTO DE OPERACIÓN SANITARIA",
    '11.2.2': "DEPARTAMENTO DE EVIDENCIA Y MANEJO DE RIESGOS",
    '11.2.3': "DEPARTAMENTO DE DICTAMEN Y AUTORIZACION SANITARIA",
    '11.2.4': "DEPARTAMENTO DE ADMINISTRACION Y PLANEACION SANITARIA",
    '12': "HOSPITAL REGIONAL DE ALTA ESPECIALIDAD DR. GUSTAVO A. ROVIROSA PEREZ",
    '13': "HOSPITAL REGIONAL DE ALTA ESPECIALIDAD DR.JUAN GRAHAM CASASUS",
    '14': "HOSPITAL REGIONAL DE ALTA ESPECIALIDAD DEL NIÑO DR. RODOLFO NIETO PADRON",
    '15': "HOSPITAL REGIONAL DE ALTA ESPECIALIDAD DE LA MUJER",
    '16': "HOSPITAL REGIONAL DE ALTA ESPECIALIDAD DE SALUD MENTAL",
    '17': "CENTRO DE REFERENCIA DE ESPECIALIDADES ODONTOLOGICAS (CREO)",
    '18': "UNIDAD MEDICA ESPECIALIZADA DE IMAGENOLOGIA DE VILLAHERMOSA (UNEME)",
    '19': "CENTRO ESTATAL DE HEMOTERAPIA",
    '20': "LABORATORIO DE SALUD PUBLICA",
    '21': "CENTRO ESTATAL DE TRASPLANTE",
    '22': "JURISDICCION SANITARIA DE BALANCAN",
    '23': "JURISDICCION SANITARIA DE CARDENAS",
    '24': "JURISDICCION SANITARIA DE CENTLA",
    '25': "JURISDICCION SANITARIA DE CENTRO",
    '26': "JURISDICCION SANITARIA DE COMALCALCO",
    '27': "JURISDICCION SANITARIA DE CUNDUACAN",
    '28': "JURISDICCION SANITARIA  EMILIANO ZAPATA",
    '29': "JURISDICCION SANITARIA DE HUIMANGUILLO",
    '30': "JURISDICCION SANITARIA DE JALAPA",
    '31': "JURISDICCION SANITARIA  JALPA DE MENDEZ",
    '32': "JURISDICCION SANITARIA DE JONUTA",
    '33': "JURISDICCION SANITARIA DE MACUSPANA",
    '34': "JURISDICCION SANITARIA DE NACAJUCA",
    '35': "JURISDICCION SANITARIA DE PARAISO",
    '36': "JURISDICCION SANITARIA DE TACOTALPA",
    '37': "JURISDICCION SANITARIA DE TEAPA",
    '38': "JURISDICCION SANITARIA DE TENOSIQUE",
    '39': "CESSA  BUENA VISTA ,ZONA INDIG.YOKOTAN,CENTRO",
    '40': "CESSA  GAVIOTAS, CENTRO",
    '41': "CESSA  LA MANGA 1RA, CENTRO",
    '42': "CESSA  MAXIMILIANO DORANTES, CENTRO",
    '43': "CESSA  TAMULTE DELICIAS, CENTRO",
    '44': "CESSA  VILLA LUIS GIL PEREZ, CENTRO",
    '45': "CESSA TIERRA COLORADA, CENTRO",
    '46': "HOSPITAL COMUNITARIO DE JALAPA",
    '47': "HOSPITAL COMUNITARIO DE JALPA DE MENDEZ",
    '48': "HOSPITAL COMUNITARIO DE JONUTA",
    '49': "HOSPITAL COMUNITARIO DE NACAJUCA",
    '50': "HOSPITAL COMUNITARIO DE TACOTALPA",
    '51': "HOSPITAL COMUNITARIO DE TENOSIQUE",
    '52': "HOSPITAL COMUNITARIO FRONTERA, CENTLA",
    '53': "HOSPITAL COMUNITARIO LA VENTA, HUIMANGUILLO",
    '54': "HOSPITAL GENERAL  DE HUIMANGUILLO",
    '55': "HOSPITAL GENERAL DE BALANCAN",
    '56': "HOSPITAL GENERAL DE CARDENAS",
    '57': "HOSPITAL GENERAL DE COMALCALCO",
    '58': "HOSPITAL GENERAL DE CUNDUACAN",
    '59': "HOSPITAL GENERAL DE EMILIANO  ZAPATA",
    '60': "HOSPITAL GENERAL DE MACUSPANA",
    '61': "HOSPITAL GENERAL DE PARAISO",
    '62': "HOSPITAL GENERAL DE TEAPA",
    '63': "HOSPITAL GENERAL VILLA BENITO JUAREZ, MACUSPANA",
    '64': "BAJAS POR ACTAS DE AÑOS ANTERIORES",
    '65': "BIENES PENDIENTES POR REGULARIZAR DE ADMINISTRACIONES ANTERIORES",
    '65.1': "DIRECCION DE DESCENTRALIZACION",
    '65.2': "DIRECCION DE POLITICA EN SALUD",
    '65.3': "DIRECCION DEL REPSS TABASCO",
    '65.4': "UNIDAD DE ACCESO A LA INFORMACION",
    '65.5': "C.R.E.E.",
    '65.6': "CASA DEL ARBOL",
    '65.7': "CRUZ ROJA MEXICANA DELEGACION TABASCO",
    '65.8': "DIF - DESARROLLO INTEGRAL DE LA FAMILIA",
    '65.9': "DIVISION ACADEMICA CIENCIAS DE LA SALUD",
    '65.10': "ISSET",
    '65.11': "UNIDAD MEDICA DEL CRESET",
    '65.12': "UNIVERSIDAD JUAREZ  AUTONOMA DE TABASCO",
    '65.13': "UNIDAD DE BIENES NO LOCALIZADOS",
    '65.14': "UNIDAD DE BIENES OBSERVADOS",
    '65.15': "SIN UNIDAD"
}

ModuleNotFoundError: No module named 'psycopg2'

In [104]:
# Unidad a cargo #

# Cambiar tipo de dato a string
df['unidad_cargo_id'] = df['unidad_cargo_id'].astype(str)

# Mapear columna unidad a cargo
df['unidad_cargo_id'] = df['unidad_cargo_id'].map(unidades_dict)
df['unidad_cargo_id'] = df['unidad_cargo_id'].map(unidades)

# Quitar decimales en unidad_cargo_id
df['unidad_cargo_id'] = df['unidad_cargo_id'].apply(
    lambda x: pd.Series(str(x)).str.replace(
        r'\.0$', '', regex=True).iloc[0] if pd.notna(x) else x
)

In [107]:
# Unidad Salida

# Quitar decimales en unidad_salida_id
df['unidad_salida_id'] = df['unidad_salida_id'].apply(
    lambda x: pd.Series(str(x)).str.replace(
        r'\.0$', '', regex=True).iloc[0] if pd.notna(x) else x
)
# Mapear valores
df['unidad_salida_id'] = df['unidad_salida_id'].map(unidades_dict)
df['unidad_salida_id'] = df['unidad_salida_id'].map(unidades)

# Se vuelven a quitar decimales en unidad_salida_id
df['unidad_salida_id'] = df['unidad_salida_id'].apply(
    lambda x: pd.Series(str(x)).str.replace(
        r'\.0$', '', regex=True).iloc[0] if pd.notna(x) else x
)

In [113]:
# Fuente de Financiamiento #

# Cambiar tipo de dato a string
# df['fuente_financiamiento_id'] = df['fuente_financiamiento_id'].astype(str)

# Mapear columna fuente de financiamiento
# df['fuente_financiamiento_id_sust'] = df['fuente_financiamiento_id'].map(ffs)

# Quitar decimales
df['fuente_financiamiento_id_sust'] = df['fuente_financiamiento_id_sust'].apply(
    lambda x: pd.Series(str(x)).str.replace(
        r'\.0$', '', regex=True).iloc[0] if pd.notna(x) else x
)


# print(df['fuente_financiamiento_id'].head(1000))
print(df['fuente_financiamiento_id_sust'].head(1000))

# print(ffs)

0      2
1      2
2      2
3      2
4      2
      ..
995    2
996    2
997    2
998    2
999    2
Name: fuente_financiamiento_id_sust, Length: 1000, dtype: object
