## **Codificación de variables categóricas**

In [1084]:
import pandas as pd

In [1085]:
# Cargar desde CSV
data = pd.read_csv('dataframe24.csv')
data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 28787 entries, 0 to 28786
Data columns (total 24 columns):
 #   Column                               Non-Null Count  Dtype  
---  ------                               --------------  -----  
 0   DESCRIPCION                          28787 non-null  object 
 1   Mes                                  28787 non-null  object 
 2   Paciente Entidad Responsable Pago    28787 non-null  object 
 3   Paciente Modalidad Contrato          28787 non-null  object 
 4   Paciente Regimen Afiliacion          28787 non-null  object 
 5   Minutos (Camara - F3)                28787 non-null  float64
 6   Dx Principal Tipo                    28787 non-null  object 
 7   Dx Principal Cod                     28787 non-null  object 
 8   Dx Principal Cod.1                   28787 non-null  object 
 9   Dx Relacionado1 Cod                  28787 non-null  object 
 10  Dx Relacionado2 Cod                  28787 non-null  object 
 11  Dx Relacionado3 Cod         

## Descripción

Codificación binaria

In [1086]:
frec = data['DESCRIPCION'].value_counts()
print(frec)

URGENCIAS ADULTO         21426
URGENCIAS PEDIATRICAS     7361
Name: DESCRIPCION, dtype: int64


In [1087]:
data['DESCRIPCION'] = data['DESCRIPCION'].map({'URGENCIAS PEDIATRICAS':0 , 'URGENCIAS ADULTO':1})

print(data['DESCRIPCION'].value_counts())

1    21426
0     7361
Name: DESCRIPCION, dtype: int64


## Mes

Codificación por frecuencia, dado que puede ser **útil cuando capturar la información sobre la prevalencia de hospitalizados según el mes, dado que hay variaciones considerables**

In [1088]:
month_counts = data['Mes'].value_counts()

# Aplicar la codificación de frecuencia
data['Mes'] = data['Mes'].map(month_counts/1000)

# Imprimir el dataframe codificado
print(data.head())

   DESCRIPCION    Mes Paciente Entidad Responsable Pago  \
0            1  2.634                                48   
1            1  2.634                                 5   
2            1  2.634                                65   
3            1  2.634                                48   
4            1  2.634                             Otros   

  Paciente Modalidad Contrato Paciente Regimen Afiliacion  \
0                      EVENTO                  SUBSIDIADO   
1                         PGP                  SUBSIDIADO   
2                      EVENTO                    ESPECIAL   
3                      EVENTO                CONTRIBUTIVO   
4                      EVENTO                CONTRIBUTIVO   

   Minutos (Camara - F3) Dx Principal Tipo  Dx Principal Cod  \
0              26.633333           REPETIDO             I10X   
1              65.133333              NUEVO             W540   
2              82.050000              NUEVO             G510   
3               0.0000

## Paciente entidad responsable pago

In [1089]:
frec = data['Paciente Entidad Responsable Pago'].value_counts()
print (frec)
# Reemplazar 'Otros' por 1
data['Paciente Entidad Responsable Pago'].replace('Otros', 1, inplace=True)

# Convertir la columna a tipo de datos numérico
data['Paciente Entidad Responsable Pago'] = data['Paciente Entidad Responsable Pago'].astype(int)

# Verificar el tipo de datos de la columna después de la conversión
print(data['Paciente Entidad Responsable Pago'].dtype)

48       10607
65        3458
4         3045
5         2535
47        2199
34        1259
68         830
Otros      690
53         602
18         460
23         408
2          398
11         375
63         364
39         326
56         242
15         222
60         163
46         140
62         139
57         118
8          107
61         100
Name: Paciente Entidad Responsable Pago, dtype: int64
int32


In [1090]:
print(data['Paciente Entidad Responsable Pago'].value_counts())

48    10607
65     3458
4      3045
5      2535
47     2199
34     1259
68      830
1       690
53      602
18      460
23      408
2       398
11      375
63      364
39      326
56      242
15      222
60      163
46      140
62      139
57      118
8       107
61      100
Name: Paciente Entidad Responsable Pago, dtype: int64


## Paciente Modalidad Contrato 

In [1091]:
frec = data['Paciente Modalidad Contrato'].value_counts()
print (frec)

EVENTO    24023
PGP        4734
CAPITA       30
Name: Paciente Modalidad Contrato, dtype: int64


In [1092]:
data = pd.get_dummies(data, columns=['Paciente Modalidad Contrato'])
print(data.head())

   DESCRIPCION    Mes  Paciente Entidad Responsable Pago  \
0            1  2.634                                 48   
1            1  2.634                                  5   
2            1  2.634                                 65   
3            1  2.634                                 48   
4            1  2.634                                  1   

  Paciente Regimen Afiliacion  Minutos (Camara - F3) Dx Principal Tipo   \
0                  SUBSIDIADO              26.633333           REPETIDO   
1                  SUBSIDIADO              65.133333              NUEVO   
2                    ESPECIAL              82.050000              NUEVO   
3                CONTRIBUTIVO               0.000000              NUEVO   
4                CONTRIBUTIVO             116.850000              NUEVO   

  Dx Principal Cod Dx Principal Cod.1 Dx Relacionado1 Cod  \
0             I10X            I00-I99                NA00   
1             W540            V01-Y98                NA00   
2    

## Paciente Regimen Afiliacion 

In [1093]:
frec = data['Paciente Regimen Afiliacion'].value_counts()
print (frec)

CONTRIBUTIVO    11911
SUBSIDIADO       9232
ESPECIAL         4978
NO ASEGURADO     2666
Name: Paciente Regimen Afiliacion, dtype: int64


In [1094]:
data = pd.get_dummies(data, columns=['Paciente Regimen Afiliacion'])
print(data.head())

   DESCRIPCION    Mes  Paciente Entidad Responsable Pago  \
0            1  2.634                                 48   
1            1  2.634                                  5   
2            1  2.634                                 65   
3            1  2.634                                 48   
4            1  2.634                                  1   

   Minutos (Camara - F3) Dx Principal Tipo  Dx Principal Cod  \
0              26.633333           REPETIDO             I10X   
1              65.133333              NUEVO             W540   
2              82.050000              NUEVO             G510   
3               0.000000              NUEVO             R224   
4             116.850000              NUEVO             K922   

  Dx Principal Cod.1 Dx Relacionado1 Cod Dx Relacionado2 Cod   \
0            I00-I99                NA00                 NA00   
1            V01-Y98                NA00                 NA00   
2            G00-G99                NA00                 NA

## Dx principal tipo

Como solo se tienen dos categorías se usa codificación binaria.

In [1095]:
frec = data['Dx Principal Tipo '].value_counts()
print (frec)

NUEVO       23861
REPETIDO     4926
Name: Dx Principal Tipo , dtype: int64


In [1096]:
data['Dx Principal Tipo '] = data['Dx Principal Tipo '].map({'NUEVO':0 , 'REPETIDO':1})

In [1097]:
print(data['Dx Principal Tipo '].value_counts())
print(data.head())

0    23861
1     4926
Name: Dx Principal Tipo , dtype: int64
   DESCRIPCION    Mes  Paciente Entidad Responsable Pago  \
0            1  2.634                                 48   
1            1  2.634                                  5   
2            1  2.634                                 65   
3            1  2.634                                 48   
4            1  2.634                                  1   

   Minutos (Camara - F3)  Dx Principal Tipo  Dx Principal Cod  \
0              26.633333                   1             I10X   
1              65.133333                   0             W540   
2              82.050000                   0             G510   
3               0.000000                   0             R224   
4             116.850000                   0             K922   

  Dx Principal Cod.1 Dx Relacionado1 Cod Dx Relacionado2 Cod   \
0            I00-I99                NA00                 NA00   
1            V01-Y98                NA00                 

## Paciente Sexo  

Solo hay dos categorías y se realiza codificación binaria

In [1098]:
frec = data['Paciente Sexo'].value_counts()
print (frec)

FEMENINO     14605
MASCULINO    14182
Name: Paciente Sexo, dtype: int64


In [1099]:
data['Paciente Sexo'] = data['Paciente Sexo'].map({'MASCULINO':0 , 'FEMENINO':1})
print (data.head())

   DESCRIPCION    Mes  Paciente Entidad Responsable Pago  \
0            1  2.634                                 48   
1            1  2.634                                  5   
2            1  2.634                                 65   
3            1  2.634                                 48   
4            1  2.634                                  1   

   Minutos (Camara - F3)  Dx Principal Tipo  Dx Principal Cod  \
0              26.633333                   1             I10X   
1              65.133333                   0             W540   
2              82.050000                   0             G510   
3               0.000000                   0             R224   
4             116.850000                   0             K922   

  Dx Principal Cod.1 Dx Relacionado1 Cod Dx Relacionado2 Cod   \
0            I00-I99                NA00                 NA00   
1            V01-Y98                NA00                 NA00   
2            G00-G99                NA00             

## Clasificacion 1 Triaje Enfermeria

Se hace una codificación ordinal dado que hay una jerarquía conocida entre las categorías. Se le da mayor valor numérico al triaje de mayor urgencia y así disminuye.

In [1100]:
frec = data['Clasificacion 1 Triaje \nEnfermeria '].value_counts()
print (frec)

TRIAJE 3     22134
TRIAJE 2      4808
NO APLICA     1460
TRIAJE 4       207
TRIAJE 1       134
TRIAJE 5        44
Name: Clasificacion 1 Triaje \nEnfermeria , dtype: int64


In [1101]:
# Definir el orden de las categorías
orden = ['NO APLICA', 'TRIAJE 5', 'TRIAJE 4', 'TRIAJE 3', 'TRIAJE 2', 'TRIAJE 1']

# Aplicar la codificación ordinal
data['Clasificacion 1 Triaje \nEnfermeria '] = data['Clasificacion 1 Triaje \nEnfermeria '].map({cat: idx for idx, cat in enumerate(orden)})

# Imprimir el dataframe codificado
print(data['Clasificacion 1 Triaje \nEnfermeria '].value_counts())
print(data.head())

3    22134
4     4808
0     1460
2      207
5      134
1       44
Name: Clasificacion 1 Triaje \nEnfermeria , dtype: int64
   DESCRIPCION    Mes  Paciente Entidad Responsable Pago  \
0            1  2.634                                 48   
1            1  2.634                                  5   
2            1  2.634                                 65   
3            1  2.634                                 48   
4            1  2.634                                  1   

   Minutos (Camara - F3)  Dx Principal Tipo  Dx Principal Cod  \
0              26.633333                   1             I10X   
1              65.133333                   0             W540   
2              82.050000                   0             G510   
3               0.000000                   0             R224   
4             116.850000                   0             K922   

  Dx Principal Cod.1 Dx Relacionado1 Cod Dx Relacionado2 Cod   \
0            I00-I99                NA00                 NA0

## Causa Externa  (Riesgo) 

In [1102]:
frec = data['Causa Externa  (Riesgo)'].value_counts()
print (frec)

ENFERMEDAD GENERAL        25595
ACCIDENTE DE TRANSITO      2237
ACCIDENTE DE TRABAJO        737
OTRO TIPO DE ACCIDENTE      156
LESIÓN POR AGRESIÓN          20
OTRA                         16
ENFERMEDAD PROFESIONAL       12
SOSPECHA ABUSO SEXUAL         9
ACCIDENTE RÁBICO              5
Name: Causa Externa  (Riesgo), dtype: int64


In [1103]:
data = pd.get_dummies(data, columns=['Causa Externa  (Riesgo)'])
print(data.head())

   DESCRIPCION    Mes  Paciente Entidad Responsable Pago  \
0            1  2.634                                 48   
1            1  2.634                                  5   
2            1  2.634                                 65   
3            1  2.634                                 48   
4            1  2.634                                  1   

   Minutos (Camara - F3)  Dx Principal Tipo  Dx Principal Cod  \
0              26.633333                   1             I10X   
1              65.133333                   0             W540   
2              82.050000                   0             G510   
3               0.000000                   0             R224   
4             116.850000                   0             K922   

  Dx Principal Cod.1 Dx Relacionado1 Cod Dx Relacionado2 Cod   \
0            I00-I99                NA00                 NA00   
1            V01-Y98                NA00                 NA00   
2            G00-G99                NA00             

## Modalidad Atencion

In [1104]:
frec = data['Modalidad Atencion'].value_counts()
print (frec)

URGENCIAS    26906
REMITIDO      1881
Name: Modalidad Atencion, dtype: int64


In [1105]:
data['Modalidad Atencion'] = data['Modalidad Atencion'].map({'URGENCIAS':1 , 'REMITIDO':0})
print (data['Modalidad Atencion'].value_counts())
print (data.head())

1    26906
0     1881
Name: Modalidad Atencion, dtype: int64
   DESCRIPCION    Mes  Paciente Entidad Responsable Pago  \
0            1  2.634                                 48   
1            1  2.634                                  5   
2            1  2.634                                 65   
3            1  2.634                                 48   
4            1  2.634                                  1   

   Minutos (Camara - F3)  Dx Principal Tipo  Dx Principal Cod  \
0              26.633333                   1             I10X   
1              65.133333                   0             W540   
2              82.050000                   0             G510   
3               0.000000                   0             R224   
4             116.850000                   0             K922   

  Dx Principal Cod.1 Dx Relacionado1 Cod Dx Relacionado2 Cod   \
0            I00-I99                NA00                 NA00   
1            V01-Y98                NA00                 

## Ubicación Triaje

In [1106]:
frec = data['Ubicación Triaje'].value_counts()
print (frec)

CONSULTORIO 1               11786
CONSULTORIO PEDIATRIA        7270
TRAUMA                       5020
XPRESS                       3098
CONSULTORIO 4                 955
UDEA                          558
CONSULTORIO ONCOLOGIA          42
SAI ADULTO                     19
CONSULTORIO 1 MAGISTERIO       18
CONSULTORIO 2                  10
CONSULTORIO 3                   6
TAMIZAJE COVID                  4
XPress                          1
Name: Ubicación Triaje, dtype: int64


In [1107]:
data = pd.get_dummies(data, columns=['Ubicación Triaje'])
print(data.head())

   DESCRIPCION    Mes  Paciente Entidad Responsable Pago  \
0            1  2.634                                 48   
1            1  2.634                                  5   
2            1  2.634                                 65   
3            1  2.634                                 48   
4            1  2.634                                  1   

   Minutos (Camara - F3)  Dx Principal Tipo  Dx Principal Cod  \
0              26.633333                   1             I10X   
1              65.133333                   0             W540   
2              82.050000                   0             G510   
3               0.000000                   0             R224   
4             116.850000                   0             K922   

  Dx Principal Cod.1 Dx Relacionado1 Cod Dx Relacionado2 Cod   \
0            I00-I99                NA00                 NA00   
1            V01-Y98                NA00                 NA00   
2            G00-G99                NA00             

## Urgencia Xpress F3

In [1108]:
frec = data['Urgencia Xpress F3'].value_counts()
print (frec, frec.index)

False    22947
True      5840
Name: Urgencia Xpress F3, dtype: int64 Index([False, True], dtype='bool')


In [1109]:
data['Urgencia Xpress F3'] = data['Urgencia Xpress F3'].map({False:1 , True:0})
print (data['Urgencia Xpress F3'].value_counts())
print (data.head())

1    22947
0     5840
Name: Urgencia Xpress F3, dtype: int64
   DESCRIPCION    Mes  Paciente Entidad Responsable Pago  \
0            1  2.634                                 48   
1            1  2.634                                  5   
2            1  2.634                                 65   
3            1  2.634                                 48   
4            1  2.634                                  1   

   Minutos (Camara - F3)  Dx Principal Tipo  Dx Principal Cod  \
0              26.633333                   1             I10X   
1              65.133333                   0             W540   
2              82.050000                   0             G510   
3               0.000000                   0             R224   
4             116.850000                   0             K922   

  Dx Principal Cod.1 Dx Relacionado1 Cod Dx Relacionado2 Cod   \
0            I00-I99                NA00                 NA00   
1            V01-Y98                NA00                 

## Grupo Poblacional 

In [1110]:
frec = data['Grupo Poblacional'].value_counts()
print (frec, frec.index)

POBLACIÓN GENERAL              28486
HABITANTE DE CALLE               205
VICTIMA DE CONFLICTO ARMADO       96
Name: Grupo Poblacional, dtype: int64 Index(['POBLACIÓN GENERAL', 'HABITANTE DE CALLE',
       'VICTIMA DE CONFLICTO ARMADO'],
      dtype='object')


In [1111]:
data = pd.get_dummies(data, columns=['Grupo Poblacional'])
print(data.head())

   DESCRIPCION    Mes  Paciente Entidad Responsable Pago  \
0            1  2.634                                 48   
1            1  2.634                                  5   
2            1  2.634                                 65   
3            1  2.634                                 48   
4            1  2.634                                  1   

   Minutos (Camara - F3)  Dx Principal Tipo  Dx Principal Cod  \
0              26.633333                   1             I10X   
1              65.133333                   0             W540   
2              82.050000                   0             G510   
3               0.000000                   0             R224   
4             116.850000                   0             K922   

  Dx Principal Cod.1 Dx Relacionado1 Cod Dx Relacionado2 Cod   \
0            I00-I99                NA00                 NA00   
1            V01-Y98                NA00                 NA00   
2            G00-G99                NA00             

## Pertenencia Etnica

In [1112]:
frec = data['Pertenencia Etnica'].value_counts()
print (frec)

OTRAS ETNIAS                                                     26991
NEGRO (A). MULATO (A). AFROCOLOMBIANO (A) O AFRO DESCENDIENTE     1506
RROM (GITANO)                                                      163
INDÍGENA                                                           106
RAIZAL (ARCHIPIELAGO DE SAN ANDRES Y PROVIDENCIA)                   21
Name: Pertenencia Etnica, dtype: int64


In [1113]:
data = pd.get_dummies(data, columns=['Pertenencia Etnica'])
print(data.head())

   DESCRIPCION    Mes  Paciente Entidad Responsable Pago  \
0            1  2.634                                 48   
1            1  2.634                                  5   
2            1  2.634                                 65   
3            1  2.634                                 48   
4            1  2.634                                  1   

   Minutos (Camara - F3)  Dx Principal Tipo  Dx Principal Cod  \
0              26.633333                   1             I10X   
1              65.133333                   0             W540   
2              82.050000                   0             G510   
3               0.000000                   0             R224   
4             116.850000                   0             K922   

  Dx Principal Cod.1 Dx Relacionado1 Cod Dx Relacionado2 Cod   \
0            I00-I99                NA00                 NA00   
1            V01-Y98                NA00                 NA00   
2            G00-G99                NA00             

## Alto costo

In [1114]:
frec = data['ALTO COSTO'].value_counts()
print (frec)

ZNO ALTO COSTO         27685
CANCER                   560
DIABETES                 191
HIPERTENSION             153
RENAL                    128
TUBERCULOSIS              37
VIH                       20
ARTRITIS REUMATOIDE        8
GESTANTES                  3
HEMOFILIA                  1
HEPATITIS C                1
Name: ALTO COSTO, dtype: int64


In [1115]:
data = pd.get_dummies(data, columns=['ALTO COSTO'])
print(data.head())

   DESCRIPCION    Mes  Paciente Entidad Responsable Pago  \
0            1  2.634                                 48   
1            1  2.634                                  5   
2            1  2.634                                 65   
3            1  2.634                                 48   
4            1  2.634                                  1   

   Minutos (Camara - F3)  Dx Principal Tipo  Dx Principal Cod  \
0              26.633333                   1             I10X   
1              65.133333                   0             W540   
2              82.050000                   0             G510   
3               0.000000                   0             R224   
4             116.850000                   0             K922   

  Dx Principal Cod.1 Dx Relacionado1 Cod Dx Relacionado2 Cod   \
0            I00-I99                NA00                 NA00   
1            V01-Y98                NA00                 NA00   
2            G00-G99                NA00             

## Variables de diagnostico


In [1116]:
# Suponiendo que 'data' es tu DataFrame
categorias_dx_principal = data['Dx Principal Cod'].value_counts().index
categorias_dx_relacionado1 = data['Dx Relacionado1 Cod'].value_counts().index
categorias_dx_relacionado2 = data['Dx Relacionado2 Cod '].value_counts().index
categorias_dx_relacionado3 = data['Dx Relacionado3 Cod'].value_counts().index

# Verificar si hay categorías iguales
categorias_comunes = set(categorias_dx_principal) & set(categorias_dx_relacionado1) & set(categorias_dx_relacionado2) & set(categorias_dx_relacionado3)

if len(categorias_comunes) > 0:
    print("Hay categorías comunes entre las columnas")
    print("Categorías comunes:", categorias_comunes)
else:
    print("No hay categorías comunes entre las columnas.")

Hay categorías comunes entre las columnas
Categorías comunes: {'I10X', 'E440', 'S910', 'S900', 'S501', 'K922', 'J039', 'J960', 'E039', 'S420', 'N189', 'R300', 'M796', 'S809', 'S903', 'S818', 'S700', 'M329', 'I500', 'K830', 'S800', 'E86X', 'J22X', 'J00X', 'R040', 'G409', 'H651', 'R51X', 'S015', 'S901', 'A419', 'R55X', 'E119', 'S069', 'T861', 'H920', 'R11X', 'D649', 'R31X', 'L039', 'R521', 'S068', 'G934', 'A090', 'S019', 'C900', 'L089', 'R400', 'E109', 'H669', 'J441', 'N390', 'S801', 'I269', 'R17X', 'J050', 'R072', 'N179', 'S022', 'S701', 'J353', 'B86X', 'S018', 'N185', 'R104', 'R05X', 'S519', 'K746', 'I499', 'S422', 'S202', 'S619', 'S607', 'J448', 'I219', 'E107', 'H659', 'M545', 'R520', 'R101', 'R074', 'F09X', 'S099', 'R34X', 'R634', 'R060', 'Z940', 'S810', 'S600', 'S500', 'R509', 'S909', 'R418', 'S609', 'S098', 'N939', 'S602', 'J449', 'S301', 'M542'}


Como hay categorias de diagnosticos comunes entre el principal y relacionados, en este caso se usa un enfoque similar al one-hot encoding, se crea una codificación especial donde se tenga una columna por cada código de diagnóstico posible, y si un paciente tiene ese diagnóstico como principal, el valor sea 2; si es un diagnóstico relacionado, el valor sea 1; y si el paciente no tiene ese diagnóstico, el valor sea 0.

In [1117]:
# Obtener la lista de todos los códigos de diagnóstico únicos
codigos_diagnosticos = list(set(data['Dx Principal Cod'].unique()).union(
                             set(data['Dx Relacionado1 Cod'].unique()),
                             set(data['Dx Relacionado2 Cod '].unique()),  # Espacio adicional aquí
                             set(data['Dx Relacionado3 Cod'].unique())))

# Crear un DataFrame vacío para almacenar las nuevas columnas
nuevas_columnas = pd.DataFrame(0, index=data.index, columns=codigos_diagnosticos)

# Recorrer cada fila y establecer el valor apropiado para cada código de diagnóstico
for idx, row in data.iterrows():
    if row['Dx Principal Cod'] in codigos_diagnosticos:
        nuevas_columnas.at[idx, row['Dx Principal Cod']] = 2
    if row['Dx Relacionado1 Cod'] in codigos_diagnosticos:
        nuevas_columnas.at[idx, row['Dx Relacionado1 Cod']] = 1
    if row['Dx Relacionado2 Cod '] in codigos_diagnosticos:  # Espacio adicional aquí
        nuevas_columnas.at[idx, row['Dx Relacionado2 Cod ']] = 1  # Espacio adicional aquí
    if row['Dx Relacionado3 Cod'] in codigos_diagnosticos:
        nuevas_columnas.at[idx, row['Dx Relacionado3 Cod']] = 1

# Concatenar el DataFrame original con las nuevas columnas
data = pd.concat([data, nuevas_columnas], axis=1)

# Verificar el resultado
print(data.head())

   DESCRIPCION    Mes  Paciente Entidad Responsable Pago  \
0            1  2.634                                 48   
1            1  2.634                                  5   
2            1  2.634                                 65   
3            1  2.634                                 48   
4            1  2.634                                  1   

   Minutos (Camara - F3)  Dx Principal Tipo  Dx Principal Cod  \
0              26.633333                   1             I10X   
1              65.133333                   0             W540   
2              82.050000                   0             G510   
3               0.000000                   0             R224   
4             116.850000                   0             K922   

  Dx Principal Cod.1 Dx Relacionado1 Cod Dx Relacionado2 Cod   \
0            I00-I99                NA00                 NA00   
1            V01-Y98                NA00                 NA00   
2            G00-G99                NA00             

In [1118]:
# Eliminar las columnas de diagnóstico originales si es necesario
data.drop(columns=['Dx Principal Cod.1','Dx Principal Cod', 'Dx Relacionado1 Cod', 'Dx Relacionado2 Cod ', 'Dx Relacionado3 Cod'], inplace=True)
print(data)

       DESCRIPCION    Mes  Paciente Entidad Responsable Pago  \
0                1  2.634                                 48   
1                1  2.634                                  5   
2                1  2.634                                 65   
3                1  2.634                                 48   
4                1  2.634                                  1   
...            ...    ...                                ...   
28782            1  1.634                                 53   
28783            1  1.634                                 48   
28784            1  1.634                                 65   
28785            1  1.634                                 18   
28786            1  1.634                                 48   

       Minutos (Camara - F3)  Dx Principal Tipo   Paciente Edad  \
0                  26.633333                   1           75.0   
1                  65.133333                   0           61.0   
2                  82.050000  

Ya todas las columnas son numéricas y no hay ninguna categórica

In [1119]:
# Mostrar información sobre el DataFrame
print(data.info())

# Filtrar columnas de tipo 'object'
columnas_categoricas = data.select_dtypes(include=['object']).columns

# Imprimir las columnas categóricas
print("Columnas categóricas:")
print(columnas_categoricas)


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 28787 entries, 0 to 28786
Columns: 2429 entries, DESCRIPCION to C495
dtypes: float64(5), int32(1), int64(2375), uint8(48)
memory usage: 524.1 MB
None
Columnas categóricas:
Index([], dtype='object')
