In [5]:
import pandas as pd
import numpy as np

df = pd.read_csv("/content/datos_procesados.csv")

In [3]:
import os
print(os.listdir('.'))

['.config', 'drive', 'sample_data']


In [25]:
# --- Pacientes que agendaron cita según cada enermedad
cols = ['hipertension', 'diabetes', 'alcoholismo', 'discapacidad']

df[cols] = df[cols].apply(pd.to_numeric, errors='coerce')

# --- Calculamos el promedio de pacientes con cada condición ---
promedios = df[cols].mean().to_frame(name='Promedio de pacientes')
promedios['Porcentaje (%)'] = promedios['Promedio de pacientes'] * 100

# Redondeamos para mejor presentación
promedios = promedios.round(2)

# --- Mostramos la tabla ---
print("=== PROMEDIO DE TODOS LOS PACIENTES CON CADA CONDICIÓN MÉDICA ===")
print(promedios)

=== PROMEDIO DE TODOS LOS PACIENTES CON CADA CONDICIÓN MÉDICA ===
              Promedio de pacientes  Porcentaje (%)
hipertension                   0.20           19.73
diabetes                       0.07            7.19
alcoholismo                    0.03            3.04
discapacidad                   0.02            2.22


In [24]:
cols_condiciones = ['hipertension', 'diabetes', 'alcoholismo', 'discapacidad']
df[cols_condiciones + ['edad']] = df[cols_condiciones + ['edad']].apply(pd.to_numeric, errors='coerce')

# --- Calcular edad promedio por condición ---
# Se toma la edad promedio de los pacientes que SÍ tienen la condición (valor == 1)
edad_promedio = {
    'hipertension': df.loc[df['hipertension'] == 1, 'edad'].mean(),
    'diabetes': df.loc[df['diabetes'] == 1, 'edad'].mean(),
    'alcoholismo': df.loc[df['alcoholismo'] == 1, 'edad'].mean(),
    'discapacidad': df.loc[df['discapacidad'] == 1, 'edad'].mean()
}

# Convertimos el diccionario en DataFrame para una presentación más clara
tabla_edad = pd.DataFrame.from_dict(edad_promedio, orient='index', columns=['Edad promedio (años)']).round(2)

# --- Mostrar la tabla ---
print("=== EDAD PROMEDIO DE PACIENTES SEGÚN CADA CONDICIÓN MÉDICA ===")
print(tabla_edad)

=== EDAD PROMEDIO DE PACIENTES SEGÚN CADA CONDICIÓN MÉDICA ===
              Edad promedio (años)
hipertension                 60.61
diabetes                     61.37
alcoholismo                  49.59
discapacidad                 50.73


In [29]:
cols_condiciones = ['hipertension', 'diabetes', 'alcoholismo', 'discapacidad']
col_vecindario = 'vecindario'  # cambia si tu dataset usa otro nombre (por ej. 'barrio', 'neighbourhood')

# Convertir columnas a tipo numérico por seguridad
df[cols_condiciones] = df[cols_condiciones].apply(pd.to_numeric, errors='coerce')

# --- TABLAS INDEPENDIENTES POR ENFERMEDAD (solo top 10) ---

# Hipertensión
tabla_hipertension = df.groupby(col_vecindario)['hipertension'].mean().to_frame('Promedio hipertensión (%)') * 100
tabla_hipertension = tabla_hipertension.round(2)
tabla_hipertension_top15 = tabla_hipertension.nlargest(15, 'Promedio hipertensión (%)')


# --- Mostrar tabla ---
print("=== TOP 15 VECINDARIOS DONDE HABITAN PACIENTES CON HIPERTENSIÓN ===")
print(tabla_hipertension_top15, "\n")


=== TOP 15 VECINDARIOS DONDE HABITAN PACIENTES CON HIPERTENSIÓN ===
                   Promedio hipertensión (%)
vecindario                                  
DE LOURDES                             34.75
SANTA CECÍLIA                          32.37
PARQUE MOSCOSO                         32.04
FONTE GRANDE                           31.23
SANTOS DUMONT                          31.11
SÃO CRISTÓVÃO                          30.34
MARUÍPE                                29.02
ESTRELINHA                             28.81
GRANDE VITÓRIA                         28.20
BELA VISTA                             27.79
VILA RUBIM                             27.38
SÃO PEDRO                              27.37
UNIVERSITÁRIO                          26.97
DA PENHA                               26.75
ILHA DAS CAIEIRAS                      26.61 



In [30]:
# Diabetes
tabla_diabetes = df.groupby(col_vecindario)['diabetes'].mean().to_frame('Promedio diabetes (%)') * 100
tabla_diabetes = tabla_diabetes.round(2)
tabla_diabetes_top15 = tabla_diabetes.nlargest(15, 'Promedio diabetes (%)')

# --- Mostrar tabla ---
print("=== TOP 15 VECINDARIOS DONDE HABITAN PACIENTES CON DIABETES ===")
print(tabla_diabetes_top15, "\n")



=== TOP 15 VECINDARIOS DONDE HABITAN PACIENTES CON DIABETES ===
                   Promedio diabetes (%)
vecindario                              
MORADA DE CAMBURI                  13.54
ANDORINHAS                         13.24
COMDUSA                            12.26
SÃO JOSÉ                           12.04
DE LOURDES                         11.80
PARQUE MOSCOSO                     11.72
SÃO CRISTÓVÃO                      11.33
UNIVERSITÁRIO                      11.18
DA PENHA                           11.01
ESTRELINHA                         10.97
SANTOS DUMONT                      10.97
GRANDE VITÓRIA                     10.92
NOVA PALESTINA                     10.69
ILHA DAS CAIEIRAS                  10.64
VILA RUBIM                         10.58 



In [31]:
# Alcoholismo
tabla_alcoholismo = df.groupby(col_vecindario)['alcoholismo'].mean().to_frame('Promedio alcoholismo (%)') * 100
tabla_alcoholismo = tabla_alcoholismo.round(2)
tabla_alcoholismo_top15 = tabla_alcoholismo.nlargest(15, 'Promedio alcoholismo (%)')

# --- Mostrar tabla ---
print("=== TOP 15 VECINDARIOS DONDE HABITAN PACIENTES CON ALCOHOLISMO ===")
print(tabla_alcoholismo_top15, "\n")


=== TOP 15 VECINDARIOS DONDE HABITAN PACIENTES CON ALCOHOLISMO ===
                Promedio alcoholismo (%)
vecindario                              
ESTRELINHA                         14.68
DO MOSCOSO                         13.08
SANTA MARTHA                       10.99
PRAIA DO SUÁ                        7.92
DA PENHA                            7.76
CRUZAMENTO                          6.94
SÃO BENEDITO                        6.88
INHANGUETÁ                          6.53
SÃO PEDRO                           6.13
BONFIM                              5.99
ROMÃO                               5.65
NOVA PALESTINA                      5.39
SANTOS REIS                         5.12
PIEDADE                             5.09
BELA VISTA                          4.98 



In [32]:
# Discapacidad
tabla_discapacidad = df.groupby(col_vecindario)['discapacidad'].mean().to_frame('Promedio discapacidad (%)') * 100
tabla_discapacidad = tabla_discapacidad.round(2)
tabla_discapacidad_top15 = tabla_discapacidad.nlargest(15, 'Promedio discapacidad (%)')

# --- Mostrar tabla ---
print("=== TOP 15 PROMEDIO DE PACIENTES CON DISCAPACIDAD POR VECINDARIO ===")
print(tabla_discapacidad_top15, "\n")

=== TOP 15 PROMEDIO DE PACIENTES CON DISCAPACIDAD POR VECINDARIO ===
                     Promedio discapacidad (%)
vecindario                                    
HORTO                                    10.86
MATA DA PRAIA                             9.63
DO QUADRO                                 6.48
DE LOURDES                                6.23
ESTRELINHA                                6.13
GRANDE VITÓRIA                            5.60
VILA RUBIM                                4.94
SANTA LUÍZA                               4.91
SANTA TEREZA                              4.65
BELA VISTA                                4.40
DA PENHA                                  4.06
SÃO JOSÉ                                  4.00
SÃO PEDRO                                 3.96
ARIOVALDO FAVALESSA                       3.90
SANTA MARTHA                              3.86 



In [35]:
col_vecindario = 'vecindario'
col_asistencia = 'asistio'         # columna que indica si asistió (1 = sí, 0 = no)

df[col_asistencia] = pd.to_numeric(df[col_asistencia], errors='coerce')

# Agrupar por vecindario y calcular la media (porcentaje de asistencia)
tabla_asistencia = df.groupby(col_vecindario)[col_asistencia].mean().to_frame('Promedio asistencia (%)') * 100

# Redondear a 2 decimales
tabla_asistencia = tabla_asistencia.round(2)

# Ordenar de mayor a menor y tomar solo el top 15
tabla_asistencia_top15 = tabla_asistencia.sort_values(by='Promedio asistencia (%)', ascending=False).head(15)

# Mostrar tabla
print("=== TOP 15 VECINDARIOS SEGÚN PROMEDIO DE ASISTENCIA A SU CITA ===")
print(tabla_asistencia_top15)

=== TOP 15 VECINDARIOS SEGÚN PROMEDIO DE ASISTENCIA A SU CITA ===
                             Promedio asistencia (%)
vecindario                                          
ILHAS OCEÂNICAS DE TRINDADE                   100.00
SANTOS DUMONT                                  28.92
SANTA CECÍLIA                                  27.46
SANTA CLARA                                    26.48
ITARARÉ                                        26.27
JESUS DE NAZARETH                              24.40
HORTO                                          24.00
ILHA DO PRÍNCIPE                               23.48
CARATOÍRA                                      23.04
ANDORINHAS                                     22.94
PRAIA DO SUÁ                                   22.83
GURIGICA                                       22.60
BENTO FERREIRA                                 22.49
PARQUE MOSCOSO                                 22.32
MARUÍPE                                        22.29


In [36]:
tabla_asistencia_top15_menor = tabla_asistencia.sort_values(by='Promedio asistencia (%)', ascending=True).head(15)

# Mostrar tabla
print("=== TOP 15 VECINDARIOS CON MENOR PROMEDIO DE ASISTENCIA A SU CITA ===")
print(tabla_asistencia_top15_menor)

=== TOP 15 VECINDARIOS CON MENOR PROMEDIO DE ASISTENCIA A SU CITA ===
                   Promedio asistencia (%)
vecindario                                
PARQUE INDUSTRIAL                     0.00
ILHA DO BOI                           8.57
AEROPORTO                            12.50
MÁRIO CYPRESTE                       14.56
SOLON BORGES                         14.71
DE LOURDES                           15.41
DO CABRAL                            15.71
SANTA MARTHA                         15.84
JARDIM DA PENHA                      16.28
DO QUADRO                            16.49
VILA RUBIM                           16.57
MORADA DE CAMBURI                    16.67
MATA DA PRAIA                        17.08
REPÚBLICA                            17.13
CONSOLAÇÃO                           17.22
