In [1]:
import pandas as pd

In [2]:
# DEFINE LOS LÍMITES PARA CALCULAR EL AQI DEL PM 2.5
breakpoints = [
        (0, 50, 0.0, 12.0),
        (51, 100, 12.1, 35.4),
        (101, 150, 35.5, 55.4),
        (151, 200, 55.5, 150.4),
        (201, 300, 150.5, 250.4),
        (301, 400, 250.5, 350.4),
        (401, 500, 350.5, 500.4),
]
# 24 HORAS AQI PM25
def calculate_pm25_aqi(pm25):
    for I_lo, I_hi, C_lo, C_hi in breakpoints:
        if C_lo <= pm25 <= C_hi:
            aqi = ((I_hi - I_lo) / (C_hi - C_lo)) * (pm25 - C_lo) + I_lo
            return round(aqi)

    return None 


    

In [3]:
# FUNCIÓN PARA ESTABLECER LA CATEGORÍA DE CADA AQI CALCULADO
def aqi_category(aqi):
    if aqi <= 50:
        return "Bueno"
    elif aqi <= 100:
        return "Moderado"
    elif aqi <= 150:
        return "No saludable para grupos sensibles"
    elif aqi <= 200:
        return "No saludable"
    elif aqi <= 300:
        return "Muy poco saludable"
    else:
        return "Peligroso"


In [4]:
# FUNCIÓN PARA PROCESAR LOS DATOS DEL PM 2.5
def procesar_pm25():
    # LEER EL EXCEL PM25_Cotocollao.xlsx
    df_pm25 = pd.read_excel("datos_entrenamiento/PM25_Cotocollao.xlsx")

    #ELIMINAR LAS FILAS CON VALORES NAN
    df_pm25 = df_pm25.dropna(subset=["COTOCOLLAO"])

    # RENOMBRAR COLUMNA COTOCOLLAO A PM25 ug/m3
    df_pm25 = df_pm25.rename(columns={"COTOCOLLAO":"PM25 ug/m3"})

    # CALCULAR EL AQI PARA CADA VALOR DE MUESTRA
    df_pm25.loc[:,"PM25_AQI"] = df_pm25.loc[:,"PM25 ug/m3"].apply(calculate_pm25_aqi).round(0)

    #LIMPIAR VALORES NULOS DEL CALCULO DEL AQI PM25
    df_pm25 = df_pm25.dropna(subset=["PM25_AQI"])

    # ESTABLECER UNA CATEGORIA PARA CADA AQI CALCULADO E IMPRIME EL DATASET PROCESADO
    df_pm25.loc[:,"Categoria_PM25"] = df_pm25.loc[:,"PM25_AQI"].apply(aqi_category)

    # EXPORTAR E IMPRIMIR EL DATASET PRCOESADO
    df_pm25.to_excel("datos_procesados/datosProcesadosPM25.xlsx", index=False)
    print("SE HA PROCESADO EL DATASET CORRECTAMENTE!!")
    print(df_pm25)

In [5]:
procesar_pm25()

SE HA PROCESADO EL DATASET CORRECTAMENTE!!
                         FECHA  PM25 ug/m3  PM25_AQI Categoria_PM25
4383   2005-02-25 10:00:00.000        0.00       0.0          Bueno
4384   2005-02-25 11:00:00.000        0.00       0.0          Bueno
4386   2005-02-25 13:00:00.000        0.00       0.0          Bueno
4387   2005-02-25 14:00:00.000        0.00       0.0          Bueno
4388   2005-02-25 15:00:00.000        0.00       0.0          Bueno
...                        ...         ...       ...            ...
186335 2025-11-30 18:00:03.585        5.62      23.0          Bueno
186336 2025-11-30 19:00:03.590        6.84      28.0          Bueno
186337 2025-11-30 20:00:03.595        7.65      32.0          Bueno
186338 2025-11-30 21:00:03.600        3.46      14.0          Bueno
186339 2025-11-30 22:00:03.605        5.54      23.0          Bueno

[174294 rows x 4 columns]
