In [1]:
import pandas as pd

In [2]:
# DEFINE LOS LÍMITES PARA CALCULAR EL AQI DEL OZONO
breakpoints = [
        (0, 50, 0, 54),
        (51, 100, 55, 70),
        (101, 150, 71, 85),
        (151, 200, 86, 105),
        (201, 300, 106, 200),
]

# FUNCION PARA CALCULAR EL AQI DEL OZONO EN PPB
def calculate_o3_aqi(o3_ppb):
    for I_lo, I_hi, C_lo, C_hi in breakpoints:
        if C_lo <= o3_ppb <= C_hi:
            aqi = ((I_hi - I_lo) / (C_hi - C_lo)) * (o3_ppb - C_lo) + I_lo
            return round(aqi)

    return None  # requires 1-hour O₃ AQI


    

In [3]:
# FUNCIÓN PARA ESTABLECER LA CATEGORÍA DE CADA AQI CALCULADO
def aqi_category(aqi):
    if aqi <= 50:
        return "Bueno"
    elif aqi <= 100:
        return "Moderado"
    elif aqi <= 150:
        return "No saludable para grupos sensibles"
    elif aqi <= 200:
        return "No saludable"
    elif aqi <= 300:
        return "Muy poco saludable"
    else:
        return "Use 1-hour O₃ AQI"


In [4]:
# FUNCIÓN PARA PROCESAR LOS DATOS DEL OZONO
def procesar_o3():
    # LEER EL EXCEL O3_Cotocollao.xlsx
    df_o3 = pd.read_excel("datos_entrenamiento/O3_Cotocollao.xlsx")

    #ELIMINAR LAS FILAS CON VALORES NAN
    df_o3 = df_o3.dropna(subset=["COTOCOLLAO"])

    # CONVERTIR UG/M3 A PPB
    MW_O3= 48
    df_o3.loc[:,"O3_ppb"] = df_o3.loc[:,"COTOCOLLAO"] * (24.45 / MW_O3)

    # CALCULAR EL AQI PARA CADA VALOR DE MUESTRA
    df_o3.loc[:,"O3_AQI"] = df_o3.loc[:,"O3_ppb"].apply(calculate_o3_aqi).round(0)

    # ESTABLECER UNA CATEGORIA PARA CADA AQI CALCULADO E IMPRIME EL DATASET PROCESADO
    df_o3.loc[:,"Categoria_O3"] = df_o3.loc[:,"O3_AQI"].apply(aqi_category)

    # EXPORTAR E IMPRIMIR EL DATASET PRCOESADO
    df_o3.to_excel("datos_procesados/datosProcesadosO3.xlsx", index=False)
    print("SE HA PROCESADO EL DATASET CORRECTAMENTE!!")
    print(df_o3)

In [5]:
procesar_o3()

SE HA PROCESADO EL DATASET CORRECTAMENTE!!
                     Fecha  COTOCOLLAO     O3_ppb  O3_AQI Categoria_O3
10116  2005-02-25 13:00:00       60.77  30.954719    29.0        Bueno
10117  2005-02-25 14:00:00       61.06  31.102438    29.0        Bueno
10118  2005-02-25 15:00:00       56.20  28.626875    27.0        Bueno
10119  2005-02-25 16:00:00       51.08  26.018875    24.0        Bueno
10120  2005-02-25 17:00:00       47.30  24.093438    22.0        Bueno
...                    ...         ...        ...     ...          ...
191928 2025-11-30 19:00:00       14.68   7.477625     7.0        Bueno
191929 2025-11-30 20:00:00        7.14   3.636938     3.0        Bueno
191930 2025-11-30 21:00:00        8.20   4.176875     4.0        Bueno
191931 2025-11-30 22:00:00        3.74   1.905063     2.0        Bueno
191932 2025-11-30 23:00:00        7.62   3.881438     4.0        Bueno

[173790 rows x 5 columns]
