In [1]:
import pandas as pd

In [2]:
# DEFINE LOS LÍMITES PARA CALCULAR EL AQI DEL MONOXIDO DE CARBONO
breakpoints = [
        (0, 50, 0, 53),
        (51, 100, 54, 100),
        (101, 150, 101, 360),
        (151, 200, 361, 649),
        (201, 300, 650, 1249),
        (301, 400, 1250, 1649),
        (401, 500, 1650, 2049),
]

# FUNCION PARA CALCULAR EL AQI DEL DIOXIDO DE NITROGENO EN PPB
def calculate_no2_aqi(no2_ppb):
    # Convert µg/m³ to ppb and round (EPA rule)

    for I_lo, I_hi, C_lo, C_hi in breakpoints:
        if C_lo <= no2_ppb <= C_hi:
            aqi = ((I_hi - I_lo) / (C_hi - C_lo)) * (no2_ppb - C_lo) + I_lo
            return round(aqi)

    return None

    

In [3]:
# FUNCIÓN PARA ESTABLECER LA CATEGORÍA DE CADA AQI CALCULADO
def aqi_category(aqi):
    if aqi <= 53:
        return "Bueno"
    elif aqi <= 100:
        return "Moderado"
    elif aqi <= 360:
        return "No saludable para grupos sensibles"
    elif  aqi <= 649:
        return "No saludable"
    elif aqi <= 1249:
        return "Muy poco saludable"
    elif aqi <= 2049:
        return "Peligrosa"
    else:
        return "Beyond AQI scale"


In [4]:
# FUNCIÓN PARA PROCESAR LOS DATOS DEL DIOXIDO DE NITROGENO NO2
def procesar_no2():
    # LEER EL EXCEL CO_Cotocollao.xlsx
    df_no2 = pd.read_excel("datos_entrenamiento/NO2_Cotocollao.xlsx")

    #ELIMINAR LAS FILAS CON VALORES NAN
    df_no2 = df_no2.dropna(subset=["COTOCOLLAO"])

    # CONVERTIR UG/M3 A PPB
    MW_NO2 = 46.005
    df_no2.loc[:,"NO2_ppb"] = df_no2.loc[:,"COTOCOLLAO"] * (24.45 / MW_NO2)

    # CALCULAR EL AQI PARA CADA VALOR DE MUESTRA
    df_no2.loc[:,"NO2_AQI"] = df_no2.loc[:,"NO2_ppb"].apply(calculate_no2_aqi).round(0)

    # ESTABLECER UNA CATEGORIA PARA CADA AQI CALCULADO E IMPRIME EL DATASET PROCESADO
    df_no2.loc[:,"Categoria_NO2"] = df_no2.loc[:,"NO2_AQI"].apply(aqi_category)

    # EXPORTAR E IMPRIMIR EL DATASET PRCOESADO
    df_no2.to_excel("datos_procesados/datosProcesadosNO2.xlsx", index=False)
    print("SE HA PROCESADO EL DATASET CORRECTAMENTE!!")
    print(df_no2)

In [5]:
# EJECUTAR EL PROCESAMIENTO DE DATOS
procesar_no2()

SE HA PROCESADO EL DATASET CORRECTAMENTE!!
                         FECHA  COTOCOLLAO    NO2_ppb  NO2_AQI Categoria_NO2
10114  2005-02-25 14:00:00.000       22.21  11.803815     11.0         Bueno
10115  2005-02-25 15:00:00.000       22.31  11.856961     11.0         Bueno
10116  2005-02-25 16:00:00.000       22.54  11.979198     11.0         Bueno
10117  2005-02-25 17:00:00.000       23.09  12.271503     12.0         Bueno
10118  2005-02-25 18:00:00.000       30.04  15.965178     15.0         Bueno
...                        ...         ...        ...      ...           ...
191924 2025-11-30 18:59:56.400       18.80   9.991523      9.0         Bueno
191925 2025-11-30 19:59:56.395       29.43  15.640985     15.0         Bueno
191926 2025-11-30 20:59:56.390       30.34  16.124617     15.0         Bueno
191927 2025-11-30 21:59:56.385       28.53  15.162667     14.0         Bueno
191928 2025-11-30 22:59:56.380       22.57  11.995142     11.0         Bueno

[155877 rows x 5 columns]
