# üîé An√°lisis Exploratorio: La Calidad del Aire en Madrid (2001-2022)

Este proyecto utiliza el dataset ‚ÄúMadridPolution2001-2022.csv‚Äù, que contiene registros horarios de contaminantes atmosf√©ricos medidos en la estaci√≥n Escuelas Aguirre (Madrid) desde enero de 2001 hasta marzo de 2022. El objetivo es analizar la calidad del aire en el centro de Madrid a lo largo de dos d√©cadas y descubrir c√≥mo ha cambiado la contaminaci√≥n en la ciudad, identificando tendencias a largo plazo, patrones estacionales y episodios de poluci√≥n extrema. Para ello, se estudiar√°n los registros horarios de 14 contaminantes clave, tomados desde enero de 2001 hasta marzo de 2022.

A continuaci√≥n, se detalla qu√© es cada uno de estos contaminantes y por qu√© es importante medirlos.

---

## ¬øQu√© contaminantes se miden y qu√© significan?

Los datos recogidos incluyen diferentes tipos de part√≠culas y gases que afectan tanto a nuestra salud como al medio ambiente. Se pueden agrupar en las siguientes categor√≠as:

### üí® Part√≠culas en suspensi√≥n: El polvo que no se ve

Son peque√±as part√≠culas s√≥lidas y l√≠quidas que flotan en el aire. Su peligrosidad depende de su tama√±o: cuanto m√°s peque√±as, m√°s profundamente pueden penetrar en nuestros pulmones.

* **PM10**: Part√≠culas con un di√°metro inferior a 10 micr√≥metros. Incluyen polvo, polen, cenizas y holl√≠n. Pueden irritar los ojos, la nariz y la garganta.
* **PM2.5**: Part√≠culas con un di√°metro inferior a 2.5 micr√≥metros, tambi√©n conocidas como "part√≠culas finas". Son mucho m√°s peligrosas, ya que pueden llegar a los alv√©olos pulmonares e incluso pasar al torrente sangu√≠neo. Se originan principalmente en la quema de combustibles de veh√≠culos e industria.

### üöó Gases relacionados con el tr√°fico y la combusti√≥n

La mayor√≠a de estos gases se producen al quemar combustibles como la gasolina, el di√©sel o el gas natural. Son los principales responsables de la "boina" de contaminaci√≥n de las grandes ciudades.

* **CO (Mon√≥xido de carbono)**: Un gas t√≥xico que se genera cuando la combusti√≥n es incompleta. Su principal fuente en las ciudades son los tubos de escape de los coches.
* **NO (Mon√≥xido de nitr√≥geno)** y **NO2 (Di√≥xido de nitr√≥geno)**: Com√∫nmente agrupados como **NOx (√ìxidos de nitr√≥geno)**, son gases que se forman a altas temperaturas en los motores de los veh√≠culos y en las centrales el√©ctricas. El NO2 es el gas de color marr√≥n-rojizo que se ve en las nubes de contaminaci√≥n y est√° directamente relacionado con enfermedades respiratorias.
* **SO2 (Di√≥xido de azufre)**: Proviene principalmente de la quema de combustibles f√≥siles con contenido de azufre, como el carb√≥n y el petr√≥leo, en la industria y la calefacci√≥n. Es uno de los causantes de la lluvia √°cida.

### ‚òÄÔ∏è Ozono "malo": Un contaminante de verano

* **O3 (Ozono)**: A diferencia del ozono bueno de la estratosfera que nos protege del sol, el ozono a nivel del suelo es un contaminante. No se emite directamente, sino que se forma cuando los √≥xidos de nitr√≥geno (NOx) y otros compuestos reaccionan con la luz solar. Por eso, sus niveles suelen ser m√°s altos en d√≠as soleados y calurosos, provocando irritaci√≥n en las v√≠as respiratorias.

### ‚õΩ Compuestos Org√°nicos Vol√°tiles (COVs)

Son un grupo amplio de sustancias qu√≠micas que se evaporan f√°cilmente a temperatura ambiente. Proceden de los combustibles, disolventes, pinturas y tambi√©n de los tubos de escape.

* **BEN (Benceno)**, **TOL (Tolueno)** y **EBE (Etilbenceno)**: Son compuestos arom√°ticos derivados del petr√≥leo, muy presentes en la gasolina. Son t√≥xicos y el benceno, en particular, es un conocido cancer√≠geno.
* **CH4 (Metano)**, **NMHC (Hidrocarburos no met√°nicos)** y **TCH (Hidrocarburos totales)**: Estos t√©rminos agrupan a todos los compuestos de hidrocarburos en el aire. El metano (CH4) es un potente gas de efecto invernadero, mientras que los NMHC son importantes porque contribuyen a la formaci√≥n de ozono. El TCH es simplemente la suma de ambos.

El an√°lisis de estas variables nos permitir√° obtener una radiograf√≠a completa de la evoluci√≥n del aire que respiramos en Madrid y entender mejor el impacto de nuestras actividades diarias en el entorno urbano.

## üå± Alba (limpieza y calidad de datos)

Para asegurar la fiabilidad de nuestro an√°lisis, el primer paso es realizar una limpieza exhaustiva y una evaluaci√≥n de la calidad de los datos. Un dataset limpio y bien estructurado es fundamental para obtener conclusiones v√°lidas.

En esta fase, nos centraremos en:
1. Validar y transformar el formato de las fechas, que es la base de nuestro an√°lisis temporal.
2. Cuantificar y analizar los valores ausentes (nulos) para entender qu√© variables tienen datos m√°s completos.
3. Verificar la existencia de filas duplicadas que puedan distorsionar los resultados.
4. Asegurar que los tipos de datos son correctos para cada variable.
5. Detectar posibles valores an√≥malos, como mediciones negativas, que no tendr√≠an sentido f√≠sico.

Comenzamos por convertir la columna `Time` a un formato `datetime`. Esto es crucial para que Python la reconozca como una fecha y no como simple texto, permiti√©ndonos realizar operaciones temporales. Adem√°s, creamos columnas adicionales (year, month, day, hour) para facilitar la agrupaci√≥n y el an√°lisis de patrones en diferentes escalas de tiempo.

In [None]:
import pandas as pd
import calendar
import matplotlib.pyplot as plt
import matplotlib.ticker as mticker

# Cargar el dataset
csv_path = r"data/MadridPolution2001-2022.csv"

# Leer sin parsear fechas inicialmente para detectar el nombre de columna correcto
df = pd.read_csv(csv_path)

# --- LIMPIEZA DE FECHA ---
# La columna "time" la convertimos directamente a datetime
df["Time"] = pd.to_datetime(df["Time"], errors="coerce") # Con errors="coerce"

# Verificamos si se han generado nulos al convertir la columna "Time" a formato datetime
print("Nulos en la columna Time despu√©s de la conversi√≥n: ", df["Time"].isna().sum())

# Creamos columnas auxiliares para explorar temporalmente el dataset, pero de momento no haremos una limpieza estricta
df["year"] = df["Time"].dt.year
df["month"] = df["Time"].dt.month
df["day"] = df["Time"].dt.day
df["hour"] = df["Time"].dt.hour


# Mostramos los resultados
print("Columnas detectadas en el CSV:", df.columns.tolist())
print("Dimensiones del dataset:", df.shape)
print(df.head(10))

#### **Analizamos la presencia de valores nulos**
Uno de los problemas m√°s comunes en los datasets del mundo real es la ausencia de datos. Medir la cantidad de valores nulos en cada columna nos permite evaluar la fiabilidad de cada variable. A continuaci√≥n, calculamos cu√°ntos datos faltan en cada columna y qu√© porcentaje representan sobre el total de registros.

Para visualizar mejor la magnitud del problema, un gr√°fico de barras es ideal. Nos permite comparar de un vistazo qu√© contaminantes tienen la mayor proporci√≥n de datos ausentes. Esto ser√° clave para decidir si debemos descartar alguna variable o si necesitamos aplicar t√©cnicas de imputaci√≥n de datos en an√°lisis futuros.

In [None]:
conteo_de_nulos['Porcentaje'].plot(kind="bar", color='red', legend=False)
plt.title("Porcentaje de valores nulos en cada columna")
plt.xlabel("Columnas del DataSet")
plt.ylabel("Valores nulos (%)")

plt.grid(True, axis='y', linestyle='--', alpha=0.7)

plt.ylim(0, 100)
ejes = plt.gca()
ejes.yaxis.set_major_formatter(mticker.FuncFormatter(lambda y, _: f'{int(y)}%'))
plt.show()

#### **Interpretaci√≥n de los resultados:**

El an√°lisis de valores nulos revela informaci√≥n muy importante:

PM2.5 es la variable m√°s afectada, con casi un 40% de datos ausentes. Esto sugiere que las mediciones de part√≠culas finas pueden haber sido inconsistentes o que el equipo de medici√≥n no estuvo operativo durante largos periodos, por lo que cualquier an√°lisis sobre PM2.5 debe hacerse con cautela.

Los hidrocarburos NMHC, TCH y CH4 tambi√©n presentan una cantidad considerable de nulos, aunque por debajo del 20%.

Por otro lado, contaminantes clave como NO, NO2, O3, SO2 y CO tienen un porcentaje de nulos muy bajo (< 5%), lo que los convierte en candidatos muy fiables para nuestro an√°lisis de tendencias.

Es una excelente noticia que las columnas temporales (Time, year, month, day, hour) no tengan ning√∫n valor nulo (0%). Esto nos garantiza que tenemos un registro horario completo a lo largo de los 21 a√±os del dataset, lo cual es fundamental para el an√°lisis de series temporales.

---

#### **Verificaci√≥n de Duplicados**
Otro paso importante es comprobar si existen filas completamente duplicadas. En un dataset de series temporales, cada registro horario deber√≠a ser √∫nico. La presencia de duplicados podr√≠a indicar errores en la recolecci√≥n o procesamiento de los datos, y su eliminaci√≥n es necesaria para no sesgar los c√°lculos estad√≠sticos.

In [None]:
duplicados = df.duplicated().sum()
print(f"Numero de filas duplicadas: {duplicados}")

# En caso de que detectase alg√∫n duplicado, con el m√©todo drop_duplicates eliminar√≠a la columna entera
if duplicados > 0:
    df.drop_duplicates()
    print("Duplicados eliminados. Nuevo tama√±o del dataset: ", df.shape)

**Resultado:** El an√°lisis confirma que no existen filas duplicadas en el dataset. Cada registro corresponde a una medici√≥n horaria √∫nica, lo que refuerza la integridad de nuestros datos.

---

#### **Revisi√≥n de Tipos de Datos**
Ahora, nos aseguramos de que cada columna tenga el tipo de dato adecuado. Las variables de contaminantes deben ser num√©ricas (enteros o decimales) para poder realizar c√°lculos matem√°ticos, y las de fecha deben tener el formato datetime. Si una columna num√©rica se hubiera cargado como texto, cualquier operaci√≥n matem√°tica fallar√≠a.

In [None]:
print("\nTipos de datos detectados en el dataset:")
print(df.dtypes)

# Comprobamos si hay columnas num√©ricas cargadas como texto
numeric_cols = df.select_dtypes(include=["object"]).columns
print("\nColumnas tipo 'object' (texto):", numeric_cols.tolist())

**Resultado:** La revisi√≥n muestra que todas las columnas tienen el formato correcto. Las variables de los contaminantes son de tipo `float64` (decimal), las columnas de tiempo auxiliares son `int64` (entero), y la columna principal `Time` es `datetime64[ns]`. No hay columnas num√©ricas interpretadas err√≥neamente como texto.

---

#### **Detecci√≥n de Valores An√≥malos**
Finalmente, investigamos la existencia de valores que no tienen sentido desde una perspectiva l√≥gica o f√≠sica. En la medici√≥n de contaminantes, no es posible tener concentraciones negativas. Tambi√©n revisamos los rangos (m√≠nimos y m√°ximos) de cada variable para detectar posibles valores extremos que pudieran ser errores de medici√≥n.

In [None]:
# Buscar valores negativos en las columnas num√©ricas
negativos = (df.select_dtypes(include=["float64", "int64"]) < 0).sum()
print("\nValores negativos por columna:")
print(negativos[negativos > 0])

# Ver rango de cada variable (m√≠nimo y m√°ximo)
rangos = df.describe().T[["min", "max"]]
print("\nRangos de valores por columna:")
print(rangos)

**Resultado:** El an√°lisis confirma que no hay valores negativos en ninguna de las columnas de contaminantes, lo cual es coherente.

Al observar los rangos, vemos que los valores m√≠nimos son cero o cercanos a cero, como es de esperar. Aunque algunos m√°ximos puedan parecer elevados, es plausible que correspondan a episodios de alta contaminaci√≥n, por lo que no los eliminaremos en esta fase.

---

### **Conclusi√≥n de la Limpieza de Datos üßê**

Tras completar el proceso de limpieza y validaci√≥n, podemos concluir que el dataset tiene una **calidad general buena y es robusto** para el an√°lisis exploratorio.

Los puntos clave son:

* **El eje temporal es completo y coherente**, sin duplicados ni errores de formato, lo que proporciona una base s√≥lida para el an√°lisis.

* Los datos de los principales contaminantes relacionados con el tr√°fico y la salud p√∫blica **(NOx, CO, O3, SO2)** son fiables y presentan muy pocos valores ausentes.

* La principal debilidad del dataset es la ** alta proporci√≥n de valores nulos en la columna PM2.5 (~40%), as√≠ como en los hidrocarburos (CH4, NMHC, TCH) **. Esto deber√° tenerse en cuenta en las siguientes fases del an√°lisis, ya que las conclusiones sobre estas variables ser√°n menos representativas.

El dataset est√° ahora preparado para la siguiente etapa: el an√°lisis general y descriptivo.

---

## üìä Robert (an√°lisis general y descriptivo)

- Promedio anual: ¬øCu√°l es la concentraci√≥n media de cada contaminante por a√±o? (tabla resumen por a√±o y contaminante).
- Mejora: Visualizar la evoluci√≥n anual de los principales contaminantes con gr√°ficos de l√≠neas.


In [None]:
# Renombrar la columna de fecha a 'date' para homogeneidad
if date_col != "date":
    df = df.rename(columns={date_col: "date"})

# Asegurar que la columna 'date' est√© en formato datetime
if not pd.api.types.is_datetime64_any_dtype(df["date"]):
    df["date"] = pd.to_datetime(df["date"], dayfirst=True, errors="coerce")

# A√±adir columnas de a√±o, mes, d√≠a y hora para an√°lisis temporales
df["year"] = df["date"].dt.year
df["month"] = df["date"].dt.month
df["day"] = df["date"].dt.day
df["hour"] = df["date"].dt.hour

# Agrupamos todos los datos en a√±os, pasando de 2001-01-01 00:00:00+00:00 a los a√±os correspondientes
df["a√±o"] = df["date"].dt.year

# Creamos una lista con todos los contaminantes que se recogen
contaminantes = ["BEN","CH4","CO","EBE","NMHC","NO","NO2","NOx","O3","PM10","PM25","SO2","TCH","TOL"]

# Agrupamos todos los datos de todos los contaminantes en a√±os y entre todos los datos sacamos su media correspondiente
resumen = df.groupby("a√±o")[contaminantes].mean().round(2)

# Mostramos los datos
display(resumen)

# Para la mejora de este apartado, creamos una lista con la selecci√≥n de los principales contaminantes
principales = ["NO2", "O3", "PM10", "PM25"]

# Filtrar el resumen solo a esos contaminantes
resumen_principales = resumen[principales]

# Creamos el gr√°fico y lo mostramos
plt.figure(figsize=(10,6))
for col in resumen_principales.columns:
    plt.plot(resumen_principales.index, resumen_principales[col], marker="o", label=col)

plt.title("Evoluci√≥n anual de contaminantes en Madrid (2001‚Äì2022)")
plt.xlabel("A√±o")
plt.ylabel("Concentraci√≥n media")
plt.legend(title="Contaminantes principales")
# Mostramos el gr√°fico con delimitadores para mayor visibilidad
plt.grid(True, linestyle="--", alpha=0.6)
plt.tight_layout()
plt.show()

- Mes con peor calidad del aire: ¬øQu√© mes tuvo la media m√°s alta de NO‚ÇÇ cada a√±o? (gr√°fico de barras mensual por a√±o).
- Mejora: Mostrar el mes m√°s cr√≠tico para cada a√±o y visualizar la tendencia mensual agregada.

In [None]:
# ---------- LIMPIEZA DE DATOS ----------
# Convertimos NO2 de Float a Int
df["NO2"] = pd.to_numeric(df["NO2"], errors="coerce")

# Eliminamos filas donde NO2 o date sean NaN
df = df.dropna(subset=["date", "NO2"])

# Agrupamos los datos de date por mes
df["mes"] = df["date"].dt.month

# Obtenemos la media mensual de di√≥xido de nitr√≥geno NO2
mensual_no2 = df.groupby(["a√±o", "mes"])["NO2"].mean().reset_index()

# Obtenemos el mes con peor promedio de cada a√±o
peor_mes_anual = mensual_no2.loc[mensual_no2.groupby("a√±o")["NO2"].idxmax()].copy()

# Agregar el nombre del mes
peor_mes_anual["mes_nombre"] = peor_mes_anual["mes"].apply(lambda x: calendar.month_abbr[x])

# Gr√°fico
plt.figure(figsize=(14,6))
ax = sns.barplot(data=peor_mes_anual, x="a√±o", y="NO2", dodge=False, color="skyblue")

# A√±adir el nombre del mes encima de cada barra
for p, mes in zip(ax.patches, peor_mes_anual["mes_nombre"]):
    height = p.get_height()
    ax.text(
        p.get_x() + p.get_width()/2.,  # posici√≥n horizontal: centro de la barra
        height + 1,                    # posici√≥n vertical: un poco arriba de la barra
        mes,                           # texto a mostrar
        ha="center",                   # centrar el texto horizontalmente
        va="bottom",                   # alinear el texto al fondo
        fontsize=10,
        fontweight="bold"
    )

plt.title("Mes con peor calidad del aire (NO‚ÇÇ) por a√±o")
plt.xlabel("A√±o")
plt.ylabel("Concentraci√≥n media de NO‚ÇÇ (¬µg/m¬≥)")
plt.grid(axis="y", linestyle="--", alpha=0.6)
plt.tight_layout()
plt.show()

- Distribuci√≥n de O‚ÇÉ: ¬øCu√°l es el rango de concentraciones de O‚ÇÉ m√°s frecuente? (histograma global y por a√±o).
- Mejora: Analizar la variabilidad anual y estacional de O‚ÇÉ.

In [None]:
# Histograma global de O3
plt.figure(figsize=(10,5))
sns.histplot(df["O3"].dropna(), bins=50, color="skyblue")
plt.xlabel("Concentraci√≥n de O‚ÇÉ (¬µg/m¬≥)")
plt.ylabel("Frecuencia")
plt.title("Distribuci√≥n global de concentraciones de O‚ÇÉ (2001‚Äì2022)")
plt.grid(axis="y", linestyle="--", alpha=0.6)
plt.tight_layout()
plt.show()

# Histograma por a√±o
years = sorted(df["year"].unique())
n_years = len(years)

fig, axes = plt.subplots(n_years//4 + 1, 4, figsize=(18, 3*(n_years//4 + 1)), sharex=True, sharey=True)
axes = axes.flatten()

for i, y in enumerate(years):
    sns.histplot(df.loc[df["year"] == y, "O3"].dropna(), bins=40, color="orange", ax=axes[i])
    axes[i].set_title(f"A√±o {y}")
    axes[i].set_xlabel("O‚ÇÉ (¬µg/m¬≥)")
    axes[i].set_ylabel("Frecuencia")

# Eliminar subplots vac√≠os
for j in range(i+1, len(axes)):
    fig.delaxes(axes[j])

plt.suptitle("Distribuci√≥n anual de O‚ÇÉ por a√±o", fontsize=16, y=1.02)
plt.tight_layout()
plt.show()

# A partir de la media, obtenemos la evoluci√≥n anual de O3
o3_anual = df.groupby("year")["O3"].mean()

plt.figure(figsize=(10,5))
plt.plot(o3_anual.index, o3_anual.values, marker="o", color="green")
plt.xlabel("A√±o")
plt.ylabel("Concentraci√≥n media de O‚ÇÉ (¬µg/m¬≥)")
plt.title("Evoluci√≥n anual de O‚ÇÉ en Madrid (2001‚Äì2022)")
plt.grid(True, linestyle="--", alpha=0.6)
plt.tight_layout()
plt.show()

# Variabilidad estacional (promedio mensual de todos los a√±os)
o3_mensual = df.groupby("month")["O3"].mean()

plt.figure(figsize=(10,5))
plt.plot(o3_mensual.index, o3_mensual.values, marker="o", color="darkred")
plt.xticks(range(1,13), ["Ene","Feb","Mar","Abr","May","Jun","Jul","Ago","Sep","Oct","Nov","Dic"])
plt.xlabel("Mes")
plt.ylabel("Concentraci√≥n media de O‚ÇÉ (¬µg/m¬≥)")
plt.title("Variabilidad estacional de O‚ÇÉ en Madrid (promedio mensual 2001‚Äì2022)")
plt.grid(True, linestyle="--", alpha=0.6)
plt.tight_layout()
plt.show()


- Picos diarios: ¬øQu√© d√≠a present√≥ la concentraci√≥n m√°s alta de PM10 en cada a√±o?
- Mejora: Visualizar los d√≠as de picos extremos y analizar si hay patrones estacionales o de eventos puntuales.

In [None]:
# Primero calculamos la media diaria de PM10
pm10_diario = df.groupby(df["date"].dt.date)["PM10"].mean().reset_index()
pm10_diario["date"] = pd.to_datetime(pm10_diario["date"])
pm10_diario["year"] = pm10_diario["date"].dt.year
pm10_diario["month"] = pm10_diario["date"].dt.month

# Obtenemos el d√≠a con mayor PM10 en cada a√±o
pico_anual_pm10 = pm10_diario.loc[pm10_diario.groupby("year")["PM10"].idxmax()].copy()

# Mostramos una tabla de resultados
display(pico_anual_pm10[["year", "date", "PM10"]])

# Visualizaci√≥n de picos anuales
plt.figure(figsize=(12,6))
sns.barplot(data=pico_anual_pm10, x="year", y="PM10", color="coral")

# Anotar la fecha exacta sobre cada barra
for p, fecha in zip(plt.gca().patches, pico_anual_pm10["date"].dt.strftime("%d-%b")):
    height = p.get_height()
    plt.text(p.get_x() + p.get_width()/2., height + 1, fecha,
             ha="center", va="bottom", fontsize=9, rotation=90)

plt.title("D√≠a con mayor concentraci√≥n de PM10 por a√±o (2001‚Äì2022)")
plt.xlabel("A√±o")
plt.ylabel("Concentraci√≥n media diaria de PM10 (¬µg/m¬≥)")
plt.grid(axis="y", linestyle="--", alpha=0.6)
plt.tight_layout()
plt.show()

# ---------- DISTRIBUCI√ìN ESTACIONAL DE PICOS ----------

# Extraemos solo el mes de los picos
pico_anual_pm10["mes_nombre"] = pico_anual_pm10["month"].apply(lambda x: calendar.month_abbr[x])

plt.figure(figsize=(10,5))
sns.countplot(data=pico_anual_pm10, x="mes_nombre", order=["Jan","Feb","Mar","Apr","May","Jun","Jul","Aug","Sep","Oct","Nov","Dec"], color="steelblue")
plt.title("Distribuci√≥n estacional de los picos anuales de PM10")
plt.xlabel("Mes")
plt.ylabel("N√∫mero de picos")
plt.tight_layout()
plt.show()

# Creamos una l√≠nea temporal con todos los m√°ximos diarios
plt.figure(figsize=(14,6))
plt.plot(pm10_diario["date"], pm10_diario["PM10"], alpha=0.4, color="gray", label="PM10 diario")
plt.scatter(pico_anual_pm10["date"], pico_anual_pm10["PM10"], color="red", s=60, label="Picos anuales")
plt.title("Evoluci√≥n de PM10 diario con picos anuales destacados")
plt.xlabel("Fecha")
plt.ylabel("PM10 (¬µg/m¬≥)")
plt.legend()
plt.grid(True, linestyle="--", alpha=0.6)
plt.tight_layout()
plt.show()


## üåç David (comparaciones y correlaciones)

- Estacionalidad en un a√±o: ¬øQu√© contaminante presenta mayores diferencias entre invierno y verano?
- Mejora: Analizar la estacionalidad de todos los contaminantes y visualizar la diferencia entre estaciones.

- Correlaci√≥n: ¬øExiste correlaci√≥n entre los niveles diarios de NO‚ÇÇ y CO en el periodo analizado?
- Mejora: Analizar correlaciones entre m√°s contaminantes y visualizar la matriz de correlaci√≥n.

- Laborables vs fines de semana: ¬øHay diferencias en los niveles de NO‚ÇÇ promedio entre d√≠as laborables y fines de semana?
- Mejora: Analizar diferencias para m√°s contaminantes y visualizar la variaci√≥n semanal.

- Variaci√≥n horaria: ¬øA qu√© horas del d√≠a se concentran los picos de NO‚ÇÇ en promedio durante el a√±o? (curva horaria).
- Mejora: Analizar la variaci√≥n horaria de m√°s contaminantes y comparar entre a√±os.