# AIR QUALITY MONITOR

# Introduzione

Air Quality Monitor nasce con lo scopo di **monitorare** la qualità dell'aria delle principali città italiane al fine di poter applicare le migliori strategie per **ridurre l'effetto inquinante** e per migliorare la **qualità** della vita.

<img src="media/data_analysis.png" width=700/>

## Problema

Si vuole affrontare il problema **dell'inquinamento atmosferico** che è una delle principali minacce alla salute pubblica a livello globale.

L'inquinamento dell'aria può causare una serie di gravi **problemi di salute** e inoltre ha un impatto negativo sull'ambiente, contribuendo al cambiamento climatico e **danneggiando gli ecosistemi**.

![PM_visibility.png](attachment:54e8c9d9-f400-44a6-9757-31a36781fa0d.png)

## Cambiamento climatico

![surriscaldamento.png](attachment:08426893-1b1e-49e3-8730-7b4f45263cf7.png)

[👉Source](https://www.my-personaltrainer.it/green/riscaldamento-globale-gli-ultimi-7-anni-i-piu-caldi-di-sempre.html)

## Soluzione

Necessità di monitoraggio

Con dati accurati e in **tempo reale** sulla concentrazione di vari inquinanti, le persone possono prendere **decisioni** informate per evitare l'**esposizione ad aria inquinata**. 

Questo è particolarmente importante per gruppi vulnerabili come bambini, anziani e persone con malattie respiratorie.

## Demo

Nella directory principale del progetto *air-quality-monitor*

`docker compose up`

[👉Dashboard](http://34.155.118.97:5601)

![image.png](attachment:c671529e-0a22-4def-bd02-ca7be401d02d.png)

### Principali inquinanti atmosferici 

<img src="media/principali_inquinanti.png" width=700>

### Air Quality Index - `AQI`

![indici.png](attachment:7f025ff5-89cf-4f55-b7fc-5df7f63142cc.png)

### Città italiane scelte

![citta_selezionate](./media/citta.svg)

## Applicazioni future

Air Quality Monitor ha un potenziale significativo per essere ampliato e migliorato in diverse direzioni.

### 1. Estensione Geografica

- Il sistema può essere esteso ad altre **città europee e mondiali**. Questo permetterà un **confronto globale** dei dati sulla qualità dell'aria.

### 2. Integrazione con altri servizi

- **Servizi Sanitari:** Collaborare con **enti sanitari** per fornire dati in tempo reale che possano aiutare a prevedere e gestire emergenze sanitarie legate all'inquinamento atmosferico.

- **Smart City:** Integrare il sistema di monitoraggio con le infrastrutture di smart city per **ottimizzare i trasporti pubblici**, la gestione del traffico e le politiche ambientali.

### 3. Applicazioni Commerciali

- **Ambiente di lavoro aziendale**

- **Settore immobiliare** Permettere agli **acquirenti di immobili** di fare scelte informate basate sull'ambiente.

### 4. Collaborazioni e Partnership

- **Enti di Ricerca:** Lavorare con **università e istituti di ricerca** per condurre **studi approfonditi** sull'inquinamento atmosferico e sviluppare **soluzioni innovative**.

# Un'occhiata più da vicino..

## Tecnologie

- **Google Cloud**

- **Docker**

- **Logstash**

- **Kafka**

- **Spark**

- **Elasticsearch**

- **Kibana**

## Pipeline

![pipeline](media/aqm_pipeline.svg)

## Google Cloud

[👉Link](https://cloud.google.com/products/compute)

Google Cloud mette a disposizione delle **macchine virtuali** in varie parti del mondo che possono avere varie caratteristiche. Permette di creare ed eseguire facilmente VM online su un'infrastruttura **cloud affidabile** e ad **alte prestazioni**.

## Il servizio di OpenWeather

![OpenWeather Logo](media/openweather-logo.svg)

[👉OpenWeather](https://openweathermap.org/) è un servizio online, di proprietà di *OpenWeather Ltd*, che fornisce dati meteorologici globali tramite API, inclusi dati meteorologici attuali, previsioni, nowcast e dati meteorologici storici. L'azienda offre una previsione delle precipitazioni iperlocalizzata **minuto per minuto**. 

## Pollution API

Per l’utilizzo delle API si è scelto di usare quelle relative agli indici di inquinamento dell'aria (*Air Quality Index - AQI*).

E' presente la documentazione online consultabile al seguente [👉link](https://openweathermap.org/api/air-pollution)

## Docker

![docker-logo](https://www.mercurio.it/sites/mercurio.it/files/field/image/homepage-docker-logo.png)

[Docker](https://www.docker.com/) ha concesso al progetto Air Quality Monitor numerosi vantaggi in termini di **prestazioni** ma, in particolar modo, ha permesso la **PORTABILITÁ**.

![gh_codespaces.png](attachment:b563da7c-4cab-41c2-8d7f-3b50b91555ad.png)

![google_cloud.png](attachment:ea8e25ab-f551-48e1-8385-9ea802969d81.png)

### Docker Compose

Vantaggi:

- Semplicità nella configurazione

- Velocità di esecuzione dei container

- Gestione delle dipendenze

[👉Docker Compose](https://docs.docker.com/compose/) 

## Ingestion Manager (python)

**Ingestion Manager** è un componente di Air Quality Monitor che è predisposto al prelievo dei dati in tempo reale e al loro invio.

Per quanto riguarda la connessione fra i dati ricevuti dalle chiamate API e Logstash si è optato di utilizzare la libreria **[👉pylogbeat](https://pypi.org/project/pylogbeat/)** in modo da semplificare la complessità del codice.

![image.png](attachment:90d9a996-c5a8-4834-8b32-172da4cbdf40.png)

### Aggiungere nuove città da analizzare

`ingestion_manager/utils/setup.py`

## Logstash

La scelta di tale tecnologia è basata sul fatto che il file di configurazione è **molto semplice da scrivere**, in quanto si limita ad essere un file come quello sottostante:

```yml
input{}
filter{}
output{}
```

**PRO**: file di configurazione molto **intuitivi e brevi**.

**CONTRO**: crea degli **eventi molto più complessi** con delle ridondanze.

La **documentazione ufficiale** di Logstash è reperibile [👉qui](https://www.elastic.co/guide/en/logstash/current/index.html) mentre la **documentazione per i plugin** è disponibile ai seguenti link:

- [👉INPUT](https://www.elastic.co/guide/en/logstash/current/input-plugins.html) plugins
- [👉FILTER](https://www.elastic.co/guide/en/logstash/current/filter-plugins.html) plugins
- [👉OUTPUT](https://www.elastic.co/guide/en/logstash/current/output-plugins.html) plugins

Nel nostro caso l’input avverrà tramite [👉Beats](https://www.elastic.co/beats) che è un plugin di Logstash che, rispetto a `TCP`:
- permette di **semplificare il processo di configurazione** che avviene manualmente con `TCP`;
- gestisce **automaticamente** questa struttura dati, **semplificando l'elaborazione e l'analisi dei dati.**

<img src ="./media/tcp_beats_meme.jpg" width=900 alt="tcp beats meme"/>

## Apache Kafka

![kafka-logo](https://miro.medium.com/v2/resize:fit:325/0*kdp_y7VTwZ-499q6.png)

La versione utilizzata di [Apache Kafka](https://kafka.apache.org/) è `2.13-3.7.0` e viene scaricata mediante: `wget https://downloads.apache.org/kafka/3.7.0/kafka_2.13-3.7.0.tgz`

[👉Apache Kafka Download](https://downloads.apache.org/kafka/3.7.0/)

## Apache Spark

![spark-logo](https://upload.wikimedia.org/wikipedia/commons/thumb/f/f3/Apache_Spark_logo.svg/400px-Apache_Spark_logo.svg.png)

Spark è la tecnologia scelta che servirà per **l'arricchimento dei dati**, ovvero quella che studia i dati e li trasforma. Per questo progetto si è deciso di fare delle previsioni sulla qualità dell'aria, quindi sui successiVi $AQI$ **basandosi sui valori dei principali inquinanti**.

### Regressione lineare

L'algoritmo usato è già disponibile nelle librerie di `pyspark`. Ciò è stato usato per allenare il modello usando dati storici di **3 mesi fa ad oggi** prendendo come **riferimento la città di Milano**.

# Grazie dell'attenzione

<img src="media/final_meme.png" width=700/>

Il progetto è visualizzabile al seguente link di Github dove vi è la guida per l’avvio e la configurazione nel file `README.md` 
[👉Link](https://github.com/Picred/air-quality-monitor)

<div></div>