# Air Quality Monitor

# Introduzione

Air Quality Monitor nasce con lo scopo di monitorare la qualit√† dell'aria delle principali citt√† italiane al fine di poter applicare le migliori strategie per ridurre l'effetto inquinante e per migliorare la qualit√† della vita.

## Problema

Si vuole affrontare il problema **dell'inquinamento atmosferico** che √® una delle principali minacce alla salute pubblica a livello globale.

L'inquinamento dell'aria pu√≤ causare una serie di gravi **problemi di salute** e inoltre ha un impatto negativo sull'ambiente, contribuendo al cambiamento climatico e **danneggiando gli ecosistemi**.

![PM_visibility.png](attachment:54e8c9d9-f400-44a6-9757-31a36781fa0d.png)

## Cambiamento climatico

![surriscaldamento.png](attachment:08426893-1b1e-49e3-8730-7b4f45263cf7.png)

[üëâSource](https://www.my-personaltrainer.it/green/riscaldamento-globale-gli-ultimi-7-anni-i-piu-caldi-di-sempre.html)

## Soluzione

Necessit√† di Monitoraggio

Il monitoraggio della qualit√† dell'aria √® essenziale per poter intervenire e prendere dei provvedimenti.

Con dati accurati e in **tempo reale** sulla concentrazione di vari inquinanti, le persone possono prendere **decisioni** informate per evitare l'**esposizione ad aria inquinata**. 

Questo √® particolarmente importante per gruppi vulnerabili come bambini, anziani e persone con malattie respiratorie.

## Demo

Nella directory principale del progetto *air-quality-monitor*

`docker compose up`

Useful link [Kibana UI](http://34.155.118.97:5601)

### Principali inquinanti atmosferici 

L'inquinamento atmosferico dipende fortemente da molti inquinanti atmosferici.

![principali_inquinanti.png](attachment:f31e422d-6b68-4c10-88c9-9ca65b3dfa45.png)

### Significato degli indici

![indici.png](attachment:7f025ff5-89cf-4f55-b7fc-5df7f63142cc.png)

### Citt√† italiane scelte

![citta_selezionate](./media/citta.svg)

## Applicazioni future

Air Quality Monitor ha un potenziale significativo per essere ampliato e migliorato in diverse direzioni.

### 1. Estensione Geografica

- Il sistema pu√≤ essere esteso ad altre **citt√† europee e mondiali**. Questo permetter√† un **confronto globale** dei dati sulla qualit√† dell'aria.

### 2. Integrazione con Altri Servizi

- **Servizi Sanitari:** Collaborare con **enti sanitari** per fornire dati in tempo reale che possano aiutare a prevedere e gestire emergenze sanitarie legate all'inquinamento atmosferico.

- **Smart City:** Integrare il sistema di monitoraggio con le infrastrutture di smart city per **ottimizzare i trasporti pubblici**, la gestione del traffico e le politiche ambientali.

### 3. Applicazioni Commerciali

- **Soluzioni per le Aziende:** Offrire servizi di monitoraggio della qualit√† dell'aria alle aziende che desiderano monitorare e migliorare l'ambiente lavorativo per i loro dipendenti.

- **Settore Immobiliare:** Fornire dati sulla qualit√† dell'aria per il settore immobiliare, **permettendo agli acquirenti di case di fare scelte informate basate sull'ambiente.**

### 4. Collaborazioni e Partnership

- **Collaborazioni con Enti di Ricerca:** Lavorare con **universit√† e istituti di ricerca** per condurre **studi approfonditi** sull'inquinamento atmosferico e sviluppare **soluzioni innovative**.

# Un'occhiata pi√π da vicino..

![OpenWeather Logo](media/openweather-logo.svg)

Il progetto √® reso possibile grazie all‚Äôutilizzo di <u>API</u> di [OpenWeather](https://openweathermap.org/) che vengono fornite tramite registrazione gratuita al servizio, quindi con l‚Äôutilizzo di una chiave che viene fornita successivamente.

Fra le varie tecnologie utilizzate vi sono:

- **Google Cloud**

- **Docker**

- **Logstash**

- **Kafka**

- **Spark**

- **Elasticsearch**

- **Kibana**

## Pipeline

![pipeline](media/aqm_pipeline.svg)

## Google Cloud

[üëâLink](https://cloud.google.com/products/compute)

Google Cloud mette a disposizione delle **macchine virtuali** in varie parti del mondo che possono avere varie caratteristiche. Permette di creare ed eseguire facilmente VM online su un'infrastruttura **cloud affidabile** e ad **alte prestazioni**.

## Il servizio di OpenWeather

![OpenWeather Logo](media/openweather-logo.svg)

**OpenWeatherMap** √® un servizio online, di propriet√† di *OpenWeather Ltd*, che fornisce dati meteorologici globali tramite API, inclusi dati meteorologici attuali, previsioni, nowcast e dati meteorologici storici. L'azienda offre una previsione delle precipitazioni iperlocalizzata **minuto per minuto**. 

## Pollution API

Per l‚Äôutilizzo delle API si √® scelto di usare quelle relative agli indici di inquinamento dell'aria (*Air Quality Index - AQI*).

E' presente la documentazione online consultabile al seguente [üëâlink](https://openweathermap.org/api/air-pollution)

## Docker

![docker-logo](https://www.mercurio.it/sites/mercurio.it/files/field/image/homepage-docker-logo.png)

[Docker](https://www.docker.com/) ha concesso al progetto Air Quality Monitor numerosi vantaggi in termini di **prestazioni** ma, in particolar modo, ha permesso la **PORTABILIT√Å**.

![gh_codespaces.png](attachment:b563da7c-4cab-41c2-8d7f-3b50b91555ad.png)

![google_cloud.png](attachment:ea8e25ab-f551-48e1-8385-9ea802969d81.png)

### Docker Compose

Vantaggi:

- Semplicit√† nella configurazione

- Velocit√† di esecuzione dei container

- Gestione delle dipendenze

[üëâDocker Compose](https://docs.docker.com/compose/) 

## Ingestion Manager (python)

**Ingestion Manager** √® un componente di Air Quality Monitor che √® predisposto al prelievo dei dati in tempo reale e al loro invio.

Per quanto riguarda la connessione fra i dati ricevuti dalle chiamate API e Logstash si √® optato di utilizzare la libreria **[üëâpylogbeat](https://pypi.org/project/pylogbeat/)** in modo da semplificare la complessit√† del codice.

![image.png](attachment:90d9a996-c5a8-4834-8b32-172da4cbdf40.png)

### Aggiungere nuove citt√† da analizzare

`ingestion_manager/utils/setup.py`

## Logstash

La scelta di tale tecnologia √® basata sul fatto che il file di configurazione √® **molto semplice da scrivere**, in quanto si limita ad essere un file come quello sottostante:

```yml
input{}
filter{}
output{}
```

$Pro$: file di configurazione molto **intuitivi e brevi**.

$Contro$: crea degli **eventi molto pi√π complessi** con delle ridondanze.

La **documentazione ufficiale** di Logstash √® reperibile [üëâqui](https://www.elastic.co/guide/en/logstash/current/index.html) mentre la **documentazione per i plugin** √® disponibile ai seguenti link:

- [üëâINPUT](https://www.elastic.co/guide/en/logstash/current/input-plugins.html) plugins
- [üëâFILTER](https://www.elastic.co/guide/en/logstash/current/filter-plugins.html) plugins
- [üëâOUTPUT](https://www.elastic.co/guide/en/logstash/current/output-plugins.html) plugins

Nel nostro caso l‚Äôinput avverr√† tramite [üëâBeats](https://www.elastic.co/beats) che √® un plugin di Logstash che, rispetto a `TCP`:
- permette di **semplificare il processo di configurazione** che avviene manualmente con `TCP`;
- gestisce **automaticamente** questa struttura dati, **semplificando l'elaborazione e l'analisi dei dati.**

Inoltre, √® stata fatta questa scelta perch√© con `TCP` vi era un errore del tipo:

<code><font color="red">Caused by: org.logstash.beats.InvalidFrameProtocolException: Invalid version of beats protocol: 123</font></code>

## Apache Kafka

![kafka-logo](https://miro.medium.com/v2/resize:fit:325/0*kdp_y7VTwZ-499q6.png)

La versione utilizzata di [Apache Kafka](https://kafka.apache.org/) √® `2.13-3.7.0` e viene scaricata mediante: `wget https://downloads.apache.org/kafka/3.7.0/kafka_2.13-3.7.0.tgz`

[Apache Kafka Download](https://downloads.apache.org/kafka/3.7.0/)

## Apache Spark

![spark-logo](https://upload.wikimedia.org/wikipedia/commons/thumb/f/f3/Apache_Spark_logo.svg/400px-Apache_Spark_logo.svg.png)

Spark √® la tecnologia scelta che servir√† per **l'arricchimento dei dati**, ovvero quella tecnoogia che studia i dati e li trasforma. Per questo progetto si √® deciso di fare delle previsioni sulla qualit√† dell'aria, quindi sui successici $AQI$ **basandosi sui valori dei principali inquinanti**.

### Regressione lineare

L'algoritmo usato √® gi√† disponibile nelle librerie di `pyspark`. Ci√≤ √® stato usato per allenare il modello usando dati storici di **3 mesi fa ad oggi** prendendo come **riferimento la citt√† di Milano**.

# Conclusioni

Grazie dell'attenzione

Il progetto √® visualizzabile al seguente link di Github dove vi √® la guida per l‚Äôavvio e la configurazione nel file `README.md`

[üëâLink](https://github.com/Picred/air-quality-monitor)