# Esercizio: Sardi montani (CSV)

Requisiti: modulo built-in `csv`.

Un tuo cliente vuole fare un po' di analisi di mercato e ti chiede di aiutarlo a scrivere uno script in Python per leggere dei file CSV, JSON e XML, che provengono dai progetti di "Open Data" delle pubbliche amministrazioni. Avete selezionato come fonti i database regionali, in particolare delle tabelle che contengono dei dati sulla popolazione delle varie regioni italiane.

La Regione Sardenga ha pubblicato una tabella denominata ["Centri urbani per abitante e altitudine"](http://www.datiopen.it/it/opendata/Regione_Sardegna_Centri_Urbani_per_abitante_e_altititudine) e che contiene dei dati aggiornati al 13/01/2014. Come si intuisce dal nome, è un elenco di comuni con vari dati, tra cui il numero di abitanti e l'altezza del comune in metri sul livello del mare.

I dati sono contenuti in un file di tipo CSV: `Sardegna_centri_urbani_per_abitante_e_altitudine_2014-01-13.csv` contenuto nella cartella `/files_esercizi/` del nostro repository.

Apri il file in un editor di testo per visualizzare il suo contenuto "grezzo" e le <u>prime 10 righe, compresa compresa la prima riga di intestazione</u>, appaiono così:

<pre>
COMUNE;PROVINCIA;REGIONE;NOME LOCALITA';ABITANTI LOCALITA';QUOTA LOCALITA';ID FEATURE;CODICE LOCALITA'
ALGHERO;SASSARI;Sardegna;ALGHERO;33677;7;348;1001
ALGHERO;SASSARI;Sardegna;FERTILIA;1146;9;346;1002
ALGHERO;SASSARI;Sardegna;GUARDIA GRANDE;10;30;335;2001
ALGHERO;SASSARI;Sardegna;MARISTELLA PORTO CONTE;379;9;344;1003
ALGHERO;SASSARI;Sardegna;PISCHINA SALIDA;17;5;349;1004
ALGHERO;SASSARI;Sardegna;SANTA MARIA LA PALMA;112;34;330;1005
ALGHERO;SASSARI;Sardegna;SA SEGADA;15;20;339;2002
ALGHERO;SASSARI;Sardegna;TRAMARIGLIO;4;5;345;2003
ANELA;SASSARI;Sardegna;ANELA;924;446;375;1001
</pre>


Importando i dati in un foglio di calcolo, l'aspetto di queste prime 10 righe appare così:

| COMUNE    | PROVINCIA | REGIONE  | NOME LOCALITA'         | ABITANTI LOCALITA' | QUOTA LOCALITA' | ID FEATURE | CODICE LOCALITA' |
|-----------|-----------|----------|------------------------|--------------------|-----------------|------------|------------------|
| ALGHERO   | SASSARI   | Sardegna | ALGHERO                | 33677              | 7               | 348        | 1001             |
| ALGHERO   | SASSARI   | Sardegna | FERTILIA               | 1146               | 9               | 346        | 1002             |
| ALGHERO   | SASSARI   | Sardegna | GUARDIA GRANDE         | 10                 | 30              | 335        | 2001             |
| ALGHERO   | SASSARI   | Sardegna | MARISTELLA PORTO CONTE | 379                | 9               | 344        | 1003             |
| ALGHERO   | SASSARI   | Sardegna | PISCHINA SALIDA        | 17                 | 5               | 349        | 1004             |
| ALGHERO   | SASSARI   | Sardegna | SANTA MARIA LA PALMA   | 112                | 34              | 330        | 1005             |
| ALGHERO   | SASSARI   | Sardegna | SA SEGADA              | 15                 | 20              | 339        | 2002             |
| ALGHERO   | SASSARI   | Sardegna | TRAMARIGLIO            | 4                  | 5               | 345        | 2003             |
| ANELA     | SASSARI   | Sardegna | ANELA                  | 924                | 446             | 375        | 1001             |


I dati che ti interessano sono:

- numero di abitanti nel comune: campo `ABITANTI LOCALITA'`
- l'altezza del comune in metri: campo `QUOTA LOCALITA'`

Il vostro compito è creare un programma per leggere questo file CSV, quindi contare il numero di record, ovvero di comuni, che sono più in alto di 600 metri s.l.m. e il numero di abitanti totali residenti in questi comuni.

Output atteso:
<pre>
N. centri urbani sopra i 600 m s.l.m.: 55
N. abitanti sopra i 600 m s.l.m.: 75251
</pre>

AIUTO: Naturalmente, oltre a provare ad importare il file CSV in un foglio di calcolo per vedere come appare sotto forma di tabella, aprirai anche il file in un editor di testo per visualizzare il suo contenuto "grezzo", così comè!

In [8]:
import csv

tot_comuni = 0
tot_abitanti = 0

with open('../../files_esercizi/Sardegna_centri_urbani_per_abitante_e_altitudine_2014-01-13.csv', encoding='latin-1') as file_in:
    reader_obj = csv.DictReader(file_in, delimiter=';')
    next(reader_obj)     # salto la prima riga, dove c'è l'intestazione
    for linea in reader_obj:                        # per ciascuna 
        if int(linea["QUOTA LOCALITA'"]) > 600:
            tot_comuni += 1
            tot_abitanti += int(linea["ABITANTI LOCALITA'"])

print('N. centri urbani sopra i 600 m s.l.m..:', tot_comuni)
print('N. abitanti sopra i 600 mt.:', tot_abitanti)


N. centri urbani sopra i 600 m s.l.m..: 55
N. abitanti sopra i 600 mt.: 75251


# Variante: Sardi montani (JSON)

Requisiti: modulo built-in `json`.

La stessa base di dati dell'esercizio precedente è anche disponibile in formato JSON.

Il file è `Sardegna_centri_urbani_per_abitante_e_altitudine_2014-01-13.json`, anche esso contenuto nella cartella `files_esercizi/` del nostro repository.

L'esercizio è il medesimo del precedente, ma ora invece di leggere e manipolare dati CSV, devi usare il modulo `json` e i relativi metodi.

In [None]:
import json
# from pprint import pprint

tot_comuni = 0
tot_abitanti = 0

with open('../../files_esercizi/Sardegna_centri_urbani_per_abitante_e_altitudine_2014-01-13.json', encoding='latin-1') as file_in:
    json_list = json.load(file_in)
    # pprint(json_list)
    for comune in json_list:
        if comune["QUOTA LOCALITA'"] > 600:
            tot_comuni += 1
            tot_abitanti += comune["ABITANTI LOCALITA'"]
        
print('N. centri urbani sopra i 600 m:', tot_comuni)
print('N. abitanti sopra i 600 m:', tot_abitanti)

# Variante: script generico (CSV e JSON)

Ora prova a creare uno script che prende in ingresso (input):
- un file (CSV o JSON);
- l'altezza minima;
- l'altezza massima.

Il nostro codice deve rilevare direttamente il formato del file (dall'estensione) e effettuare i conteggi come per gli esercizi precedenti. L'unica differenza è che ora abbiamo un intervallo di altezza in cui cercare. Dobbiamo trovare tutti i record che sono a un'altezza compresa tra l'altezza minima e massima indicate dall'utente.

Output atteso:
<pre>
N. centri urbani compresi tra XXX e YYY mt.:
N. abitanti compresi tra XXX e YYY mt.:
</pre>

I valori di input (nome file, altezza min e max) li puoi scrivere direttamente "hard-coded" come costanti, puoi utilizzare la funzione `input()` o anche accettare argomenti `sys.argv`. Inizialmente, scrivere direttamente gli input come costanti ti faciliterà il lavoro. Una volta che l'algoritmo funziona, puoi sempre migliorare le modalità di inserimento degli input da parte dell'utente.

In [9]:
import csv
import json

tot_comuni = 0
tot_abitanti = 0
h_min = 600
h_max = 4000
path_in = '../../files_esercizi/Sardegna_centri_urbani_per_abitante_e_altitudine_2014-01-13.json'
path_out = '../../files_esercizi/Sardegna_centri_urbani_per_abitante_e_altitudine_2014-01-13.csv'
encod = 'latin-1'


with open(path_in, encoding=encod) as file_in:
    json_list = json.load(file_in)
    for comune in json_list:
        # if h_min < comune["QUOTA LOCALITA'"] and comune["QUOTA LOCALITA'"] < h_max:
        if h_min < comune["QUOTA LOCALITA'"] < h_max:
            tot_comuni += 1
            tot_abitanti += comune["ABITANTI LOCALITA'"]
        
print(tot_comuni, tot_abitanti)

55 75251


# Variante: estrazione dati

Se sei arrivato fino qua, perchè non esportare in un file anche tutti i record trovati?

Aggiungi dunque la funzionalità di esportazione dei dati trovati: CSV o JSON, è l'utente che deve poter decidere.

In questo modo avrai creato un convertitore di dati da CSV a JSON e viceversa con la possibilità di filtrare i dati prima dell'esportazione.

In [None]:
# scrivi qui