# Estrazione dati: esercizi


## Obbiettivi

0. Chiedersi se ne vale la pena
1. Analizzare l'html da una pagina del sito `visittrentino.info`, usando la libreria Python BeautifulSoup 4.
2. Per ogni evento, estrarre nome, data, luogo, tipo, descrizione e metterli un una lista di dizionari Python così:

```python
[{'data': '14/12/2017',
  'descrizione': 'Al Passo Costalunga sfida tra i migliori specialisti del mondo',
  'luogo': 'Passo Costalunga',
  'nome': 'Coppa del Mondo di Snowboard',
  'tipo': 'Sport, TOP EVENTI SPORT'},
 {'data': '18/12/2017',
  'descrizione': 'Lunedì 18 dicembre la Coppa Europa fa tappa in Val di Fassa',
  'luogo': 'Pozza di Fassa',
  'nome': 'Coppa Europa di sci alpino maschile - slalom speciale',
  'tipo': 'Sport, TOP EVENTI SPORT'},
  ....
]
```
3. Scrivere un file CSV `eventi.csv` usando la lista di dizionari generata al punto precedente.

## 0. Ne vale la pena ?

L'estrazione diretta dall'HTML (detta anche _scraping_) è sempre _l'ultima opzione_ possibile. E' dispendiosa in termini di tempo, e se il sito viene modificato anche solo graficamente (cosa sempre probabile) potreste non essere più in grado di estrarre di nuovo i dati. Quindi, prima di procedere, chiedersi sempre: 

- i dati desiderati sono magari sono già disponibili altrove in qualche formato che possiamo leggere in Python (CSV / JSON) ?
- se no, dal sito dove vorremmo estrarre, è disponibile una webapi per ottenere i dati desiderati in modo programmatico ? Di solito queste webapi si trovano nella sezione _developers_ dei siti. Se esiste
    - di quante / quali chiamate abbiamo bisogno? 
    - bisogna registrarsi una api key?
    - la api costa qualcosa?
    - Quante chiamate possiamo fare al giorno?
- la pagina è annotata semanticamente con tag jsonld / RDF ? 
- Se la risposta a tutte le domande precenti è negativa e ci vediamo costretti a leggere l'html:
    - quali sono i termini d'uso del sito in questione? 
    - i termini negano esplicitamente il cosiddetto _scraping_?

**DA FARE**: Cercare file di "eventi" su [dati.trentino.it](http://dati.trentino.it). 

**DA FARE**: cercare i termini d'uso di [visittrentino.info](https://www.visittrentino.info/en) 

**DOMANDA**: Nel nostro caso, varrebbe la pena / saremmo autorizzati a fare scraping HTML ?


## 1. Guardiamo l'html

Indipendentemente dalla domanda posta al punto precedente, per fini didattici proseguiremo con lo _scraping_ html.

All'interno dello zip degli esercizi, c'è un file chiamato `eventi.html` (questo esatto file è anche disponibile per il browsing online [qui](eventi.html)). Dopo aver scompattato lo zip, apri il file nel tuo browser. 

**1.1 DA FARE**: Dopo aver aperto il file nel browser, visualizza l'HTML all'interno (premendo per es `Ctrl+U` in Firefox/Chrome/Safari). Familiarizzati un po' con il file sorgente, cercando all'interno alcuni valori del primo evento , come per esempio il nome `Coppa del Mondo di Snowboard`, la data `14/12/2017`, il luogo `Passo Costalunga`, il tipo `Sport, TOP EVENTI SPORT`, e la descrizione `Al Passo Costalunga sfida tra i migliori specialisti del mondo`.

**NOTA 1**: Per questo esercizio, usa solo il file `eventi.html`indicato, NON usare l'html proveniente dalla [versione live](https://www.visittrentino.info/it/guida/eventi) di visittrentino, che può essere soggetta a cambiamenti !   

**NOTA 2**: Evita di usare il browser Internet Explorer, in alternativa cerca di usare uno tra i seguenti (in quest'ordine): Firefox, Chrome, Safari.  

Per maggiori informazioni sul formato XML, di cui l'HTML è una incarnazione, puoi consultare il libro Immersione in Python [al capitolo 12](http://gpiancastelli.altervista.org/dip3-it/xml.html), 

## 2. Estrazione con BeautifulSoup

Installiamo le librerie `beautifulsoup4` e il parser `lxml`:

- Anaconda: 
    * `conda install beautifulsoup4`
    * `conda install lxml`
- Linux/Mac (`--user` installa nella propria home): 
    * `python3 -m pip install --user beautifulsoup4`
    * `python3 -m pip install --user lxml`

### 2.1 Estraiamo i nomi

**DA FARE 2.1.1** Cerchiamo nell'HTML la stringa `Coppa del Mondo di Snowboard`, cercando di capire bene in quali blocchi appare. 

**SOLUZIONE 2.1.1**:

Compare in blocchi `h2` come `<h2 class="text-secondary">Coppa del Mondo di Snowboard</h2>` qua:

```html
<div class="col col-sm-9 arrange__item">
                    <a href="https://www.visittrentino.info/it/guida/eventi/coppa-del-mondo-di-snowboard_e_165375" class="text-primary list-teaser__link"><span class="icon icon-circle-arrow fz30"></span></a>
                    <div class="teaser__body">
                                                    <span class="text-secondary fz14 text-uppercase strong">Sport, TOP EVENTI SPORT</span>
                                                <h2 class="text-secondary">Coppa del Mondo di Snowboard</h2>
                        <ul class="list-unstyled list-inline list__teaser__list mb15 mt10">
                                                            <li>
                                    <a class="fz14 text-uppercase strong text-primary"><span class="icon icon-map-view mr10"></span>Passo Costalunga</a>
                                </li>
                                                        <li>
                                <a class="fz14 text-uppercase strong text-primary"><span class="icon icon-map-view mr10"></span>14/12/2017</a>
                            </li>
                        </ul>
                        <p>Al Passo Costalunga sfida tra i migliori specialisti del mondo</p>
                    </div>
                </div>
```

Compare in blocchi script come qua alla riga ` class=\"fz24 text-blue\">Coppa del Mondo di Snowboard<\/` : 

```html

<script>
    var mapData = [{"id":165375,"lat":46.4021014,"lng":11.6110718,"poiIcon":"\/static\/img\/content\/pois\/poi.png","poiIconActive":"\/static\/img\/content\/pois\/poi-active.png","infoBox":"<div class=\"row\"><div class=\"col-xs-5\"><img src=\"\/website\/var\/tmp\/image-thumbnails\/0\/9500\/thumb__moodboardmap\/snowparks-and-snowboard-brenta-dolomites_1.jpeg\"><\/div><div class=\"col-xs-7\"><h2 class=\"fz24 text-blue\">Coppa del Mondo di Snowboard<\/h2><p class=\"fz14\">14\/12 A Passo Costalunga sfida tra i migliori specialisti del mondo<\/p><a href=\"\/it\/guida\/eventi\/coppa-del-mondo-di-snowboard_e_165375\" class=\"btn btn-primary\">Maggiori info<\/a><\/div><\/div>"},{"id":309611,"lat":46.403707118232,"lng":11.60915851593,"poiIcon":"\/static\/img\/content\/pois\/poi.png","poiIconActive":"\/static\/img\/content\/pois\/poi-active.png","infoBox":"<div class=\"row\"><div class=\"col-xs-5\"><img src=\"\/website\/var\/tmp\/image-thumbnails\/110000\/119958\/thumb__moodboardmap\/foto-3_2.jpeg\"><\/div><div class=\"col-xs-7\"><h2 class=\"fz24 text-blue\">Coppa Europa di sci alpino maschile - slalom speciale<\/h2><p class=\"fz14\">18 dicembre in Val di Fassa<\/p><a href=\"\/it\/guida\/eventi\/coppa-europa-di-sci-alpino-maschile-slalom-speciale_e_309611\" class=\"btn btn-primary\">Maggiori info<\/a><\/div><\/div>"},

....
....
</script>
```

Compare in altri blocchi script jsonld nella parte  `"name":"Coppa del Mondo di Snowboard"` come qua: 

```
 <script type="application/ld+json">
{"@context":"http://schema.org","@type":"Event","name":"Coppa del Mondo di Snowboard","description":"Al Passo Costalunga sfida tra i migliori specialisti del mondo","startDate":"2017-12-14T00:00:00+01:00","endDate":"2017-12-14T00:00:00+01:00","location":{"@type":"Place","name":"Passo Costalunga","address":{"@type":"PostalAddress","addressCountry":"Italy","postalCode":"39056","streetAddress":""}},"image":{"@type":"ImageObject","url":"https://www.visittrentino.info/website/var/tmp/image-thumbnails/0/9500/thumb__contentgallery/snowparks-and-snowboard-brenta-dolomites_1.jpeg","height":396,"width":791},"performer":"Trentino Marketing S.r.l.","url":"https://www.visittrentino.info/it/guida/eventi/coppa-del-mondo-di-snowboard_e_165375","offers":{"@type":"AggregateOffer","lowPrice":"\u20ac0","offerCount":"000","url":"https://www.visittrentino.info/it/guida/eventi/coppa-del-mondo-di-snowboard_e_165375"}}
</script>
```

Compare in blocchi `h4` come qua: ` <h4 class="moodboard__item-headline">Coppa del Mondo di Snowboard</h4>`:

```html
<div class="moodboard__item-text text-white">
    <div>
        <h4 class="moodboard__item-headline">Coppa del Mondo di Snowboard</h4>
                    <span class="moodboard__item-subline strong fz14 text-uppercase d-b">14/12/2017</span>
                            <span class="moodboard__item-subline strong fz14 d-b"><span class="icon icon-map-view fz20"></span> Passo Costalunga</span>
            </div>
    <div class="moodboard__item-text__link text-right">
        <a href="https://www.visittrentino.info/it/guida/eventi/coppa-del-mondo-di-snowboard_e_165375" role="link"><span class="icon icon-circle-arrow fz30"></span></a>
    </div>
</div>

```

Per questo esercizio, considereremo quest'ultimo blocco. In particolare vediamo la riga: 

```html
<h4 class="moodboard__item-headline">Coppa del Mondo di Snowboard</h4>
```

Notiamo che: 

* inizia con il tag `<h4>`
* finisce simmetricamente con il tag di chiusura `</h4>`
* il tag di apertura ha un parametro `class="moodboard__item-headline"`, ma al momento non ci interessa
* Il testo che cerchiamo `Coppa del Mondo di Snowboard` è incluso tra i due tag

Per estrarre solo i nomi degli eventi dal documento, possiamo quindi cercare i tag `h4`. Eseguiamo la nostra prima estrazione

In [1]:
from bs4 import BeautifulSoup

with open("eventi.html") as f:  # apriamo il file degli eventi, e lo chiamiamo con 'f', un nome che scegliamo noi  
    soup = BeautifulSoup(f, "lxml")    # creaiamo un oggetto che chiamiamo 'soup', usando il parser lxml
    
# soup ci permette di chiamare il metodo select, per selezionare per esempio solo tag 'h4':
# il metodo ritorna una lista di tag trovate nel documento. Per ogni tag ritornata, la stampiamo:
for tag in soup.select("h4"):  
    print(tag)

<h4 class="moodboard__item-headline">Coppa del Mondo di Snowboard</h4>
<h4 class="moodboard__item-headline">Coppa Europa di sci alpino maschile - slalom speciale</h4>
<h4 class="moodboard__item-headline">3Tre - AUDI FIS Ski World Cup</h4>
<h4 class="moodboard__item-headline">La Marcialonga di Fiemme e Fassa </h4>
<h4 class="moodboard__item-headline">TrentinoSkiSunrise: sulle piste alla luce dell’alba</h4>
<h4 class="moodboard__item-headline">Tour de Ski</h4>
<h4 class="moodboard__item-headline">La mia nuvola</h4>
<h4 class="moodboard__item-headline">Dormire sotto un cielo di stelle</h4>
<h4 class="moodboard__item-headline">Mercatini di Natale di Canale di Tenno e Rango </h4>
<h4 class="moodboard__item-headline">La Ciaspolada</h4>
<h4 class="moodboard__item-headline">Mercatini di Natale a Trento</h4>
<h4 class="moodboard__item-headline">Mercatini di Natale di Rovereto</h4>
<h4 class="moodboard__item-headline">Mercatino di Natale asburgico di Levico Terme</h4>
<h4 class="moodboard__item-

Benissimo, abbiamo filtrato le tag coi nomi degli eventi. Ma noi vogliamo solo i nomi. Tipicamente dalle nostre tag ci interessa estrarre solo il testo. A tal fine. possiamo usare l'attributo `text` delle tag:

In [2]:
for tag in soup.select("h4"):
    print(tag.text)

Coppa del Mondo di Snowboard
Coppa Europa di sci alpino maschile - slalom speciale
3Tre - AUDI FIS Ski World Cup
La Marcialonga di Fiemme e Fassa 
TrentinoSkiSunrise: sulle piste alla luce dell’alba
Tour de Ski
La mia nuvola
Dormire sotto un cielo di stelle
Mercatini di Natale di Canale di Tenno e Rango 
La Ciaspolada
Mercatini di Natale a Trento
Mercatini di Natale di Rovereto
Mercatino di Natale asburgico di Levico Terme
Magnifico Mercatino di Cavalese
Mercatino di Natale ad Arco
El paès dei presepi


Casomai volessimo, si può anche estrarre un attributo, per esempio la `class`

In [3]:
for tag in soup.select('h4'):    
    print(tag['class'])

['moodboard__item-headline']
['moodboard__item-headline']
['moodboard__item-headline']
['moodboard__item-headline']
['moodboard__item-headline']
['moodboard__item-headline']
['moodboard__item-headline']
['moodboard__item-headline']
['moodboard__item-headline']
['moodboard__item-headline']
['moodboard__item-headline']
['moodboard__item-headline']
['moodboard__item-headline']
['moodboard__item-headline']
['moodboard__item-headline']
['moodboard__item-headline']


Intanto, cerchiamo di mettere tutti i nomi in una lista che chiameremo `nomi`:

In [4]:
nomi = []
for tag in soup.select("h4"):
    nomi.append(tag.text)

In [5]:
nomi

['Coppa del Mondo di Snowboard',
 'Coppa Europa di sci alpino maschile - slalom speciale',
 '3Tre - AUDI FIS Ski World Cup',
 'La Marcialonga di Fiemme e Fassa ',
 'TrentinoSkiSunrise: sulle piste alla luce dell’alba',
 'Tour de Ski',
 'La mia nuvola',
 'Dormire sotto un cielo di stelle',
 'Mercatini di Natale di Canale di Tenno e Rango ',
 'La Ciaspolada',
 'Mercatini di Natale a Trento',
 'Mercatini di Natale di Rovereto',
 'Mercatino di Natale asburgico di Levico Terme',
 'Magnifico Mercatino di Cavalese',
 'Mercatino di Natale ad Arco',
 'El paès dei presepi']

Cominciamo a costruirci la struttura dati che modellerà il CSV che vogliamo creare. Un CSV può essere visto come una lista di dizionari. Ogni dizionario rappresenterà un evento. Passo passo, vorremmo arrivare ad avere una forma simile:

```python
[{'data': '14/12/2017',
  'descrizione': 'Al Passo Costalunga sfida tra i migliori specialisti del mondo',
  'luogo': 'Passo Costalunga',
  'nome': 'Coppa del Mondo di Snowboard',
  'tipo': 'Sport, TOP EVENTI SPORT'},
 {'data': '18/12/2017',
  'descrizione': 'Lunedì 18 dicembre la Coppa Europa fa tappa in Val di Fassa',
  'luogo': 'Pozza di Fassa',
  'nome': 'Coppa Europa di sci alpino maschile - slalom speciale',
  'tipo': 'Sport, TOP EVENTI SPORT'},
  ....
]
```


Inizializziamo la lista delle righe:

In [6]:
righe = []

In [7]:
righe

[]

Dobbiamo aggiungere dei dizionari vuoti, ma quanti ce ne servono ? Vediamo quanti titoli abbiamo trovato con la funzione `len`:

In [8]:
len(nomi)

16

In [9]:
for i in range(16):
    righe.append({})

In [10]:
righe

[{}, {}, {}, {}, {}, {}, {}, {}, {}, {}, {}, {}, {}, {}, {}, {}]

Adesso, in ogni dizionario, mettiamo un campo 'nome' usando il valore corrispendente trovato nella lista `nomi`: 

In [11]:
i = 0
for stringa in nomi:
    righe[i]['nome'] = stringa  # metti stringa nella riga i-esima, al campo 'nome'  del dizionario
    i += 1

Dovremmo cominciare a vedere i dizionari in `righe` popolati con i nomi. Verifichiamo: 

In [12]:
righe

[{'nome': 'Coppa del Mondo di Snowboard'},
 {'nome': 'Coppa Europa di sci alpino maschile - slalom speciale'},
 {'nome': '3Tre - AUDI FIS Ski World Cup'},
 {'nome': 'La Marcialonga di Fiemme e Fassa '},
 {'nome': 'TrentinoSkiSunrise: sulle piste alla luce dell’alba'},
 {'nome': 'Tour de Ski'},
 {'nome': 'La mia nuvola'},
 {'nome': 'Dormire sotto un cielo di stelle'},
 {'nome': 'Mercatini di Natale di Canale di Tenno e Rango '},
 {'nome': 'La Ciaspolada'},
 {'nome': 'Mercatini di Natale a Trento'},
 {'nome': 'Mercatini di Natale di Rovereto'},
 {'nome': 'Mercatino di Natale asburgico di Levico Terme'},
 {'nome': 'Magnifico Mercatino di Cavalese'},
 {'nome': 'Mercatino di Natale ad Arco'},
 {'nome': 'El paès dei presepi'}]

Visto che i campi da aggiungere saranno diversi, definiamoci una funzione per aggiugere comodamente i campi alla variabile `righe`:

In [13]:
# 'attributo' potrebbe essere la stringa 'nome'
# 'lista' potrebbe essere la lista dei nomi degli eventi ['Coppa del Mondo di Snowboard', 'Coppa Europa', ...] 
def aggiungi_campo(attributo, lista):
    i = 0
    for stringa in lista:
        righe[i][attributo] = stringa
        i += 1                  
    return righe   # ritorniamo righe per stampare immediatamente il risultato in Jupyter   

Chiamando `aggiungi_campo` con i nomi, non dovrebbe cambiare nulla perchè andremo semplicemente a riscrivere i campi `nome` dentro i dizionari della lista `righe` :

In [14]:
aggiungi_campo('nome', nomi)

[{'nome': 'Coppa del Mondo di Snowboard'},
 {'nome': 'Coppa Europa di sci alpino maschile - slalom speciale'},
 {'nome': '3Tre - AUDI FIS Ski World Cup'},
 {'nome': 'La Marcialonga di Fiemme e Fassa '},
 {'nome': 'TrentinoSkiSunrise: sulle piste alla luce dell’alba'},
 {'nome': 'Tour de Ski'},
 {'nome': 'La mia nuvola'},
 {'nome': 'Dormire sotto un cielo di stelle'},
 {'nome': 'Mercatini di Natale di Canale di Tenno e Rango '},
 {'nome': 'La Ciaspolada'},
 {'nome': 'Mercatini di Natale a Trento'},
 {'nome': 'Mercatini di Natale di Rovereto'},
 {'nome': 'Mercatino di Natale asburgico di Levico Terme'},
 {'nome': 'Magnifico Mercatino di Cavalese'},
 {'nome': 'Mercatino di Natale ad Arco'},
 {'nome': 'El paès dei presepi'}]

### 2.2 Estraiamo le date

Bene, è tempo di aggiungere un altro campo, per esempio per la data. Dove trovarlo?

**DA FARE 2.2.1**: Cerca dentro l'HTML il valore della data della Coppa del Mondo di Snowboard `14/12/2017`. Quanti valori trovi? Intorno alle date, trovi del testo che potrebbero permetterci di filtrare tutte e sole le date ? 


**SOLUZIONE 2.2.1**: Guardiamo l'HTML intorno alle posizioni `h4`:



```html
<div class="moodboard__item-text text-white">
    <div>
        <h4 class="moodboard__item-headline">Coppa del Mondo di Snowboard</h4>
                    <span class="moodboard__item-subline strong fz14 text-uppercase d-b">14/12/2017</span>
                            <span class="moodboard__item-subline strong fz14 d-b"><span class="icon icon-map-view fz20"></span> Passo Costalunga</span>
            </div>
    <div class="moodboard__item-text__link text-right">
        <a href="https://www.visittrentino.info/it/guida/eventi/coppa-del-mondo-di-snowboard_e_165375" role="link"><span class="icon icon-circle-arrow fz30"></span></a>
    </div>
</div>

```


Vediamo che le date sono dentro attributi `span`: di span ce ne sono tanti, ma pochi hanno l'attributo `class="moodboard__item-subline strong fz14 text-uppercase d-b"`. 


**DA FARE 2.2.2**: Come possiamo filtrare in Python solo le tag `span` che contengono l'attributo `class="moodboard__item-subline strong fz14 text-uppercase d-b"` ? 

**SUGGERIMENTO**:  Usa come prima le date nei blocchi intorno agli `h4`

In [15]:
# scrivi qua il codice








**SOLUZIONE 2.2.2**: Di nuovo, usiamo la `select`:

In [16]:
for tag in soup.select('span[class="moodboard__item-subline strong fz14 text-uppercase d-b"]'):
    print(tag.text)

14/12/2017
18/12/2017
22/12/2017
28/01/2018
06/01/2018 - 07/04/2018
06/01/2018 - 07/01/2018
01/10/2017 - 30/11/2017
31/10/2017 - 20/12/2017
19/11/2017 - 30/12/2017
06/01/2018
18/11/2017 - 06/01/2018
25/11/2017 - 06/01/2018
25/11/2017 - 06/01/2018
01/12/2017 - 06/01/2018
17/11/2017 - 07/01/2018
08/12/2017 - 07/01/2018


Ecco le nostre date! In questo caso particolare, il `"moodboard__item-subline strong fz14 text-uppercase d-b"` è così identificativo che non serve nemmeno specificare `span`:

In [17]:
            # nota che 'span' è rimosso: 
for tag in soup.select('[class="moodboard__item-subline strong fz14 text-uppercase d-b"]'):
    print(tag.text)

14/12/2017
18/12/2017
22/12/2017
28/01/2018
06/01/2018 - 07/04/2018
06/01/2018 - 07/01/2018
01/10/2017 - 30/11/2017
31/10/2017 - 20/12/2017
19/11/2017 - 30/12/2017
06/01/2018
18/11/2017 - 06/01/2018
25/11/2017 - 06/01/2018
25/11/2017 - 06/01/2018
01/12/2017 - 06/01/2018
17/11/2017 - 07/01/2018
08/12/2017 - 07/01/2018


Come fatto prima, possiamo crearci una colonna per le date:

In [18]:
date_eventi = []
for tag in soup.select('[class="moodboard__item-subline strong fz14 text-uppercase d-b"]'):
    date_eventi.append(tag.text)

In [19]:
date_eventi

['14/12/2017',
 '18/12/2017',
 '22/12/2017',
 '28/01/2018',
 '06/01/2018 - 07/04/2018',
 '06/01/2018 - 07/01/2018',
 '01/10/2017 - 30/11/2017',
 '31/10/2017 - 20/12/2017',
 '19/11/2017 - 30/12/2017',
 '06/01/2018',
 '18/11/2017 - 06/01/2018',
 '25/11/2017 - 06/01/2018',
 '25/11/2017 - 06/01/2018',
 '01/12/2017 - 06/01/2018',
 '17/11/2017 - 07/01/2018',
 '08/12/2017 - 07/01/2018']

Per sincerarci di aver rastrellato tutte le date necessarie, possiamo controllare quante sono:

In [20]:
len(date_eventi)

16

Adesso possiamo sfruttare la funzione di prima `aggiungi_campo` per aggiornare `righe`:

In [21]:
aggiungi_campo('data', date_eventi)

[{'data': '14/12/2017', 'nome': 'Coppa del Mondo di Snowboard'},
 {'data': '18/12/2017',
  'nome': 'Coppa Europa di sci alpino maschile - slalom speciale'},
 {'data': '22/12/2017', 'nome': '3Tre - AUDI FIS Ski World Cup'},
 {'data': '28/01/2018', 'nome': 'La Marcialonga di Fiemme e Fassa '},
 {'data': '06/01/2018 - 07/04/2018',
  'nome': 'TrentinoSkiSunrise: sulle piste alla luce dell’alba'},
 {'data': '06/01/2018 - 07/01/2018', 'nome': 'Tour de Ski'},
 {'data': '01/10/2017 - 30/11/2017', 'nome': 'La mia nuvola'},
 {'data': '31/10/2017 - 20/12/2017',
  'nome': 'Dormire sotto un cielo di stelle'},
 {'data': '19/11/2017 - 30/12/2017',
  'nome': 'Mercatini di Natale di Canale di Tenno e Rango '},
 {'data': '06/01/2018', 'nome': 'La Ciaspolada'},
 {'data': '18/11/2017 - 06/01/2018', 'nome': 'Mercatini di Natale a Trento'},
 {'data': '25/11/2017 - 06/01/2018',
  'nome': 'Mercatini di Natale di Rovereto'},
 {'data': '25/11/2017 - 06/01/2018',
  'nome': 'Mercatino di Natale asburgico di Levic

### 2.3 Estraiamo i luoghi

E' tempo di aggiungere il luogo. 

**DA FARE 2.3.1**: Cerca nell'HTML il luogo `Passo Costalunga` dell'evento Coppa di Snowboard. Con quale criterio possiamo filtrare i luoghi ?   

**SOLUZIONE 2.3.1**: 

Possiamo usare la classe `class="moodboard__item-subline strong fz14 d-b"` nelle righe: 

```html
<div class="moodboard__item-text text-white">
    <div>
        <h4 class="moodboard__item-headline">Coppa del Mondo di Snowboard</h4>
                    <span class="moodboard__item-subline strong fz14 text-uppercase d-b">14/12/2017</span>
                            <span class="moodboard__item-subline strong fz14 d-b"><span class="icon icon-map-view fz20"></span> Passo Costalunga</span>
            </div>
    <div class="moodboard__item-text__link text-right">
        <a href="https://www.visittrentino.info/it/guida/eventi/coppa-del-mondo-di-snowboard_e_165375" role="link"><span class="icon icon-circle-arrow fz30"></span></a>
    </div>
</div>
```

**DA FARE 2.3.2**: Scrivi il codice Python per estrarre i luoghi e metterlo nella lista `luoghi` (usa sempre l'html intorno ai blochhi `h4`)   

**SUGGERIMENTO**: Non importa se il testo che cerchi è contenuto in uno span all'interno di un'altro span identificabile 

In [22]:
# scrivi qui

**SOLUZIONE 2.3.2**:

In [23]:
for tag in soup.select('[class="moodboard__item-subline strong fz14 d-b"]'):
    print(tag.text)

 Passo Costalunga
 Pozza di Fassa
 Madonna di Campiglio
 Val di Fassa 
 Tesero
 Pozza di Fassa
 Pozza di Fassa
 Tenno
 Fondo
 Trento
 Rovereto
 Levico Terme
 Cavalese
 Arco
 Baselga di Piné


In [24]:
luoghi = []
for tag in soup.select('[class="moodboard__item-subline strong fz14 d-b"]'):
    luoghi.append(tag.text)

In [25]:
luoghi

[' Passo Costalunga',
 ' Pozza di Fassa',
 ' Madonna di Campiglio',
 ' Val di Fassa ',
 ' Tesero',
 ' Pozza di Fassa',
 ' Pozza di Fassa',
 ' Tenno',
 ' Fondo',
 ' Trento',
 ' Rovereto',
 ' Levico Terme',
 ' Cavalese',
 ' Arco',
 ' Baselga di Piné']

### 2.3 Sistemiamo i luoghi

Quanti luoghi abbiamo trovato ?

In [26]:
len(luoghi)

15

Ops, ci aspettavamo 16 e abbiamo scoperto solo 15 luoghi. A quanto pare manca un dato!

**DA FARE 2.3.3**: Che dato è? Guarda la pagina e cerca se qualche evento non ha un luogo. In che posizione è nella lista ? 

**SOLUZIONE 2.3.3**: L'evento incriminato è `TrentinoSkiSunrise: sulle piste alla luce dell’alba`, guardando dentro l'html vediamo che manca proprio lo `span` con la classe:

```html
<div class="moodboard__item-text text-white">
    <div>
        <h4 class="moodboard__item-headline">TrentinoSkiSunrise: sulle piste alla luce dell’alba</h4>
                    <span class="moodboard__item-subline strong fz14 text-uppercase d-b">06/01/2018 - 07/04/2018</span>
                    </div>
    <div class="moodboard__item-text__link text-right">
        <a href="https://www.visittrentino.info/it/guida/eventi/trentinoskisunrise-sulle-piste-alla-luce-dell-alba_e_318133" role="link"><span class="icon icon-circle-arrow fz30"></span></a>
    </div>
</div>
``` 

**DA FARE 2.3.4**: Come rimediare al problema? Ci sono metodo più furbi, ma per stavolta semplicemente possiamo inserire una stringa vuota alla posizione della lista `luoghi` in cui ci dovrebbe essere il campo mancante - e cioè dopo `Val di Fassa`. Per farlo, puoi usare il metodo `insert`. Qua puoi vedere qualche esempio di utilizzo.

**NOTA**: Ricordati che gli indici iniziano da 0 !

In [27]:
prova = ['a','b','c','d']
prova.insert(0, 'x') # inserisce 'x' all'inizio in posizione 0
prova

['x', 'a', 'b', 'c', 'd']

In [28]:
prova = ['a','b','c','d']
prova.insert(2, 'x') # inserisce 'x' a metà
prova

['a', 'b', 'x', 'c', 'd']

In [29]:
# scrivi qua la soluzione

**SOLUZIONE 2.3.4**: 

```












```

In [30]:
luoghi.insert(4, '')

In [31]:
luoghi

[' Passo Costalunga',
 ' Pozza di Fassa',
 ' Madonna di Campiglio',
 ' Val di Fassa ',
 '',
 ' Tesero',
 ' Pozza di Fassa',
 ' Pozza di Fassa',
 ' Tenno',
 ' Fondo',
 ' Trento',
 ' Rovereto',
 ' Levico Terme',
 ' Cavalese',
 ' Arco',
 ' Baselga di Piné']

In [32]:
len(luoghi)

16


Prima di procedere, verifica che la lunghezza della lista `len(luoghi)` sia corretta (= 16). Adesso, osserva attentamente le stringhe dei luoghi. Noterai che iniziano tutte con uno spazio inutile:

In [33]:
luoghi

[' Passo Costalunga',
 ' Pozza di Fassa',
 ' Madonna di Campiglio',
 ' Val di Fassa ',
 '',
 ' Tesero',
 ' Pozza di Fassa',
 ' Pozza di Fassa',
 ' Tenno',
 ' Fondo',
 ' Trento',
 ' Rovereto',
 ' Levico Terme',
 ' Cavalese',
 ' Arco',
 ' Baselga di Piné']

La funzione `strip()` ci può aiutare a togliere gli spazi inutili:

In [34]:
'   fdf '.strip() 

'fdf'

Ma come possiamo applicarla a tutti gli elementi della lista ? Un modo può essere usare le cosiddette "list comprehnsion" ([Capitolo 19.2 Pensare in Python](https://davidleoni.github.io/ThinkPythonItalian/html/thinkpython2020.html#sec227)), che servono per generare nuove liste eseguendo la stessa operazione su tutti gli elementi di una lista esistente di partenza. Nel nostro caso, possiamo generare una nuova lista in cui per ogni elemento `luogo` (quindi ogni stringa) della lista `luoghi` eseguiamo la funzione `strip()`:

In [35]:
[luogo.strip() for luogo in luoghi]

['Passo Costalunga',
 'Pozza di Fassa',
 'Madonna di Campiglio',
 'Val di Fassa',
 '',
 'Tesero',
 'Pozza di Fassa',
 'Pozza di Fassa',
 'Tenno',
 'Fondo',
 'Trento',
 'Rovereto',
 'Levico Terme',
 'Cavalese',
 'Arco',
 'Baselga di Piné']

Questa manipolazione certamente ci ha dato il risultato aspettato, ma ci ha modificato la lista `luoghi` originale? Verifichiamolo:

In [36]:
luoghi

[' Passo Costalunga',
 ' Pozza di Fassa',
 ' Madonna di Campiglio',
 ' Val di Fassa ',
 '',
 ' Tesero',
 ' Pozza di Fassa',
 ' Pozza di Fassa',
 ' Tenno',
 ' Fondo',
 ' Trento',
 ' Rovereto',
 ' Levico Terme',
 ' Cavalese',
 ' Arco',
 ' Baselga di Piné']

Pare di no. Affinchè il tutto funzioni, bisogna riassegnare `luoghi` al risultato della list comprehension:

In [37]:
luoghi = [luogo.strip() for luogo in luoghi]

In [38]:
luoghi

['Passo Costalunga',
 'Pozza di Fassa',
 'Madonna di Campiglio',
 'Val di Fassa',
 '',
 'Tesero',
 'Pozza di Fassa',
 'Pozza di Fassa',
 'Tenno',
 'Fondo',
 'Trento',
 'Rovereto',
 'Levico Terme',
 'Cavalese',
 'Arco',
 'Baselga di Piné']

Finalmente luoghi è come la volevamo noi.

**DA FARE 2.3.5**: Prova a riscrivere qua sotto manualmente la solq list comprehension (senza riassegnarla a `luoghi`). Prova anche ad usare funzioni diverse da `strip`, come:
    * `upper()`
    * `rstrip()`
    * `lstrip()`

In [39]:
# riscrivi qua la comprehension

Finalmente abbiamo sistemato i luoghi, aggiungiamoli alla nostra lista di righe:

In [40]:
aggiungi_campo('luogo', luoghi)

[{'data': '14/12/2017',
  'luogo': 'Passo Costalunga',
  'nome': 'Coppa del Mondo di Snowboard'},
 {'data': '18/12/2017',
  'luogo': 'Pozza di Fassa',
  'nome': 'Coppa Europa di sci alpino maschile - slalom speciale'},
 {'data': '22/12/2017',
  'luogo': 'Madonna di Campiglio',
  'nome': '3Tre - AUDI FIS Ski World Cup'},
 {'data': '28/01/2018',
  'luogo': 'Val di Fassa',
  'nome': 'La Marcialonga di Fiemme e Fassa '},
 {'data': '06/01/2018 - 07/04/2018',
  'luogo': '',
  'nome': 'TrentinoSkiSunrise: sulle piste alla luce dell’alba'},
 {'data': '06/01/2018 - 07/01/2018', 'luogo': 'Tesero', 'nome': 'Tour de Ski'},
 {'data': '01/10/2017 - 30/11/2017',
  'luogo': 'Pozza di Fassa',
  'nome': 'La mia nuvola'},
 {'data': '31/10/2017 - 20/12/2017',
  'luogo': 'Pozza di Fassa',
  'nome': 'Dormire sotto un cielo di stelle'},
 {'data': '19/11/2017 - 30/12/2017',
  'luogo': 'Tenno',
  'nome': 'Mercatini di Natale di Canale di Tenno e Rango '},
 {'data': '06/01/2018', 'luogo': 'Fondo', 'nome': 'La C

### 2.4 tipo dell'evento

Proseguiamo con il tipo dell'evento. Per esempio, per la Coppa del Mondo di Snowboard, la tipologia dell'evento sarebbe `Sport, TOP EVENTI SPORT`

**DA FARE 2.4.1**: Cerca la stringa `Sport, TOP EVENTI SPORT` nell'HTML. Quante occorrenze ci sono ? E' possibile filtrare il tipo eventi in modo univoco ?  

**SOLUZIONE 2.4.1**: Questa volta il tipo eventi appare solo nei blocchi intorno agli `h2`, in particolare notiamo la riga 

`<span class="text-secondary fz14 text-uppercase strong">Sport, TOP EVENTI SPORT</span>` :

```html
<div class="col col-sm-9 arrange__item">
                    <a href="https://www.visittrentino.info/it/guida/eventi/coppa-del-mondo-di-snowboard_e_165375" class="text-primary list-teaser__link"><span class="icon icon-circle-arrow fz30"></span></a>
                    <div class="teaser__body">
                                                    <span class="text-secondary fz14 text-uppercase strong">Sport, TOP EVENTI SPORT</span>
                                                <h2 class="text-secondary">Coppa del Mondo di Snowboard</h2>
                        <ul class="list-unstyled list-inline list__teaser__list mb15 mt10">
                                                            <li>
                                    <a class="fz14 text-uppercase strong text-primary"><span class="icon icon-map-view mr10"></span>Passo Costalunga</a>
                                </li>
                                                        <li>
                                <a class="fz14 text-uppercase strong text-primary"><span class="icon icon-map-view mr10"></span>14/12/2017</a>
                            </li>
                        </ul>
                        <p>Al Passo Costalunga sfida tra i migliori specialisti del mondo</p>
                    </div>
                </div>

```

**DA FARE 2.4.2**: Scrivi il codice Python per estrarre la lista degli eventi, e chiamala `tipo_evento`. Per farlo, puoi usare il codice già visto in precedenza, ma questa volta, per creare la lista sforzati di usare una _list comprehension_.
Verifica poi che la lunghezza della stringa sia 16.

**SUGGERIMENTO**: La lista originale da cui prelevare il testo delle le tag sarà creata dalla chiamata a `soup.select`

**SOLUZIONE 2.4.2**

In [41]:
for tag in soup.select('[class="text-secondary fz14 text-uppercase strong"]'):
    print(tag.text)

Sport, TOP EVENTI SPORT
Sport, TOP EVENTI SPORT
Sport, TOP EVENTI SPORT
Sport, TOP EVENTI SPORT
Enogastronomia, Intrattenimento della Località, Sport
Sport, Intrattenimento della Località, Enogastronomia
Wellness
Wellness
Intrattenimento della Località, Mercati e mercatini
Sport, TOP EVENTI SPORT
Intrattenimento della Località, Mercati e mercatini
Intrattenimento della Località, Mercati e mercatini
Mercati e mercatini, Intrattenimento della Località
Intrattenimento della Località, Mercati e mercatini
Intrattenimento della Località, Mercati e mercatini
Mercati e mercatini, Folklore


In [42]:
tipi_evento = [tag.text for tag in soup.select('[class="text-secondary fz14 text-uppercase strong"]')]

In [43]:
tipi_evento

['Sport, TOP EVENTI SPORT',
 'Sport, TOP EVENTI SPORT',
 'Sport, TOP EVENTI SPORT',
 'Sport, TOP EVENTI SPORT',
 'Enogastronomia, Intrattenimento della Località, Sport',
 'Sport, Intrattenimento della Località, Enogastronomia',
 'Wellness',
 'Wellness',
 'Intrattenimento della Località, Mercati e mercatini',
 'Sport, TOP EVENTI SPORT',
 'Intrattenimento della Località, Mercati e mercatini',
 'Intrattenimento della Località, Mercati e mercatini',
 'Mercati e mercatini, Intrattenimento della Località',
 'Intrattenimento della Località, Mercati e mercatini',
 'Intrattenimento della Località, Mercati e mercatini',
 'Mercati e mercatini, Folklore']

In [44]:
len(tipi_evento)

16

Come già fatto in precedenza, aggiungiamo `tipi_evento` alla nostra variabile `righe`:

In [45]:
aggiungi_campo('tipo', tipi_evento)

[{'data': '14/12/2017',
  'luogo': 'Passo Costalunga',
  'nome': 'Coppa del Mondo di Snowboard',
  'tipo': 'Sport, TOP EVENTI SPORT'},
 {'data': '18/12/2017',
  'luogo': 'Pozza di Fassa',
  'nome': 'Coppa Europa di sci alpino maschile - slalom speciale',
  'tipo': 'Sport, TOP EVENTI SPORT'},
 {'data': '22/12/2017',
  'luogo': 'Madonna di Campiglio',
  'nome': '3Tre - AUDI FIS Ski World Cup',
  'tipo': 'Sport, TOP EVENTI SPORT'},
 {'data': '28/01/2018',
  'luogo': 'Val di Fassa',
  'nome': 'La Marcialonga di Fiemme e Fassa ',
  'tipo': 'Sport, TOP EVENTI SPORT'},
 {'data': '06/01/2018 - 07/04/2018',
  'luogo': '',
  'nome': 'TrentinoSkiSunrise: sulle piste alla luce dell’alba',
  'tipo': 'Enogastronomia, Intrattenimento della Località, Sport'},
 {'data': '06/01/2018 - 07/01/2018',
  'luogo': 'Tesero',
  'nome': 'Tour de Ski',
  'tipo': 'Sport, Intrattenimento della Località, Enogastronomia'},
 {'data': '01/10/2017 - 30/11/2017',
  'luogo': 'Pozza di Fassa',
  'nome': 'La mia nuvola',
  

### 2.5 descrizione

Rimane da aggiungere la descrizione, per esempio per la Coppa del Mondo di Snowboard la descrizione sarebbe "Al Passo Costalunga sfida tra i migliori specialisti del mondo". 

**DA FARE 2.5.1**: Cerca manualmente nell'HTML la stringa `Al Passo Costalunga sfida tra i migliori specialisti del mondo`. In quante posizioni appare ? In base a quali criteri potremo filtrare i tipi degli eventi ? 

**SOLUZIONE 2.5.1**:

Vediamo che compare in un blocco html regolare e come già successo prima in un blocco `script`. Concentriamoci sul blocco html. Vediamo che la descrizione sta solo vicino ai blocchi `h2`, in particolare alla linea 
`<p>Al Passo Costalunga sfida tra i migliori specialisti del mondo</p>`:

```html
<div class="col col-sm-9 arrange__item">
                    <a href="https://www.visittrentino.info/it/guida/eventi/coppa-del-mondo-di-snowboard_e_165375" class="text-primary list-teaser__link"><span class="icon icon-circle-arrow fz30"></span></a>
                    <div class="teaser__body">
                                                    <span class="text-secondary fz14 text-uppercase strong">Sport, TOP EVENTI SPORT</span>
                                                <h2 class="text-secondary">Coppa del Mondo di Snowboard</h2>
                        <ul class="list-unstyled list-inline list__teaser__list mb15 mt10">
                                                            <li>
                                    <a class="fz14 text-uppercase strong text-primary"><span class="icon icon-map-view mr10"></span>Passo Costalunga</a>
                                </li>
                                                        <li>
                                <a class="fz14 text-uppercase strong text-primary"><span class="icon icon-map-view mr10"></span>14/12/2017</a>
                            </li>
                        </ul>
                        <p>Al Passo Costalunga sfida tra i migliori specialisti del mondo</p>
                    </div>
                </div>
```



Stavolta il filtraggio non è così semplice come prima, perchè per `<p>` non c'è nessun comodo attributo come `class`. Possiamo però cercare se qualche attributo prima è più facilmente identificabile. Guardiamo per esempio la tag `<ul>` immediatamente precedente:

```html
                        <ul class="list-unstyled list-inline list__teaser__list mb15 mt10">
                                                            <li>
                                    <a class="fz14 text-uppercase strong text-primary"><span class="icon icon-map-view mr10"></span>Passo Costalunga</a>
                                </li>
                                                        <li>
                                <a class="fz14 text-uppercase strong text-primary"><span class="icon icon-map-view mr10"></span>14/12/2017</a>
                            </li>
                        </ul>
                        <p>Al Passo Costalunga sfida tra i migliori specialisti del mondo</p>
```



 Vediamo che la tag in questione `<ul class="list-unstyled list-inline list__teaser__list mb15 mt10">` contiene una classe, se la cerchiamo nel documento troveremo che tutte queste `ul` con questa classe compaiono sempre e solo prima del `<p>` che vogliamo noi. Quindi non ci resta che trovare un selettore CSS che
 
* trovi le tag `ul` con `class=list-unstyled list-inline list__teaser__list mb15 mt10`
* selezioni la tag successiva `p`

Per fare ciò possiamo usare il selettore col simbolo `+`, quindi nella select basterà scrivere: 

In [46]:
soup.select('ul[class="list-unstyled list-inline list__teaser__list mb15 mt10"] + p')

[<p>Al Passo Costalunga sfida tra i migliori specialisti del mondo</p>,
 <p>Lunedì 18 dicembre la Coppa Europa fa tappa in Val di Fassa</p>,
 <p>Torna il mitico slalom in notturna: vivi l'evento da VIP!</p>,
 <p>La “regina” delle granfondo compie 45 anni</p>,
 <p>L'emozione di sciare all’alba e prima di tutti. Dopo, una colazione da campioni!</p>,
 <p>Coppa del Mondo Sci di Fondo
 </p>,
 <p>Contest fotografico della Nuvola del Benessere</p>,
 <p>Fra le nuvole ai piedi delle Dolomiti</p>,
 <p>L'incanto genuino del Natale</p>,
 <p>La regina delle ciaspole nel giorno della Befana</p>,
 <p>Profumi, luci, atmosfera di festa </p>,
 <p>La forza della tradizione con un omaggio all'arte</p>,
 <p>Parco secolare degli Asburgo </p>,
 <p>Musica, zelten, vin brulé e spumante Trentodoc per assaporare l’atmosfera prenatalizia</p>,
 <p>Quasi 40 casette negli angoli più suggestivi del centro</p>,
 <p>Tradizioni e mercatini natalizi di Pinè</p>]

Benissimo, abbiamo ottenuto la lista dei `<p>` che vogliamo. Adesso possiamo mettere il testo interno dei `<p>` dentro una lista che chiameremo `descrizioni`. Possiamo farlo in un colpo solo usando una _list comprehension_:

In [47]:
descrizioni = [tag.text for tag in soup.select('ul[class="list-unstyled list-inline list__teaser__list mb15 mt10"] + p')]

In [48]:
descrizioni

['Al Passo Costalunga sfida tra i migliori specialisti del mondo',
 'Lunedì 18 dicembre la Coppa Europa fa tappa in Val di Fassa',
 "Torna il mitico slalom in notturna: vivi l'evento da VIP!",
 'La “regina” delle granfondo compie 45 anni',
 "L'emozione di sciare all’alba e prima di tutti. Dopo, una colazione da campioni!",
 'Coppa del Mondo Sci di Fondo\n',
 'Contest fotografico della Nuvola del Benessere',
 'Fra le nuvole ai piedi delle Dolomiti',
 "L'incanto genuino del Natale",
 'La regina delle ciaspole nel giorno della Befana',
 'Profumi, luci, atmosfera di festa ',
 "La forza della tradizione con un omaggio all'arte",
 'Parco secolare degli Asburgo ',
 'Musica, zelten, vin brulé e spumante Trentodoc per assaporare l’atmosfera prenatalizia',
 'Quasi 40 casette negli angoli più suggestivi del centro',
 'Tradizioni e mercatini natalizi di Pinè']

Come al solito, verifichiamo che la lista delle descrizioni sia di 16 elementi:

In [49]:
len(descrizioni)

16

In [50]:
aggiungi_campo('descrizione', descrizioni)

[{'data': '14/12/2017',
  'descrizione': 'Al Passo Costalunga sfida tra i migliori specialisti del mondo',
  'luogo': 'Passo Costalunga',
  'nome': 'Coppa del Mondo di Snowboard',
  'tipo': 'Sport, TOP EVENTI SPORT'},
 {'data': '18/12/2017',
  'descrizione': 'Lunedì 18 dicembre la Coppa Europa fa tappa in Val di Fassa',
  'luogo': 'Pozza di Fassa',
  'nome': 'Coppa Europa di sci alpino maschile - slalom speciale',
  'tipo': 'Sport, TOP EVENTI SPORT'},
 {'data': '22/12/2017',
  'descrizione': "Torna il mitico slalom in notturna: vivi l'evento da VIP!",
  'luogo': 'Madonna di Campiglio',
  'nome': '3Tre - AUDI FIS Ski World Cup',
  'tipo': 'Sport, TOP EVENTI SPORT'},
 {'data': '28/01/2018',
  'descrizione': 'La “regina” delle granfondo compie 45 anni',
  'luogo': 'Val di Fassa',
  'nome': 'La Marcialonga di Fiemme e Fassa ',
  'tipo': 'Sport, TOP EVENTI SPORT'},
 {'data': '06/01/2018 - 07/04/2018',
  'descrizione': "L'emozione di sciare all’alba e prima di tutti. Dopo, una colazione da c

Proviamo a scriverci un file CSV contenente tutti i dati raccolti. Diversamente da quanto fatto finora, in cui abbiamo solo considerato righe come liste, in questo caso dato che abbiamo dizionari ci servirà un oggetto di tipo `DictWriter`: 

In [51]:
import csv

# apriamo il file `eventi.csv`in scrittura :
# 'fouput' è un nome  scelto da noi)
# 'w' indica a Python che vogliamo scrivere il file
#     se il file esiste già, verrà sovrascritto. 
#     NOTA:  FATE SEMPRE MOLTA ATTENZIONE A NON SOVRASCRIVERE FILE PER SBAGLIO !!!!!
with open('eventi.csv', 'w', encoding='utf-8') as foutput:
    # andremo a scrivere dizionari, ma nei dizionari le chiavi sono in ordine casuale: 
    # per avere una serie di colonne ordinata in modo prevedibile, siamo quindi obbligati
    # a fornire una lista di intestazioni: 
    nomi_campi = ['nome', 'data', 'luogo', 'tipo', 'descrizione']  
    writer = csv.DictWriter(foutput,fieldnames=nomi_campi)  # Ci serve creare un'oggetto 'scrittore' di tipo DictWriter            
    writer.writeheader()
    for diz in righe: # stavolta le righe contengono dizionari
        writer.writerow(diz)  # chiamiamo l'oggetto scrittore dicendogli di scrivere il dizionario corrente