#### Autori: Domenico Lembo, Giuseppe Santucci and Marco Schaerf

[Dipartimento di Ingegneria informatica, automatica e gestionale](https://www.diag.uniroma1.it)

<img src="https://mirrors.creativecommons.org/presskit/buttons/88x31/png/by-nc-sa.eu.png"
     alt="License"
     style="float: left;"
     height="40" width="100" />
This notebook is distributed with license Creative Commons *CC BY-NC-SA*

# Trivia: indovina città e attrazione da immagini
1. Obiettivo del gioco
2. Preparazione del gioco
3. Creazione delle strutture dati
4. Esecuzione del gioco
5. Analisi dei dati

### Obiettivo del gioco
Dobbiamo implementare un semplice gioco a quiz su città e attrazioni. Il gioco consiste nel proporre all'utente una sequenza di immagini e chiedergli di riconoscere la città e l'attrazione a cui si riferiscono.

### Preparazione del gioco
Selezioniamo (almeno) 3 città ed (almeno) 3 attrazioni per ogni città. Assegnamo a ogni città e ad ogni attrazione un nome univoco per evitare ambiguità. Creiamo la directory del progetto e salviamo lì questo notebook. Troviamo sul web (almeno) 2 immagini per ogni attrazione. Per ogni immagine copiamo l'indirizzo dell'immagine. Ad esempio, in questa pagina Wikipedia sul [Colosseo](https://it.wikipedia.org/wiki/Colosseo) selezioniamo l'immagine in alto a destra e copiamo il suo indirizzo immagine, che dovrebbe essere https://upload.wikimedia.org/wikipedia/commons/thumb/d/d8/Colosseum_in_Rome-April_2007-1-_copie_2B.jpg/390px-Colosseum_in_Rome-April_2007-1-_copie_2B.jpg. 

In Windows (Chrome o Firefox), premi il pulsante destro sull'immagine e quindi seleziona copia indirizzo immagine, in iOS (Safari) fai clic / tocca e tieni premuto sull'immagine e quindi selezionare copia. Creiamo un file CSV (o Excel xlsx se preferite) con una linea per ogni immagine (vedi formato sotto) e salviamo questo file come "images.csv" nella directory del progetto.

Il file CSV (xlsx) deve avere il seguente formato (prima riga è intestazione):

```
Luogo,Attrazione,Url
luogo1,attrazione1,indirizzo1
```

Dove Url è l'indirizzo web del file dell'immagine. Non inserire spazi vuoti prima e dopo le virgole. **Inserite** una riga di intestazione nel file nel formato descritto.

### Creazione delle strutture dati
Leggiamo il file CSV (o xlsx) e creiamo il corrispondente DataFrame in memoria. Poi creiamo un file CSV (o xlsx), chiamato 'risposte.csv', contenente la sola riga di intestazione, che possa contenere le risposte con il seguente formato:

```
Utente,luogoCorretto,AttrazioneCorretta,IndirizzoImmagine,LuogoSelezionato,AttrazioneSelezionata
```

In [1]:
import pandas as pd

gioco = pd.read_csv("images.csv")
print(gioco)

# definiamo i nomi delle colonne in una lista
nomiColonne = ['Utente','luogoCorretto','AttrazioneCorretta','IndirizzoImmagine','LuogoSelezionato','AttrazioneSelezionata']
# Creiamo un DataFrame 'risposte'
risposte = pd.DataFrame(columns = nomiColonne)
# creiamo il file con la sola intestazione
risposte.to_csv('risposte.csv')

       Luogo             Attrazione  \
0       Roma               Colosseo   
1       Roma               Colosseo   
2       Roma          Piazza Navona   
3       Roma          Piazza Navona   
4       Roma       Piazza di Spagna   
5       Roma       Piazza di Spagna   
6   New York           Times Square   
7   New York           Times Square   
8   New York  Empire State Building   
9   New York  Empire State Building   
10  New York           Central Park   
11  New York           Central Park   
12    Parigi                 Louvre   
13    Parigi                 Louvre   
14    Parigi           Torre Eiffel   
15    Parigi           Torre Eiffel   
16    Parigi          Champs Elysee   
17    Parigi          Champs Elysee   

                                                  Url  
0   https://upload.wikimedia.org/wikipedia/commons...  
1   https://upload.wikimedia.org/wikipedia/commons...  
2   https://images.musement.com/cover/0002/23/thum...  
3   https://images.musement.com/de

### Esecuzione del gioco
Implementiamo il gioco nel seguente modo: chiediamo all'utente di inserire il suo nome (idealmente ogni esecuzione del gioco dovrebbe avere un utente diverso), quindi scegliamo in modo casuale 10 immagini presenti nel file. Mostriamo le immagini una alla volta all'utente e gli chiediamo di che città si tratti (l'utente può scegliere dall'elenco delle città possibili, presa dalla colonna 'Luogo' del DataFrame).
Quindi gli chiediamo di indovinare l'attrazione (l'utente può scegliere dall'elenco delle possibili attrazioni per la città che ha selezionato). In entrambi i casi l'utente può anche selezionare la risposta "Non so". Se risponde "Non so" alla domanda sulla città assegniamo "Non so" anche all'attrazione e passiamo alla prossima immagine. 

Per non obbligare l'utente ad inserire il nome per esteso della città o dell'attrazione conviene numerare le varie opzioni e poi chiedere di inserire il numero corrispondente.

Ogni esecuzione deve sempre aggiungere le nuove informazioni senza eliminare le risposte fornite dai giocatori precedenti.

Per selezionare 10 immagini a caso, possiamo usare il metodo dei DataFrame di Pandas **DataFrame.sample(num,replace=False)** (https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.sample.html), applicata ad un DataFrame che contenga solo la colonna 'Url', dove num è il numero di elementi da selezionare e replace=False specifica che NON bisogna mai selezionare 2 volte lo stesso elemento. Questa funzione restituisce num elementi scelti casualmente.

In [None]:
#importiamo le librerie necessarie per il gioco
import numpy as np
from IPython.display import display, Image, clear_output

nonSo = "Non so" # Per poter poi cambiare questa frase, la salviamo in una variabile

utente = input('Inserisci il tuo nome per iniziare: ') #salva il nome dell'utente che sta effettuando il gioco

# Sceglie le 10 foto a casox
scelta = gioco['Url'].sample(10,replace=False)

# Creiamo un DataFrame vuoto
risposte = pd.DataFrame()

for foto in scelta:
    """ Cose da fare: 
    1) Caricare e mostrare l'immagine. Usate la funzione display(image)
    2) Chiedere all'utente di indovinare la città e poi l'attrazione.
    3) Costruire la riga e poi inserirla nel DataFrame
    4) Cancellare l'output prima di mostrare l'immagine successiva
    """

# scriviamo il dataframe risposte nel file CSV, in modalità 'append'
risposte.to_csv('risposte.csv',mode = 'a')

### Analisi dei dati
Leggiamo il file 'risposte.csv', prodotto nel passaggio precedente, in un DataFrame 'risposteSalvate' e visualizziamo le seguenti informazioni:
1. Creiamo la [matrice di confusione](https://it.wikipedia.org/wiki/Matrice_di_confusione) delle città
2. Tracciamo con un istogramma il numero di risposte di città corrette per ogni esecuzione del gioco
3. Tracciamo con un istogramma il numero di risposte di città/attrazione corrette per ogni esecuzione del gioco
4. Tracciamo per ogni immagine la percentuale di risposte corrette di città e di città/attrazione

Vediamo queste operazioni una per una. Ogni operazione aprirà il file delle risposte e calcolerà i dati che gli servono, questa soluzione non è ovviamente molto efficiente, ma permette di separare meglio il codice ed i grafici.

In [None]:
risposteSalvate = pd.read_csv('risposte.csv')

#### Punto 1:
Creiamo la [matrice di confusione](https://it.wikipedia.org/wiki/Matrice_di_confusione) delle città. Questo vuol dire innanzitutto creare la lista **lcitta** ordinata delle città estraendole dall collonna 'Luogo' del DataFrame gioco e poi un array numpy **matConf** nx(n+1), dove n è il numero delle città, ed in ogni posizione (i,j) c'è il numero di volte in cui la risposta giusta era la città con indice i nella lista **lcitta** e l'utente ha risposto la città con indice j. Se l'utente ha risposto "Non so" inseriamo la risposta nella cella (i,n), cioè la colonna in più (quella di indice n, serve per contare le risposte "Non so" date ad immagini delle varie città). Definiamo una funzione che prende in ingresso il DataFrame delle risposte **risposteSalvate** e la lista delle città **lcitta** e restituisce la matrice di confusione.

In [None]:
import numpy as np

def confusione(risposteSalvate,lcitta):
    """ Costruite e restituite la matrice di confusione
    """

Possiamo ora creare e stampare la matrice di confusione sui vostri dati

In [None]:
# da completare estraendo i dati dal DataFrame gioco
lcitta = []

matConf = confusione(risposteSalvate,lcitta)
print('la matrice di confusione per le città:',lcitta,'è:')
print(matConf)

#### Punto 2:
Tracciamo con un istogramma il numero di risposte di città corrette per ogni esecuzione del gioco (in altri termini, per ogni valore *n* l'istogramma mostra in quante esecuzioni ci sono state *n* risposte corrette). Assumendo che **ad ogni esecuzione del gioco venga usato un nome diverso**, dobbiamo contare per ogni utente quante risposte esatte sulla città ha fornito e metterle in un array. Per fare questo calcolo definiamo una funzione *cittaCorrette* che prende in ingresso il dataframe delle risposte e restituisce la lista (ordinata in ordine crescente) del numero delle risposte corrette relative alle città date da ciascun utente.

In [None]:
def cittaCorrette(df):
    """Costruite e restituite la lista del numero di risposte
    corrette (sulla città) per ogni utente. La lista deve essere
    ordinata in ordine crescente
    """

Usando la funzione sopra definita possiamo ora disegnare l'istogramma

In [2]:
%matplotlib inline
import matplotlib.pyplot as plt

dati = cittaCorrette(risposte)
# Disegna l'istogramma come specificato

NameError: name 'cittaCorrette' is not defined

#### Punto 3:
Tracciamo con un istogramma il numero di risposte di città e attrazione corrette per ogni esecuzione del gioco. Assumendo che **ad ogni esecuzione del gioco venga usato un nome diverso**, dobbiamo contare per ogni utente quante risposte esatte su città e attrazione ha fornito e metterle in un array, poi disegnare l'istogramma corrispondente. Come prima, definiamo una funzione *rispCorrette* che prende in ingresso il DataFrame delle risposte e restituisce la lista (ordinata in ordine crescente) del numero delle risposte corrette (città e attrazione) per ogni utente.

In [None]:
def rispCorrette(df):
    """Costruite e restituite la lista del numero di risposte
    corrette (sulla città e sull'attrazione) per ogni utente.
    La lista deve essere ordinata in ordine crescente
    """

Usando la funzione sopra definita possiamo ora disegnare l'istogramma

In [None]:
dati = rispCorrette(risposte)
# Disegna l'istogramma come specificato

#### Punto 4:
Tracciamo per ogni immagine la percentuale di risposte corrette di città e di città/attrazione. Quindi dobbiamo fare un grafico con 2 plot, uno che mostra le risposte esatte sulla città dell'attrazione ed uno sul riconoscimento di città ed attrazione. L'asse x è quindi semplicemente l'indice delle righe nel DataFrame **gioco** e le 2 funzioni sono 2 array, della stessa dimensione della x, con il numero di risposte esatte nei 2 casi. Per prima cosa definiamo quindi una funzione che prende in ingresso il nome del DataFrame **risposte** con le risposte e quello complessivo **gioco** e restituisce gli arrays x, y1 e y2.

In [None]:
def corretteImmagine(risposte,gioco):
    """ Costruisci e restituisci i 3 arrays
    """

Usando la funzione appena definita possiamo ora disegnare le 2 funzioni

In [None]:

#Calcoliamo le due funzioni sui vostri dati
x,y1,y2 = corretteImmagine(risposte,gioco)
# Eseguite il plot delle 2 funzioni.
# Disegnate la y1 in blue tratteggiato (b--) e
# la y2 in rosso trattegggiato (r--)