In [None]:
import json

### Apriamo un file json con tutti i risultati del campionato di seria A 2015/16

In [None]:
fp = open('datasets/serie_A/2015-16.json')
campionato = json.load(fp)

### Ispezioniamo il contenuto "trasformato" in strutture dati Python

In [None]:
type(campionato)

In [None]:
campionato.keys()

In [None]:
campionato['name']

### Ci aspettiamo che rounds corriponda ad una lista ...

In [None]:
type(campionato['rounds'])

In [None]:
campionato['rounds'][0]

In [None]:
campionato['rounds'][0].keys()

In [None]:
campionato['rounds'][0]['name']

In [None]:
type(campionato['rounds'][0]['matches'])

In [None]:
campionato['rounds'][0]['matches'][0]

### Abbiamo la struttura
1. Un campionato è un dizionario con il nome (una stringa) e la lista delle giornate
2. Una giornata (un elemento della lista) è a sua volta un dizinario con il nome (1^ giornata, 2^ giornata, ....) e la lista degli incontri
3. Un incontro è un dizionario con 5 voci: 
   1. data (in cui si dell'incontro), 
   2. team1 (squadra di casa)
   3. team2 (squadra ospite)
   4. score1 (goal segnati dalla squadra di casa)
   5. score2 (goal segnati dalla squadra ospite)
4. Team1 e team2 sono a loro volta dei dizionari

### Controlliamo il numero delle giornate

In [None]:
num_giornate = len(campionato['rounds'])
print(num_giornate)

### Proviamo innanzitutto a stampare (in modo "pulito") il programma della giornata

In [None]:
for partita in campionato['rounds'][0]['matches']:
    print(partita['team1']['name'],partita['team2']['name'])

### Primo obiettivo: ottenere una lista di coppie (nomesquadre,codicesquadra), con tutte le squadre partecipanti

#### Soluzioni non-pythoniche

In [None]:
squadre_partecipanti = []
for partita in campionato['rounds'][0]['matches']:
    squadre_partecipanti.append((partita['team1']['name'],partita['team1']['code']))
    squadre_partecipanti.append((partita['team2']['name'],partita['team2']['code']))

In [None]:
squadre_partecipanti

#### Un po' meglio ma sempre non pythonica

In [None]:
def squadre(partita):
    return [(partita['team1']['name'],partita['team1']['code']),\
           (partita['team2']['name'],partita['team2']['code'])]

In [None]:
squadre(campionato['rounds'][0]['matches'][0])

In [None]:
squadre_partecipanti = []
for partita in campionato['rounds'][0]['matches']:
    squadre_partecipanti += squadre(partita)

In [None]:
squadre_partecipanti

### List comprehension

In [None]:
[squadre(p) for p in campionato['rounds'][0]['matches']]

#### Non è ancora quel che vogliamo: non è una lista di coppie, ma una lista di liste formate ciascuna da due coppie

#### Possiamo usare la funzione reduce (pare non amata da Van Rossum)

In [None]:
from functools import reduce

In [None]:
def lsum(x,y):
    return x+y

In [None]:
reduce(lsum, [squadre(p) for p in campionato['rounds'][0]['matches']])

#### Ancora meglio

In [None]:
reduce(lambda x,y: x+y, [squadre(p) for p in campionato['rounds'][0]['matches']])

In [None]:
squadre_partecipanti = reduce(lambda x,y: x+y, [squadre(p) for p in campionato['rounds'][0]['matches']])

In [None]:
squadre_partecipanti

### Vogliamo ora generare una lista di tuple che descriva tutto il calendario
### Le tuple devono contenere un id progressivo

In [None]:
campionato['rounds'][0]['matches'][0]

In [None]:
partita = campionato['rounds'][0]['matches'][0]
id = 1
(id, campionato['name'],campionato['rounds'][0]['name'],'andata',squadre(partita)[0][1],squadre(partita)[1][1])