# Meltin pot - dati per D3
Questo notebook serve a convertire i dati per i 3 grafici in un formato agevole per il rendering delle mappe nel browser utilizzando D3. 
## Grafico 1
Carico i dati in `map1Data_ultracompact.json`, una lista in cui ogni riga contiene tutti i dati relativi ad un determinato anno e nil.

In [1]:
import json

dirPath = '/Users/tommaso/Projects/sod2019/-milano-melting-pot/dati/'
with open(dirPath + 'map1Data_ultracompact.json') as datafile:
    map1Data = json.load(datafile) 
print(len(map1Data))

Il numero di righe è esattamente il doppio di quello che dovrebbe essere: 20 anni * 88 Nil dovrebbero dare 1760 righe. Continuo assumendo che i dati siano semplicemente duplicati, e che ci sia due volte lo stesso dato per un determinato Anno e IdNil.

Creo un oggetto che ha come chiavi gli anni presenti nel dataset. Ognuno dei valori è a sua volta un oggetto, che ha come chiavi le varie regioni di origine. I rispettivi valori sono liste di datapoints che contengono solo Nil e numero di residenti. 



In [2]:
import itertools
from operator import itemgetter

map1Data = sorted(map1Data, key=itemgetter('Anno'))
map1DataD3 = {}

for year, iterator in itertools.groupby(map1Data, key=itemgetter('Anno')):
    if year not in map1DataD3:
        map1DataD3[year] = {}
    dataPoints = list(iterator)
    for row in dataPoints:
        for key, value in row.items():
            if key not in ['IdNil', 'Anno']:
                idNil = row['IdNil']
                if key not in map1DataD3[year]:
                    map1DataD3[year][key] = []
                dot = {'IdNil': idNil, 'Pop': value }
                # evito di inserire dati duplicati
                iter = (item for item in map1DataD3[year][key] if item['IdNil'] == idNil)
                if next(iter, None) is None:
                    map1DataD3[year][key].append(dot)  

Questo genere di struttura nidificata è utile per la rappresentazione in tempo reale, in quanto è possibile selezionare i dati relativi ad un grafico con facilità. La creazione delle mappe prevede infatti il rendering di una sequenza di mappe per una determinata regione di origine in un determinato anno.

In [3]:
print('====================================================')
print('Elenca gli anni nel dataset')
print('====================================================')
print(map1DataD3.keys()                )
print('====================================================')
print('Elenca le chiavi presenti nel 2013')
print('====================================================')
print(map1DataD3['2013'].keys())
print('====================================================')
print('Dati per il Nord Africa nel 2013, divisi per Nil')
print('====================================================')
map1DataD3['2013']['noraf']

Elenca gli anni nel dataset
dict_keys(['1999', '2000', '2001', '2002', '2003', '2004', '2005', '2006', '2007', '2008', '2009', '2010', '2011', '2012', '2013', '2014', '2015', '2016', '2017', '2018'])
Elenca le chiavi presenti nel 2013
dict_keys(['eastas', 'noraf', 'ssaf', 'seas', 'ita', 'southas', 'soam', 'eu15', 'westas', 'noram', 'eun13', 'otheu', 'ocean', 'other'])
Dati per il Nord Africa nel 2013, divisi per Nil


[{'IdNil': '1', 'Pop': 59},
 {'IdNil': '2', 'Pop': 157},
 {'IdNil': '3', 'Pop': 0},
 {'IdNil': '4', 'Pop': 25},
 {'IdNil': '5', 'Pop': 255},
 {'IdNil': '6', 'Pop': 355},
 {'IdNil': '7', 'Pop': 46},
 {'IdNil': '8', 'Pop': 0},
 {'IdNil': '9', 'Pop': 44},
 {'IdNil': '10', 'Pop': 346},
 {'IdNil': '11', 'Pop': 764},
 {'IdNil': '12', 'Pop': 686},
 {'IdNil': '13', 'Pop': 502},
 {'IdNil': '14', 'Pop': 1133},
 {'IdNil': '15', 'Pop': 259},
 {'IdNil': '16', 'Pop': 811},
 {'IdNil': '17', 'Pop': 486},
 {'IdNil': '18', 'Pop': 427},
 {'IdNil': '19', 'Pop': 2549},
 {'IdNil': '20', 'Pop': 3498},
 {'IdNil': '21', 'Pop': 734},
 {'IdNil': '22', 'Pop': 620},
 {'IdNil': '23', 'Pop': 402},
 {'IdNil': '24', 'Pop': 87},
 {'IdNil': '25', 'Pop': 231},
 {'IdNil': '26', 'Pop': 275},
 {'IdNil': '27', 'Pop': 176},
 {'IdNil': '28', 'Pop': 1034},
 {'IdNil': '29', 'Pop': 522},
 {'IdNil': '30', 'Pop': 476},
 {'IdNil': '31', 'Pop': 476},
 {'IdNil': '32', 'Pop': 321},
 {'IdNil': '33', 'Pop': 324},
 {'IdNil': '34', 'Pop': 

Salvo i dati in un file json.

In [4]:
import json
with open (dirPath + 'map1Data_d3.json', 'w') as outfile:
    json.dump(map1DataD3, outfile)
print('Salvato')

Salvato
