## Uso dei Data Cube

Utilizzeremo il pacchetto `cubes` che va installato con `conda` nel nostro ambiente. `cubes` comunica con un backend SQL, detto `Store`, che verrà creato con `sqlalchemy` fornisce l'astrazione necessaria per le creazione di diversi modelli di analisi (decsrizioni json del datacube, delle sue dimensioni, categorie e misure di aggregazione) all'interno di un _workspace_.

![Architettura di `cubes`](https://cubes.readthedocs.io/en/v1.1/_images/cubes-workspace_simplified.png)

In [1]:
# importiamo le librerie
import pymysql
from sqlalchemy import create_engine
from cubes.tutorial.sql import create_table_from_csv
from cubes import Workspace

# creiamo l'engine sql e il database fisico
engine = create_engine('mysql+pymysql://root:root@localhost:3306/data_cube')
create_table_from_csv(engine,
                       "./Data/IBRD_Balance_Sheet__FY2010.csv", 
                       table_name="ibrd_balance",
                       fields=[
                             ("category", "string"),
                             ("category_label", "string"),
                             ("subcategory", "string"),
                             ("subcategory_label", "string"),
                             ("line_item", "string"),
                             ("year", "integer"),
                             ("amount", "integer")],
                       create_id=True
                   )

Il workspace potrebbe essere creato a partire da un file di configurazione chiamato `slicer.ini` di default e che ha una sintassi simile alla seguente:

```
[workspace]
model = model.json

[store]
type = sql
url = postgresql://localhost/database
```
dove viene specificata la coppia store-workspace. In alternativa è possibile inizializzare il workspace direttamente dalla API.

In [2]:
# creiamo il workspace con le API

workspace = Workspace()
workspace.register_default_store("sql", url="mysql+pymysql://root:root@localhost:3306/data_cube")

# importiamo il modello del data cube che è definito come un file json
# in cui è definito il cubo "ibrd_balance"
workspace.import_model("./Data/tutorial_model.json")

In [3]:
# Creiamo un browser sul data cube per eseguire le operazioni

browser = workspace.browser("ibrd_balance")

In [4]:
# calcoliamo le misure di aggregazione previste dal modello
result = browser.aggregate()
result.summary["record_count"]

62

In [5]:
result.summary["amount_sum"]

Decimal('1116860')

In [6]:
result.aggregates

[{'name': 'amount_sum', 'info': {}, 'label': 'Sum of Amount', 'ref': 'amount_sum', 'function': 'sum', 'measure': 'amount'},
 {'name': 'record_count', 'info': {}, 'label': 'Record Count', 'ref': 'record_count', 'function': 'count'}]

In [7]:
result = browser.aggregate(drilldown=[("year")])
for record in result:
    print(record)

{'year': 2009, 'amount_sum': Decimal('550840'), 'record_count': 31}
{'year': 2010, 'amount_sum': Decimal('566020'), 'record_count': 31}


In [8]:
result = browser.aggregate(drilldown=[("item",None,"subcategory")])
for record in result:
    print(record)

{'item.category': 'a', 'item.category_label': 'Assets', 'item.subcategory': 'da', 'item.subcategory_label': 'Derivative Assets', 'amount_sum': Decimal('244691'), 'record_count': 8}
{'item.category': 'a', 'item.category_label': 'Assets', 'item.subcategory': 'dfb', 'item.subcategory_label': 'Due from Banks', 'amount_sum': Decimal('4847'), 'record_count': 4}
{'item.category': 'a', 'item.category_label': 'Assets', 'item.subcategory': 'i', 'item.subcategory_label': 'Investments', 'amount_sum': Decimal('77024'), 'record_count': 2}
{'item.category': 'a', 'item.category_label': 'Assets', 'item.subcategory': 'lo', 'item.subcategory_label': 'Loans Outstanding', 'amount_sum': Decimal('221761'), 'record_count': 2}
{'item.category': 'a', 'item.category_label': 'Assets', 'item.subcategory': 'nn', 'item.subcategory_label': 'Nonnegotiable', 'amount_sum': Decimal('2325'), 'record_count': 2}
{'item.category': 'a', 'item.category_label': 'Assets', 'item.subcategory': 'oa', 'item.subcategory_label': 'Othe

In [73]:
report=browser.aggregate(drilldown=[('item',None,'category'),'year'])
for record in report:
    print(record)

{'item.category': 'a', 'item.category_label': 'Assets', 'year': 2009, 'amount_sum': Decimal('275420'), 'record_count': 16}
{'item.category': 'a', 'item.category_label': 'Assets', 'year': 2010, 'amount_sum': Decimal('283010'), 'record_count': 16}
{'item.category': 'e', 'item.category_label': 'Equity', 'year': 2009, 'amount_sum': Decimal('40037'), 'record_count': 4}
{'item.category': 'e', 'item.category_label': 'Equity', 'year': 2010, 'amount_sum': Decimal('37555'), 'record_count': 4}
{'item.category': 'l', 'item.category_label': 'Liabilities', 'year': 2009, 'amount_sum': Decimal('235383'), 'record_count': 11}
{'item.category': 'l', 'item.category_label': 'Liabilities', 'year': 2010, 'amount_sum': Decimal('245455'), 'record_count': 11}


In [92]:
from cubes import Cell, PointCut

cut = [
    PointCut('year', [2010]),
    PointCut('item', {'subcategory':'dl'})
]

cell = Cell(workspace.cube('ibrd_balance'),cut)

report=browser.aggregate(cell,drilldown=[('item',None,'line_item')])

for record in report:
    print(record)

In [95]:
cell=Cell(workspace.cube('ibrd_balance'))

cell=cell.drilldown('item',('item',None,'subcategory'))

In [154]:
cut = [
    PointCut('year', [2010]),
#    PointCut('item', {'subcategory':'Investments'})
]

cell = Cell(workspace.cube('ibrd_balance'),cut)

In [159]:
report = browser.aggregate(cell,drilldown=[('item',None,'category')])

for record in report:
    print(record)

{'item.category': 'a', 'item.category_label': 'Assets', 'amount_sum': Decimal('283010'), 'record_count': 16}
{'item.category': 'e', 'item.category_label': 'Equity', 'amount_sum': Decimal('37555'), 'record_count': 4}
{'item.category': 'l', 'item.category_label': 'Liabilities', 'amount_sum': Decimal('245455'), 'record_count': 11}


In [160]:
report.total_cell_count

3