In [88]:
import json
import os
import itertools
import requests
import sqlparse
import re
from IPython.display import HTML, display
import tabulate
import urllib.parse

In [89]:
def get_doc_id(doc_id):
    doc_id = urllib.parse.quote(doc_id)
    url = 'https://next.obudget.org/get/'+doc_id
    print('Getting', url)
    ret = requests.get(url).json()['value']
    assert 'page_title' in ret, repr(ret)
    return ret

In [90]:
def get_table(query, headers, formatters):
    table = requests.get('https://next.obudget.org/api/query', params={'query': query}).json()
    rows = table['rows']
    ret = []
    if len(rows)>0:
        ret.append(headers)
        ret.extend([[f(x) for f in formatters] for x in rows][:3])
    return ret + [['Total', table['total']]]

In [91]:
def questions():
    base = 'app/descriptors'
    tgt = re.compile('questions.*\.json')
    for root, dirs, fnames in os.walk(base):
        for f in fnames:
            if tgt.match(f):
                yield root.replace(base + '/', ''), os.path.join(root, f)

In [92]:
def parsed_questions():
    for q in questions():
        print(q)
        qq = json.load(open(q[1]))
        for qqq in qq:
            yield q[0], qqq

In [93]:
def parameters(q):
    p = q.get('parameters', {})
    keys = p.keys()
    values = [list(p[k].items()) for k in keys]
    return (zip(keys, prod) for prod in itertools.product(*values))

In [94]:
DOC_IDS = {
    'budget':[
        'budget/C1/2019',
        'budget/C222/2019',        
        'budget/0020/2019',
        'budget/0000/2019',
        'budget/002043/2019',
        'budget/00204301/2019',
        'budget/0020430101/2019',
    ],
    'supports': [
        'supports/0020460604/2016/עירית רחובות/הקצבות'
    ],
    'org': [
        'org/company/520039710'
    ],
    'contract-spending': [
        'contract-spending/4501218324/0033060240',
        'contract-spending/4501252882/0020400228',
    ],
    'budget-changes': [
        'national-budget-changes/2015/26-004'
    ],
    'tenders/exemptions': [
        'tenders/exemptions/31252/none'
    ]
}

In [95]:
def formatter(mod, h):
    def _f(x, row):
        return str(x) + ' + ' + mod
    return _f

In [96]:
def compose(f, g):
    def _f(x, row):
        return g(f(x, row), row)
    return _f

In [97]:
def getter(h):
    hdr = h
    def _f(x, row):
        return row[hdr]
    return _f

In [98]:
def wrapper(f):
    def _f(row):
        return f('', row)
    return _f

In [99]:
PARAM = re.compile(':([a-z()_]+)$')

def parse_headers(headers):
    _headers = []
    _formatters = []
    for h in headers:
        matches = PARAM.findall(h)
        funcs = []
        while len(matches)>0:
            mod = matches[0]
            h = h[:-(len(mod)+1)]
            funcs.append(formatter(mod, h))
            matches = PARAM.findall(h)
        f = getter(h)
        for g in funcs:
            f = compose(f, g)
        k = wrapper(f)
        _formatters.append(k)
        _headers.append(h)
    return _headers, _formatters
        
    

In [100]:
params_re = re.compile('(:[a-z_]+)')
for kind, q in parsed_questions():
    text = q['text']
    query = q['query']
    if isinstance(query, list):
        query = ' '.join(query)
    headers = q.get('headers', [])
    headers, formatters = parse_headers(headers)
    doc_ids = DOC_IDS[kind]
    for doc_id in doc_ids:
        doc = get_doc_id(doc_id)
        for p in parameters(q):
            params = {}
            updated_text = q['text']
            updated_query = query
            params.update(doc)
            for name, (disp, val) in p:
                params[name] = val
                updated_text = updated_text.replace('<'+name+'>', disp)
            display(HTML('<h3>({}) {}: {}</h3>'.format(kind, doc['page_title'], updated_text)))
            ofs = 0
            while True:
                m = params_re.search(updated_query[ofs:])
                if m is None: break
                key = m.groups(0)[0][1:]
                if key in params:
                    updated_query = updated_query[:(m.start()+ofs)] + str(params[key]) + updated_query[(m.end()+ofs):]
                else:
                    print('skipping parameter', key)
                    ofs = ofs + m.start()+1
            display(HTML('<pre>{}</pre>'.format(sqlparse.format(updated_query, reindent=True, keyword_case='upper'))))
            display(HTML(tabulate.tabulate(get_table(updated_query, headers, formatters), tablefmt='html')))


('budget', 'app/descriptors/budget/questions.json')
Getting https://next.obudget.org/get/budget/C1/2019


skipping parameter json
skipping parameter json
skipping parameter json


0,1,2,3
שנה,תקציב מקורי,תקציב אחרי שינויים,ביצוע בפועל
1997,34950827000.0 + number תקציב מקורי,42229942000.0 + number תקציב אחרי שינויים,37875516939.0 + number ביצוע בפועל
1998,37689039000.0 + number תקציב מקורי,45537812000.0 + number תקציב אחרי שינויים,41255396783.0 + number ביצוע בפועל
1999,39973799000.0 + number תקציב מקורי,48339068000.0 + number תקציב אחרי שינויים,43656479170.0 + number ביצוע בפועל
Total,22,,


Getting https://next.obudget.org/get/budget/C222/2019


skipping parameter json
skipping parameter json
skipping parameter json


0,1,2,3
שנה,תקציב מקורי,תקציב אחרי שינויים,ביצוע בפועל
1997,18588030000.0 + number תקציב מקורי,18719226000.0 + number תקציב אחרי שינויים,17705614860.0 + number ביצוע בפועל
1998,20232520000.0 + number תקציב מקורי,20549089000.0 + number תקציב אחרי שינויים,18930503119.0 + number ביצוע בפועל
1999,20660849000.0 + number תקציב מקורי,21397237000.0 + number תקציב אחרי שינויים,20662263678.0 + number ביצוע בפועל
Total,22,,


Getting https://next.obudget.org/get/budget/0020/2019


skipping parameter json
skipping parameter json
skipping parameter json


0,1,2,3
שנה,תקציב מקורי,תקציב אחרי שינויים,ביצוע בפועל
1997,17998587000.0 + number תקציב מקורי,18079238000.0 + number תקציב אחרי שינויים,17176380244.0 + number ביצוע בפועל
1998,19588376000.0 + number תקציב מקורי,19835506000.0 + number תקציב אחרי שינויים,18516602605.0 + number ביצוע בפועל
1999,20085909000.0 + number תקציב מקורי,20643414000.0 + number תקציב אחרי שינויים,20236285667.0 + number ביצוע בפועל
Total,22,,


Getting https://next.obudget.org/get/budget/0000/2019


skipping parameter json
skipping parameter json
skipping parameter json


0,1,2,3
שנה,תקציב מקורי,תקציב אחרי שינויים,ביצוע בפועל
1997,189953447000.0 + number תקציב מקורי,189953447000.0 + number תקציב אחרי שינויים,180343411795.0 + number ביצוע בפועל
1998,207727617000.0 + number תקציב מקורי,207727617000.0 + number תקציב אחרי שינויים,203762197990.0 + number ביצוע בפועל
1999,214975294000.0 + number תקציב מקורי,214975294000.0 + number תקציב אחרי שינויים,205154162213.0 + number ביצוע בפועל
Total,22,,


Getting https://next.obudget.org/get/budget/002043/2019


skipping parameter json
skipping parameter json
skipping parameter json


0,1,2,3
שנה,תקציב מקורי,תקציב אחרי שינויים,ביצוע בפועל
2015,14566516000.0 + number תקציב מקורי,14723330000.0 + number תקציב אחרי שינויים,14536312050.0 + number ביצוע בפועל
2016,14298038000.0 + number תקציב מקורי,15302527000.0 + number תקציב אחרי שינויים,15176428523.0 + number ביצוע בפועל
2017,14670822000.0 + number תקציב מקורי,16371704000.0 + number תקציב אחרי שינויים,None + number ביצוע בפועל
Total,4,,


Getting https://next.obudget.org/get/budget/00204301/2019


skipping parameter json
skipping parameter json
skipping parameter json


0,1,2,3
שנה,תקציב מקורי,תקציב אחרי שינויים,ביצוע בפועל
1997,2307000.0 + number תקציב מקורי,3872000.0 + number תקציב אחרי שינויים,5450209.0 + number ביצוע בפועל
1998,2464000.0 + number תקציב מקורי,2252000.0 + number תקציב אחרי שינויים,233388.0 + number ביצוע בפועל
1999,83000.0 + number תקציב מקורי,-1398000.0 + number תקציב אחרי שינויים,962523.0 + number ביצוע בפועל
Total,22,,


Getting https://next.obudget.org/get/budget/0020430101/2019


skipping parameter json
skipping parameter json
skipping parameter json


0,1,2,3
שנה,תקציב מקורי,תקציב אחרי שינויים,ביצוע בפועל
2001,29100000.0 + number תקציב מקורי,30900000.0 + number תקציב אחרי שינויים,30900000.0 + number ביצוע בפועל
2002,30657000.0 + number תקציב מקורי,30657000.0 + number תקציב אחרי שינויים,26824875.0 + number ביצוע בפועל
2003,31298000.0 + number תקציב מקורי,31298000.0 + number תקציב אחרי שינויים,31288982.0 + number ביצוע בפועל
Total,18,,


('budget', 'app/descriptors/budget/questions.spending.json')
Getting https://next.obudget.org/get/budget/C1/2019


JSONDecodeError: Expecting value: line 1 column 1 (char 0)