In [71]:
import dataverk as dv
import pandas as pd
import ipywidgets as widgets

import plotly.graph_objs as go
import plotly.io as plio
import plotly.figure_factory as ff
import plotly_express as px

In [72]:
import warnings
warnings.simplefilter(action='ignore', category=FutureWarning)
conn = dv.connectors.JSONStatConnector()
df = conn.get_pandas_df('https://data.ssb.no/api/v0/no/table/12446')

2019-06-07T11:17:12.070033: B149899 https://data.ssb.no/api/v0/no/table/12446


In [73]:
df['statistikkvariabel'].unique()

array(['Sykefraværsdagsverk', 'Sykefraværsprosent',
       'Sykefraværsprosent, prosentvis endring fra året før',
       'Sykefraværsprosent, prosentpoeng endring fra året før',
       'Lønnstakere med sykefravær',
       'Lønnstakere med sykefravær i prosent av arbeidstakere i alt'],
      dtype=object)

In [74]:
df['alder'].unique()

array(['16-69 år', '16-19 år', '20-24 år', '25-29 år', '30-34 år',
       '35-39 år', '40-44 år', '45-49 år', '50-54 år', '55-59 år',
       '60-64 år', '65-66 år', '67 år', '68 år', '69 år'], dtype=object)

In [75]:
utv = df[(df['statistikkvariabel'] == 'Sykefraværsdagsverk') 
         & (df['region'] == 'Hele landet')
         & (~df['alder'].isin(['16-69 år']))
         & (~df['kjønn'].isin(['Begge kjønn']))]
utv.head()

Unnamed: 0,region,kjønn,alder,statistikkvariabel,kvartal,value
7200,Hele landet,Menn,16-19 år,Sykefraværsdagsverk,2000K2,30110.0
7201,Hele landet,Menn,16-19 år,Sykefraværsdagsverk,2000K3,35788.0
7202,Hele landet,Menn,16-19 år,Sykefraværsdagsverk,2000K4,38823.0
7203,Hele landet,Menn,16-19 år,Sykefraværsdagsverk,2001K1,41473.0
7204,Hele landet,Menn,16-19 år,Sykefraværsdagsverk,2001K2,31856.0


In [76]:
margin = 10000
fig_3 = px.scatter(utv, x="alder", y="value", 
           animation_frame="kvartal", color='kjønn', 
           range_y=[-margin,utv['value'].max() + margin])
fig_3

In [77]:
utv = df[(df['statistikkvariabel'] == 'Sykefraværsprosent') 
         & (df['region'] == 'Hele landet')
         & (~df['alder'].isin(['16-69 år']))
         & (~df['kjønn'].isin(['Begge kjønn']))]
utv.head()

Unnamed: 0,region,kjønn,alder,statistikkvariabel,kvartal,value
7275,Hele landet,Menn,16-19 år,Sykefraværsprosent,2000K2,2.6
7276,Hele landet,Menn,16-19 år,Sykefraværsprosent,2000K3,2.2
7277,Hele landet,Menn,16-19 år,Sykefraværsprosent,2000K4,2.7
7278,Hele landet,Menn,16-19 år,Sykefraværsprosent,2001K1,3.1
7279,Hele landet,Menn,16-19 år,Sykefraværsprosent,2001K2,2.8


In [78]:
margin = 1
fig_3 = px.scatter(utv, x="alder", y="value", 
           animation_frame="kvartal", color='kjønn', 
           range_y=[-margin,utv['value'].max() + margin])
fig_3

In [79]:
utv = df[(df['statistikkvariabel'] == 'Sykefraværsdagsverk') 
         & (df['region'] == 'Hele landet')
         & (df['alder'] == '16-69 år')
         & (df['kjønn'] == 'Begge kjønn')]

trace1 = go.Bar(x=utv["kvartal"], y=utv["value"])

In [80]:
utv = df[(df['statistikkvariabel'] == 'Sykefraværsprosent') 
         & (df['region'] == 'Hele landet')
         & (df['alder'] == '16-69 år')
         & (df['kjønn'] == 'Begge kjønn')]

trace2 = go.Scatter(x=utv["kvartal"], y=utv["value"])

In [81]:
utv = df[(df['statistikkvariabel'] == 'Sykefraværsprosent, prosentpoeng endring fra året før') 
         & (df['region'] == 'Hele landet')
         & (df['alder'] == '16-69 år')
         & (df['kjønn'] == 'Begge kjønn')]
utv.head()

trace3 = go.Scatter(x=utv["kvartal"], y=utv["value"])

In [82]:
utv = df[(df['statistikkvariabel'] == 'Lønnstakere med sykefravær i prosent av arbeidstakere i alt') 
         & (df['region'] == 'Hele landet')
         & (df['alder'] == '16-69 år')
         & (df['kjønn'] == 'Begge kjønn')]
utv.head()

trace4 = go.Scatter(x=utv["kvartal"], y=utv["value"])

In [83]:
from plotly import tools

fig_2 = tools.make_subplots(rows=2, cols=2,
      subplot_titles=('Sykefraværsdagsverk',
                      'Sykefraværsprosent',
                      'Endring fra året før',
                      'Andel med sykefravær'))

fig_2.append_trace(trace1, 1, 1)
fig_2.append_trace(trace2, 1, 2)
fig_2.append_trace(trace3, 2, 1)
fig_2.append_trace(trace4, 2, 2)

fig_2['layout'].update(height=600, width=900, title='', showlegend=False)

go.FigureWidget(fig_2)

This is the format of your plot grid:
[ (1,1) x1,y1 ]  [ (1,2) x2,y2 ]
[ (2,1) x3,y3 ]  [ (2,2) x4,y4 ]



FigureWidget({
    'data': [{'type': 'bar',
              'uid': 'e23a0fb8-6c1a-4db0-940f-b00fd9bf62a5',
     …

In [84]:
fig_4 = tools.make_subplots(rows=2, cols=2, specs=[[{}, {}], [{'colspan': 2}, None]],
                          subplot_titles=('Sykefraværsprosent','Endring fra året før', 'Sykefraværsdagsverk'))

fig_4.append_trace(trace2, 1, 1)
fig_4.append_trace(trace3, 1, 2)
fig_4.append_trace(trace1, 2, 1)

fig_4['layout'].update(height=600, width=900, title='', showlegend=False)

go.FigureWidget(fig_4)

This is the format of your plot grid:
[ (1,1) x1,y1 ]  [ (1,2) x2,y2 ]
[ (2,1) x3,y3           -      ]



FigureWidget({
    'data': [{'type': 'scatter',
              'uid': '0c76b535-3325-48cf-b02c-79edf664f98f',
 …

## Create Datapackage

In [85]:
metadata = {
'store': 'gs',
'host': 'https://raw.githubusercontent.com/datasett/nav-examples/master/',
'title': 'Dashboard simple demo',
'readme': '',
'license':'MIT',
'accessRights':'Open',
'auth': 'NAV',
'description':'Dashboard simple demo',
'name':'Dashboard simple demo',
'source':'NAV',
'keywords':['dashboard, demo'],
'provenance':'NAV',
'publisher': 'NAV',
'project': 'odata', 
'user':'nav-examples',
'bucket': 'dataparcel',
}

In [86]:
dp = dv.Datapackage(metadata)

### Add views

In [87]:
periode = utv['kvartal'].max()
sykefraværsprosent = utv[utv['kvartal'] == periode]['statistikkvariabel']
sykefraværsprosent

449    Lønnstakere med sykefravær i prosent av arbeid...
Name: statistikkvariabel, dtype: object

In [88]:
trace2 = go.Scatter(x=utv["kvartal"], y=utv["value"])

desc = """
Sykefraværsprosent: **5.6**
"""

dp.add_view(
    spec_type='plotly',
    name='Sykefravær',
    title='',
    description =desc,
    spec= plio.to_json(fig_4),
    resources=''
)

In [89]:
dp.add_view(
    spec_type='plotly',
    name='Sykefravær',
    title='',
    description ='',
    spec= plio.to_json(fig_2),
    resources=''
)

In [90]:
dp.add_view(
    spec_type='plotly',
    name='Sykefravær',
    title='',
    description ='',
    spec= plio.to_json(fig_3),
    resources=''
)

In [91]:
import os
os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/users/b149899/projects/binder/binder/keys/mesiqi.json'


## Save data and publish elastic search index entry

In [92]:
#GOOGLE_APPLICATION_CREDENTIALS environment variable must be defined before initializing the client
client = dv.Client() 
client.publish(dp)

gs
2019-06-07T11:17:57.707576: B149899 <class 'dataverk.connectors.google_storage.GoogleStorageConnector'>: String (format: json) written to https://storage.googleapis.com/dataparcel/ba7d6370c997eb352fa313d7a055b1a1/datapackage.json
2019-06-07T11:17:58.212576: B149899 <class 'dataverk.connectors.elasticsearch.ElasticsearchConnector'>: Document ba7d6370c997eb352fa313d7a055b1a1 of type odata indexed to elastic index: odata.
