In [51]:
import dataverk as dv
import plotly_express as px
import dataverk_tools.themes.nav as nav

import pandas as pd
import ipywidgets as widgets

import plotly.graph_objs as go
import plotly.io as plio
import plotly.figure_factory as ff

# Set theme

In [52]:
px.defaults.template = nav.plotly_template
px.defaults.color_continuous_scale = nav.sequential.navRodBla
px.defaults.color_discrete_sequence = nav.discrete.navColors
px.defaults.height = None

# Get data

In [53]:
resource = "https://www.nav.no/no/NAV+og+samfunn/Kunnskap/Analyser+fra+NAV/Arbeid+og+velferd/Arbeid+og+velferd/_attachment/538358?_download=true&_ts=1632b0c00c8"
df = pd.read_excel(resource, None)
df.keys()

odict_keys(['Figur1', 'Figur 2', 'Tabell 1', 'Tabell 2', 'Tabell 3', 'Tabell 4', 'Figur 3', 'Figur 4', 'Figur 5', 'Figur 6', 'Figur 7', 'Figur 8', 'Tabell 5 ', 'Tabell 6', 'Tabell 7', 'Tabell 8', 'Figur 9', 'Figur 10'])

# Transformations

In [54]:
df_1 = pd.read_excel(resource, sheet_name='Figur1', header=2, nrows=21, encoding='utf8')
df_1.drop(columns=[df_1.columns[3]], axis=1, inplace=True)
df_1.drop(18, axis=0, inplace=True)
df_1.drop(19, axis=0, inplace=True)
df_1.columns = ['Fylke','Mislyktes','Lavere komp', 'Sum']

In [55]:
df_1.head()

Unnamed: 0,Fylke,Mislyktes,Lavere komp,Sum
0,Nordland,14.1,8.0,22.1
1,Akershus,13.1,7.8,20.9
2,Finnmark,10.6,10.0,20.6
3,Østfold,14.1,5.3,19.4
4,Troms,11.3,8.0,19.3


In [56]:
df_1_m = df_1[["Fylke","Mislyktes","Lavere komp"]].melt(id_vars=["Fylke"], var_name="Rekruttering", value_name="Prosent")
df_1_m.head()

Unnamed: 0,Fylke,Rekruttering,Prosent
0,Nordland,Mislyktes,14.1
1,Akershus,Mislyktes,13.1
2,Finnmark,Mislyktes,10.6
3,Østfold,Mislyktes,14.1
4,Troms,Mislyktes,11.3


In [57]:
fig_1 = px.bar(df_1_m, x="Fylke", y="Prosent", color="Rekruttering", barmode="stack")
fig_1

In [58]:
df_2 = pd.read_excel(resource, sheet_name='Figur 2', header=2, nrows=21)
df_2.drop(columns=[df_2.columns[3]], axis=1, inplace=True)
df_2.drop(18, axis=0, inplace=True)
df_2.drop(19, axis=0, inplace=True)
df_2.columns = ['Fylke','Få søkere','Annet', 'Sum']

In [59]:
df_2.head()

Unnamed: 0,Fylke,Få søkere,Annet,Sum
0,Nordland,18.9,3.2,22.1
1,Akershus,16.5,4.3,20.8
2,Finnmark,17.5,2.8,20.3
3,Troms,16.5,2.9,19.4
4,Østfold,14.6,4.7,19.3


In [21]:
df_2_m = df_2[["Fylke","Få søkere","Annet"]].melt(id_vars=["Fylke"], var_name="Rekruttering", value_name="Prosent")
df_2_m.head()

Unnamed: 0,Fylke,Rekruttering,Prosent
0,Nordland,Få søkere,18.9
1,Akershus,Få søkere,16.5
2,Finnmark,Få søkere,17.5
3,Troms,Få søkere,16.5
4,Østfold,Få søkere,14.6


In [22]:
fig_2 = px.bar(df_2_m, x="Fylke", y="Prosent", color="Rekruttering", barmode="stack")
fig_2

In [61]:
df_4 = pd.read_excel(resource, sheet_name='Figur 4', header=2, nrows=21).rename_axis('År').reset_index()

data = [ go.Bar(
     x=df_4['År'], 
     y=df_4['Nettoandel virksomheter som forventer økt bemanning de neste 12 månedene, v. a.'],
     name='Nettoandel virksomheter som forventer økt bemanning'
),
   go.Scatter(
     x=df_4['År'], 
     y=df_4['Sysselsettingsvekst (NR), h.a.'],
     name='Sysselsettingsvekst (NR)',
     yaxis='y2'
),
    go.Scatter(
     x=df_4['År'], 
     y=df_4['Sysselsettingsvekst (AKU), h. a.'],
     name='Sysselsettingsvekst (AKU)',
     yaxis='y2'
)
]

layout = go.Layout(
    title='Nettoandel virksomheter som forventer økt bemanning',
    legend=dict(x=0, y=-.1, orientation='h'),
    yaxis=dict(
        title='Nettoandel'
    ),
    yaxis2=dict(
        title='Sysselsettingsvekst',
        overlaying='y',
        side='right',
        rangemode='tozero'
    )
)

fig_4 = go.Figure(data,layout)

go.FigureWidget(data,layout)

FigureWidget({
    'data': [{'name': 'Nettoandel virksomheter som forventer økt bemanning',
              'typ…

In [62]:
df_5 = pd.read_excel(resource, sheet_name='Tabell 5 ', header=2)
df_5.drop(columns=[df_5.columns[0]], axis=1, inplace=True)
df_5 = df_5.rename(columns={'Unnamed: 1': 'Bransje'})
df_5.drop(24, axis=0, inplace=True)
df_5.head()

Unnamed: 0,Bransje,Mangel på arbeidskraft i antall personer,"95 % konfidens-intervall for estimert mangel , nedre grense","95 % konfidens-intervall for estimert mangel , øvre grense",NAVs stramhetsindikator,Prosentvis andel bedrifter med alvorlige rekrutteringsproblemer
0,"Jordbruk, skogbruk og fiske",350,224,517,0.603718,5.2
1,Bergverksdrift og utvinning,50,30,96,0.07891,4.6
2,Industrien,1450,1286,1582,0.688006,8.2
3,Nærings- og nytelsemidler,200,137,246,0.408651,6.1
4,Tekstil- og lærvarer,50,22,39,0.678998,5.9


In [63]:
data = [ go.Bar(
     y=df_5['Bransje'], 
     x=df_5['Mangel på arbeidskraft i antall personer'],
     name='Mangel på arbeidskraft i antall personer',
     orientation='h'
),go.Scatter(
     y=df_5['Bransje'], 
     x=df_5['NAVs stramhetsindikator'],
     name='NAVs stramhetsindikator',
     orientation='h',
     xaxis='x2',
     mode = 'markers',
),go.Scatter(
     y=df_5['Bransje'], 
     x=df_5['Prosentvis andel bedrifter med alvorlige rekrutteringsproblemer'],
     name='Prosentvis andel bedrifter med alvorlige rekrutteringsproblemer',
     orientation='h',
     xaxis='x2',
     mode = 'markers',
)
]

layout = go.Layout(
    legend=dict(x=0, y=-.2, orientation='h'),
    height=800,
     margin=dict(
        l=350,
        r=10,
        t=100,
        b=40
    ),
     xaxis=dict(
        title='Antall personer'
    ),
    xaxis2=dict(
        title='NAVs stramhetsindikator',
        overlaying='x',
        side='top',
        rangemode='tozero'
    ),
    xaxis3=dict(
        title='NAVs stramhetsindikator',
        overlaying='x',
        side='top',
        rangemode='tozero'
    )
    
)

fig_5 = go.Figure(data,layout)

go.FigureWidget(data,layout)

FigureWidget({
    'data': [{'name': 'Mangel på arbeidskraft i antall personer',
              'orientation': …

## Create Datapackage

In [64]:
readme = """
# NAV Bedriftsundersøkelsen
NAVs bedriftsundersøkelse ser på hvilke forventninger bedriftene har i forhold til sysselsettingsutviklingen det kommende året, om bedriftene har mislyktes i å rekruttere arbeidskraft de siste tre månedene og om dette skyldes for få kvalifiserte søkere på stillingene. På bakgrunn av disse svarene  estimeres en mangel på arbeidskraft for landet som helhet, for ulike regioner, samt enkeltnæringer og for ulike yrker. 
"""

#'store': 'gs'
metadata = {
'store': 'gs',
'host': 'https://raw.githubusercontent.com/datasett/nav-examples/master/',
'title': 'NAVs bedriftsundersøkelse',
'readme': readme,
'license':'MIT',
'accessRights':'Open',
'auth': 'NAV',
'description':'NAVs bedriftsundersøkelse',
'name':'NAVs bedriftsundersøkelse',
'source':'NAV',
'keywords':['bedriftsundersøkelse,sysselsetting, arbeidskraft, fylker'],
'provenance':'NAV',
'publisher': 'NAV',
'project': 'odata', 
'user':'nav-examples',
'repo': 'https://github.com/datasett/nav-examples/blob/master/bedriftsunders%C3%B8kelsen.ipynb',
'bucket': 'nav-opendata',
}

In [65]:
dp = dv.Datapackage(metadata)

### Add resource files

In [66]:
dp.add_resource(df_1,'Utfordringer med å rekruttere','Utfordringer med å rekruttere')

### Add views

In [67]:
desc = '''
### Utfordringer med å rekruttere.

Virksomheter som har mislyktes i å rekruttere arbeidskraft eller måttet ansette noen med annen eller lavere formell kompetanse enn man søkte etter, etter fylke. Prosent
'''

dp.add_view(
    spec_type='plotly',
    name='Utfordringer med å rekruttere',
    title='',
    description =desc,
    spec= plio.to_json(fig_1),
    resources=''
)

In [68]:
desc = '''
### Årsak til rekrutteringsproblemer.

 Virksomheter med rekrutteringsproblemer som skyldes for få/ingen kvalifiserte søkere eller om det er andre årsaker, etter fylke. Prosent
'''

dp.add_view(
    spec_type='plotly',
    name='Utfordringer med å rekruttere',
    title='',
    description =desc,
    spec= plio.to_json(fig_2),
    resources=''
)

In [69]:
desc = '''
### Forventninger vs Sysselsettingsvekst .

'''

dp.add_view(
    spec_type='plotly',
    name='Forventninger vs sysselsettingsvekst',
    title='',
    description ='',
    spec= plio.to_json(fig_4),
    resources=''
)

In [70]:
desc = '''
### Bransjer.

'''

dp.add_view(
    spec_type='plotly',
    name='Bransjer',
    title='',
    description ='',
    spec= plio.to_json(fig_5),
    resources=''
)

## Save data and publish elastic search index entry

In [71]:
#GOOGLE_APPLICATION_CREDENTIALS environment variable must be defined before initializing the client
client = dv.Client() 
client.publish(dp)

gs
2019-08-14T16:08:13.967401: B149899 <class 'dataverk.connectors.google_storage.GoogleStorageConnector'>: String (format: json) written to https://storage.googleapis.com/nav-opendata/ccd13e66b18f0144ebd042ec4393d83d/datapackage.json
2019-08-14T16:08:14.352908: B149899 <class 'dataverk.connectors.google_storage.GoogleStorageConnector'>: String (format: csv) written to https://storage.googleapis.com/nav-opendata/ccd13e66b18f0144ebd042ec4393d83d/resources/Utfordringer_med_%C3%A5_rekruttere.csv
2019-08-14T16:08:15.013072: B149899 <class 'dataverk.connectors.elasticsearch.ElasticsearchConnector'>: Document ccd13e66b18f0144ebd042ec4393d83d of type odata indexed to elastic index: odata.
