# IKKE I BRUK

# Automatiseringsgrad Alderpensjon

### Oppskrift for å hente datafil
- Åpne NAV applikasjoner > Datavarehus
- Velg Saker og oppgaver > Sak Pesys > Kravbehandlingsprosess
- Åpne "SAK140 Pesys saksstatistikk"
- Eksporter rapporter. Velg kun Totalrapport, filtype CSV-arkiv.
- Last opp filen til jupyter, for eksempel via onedrive (https://navno-my.sharepoint.com/)

In [None]:
#import zipfile
#with zipfile.ZipFile("pensjon-data-analyse/data/SAK140_Pesys_saksstatistikk._Tidsserie.zip","r") as zip_ref:
#    zip_ref.extractall("pensjon-data-analyse/data/")

In [None]:
import pandas as pd
import operator
import numpy as np
import unidecode

In [None]:
# Read file
# home directory might change
df_file = pd.read_csv("../data/Totalrapport_03-22.csv").drop([0,1], axis=0).drop("Periode kjørt:  2021 mnd 01 - 2022 mnd 02", axis=1).reset_index(drop=True)

In [None]:
df_file.head()

In [None]:
cols = df_file.columns.array
for i in range(len(cols)):
    cols[i] = "_".join(cols[i].split(" "))
    cols[i] = "_".join(cols[i].split("-"))
    cols[i] = "Aa".join(cols[i].split("Å"))
    cols[i] = "aa".join(cols[i].split("å"))
    cols[i] = "oe".join(cols[i].split("ø"))    
    cols[i] = "".join(cols[i].split("("))
    cols[i] = "".join(cols[i].split(")"))
df_file.columns = cols

In [None]:
df_file.head()

In [None]:
# Antall rader (flere saker per rad) per stønadsområde
#df_file.Stønadsområde.value_counts()

# Forbered data

In [None]:
def filter_df(df, col_name: str, relate, field: str):
    return df[relate(df[col_name], field)]

def clean_numbers(x):
    if isinstance(x, str):
        # replace non-ascii characters with ascii counterpart
        x = unidecode.unidecode(x)
        if "%" in x:
            tmp = x[:-2]
            x = str(float(tmp)/100)
        if "-" in x:
            x = "0"
        return "".join(x.split(" "))
    if pd.isna(x):
        return ""
    else:
        return str(x)

In [None]:
#Sett tallkolonner til numerisk type
numeric_cols = df_file.columns[15:]
for col in numeric_cols:
    df_file.loc[:,col] = df_file[col].apply(lambda x: clean_numbers(x))
    df_file.loc[:,col] = df_file[col].apply(pd.to_numeric)

In [None]:
df_file.head()

In [None]:
#project_id = "pensjon-saksbehandli-prod-1f83"
project_id = "pensjon-saksbehandli-dev-cb76"
dataset_id = "sak140"
table_id = "sak140-saksstatistikk"

destination_table = f'{project_id}.{dataset_id}.{table_id}'

In [None]:
df_file.to_gbq(
    project_id = project_id,
    destination_table=destination_table,
    if_exists='replace', 
    location='europe-north1'
)

In [None]:
print(df_file.shape)
# Fjern saker opprettet av batch
df_no_batch = filter_df(df_file, "Opprettet av batch", operator.eq, "Ikke opprettet av batch")
print(df_no_batch.shape)
# Velg kun førstegangsbehandling
#df_forstegang = filter_df(df_no_batch, "Sakstype Topp", operator.eq, "Førstegangsbehandling")
#print(df_forstegang.shape)
# Alderspensjon
ytelse = "Alderspensjon"
df_alderspensjon = filter_df(df_no_batch, "Stønadsområde", operator.eq, ytelse)
print(df_alderspensjon.shape)

In [None]:
df_alderspensjon.head()

In [None]:
df_alderspensjon.loc[:,["År-måned", "Krav automatgrad", "Vedtak automatgrad", "Utenlandssak", "Sakstype topp"]] = df_alderspensjon[["År-måned", "Krav automatgrad", "Vedtak automatgrad", "Utenlandssak", "Sakstype topp"]].astype("category")

In [None]:
# Gruppér på interessante variabler
df_ap_grouped = df_alderspensjon.groupby(["År-måned", "Sakstype topp", "Krav automatgrad", "Vedtak automatgrad", "Utenlandssak"], as_index=False)

In [None]:
df_ap = df_ap_grouped["Antall produksjon"].sum().sort_values(
    ["År-måned", "Sakstype topp", "Krav automatgrad", "Vedtak automatgrad", "Utenlandssak"]
).reset_index(drop=True)

In [None]:
# Funksjon som regner ut totalt antall saker per dag og andel per gruppering
def add_total_and_andel(df):
    df = pd.merge(left=df, 
                  right=df.groupby("År-måned", as_index=False)["Antall produksjon"].sum(),
                  how="inner", 
                  on="År-måned", 
                  suffixes=("", " totalt"))
    df["Andel"] = df["Antall produksjon"] / df["Antall produksjon totalt"]
    return df

In [None]:
df_ap = add_total_and_andel(df_ap)

In [None]:
df_ap

In [None]:
df_ap["Krav automatgrad"].value_counts()

# Utgangspunkt Alderspensjon

# Plotting

In [None]:
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots

In [None]:
# Filtre som funker på df_ap
#_selvbetjent = df_ap["Selvbetjening"] == "Selvbetjent"
_innland = df_ap["Utenlandssak"] == "Nasjonal"
_autokrav = df_ap["Krav automatgrad"] == "Automatisk"
_autovedtak = df_ap["Vedtak automatgrad"] == "Automatisk"

In [None]:
# Angi farger for ulik grad av automatisering
automatiserings_colors = px.colors.qualitative.Set1[2::-1]

In [None]:
def plot_automatisering1(df, krav_vedtak, box_color=px.colors.qualitative.Pastel[0]):
    '''
    df: en verdi per måned og automatiseringsgrad
    box_color: Farge på boxplot
    fig: Box for antall saker, line for automatiseringsgrad
    '''
    df_tot = df.groupby("År-måned", as_index=False)["Antall produksjon"].sum()
    
    _automatisk = df[krav_vedtak] == "Automatisk"
    _manuell = df[krav_vedtak] == "Manuell"
    
    fig = make_subplots(specs=[[{"secondary_y": True}]])
    
    fig.add_trace(go.Bar(x=df_tot["År-måned"], y=df_tot["Antall produksjon"], 
                         name="Antall saker", marker_color=box_color), 
                  secondary_y=False)
    
    fig.add_trace(go.Scatter(x=df[_automatisk]["År-måned"], y=df[_automatisk]["Andel"], 
                             name="Automatisk", mode="lines+markers",
                             line={'dash': 'solid', 'color': 'black'}),           
                  secondary_y=True)
    
#    fig.add_trace(go.Scatter(x=df[~_automatisk & ~_manuell]["År-måned"], y=df[~_automatisk & ~_manuell]["Andel"], 
#                             name="Del-automatisk", mode="lines",
#                             line={'dash': 'solid', 'color': 'grey'}), 
#                  secondary_y=True)
    
    fig.update_yaxes(title_text="Andel automatisert", secondary_y=True, range=[0,1], tickformat='.0%')
    fig.update_yaxes(title_text="Antall saker", range=[0,max(df_tot["Antall produksjon"])*1.1], secondary_y=False)
    fig.layout.yaxis2.showgrid = False
    fig.update_layout(
        autosize=False,
        width=1300,
        height=500,)
    return fig

In [None]:
def plot_automatisering2(df):
    '''
    df: en verdi per måned, automatiseringsgrad
    fig: Stacked box for automatiseringsgrad, line for totalt antall
    '''
    df_tot = df.groupby("År-måned", as_index=False)["Antall produksjon"].sum()
    
    _automatisk = df["Automatiseringsgrad"] == "Automatisk"
    _manuell = df["Automatiseringsgrad"] == "Manuell"
    
    fig = make_subplots(specs=[[{"secondary_y": True}]])
    
    fig.add_trace(go.Scatter(x=df_tot["År-måned"], y=df_tot["Antall produksjon"], mode="lines", marker_color="rgb(0,0,0)", name="Totalt antall saker"), secondary_y=True)
    
    fig.add_trace(go.Bar(x=df[_automatisk]["År-måned"], y=df[_automatisk]["Andel"], marker_color=automatiserings_colors[0], name="Automatisk"), secondary_y=False)
    fig.add_trace(go.Bar(x=df[~_automatisk & ~_manuell]["År-måned"], y=df[~_automatisk & ~_manuell]["Andel"], marker_color=automatiserings_colors[1], name="Del-automatisk"), secondary_y=False)
    fig.add_trace(go.Bar(x=df[_manuell]["År-måned"], y=df[_manuell]["Andel"], marker_color=automatiserings_colors[2], name="Manuell"), secondary_y=False)
    
    fig.update_layout(yaxis_tickformat = '.0%', barmode='stack')
    fig.update_yaxes(title_text="Andel", secondary_y=False)
    fig.update_yaxes(title_text="Antall saker", range=[0,max(df_tot["Antall produksjon"]*1.1)], secondary_y=True)
    
    return fig

In [None]:
def plot_automatisering_subplots(df_list, titles, box_color=px.colors.qualitative.Pastel[0]):
    '''
    df: en verdi per måned og automatiseringsgrad
    box_color: Farge på boxplot
    fig: Box for antall saker, line for automatiseringsgrad
    '''
    N = len(df_list)
    M = len(df_list[0])
    fig = make_subplots(rows=N, cols=M, specs=[[{"secondary_y": True} for i in range(N*M)]], subplot_titles=titles)
    showlegend = True
    for i in range(N):
        for j in range(M):
            if i+j > 0:
                showlegend = False
            df = df_list[i][j]
            df_tot = df.groupby("År-måned", as_index=False)["Antall produksjon"].sum()

            _automatisk = df["Automatiseringsgrad"] == "Automatisk"
            _manuell = df["Automatiseringsgrad"] == "Manuell"
    
            fig.add_trace(go.Bar(x=df_tot["År-måned"], y=df_tot["Antall produksjon"], 
                                 name="Antall saker", legendgroup="Antall saker", showlegend=showlegend, marker_color=box_color),
                          row=i+1, col=j+1, secondary_y=False)

            fig.add_trace(go.Scatter(x=df[_automatisk]["År-måned"], y=df[_automatisk]["Andel"], 
                                     name="Automatisk", legendgroup="Automatisk", showlegend=showlegend, mode="lines+markers",
                                     line={'dash': 'solid', 'color': 'black'}),
                          row=i+1, col=j+1, secondary_y=True)
            
            fig.add_trace(go.Scatter(x=df[~_automatisk & ~_manuell]["År-måned"], y=df[~_automatisk & ~_manuell]["Andel"], 
                                     name="Del-automatisk", legendgroup="Del-automatisk", showlegend=showlegend, mode="lines",
                                     line={'dash': 'solid', 'color': 'grey'}), 
                          row=i+1, col=j+1, secondary_y=True)
    
            fig.update_yaxes(title_text="Andel automatisert", secondary_y=True, range=[0,1], tickformat='.0%', row=i+1, col=j+1)
            fig.update_yaxes(title_text="Antall saker", range=[0,max(df_tot["Antall produksjon"])*1.1], secondary_y=False, row=i+1, col=j+1)
    
    fig.layout.yaxis2.showgrid = False
    fig.update_layout(
        autosize=False,
        width=1300,
        height=500,)
    return fig

## Total automatiseringsgrad

In [None]:
#krav_vedtak = "Krav automatgrad"
krav_vedtak = "Vedtak automatgrad"
df_auto = df_ap.groupby(["År-måned", krav_vedtak], as_index=False)["Antall produksjon"].sum()
df_auto = add_total_and_andel(df_auto)

In [None]:
fig_automatisering_total1 = plot_automatisering1(df_auto, krav_vedtak)
fig_automatisering_total1.show()

## Automatisering på selvbetjente saker

In [None]:
df_selvbetjent = df_ap[_selvbetjent].groupby(["År-måned", "Automatiseringsgrad"], as_index=False)[["Antall produksjon"]].sum()
df_selvbetjent = add_total_and_andel(df_selvbetjent)

#fig_selvbetjent = px.bar(df_selvbetjent, x="År-måned", y="Andel", color="Automatiseringsgrad", color_discrete_sequence=automatiserings_colors)
#fig_selvbetjent.update_layout(yaxis_tickformat = '.0%')
#fig_selvbetjent.show()

In [None]:
fig_automatisering_selvbetjent1 = plot_automatisering1(df_selvbetjent)
fig_automatisering_selvbetjent1.show()

## Automatisering på ikke selvbetjente saker

In [None]:
df_ikke_selvbetjent = df_ap[~_selvbetjent].groupby(["År-måned", "Automatiseringsgrad"], as_index=False)[["Antall produksjon"]].sum()
df_ikke_selvbetjent = add_total_and_andel(df_ikke_selvbetjent)

In [None]:
fig_automatisering_ikke_selvbetjent1 = plot_automatisering1(df_ikke_selvbetjent)
fig_automatisering_ikke_selvbetjent1.show()

In [None]:
titles = ('Selvbetjent', 'Ikke selvbetjent')
fig_automatisering_selvbetjening = plot_automatisering_subplots([[df_selvbetjent, df_ikke_selvbetjent]], titles)
fig_automatisering_selvbetjening.show()

## Automatiseringsgrad Utlandstilsnitt

In [None]:
df_automatisering_innland = df_ap[_innland].groupby(["År-måned", "Automatiseringsgrad"], as_index=False)["Antall produksjon"].sum()
df_automatisering_innland = add_total_and_andel(df_automatisering_innland)

In [None]:
df_automatisering_utland = df_ap[~_innland].groupby(["År-måned", "Automatiseringsgrad"], as_index=False)["Antall produksjon"].sum()
df_automatisering_utland = add_total_and_andel(df_automatisering_utland)

In [None]:
fig_automatisering_utlandstilsnitt = plot_automatisering_subplots([[df_automatisering_innland, df_automatisering_utland]], titles=["Innland", "Utland"])
fig_automatisering_utlandstilsnitt.show()

# Selvbetjeningsgrad

In [None]:
def plot_selvbetjening1(df, box_color=px.colors.qualitative.Pastel[2]):

    df_tot = df.groupby("År-måned", as_index=False)["Antall produksjon"].sum()
    
    _selvbetjent = df["Selvbetjening"] == "Selvbetjent"
    
    fig = make_subplots(specs=[[{"secondary_y": True}]])
    
    fig.add_trace(go.Bar(x=df_tot["År-måned"], y=df_tot["Antall produksjon"], 
                         name="Antall saker", marker_color=box_color), 
                  secondary_y=False)
    
    fig.add_trace(go.Scatter(x=df[_selvbetjent]["År-måned"], y=df[_selvbetjent]["Andel"], 
                             name="Selvbetjening", mode="lines+markers",
                             line={'dash': 'solid', 'color': 'black'}),
                  
                  secondary_y=True)
    
    fig.update_yaxes(title_text="Andel selvbetjening", secondary_y=True, range=[0,1], tickformat='.0%')
    fig.update_yaxes(title_text="Antall saker", range=[0,max(df_tot["Antall produksjon"])*1.1], secondary_y=False)
    fig.layout.yaxis2.showgrid = False
    fig.update_layout(
        autosize=False,
        width=1300,
        height=500,)    
    return fig

In [None]:
def plot_selvbetjening2(df):
    
    df_tot = df.groupby("År-måned", as_index=False)["Antall produksjon"].sum()
    
    _selvbetjent = df["Selvbetjening"] == "Selvbetjent"
    
    fig = make_subplots(specs=[[{"secondary_y": True}]])
    
    fig.add_trace(go.Scatter(x=df_tot["År-måned"], y=df_tot["Antall produksjon"], mode="lines", marker_color="rgb(0,0,0)", name="Totalt antall saker"), secondary_y=True)
    
    fig.add_trace(go.Bar(x=df[_selvbetjent]["År-måned"], y=df[_selvbetjent]["Andel"], marker_color=automatiserings_colors[0], name="Selvbetjent"), secondary_y=False)
    fig.add_trace(go.Bar(x=df[~_selvbetjent]["År-måned"], y=df[~_selvbetjent]["Andel"], marker_color=automatiserings_colors[2], name="Ikke selvbetjent"), secondary_y=False)
    
    fig.update_layout(yaxis_tickformat = '.0%', barmode='stack')
    fig.update_yaxes(title_text="Andel selvbetjening", secondary_y=False)
    fig.update_yaxes(title_text="Antall saker", range=[0,max(df_tot["Antall produksjon"])*1.1], secondary_y=True)
    
    return fig

In [None]:
def plot_selvbetjening_subplots(df_list, titles, box_color=px.colors.qualitative.Pastel[2]):
    '''
    '''
    N = len(df_list)
    M = len(df_list[0])
    fig = make_subplots(rows=N, cols=M, specs=[[{"secondary_y": True} for i in range(N*M)]], subplot_titles=titles)
    showlegend = True
    for i in range(N):
        for j in range(M):
            if i+j > 0:
                showlegend = False
            df = df_list[i][j]
            df_tot = df.groupby("År-måned", as_index=False)["Antall produksjon"].sum()

            _selvbetjent = df["Selvbetjening"] == "Selvbetjent"
            
            fig.add_trace(go.Bar(x=df_tot["År-måned"], y=df_tot["Antall produksjon"], 
                         name="Antall saker", legendgroup="Antall saker", showlegend=showlegend, marker_color=box_color), 
                  row=i+1, col=j+1, secondary_y=False)
    
            fig.add_trace(go.Scatter(x=df[_selvbetjent]["År-måned"], y=df[_selvbetjent]["Andel"], 
                             name="Selvbetjening", legendgroup="Selvbetjening", showlegend=showlegend, mode="lines+markers",
                             line={'dash': 'solid', 'color': 'black'}),
                  row=i+1, col=j+1, secondary_y=True)
            
            fig.update_yaxes(title_text="Andel selvbetjening", secondary_y=True, range=[0,1], tickformat='.0%', row=i+1, col=j+1)
            fig.update_yaxes(title_text="Antall saker", range=[0,max(df_tot["Antall produksjon"])*1.1], secondary_y=False, row=i+1, col=j+1)
    
    fig.layout.yaxis2.showgrid = False
    fig.update_layout(
        autosize=False,
        width=1300,
        height=500,)
    return fig

## Total selvbetjeningsgrad

In [None]:
df_andel_selvbetjening = df_ap.groupby(["År-måned", "Selvbetjening"], as_index=False)["Antall produksjon"].sum()
df_andel_selvbetjening = add_total_and_andel(df_andel_selvbetjening)

In [None]:
fig_selvbetjening_total1 = plot_selvbetjening1(df_andel_selvbetjening)
fig_selvbetjening_total1.show()

## Selvbetjening innland

In [None]:
df_selvbetjening_innland = df_ap[_innland].groupby(["År-måned", "Selvbetjening"], as_index=False)["Antall produksjon"].sum()
df_selvbetjening_innland = add_total_and_andel(df_selvbetjening_innland)

## Selvbetjening utland

In [None]:
df_selvbetjening_utland = df_ap[~_innland].groupby(["År-måned", "Selvbetjening"], as_index=False)["Antall produksjon"].sum()
df_selvbetjening_utland = add_total_and_andel(df_selvbetjening_utland)

In [None]:
fig_selvbetjening_utlandstilsnitt = plot_selvbetjening_subplots([[df_selvbetjening_innland, df_selvbetjening_utland]], ["Innland", "Utland"])
fig_selvbetjening_utlandstilsnitt.show()

In [None]:
innledning = f"Statistikk på automatiserings- og selvbetjeningsgrad for førstegangsbehandling av {ytelse}. Data er basert på rapporten PSAK120. Saker opprettet av batch er eksludert."

In [None]:
from datastory import DataStory

In [None]:
ds = DataStory(f"Automatiserings- og Selvbetjeningsgrad for {ytelse}")

ds.markdown(innledning)

ds.header("Automatiseringsgrad", level=1)
ds.markdown("Automatiseringsgrad på alle nye saker. Del-automatisk henviser til saker hvor deler av saksbehandlingen ble gjort automatisk.")
ds.plotly(fig_automatisering_total1.to_json())

ds.header("Automatiseringsgrad selvbetjening", level=2)
ds.plotly(fig_automatisering_selvbetjening.to_json())

ds.header("Automatiseringsgrad utlandstilsnitt", level=2)
ds.plotly(fig_automatisering_utlandstilsnitt.to_json())

ds.header("Selvbetjeningsgrad", level=1)
ds.markdown("Selvbetjeningsgrad på alle nye saker.")
ds.plotly(fig_selvbetjening_total1.to_json())

ds.header("Selvbetjeningsgrad utlandstilsnitt", level=2)
ds.plotly(fig_selvbetjening_utlandstilsnitt.to_json())

In [None]:
ds.publish(url="https://nada.ekstern.dev.nav.no/api") #dev
#ds.publish(url="https://nada.intern.nav.no/api") #prod
#ds.update(url="https://nada.ekstern.dev.nav.no/api", token='1f79f29a-b9a6-48d4-8514-96a2c45ef319')