# Green Turtle case

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from os import path
plt.style.use('ggplot')

In [None]:
# Pas data_dir aan naar de locatie op jouw eigen computer!   
# Voor Windows gebruikers bijvoorbeeld:

data_dir = r'C:\Users\pmarres\Documents\projects\python_cursus_202102\data'

infile_employees = path.join(data_dir, 'werknemers_GreenTurtle.xlsx')
infile_anw = path.join(data_dir, 'anw_premie2020.csv')
infile_wia = path.join(data_dir, 'wia_premie2020.csv')

# Linux & MacOS gebruikers: slashes forward i.p.v. backward, raw string niet nodig, bijvoorbeeld 
# infile_employees = home/pmarres/Documents/projects/python_cursus/data/werknemers_GreenTurtle.xlsx'


### A. Inlezen data

In [None]:
employees = pd.read_excel(infile_employees, sheet_name='medewerkers')
anw_tabel = pd.read_csv(infile_anw, sep='|')
wia_tabel = pd.read_csv(infile_wia, sep=',')

### B. Verkennen data

In [None]:
cols = ['Personeelsnummer', 'Voornaam', 'Achternaam', 'Geboortedatum', 'Geslacht', 'Fulltime_salaris']
ddf = employees[cols].set_index('Personeelsnummer').head(5)
ddf['Fulltime_salaris'] = round(ddf.Fulltime_salaris,2)
ddf

In [None]:
# deelnemerbestand: toon eerste 7 regels
# Ga je gang! Tip: gebruik functie .head()

In [None]:
# deelnemersbestand: summary stats
employees.describe()

In [None]:
# Histogram van Geboortejaar met blauwe balkjes
employees['Geboortejaar'] = [x.year for x in employees.Geboortedatum]
employees.Geboortejaar.plot(kind='hist', color='blue', edgecolor='white', title='Geboortejaar')

In [None]:
# Histogram van aantal jaar in dienst (met groene balkjes)
employees['Jaar_in_dienst'] = [x.year for x in employees.Datum_in_dienst]
employees.Jaar_in_dienst.plot(kind='hist', color='green',
                              edgecolor='white',title='Jaar in dienst',
                              bins=range(2000, 2021), xticks=range(2000, 2021, 5))

In [None]:
# Histogram van salaris (met paarse balkjes)
# Ga je gang! 

In [None]:
# Piechart van Geslacht
employees.Geslacht.value_counts().plot(kind='pie')

In [None]:
# Piechart van Burgelijke staat
# Ga je gang!

In [None]:
# grafiekje ANW premietabel
anw_tabel.set_index('jaar').dekking_15700.plot(kind='line', title='ANW premie per maand')

In [None]:
# Grafiekje WIA premietabel
# Ga je gang!

### C. Beantwoording vragen vanuit HR


In [None]:
# Welke medewerkers worden dit jaar 65 jaar?
employees['geboortejaar'] = [x.year for x in employees.Geboortedatum]
employees[employees.geboortejaar==1955]

In [None]:
# Welke medewerkers vieren dit jaar hun 10-jarig jubileum bij de zaak?
# Ga je gang!

In [None]:
# Wat is de top-5 van meest voorkomende achternamen?
employees.Achternaam.value_counts()[:5]

In [None]:
# Wat is de top-10 van meest voorkomende plaatsnamen?
# Ga je gang! 

In [None]:
# wat is het gemiddelde en maximale salaris van mannen en vrouwen?
employees.groupby('Geslacht')['Fulltime_salaris'].agg(['mean', 'max'])

In [None]:
# Hoe varieert het salaris naar geslacht?
employees.groupby('Geslacht')['Fulltime_salaris'].plot(kind='density', legend=True)

In [None]:
# wat is het gemiddelde, minimale en maximale salaris naar Burgelijke staat?
# Ga je gang! 

In [None]:
# Hoe varieert het salaris naar Burgelijke staat?
# Ga je gang! 

### D. Beantwoorden vragen vanuit Finance

In [None]:
# Bereken ANW premie 2020 
# (let op: alleen indien gehuwd of samenwonend met notariele akte)

# koppel ANW premietabel aan medewerkersbestand
merged = employees.merge(anw_tabel, right_on='jaar', left_on='geboortejaar')

# bereken ANW premie
heeft_dekking = employees.Burgerlijke_staat.isin(['gehuwd', 'met_akte'])
merged['premie_anw'] = 12 * heeft_dekking * merged.dekking_15700
print('De ANW premie bedraagt:')
merged.premie_anw.sum().round(2)

In [None]:
# Bereken WIA premie 2020

# Formule:
# ft_grondslag = MAX(0, ft_salaris -/- WIAloongrens)
# premie = 80% * premie% * PT% * ft_grondslag
# De WIA-loongrens is per 1 januari 2020 € 57.232

# koppel WIA premietabel aan medewerkersbestand
merged = employees.merge(wia_tabel, right_on='geboortejaar', left_on='geboortejaar')
merged['ft_grondslag'] =  np.where(merged.Fulltime_salaris > 57232, merged.Fulltime_salaris - 57232, 0) 

# Ga je gang! 