## Zusammenführung der Beschäftigungs- und Arbeitslosenzahlen in eine einheitliche Datenmatrix

In [1]:
# Bibliotheken
import numpy as np
import pandas as pd

In [2]:
# laden und vorformatieren Daten 
df_alo = pd.read_excel("Arbeitslose_nach_BL.xlsx", index_col=0)
df_alo.rename(columns={'Gesamt': 'Insgesamt'}, inplace=True)
df_alo['Berufsgruppe'] = df_alo['Berufsgruppe'].str.strip()
df_agb = pd.read_excel("aGB_Beschäftigte_nach_BL.xlsx", index_col=0)
df_agb = df_agb.iloc[:, :7]
df_svb = pd.read_excel("SVB_Beschäftigte_nach_BL.xlsx", index_col=0)
df_svb = df_svb.iloc[:, :9]
df_svb.drop(["in Vollzeit", "in Teilzeit"], axis=1, inplace=True)

In [3]:
# erste fünf Zeilen Alo
df_alo.head()

Unnamed: 0,Bundesland,Berufsgruppe,Insgesamt,Helfer,Fachkraft,Spezialist,Experte
0,Baden-Württemberg,01 Angehörige der regulären Streitkräfte,17.0,,12.0,,5.0
1,Baden-Württemberg,"11 Land-, Tier-, Forstwirtschaftsberufe",1074.0,707.0,196.0,44.0,127.0
2,Baden-Württemberg,111 Landwirtschaft,514.0,393.0,26.0,18.0,77.0
3,Baden-Württemberg,112 Tierwirtschaft,34.0,28.0,5.0,,
4,Baden-Württemberg,113 Pferdewirtschaft,71.0,,65.0,6.0,


In [4]:
# erste fünf Zeilen agB
df_agb.head()

Unnamed: 0,Bundesland,Berufsgruppe,Insgesamt,Helfer,Fachkraft,Spezialist,Experte
0,Baden-Württemberg,Insgesamt,648869.0,299575.0,268666.0,30364.0,28086.0
1,Baden-Württemberg,"11 Land-, Tier-, Forstwirtschaftsberufe",16796.0,15214.0,1123.0,375.0,84.0
2,Baden-Württemberg,111 Landwirtschaft,14797.0,14310.0,332.0,92.0,63.0
3,Baden-Württemberg,112 Tierwirtschaft,439.0,351.0,62.0,23.0,3.0
4,Baden-Württemberg,113 Pferdewirtschaft,277.0,0.0,267.0,10.0,0.0


In [5]:
# erste fünf Zeilen svb
df_svb.head()

Unnamed: 0,Bundesland,Berufsgruppe,Insgesamt,Helfer,Fachkraft,Spezialist,Experte
0,Baden-Württemberg,Insgesamt,4778076.0,723606.0,2694078.0,678284.0,662024.0
1,Baden-Württemberg,"11 Land-, Tier-, Forstwirtschaftsberufe",24033.0,12179.0,8183.0,1916.0,1755.0
2,Baden-Württemberg,111 Landwirtschaft,14396.0,10056.0,2447.0,667.0,1226.0
3,Baden-Württemberg,112 Tierwirtschaft,864.0,466.0,161.0,224.0,13.0
4,Baden-Württemberg,113 Pferdewirtschaft,1066.0,0.0,1003.0,60.0,3.0


In [6]:
# Format der SVB Daten, entspricht dem Format der aGB Daten
df_svb.shape

(2848, 7)

In [7]:
# Format der Alo Daten
df_alo.shape

(2790, 7)

In [8]:
# Merge von SVB und agB
result = pd.merge(df_svb, df_agb, how="outer", on=["Bundesland", "Berufsgruppe"], suffixes=["_svB", "_agB"])

In [9]:
# erste fünf Zeilen
result.head()

Unnamed: 0,Bundesland,Berufsgruppe,Insgesamt_svB,Helfer_svB,Fachkraft_svB,Spezialist_svB,Experte_svB,Insgesamt_agB,Helfer_agB,Fachkraft_agB,Spezialist_agB,Experte_agB
0,Baden-Württemberg,Insgesamt,4778076.0,723606.0,2694078.0,678284.0,662024.0,648869.0,299575.0,268666.0,30364.0,28086.0
1,Baden-Württemberg,"11 Land-, Tier-, Forstwirtschaftsberufe",24033.0,12179.0,8183.0,1916.0,1755.0,16796.0,15214.0,1123.0,375.0,84.0
2,Baden-Württemberg,111 Landwirtschaft,14396.0,10056.0,2447.0,667.0,1226.0,14797.0,14310.0,332.0,92.0,63.0
3,Baden-Württemberg,112 Tierwirtschaft,864.0,466.0,161.0,224.0,13.0,439.0,351.0,62.0,23.0,3.0
4,Baden-Württemberg,113 Pferdewirtschaft,1066.0,0.0,1003.0,60.0,3.0,277.0,0.0,267.0,10.0,0.0


In [10]:
# Merge von alo und Kombination aus svb und agB
final = pd.merge(result, df_alo, how="outer", on=["Bundesland", "Berufsgruppe"])

In [11]:
# ersten 50 Zeilen der finalen Datenmatrix
final.head(50)

Unnamed: 0,Bundesland,Berufsgruppe,Insgesamt_svB,Helfer_svB,Fachkraft_svB,Spezialist_svB,Experte_svB,Insgesamt_agB,Helfer_agB,Fachkraft_agB,Spezialist_agB,Experte_agB,Insgesamt,Helfer,Fachkraft,Spezialist,Experte
0,Baden-Württemberg,Insgesamt,4778076.0,723606.0,2694078.0,678284.0,662024.0,648869.0,299575.0,268666.0,30364.0,28086.0,265261.0,117016.0,85602.0,18776.0,20232.0
1,Baden-Württemberg,"11 Land-, Tier-, Forstwirtschaftsberufe",24033.0,12179.0,8183.0,1916.0,1755.0,16796.0,15214.0,1123.0,375.0,84.0,1074.0,707.0,196.0,44.0,127.0
2,Baden-Württemberg,111 Landwirtschaft,14396.0,10056.0,2447.0,667.0,1226.0,14797.0,14310.0,332.0,92.0,63.0,514.0,393.0,26.0,18.0,77.0
3,Baden-Württemberg,112 Tierwirtschaft,864.0,466.0,161.0,224.0,13.0,439.0,351.0,62.0,23.0,3.0,34.0,28.0,5.0,,
4,Baden-Württemberg,113 Pferdewirtschaft,1066.0,0.0,1003.0,60.0,3.0,277.0,0.0,267.0,10.0,0.0,71.0,,65.0,6.0,
5,Baden-Württemberg,114 Fischwirtschaft,133.0,37.0,83.0,,,62.0,43.0,16.0,,,15.0,11.0,4.0,,
6,Baden-Württemberg,115 Tierpflege,1812.0,245.0,1520.0,5.0,42.0,383.0,147.0,236.0,0.0,0.0,289.0,223.0,65.0,,
7,Baden-Württemberg,116 Weinbau,731.0,0.0,505.0,163.0,63.0,110.0,0.0,94.0,8.0,8.0,19.0,,7.0,6.0,6.0
8,Baden-Württemberg,"117 Forst-,Jagdwirtschaft, Landschaftspflege",5031.0,1375.0,2464.0,785.0,407.0,728.0,363.0,116.0,240.0,9.0,132.0,52.0,24.0,12.0,44.0
9,Baden-Württemberg,"12 Gartenbauberufe, Floristik",34329.0,10100.0,21018.0,1636.0,1575.0,7282.0,4291.0,2793.0,139.0,59.0,2799.0,2080.0,620.0,80.0,19.0


In [12]:
# Format des finalen Datensatzes
final.shape

(2864, 17)

###### Speicherung der Daten als Excel Datei

In [13]:
# ALs Excel File speichern
final.to_excel("All_in_one.xlsx") 