# Alter



In [45]:
import plotly.io as pio

# Template
infoviz_template = dict(
    layout=dict(
        template="plotly_white",
        title=dict(
            font=dict(size=20, family="Arial", weight="bold", color="black"),
            xanchor="left",  
            xref="paper",
            x=0,
            subtitle=dict(
                text="",
                font=dict(color="gray", size=13),
            ),
        ),
        xaxis=dict(
            showgrid=False,
            zerolinecolor="lightgrey",
            tickfont=dict(color="grey", size=12),
            title_font=dict(color="grey", weight="bold", size=13),
            title_standoff=15,
            ticklabelstandoff=10,
            ticklabelposition="outside bottom"
        ),
        yaxis=dict(
            showgrid=True, gridcolor="lightgrey",
            zerolinecolor="lightgrey",
            tickfont=dict(color="grey", size=12),
            title_font=dict(color="grey", weight="bold", size=13),
            title_standoff=15,
            ticklabelstandoff=10,
            ticklabelposition="outside left"
        ),
    )
)
pio.templates["infoviz"] = infoviz_template

## Import Data

In [46]:
import pandas as pd

# Datei einlesen
file_path = "data.xlsx"
sheets = pd.read_excel(file_path, sheet_name=None, engine="openpyxl")
sheets.pop(next(iter(sheets)))  # Erstes Blatt entfernen

# Altersgruppen definieren
altersgruppen = [
    "unter 18 Jahre (%)",
    "18 bis 20 Jahre (%)",
    "21 bis 23 Jahre (%)",
    "24 bis 26 Jahre (%)",
    "27 bis 29 Jahre (%)",
    "30 bis 32 Jahre (%)",
    "33 bis 35 Jahre (%)",
    "älter als 35 Jahre (%)"
]

# Jahr wählen
jahr = "2024"  
df = sheets[jahr]

# Bachelor- und Master-Spalten erkennen
bachelor_studiengaenge = df.filter(like="Bachelor").columns
master_studiengaenge = df.filter(like="Master").columns

# Absoluten Wert für jede Altersgruppe berechnen
pyramiden_data = {"Altersgruppe": [], "Bachelor (%)": [], "Master (%)": []}

for category in altersgruppen:
    row = df[(df["Variable"] == "Alter") & (df["Category"].str.contains(category, na=False, regex=False))]
    
    if not row.empty:
        # Berechnung der gewichteten Altersverteilung
        abs_bachelor = (row[bachelor_studiengaenge] / 100) * df[(df["Variable"] == "Alter") & (df["Category"] == "Anzahl")][bachelor_studiengaenge].iloc[0]
        abs_master = (row[master_studiengaenge] / 100) * df[(df["Variable"] == "Alter") & (df["Category"] == "Anzahl")][master_studiengaenge].iloc[0]

        total_abs_bachelor = abs_bachelor.sum().sum()
        total_abs_master = abs_master.sum().sum()

        total_bachelor_students = df[(df["Variable"] == "Alter") & (df["Category"] == "Anzahl")][bachelor_studiengaenge].sum().sum()
        total_master_students = df[(df["Variable"] == "Alter") & (df["Category"] == "Anzahl")][master_studiengaenge].sum().sum()

        weighted_bachelor = (total_abs_bachelor / total_bachelor_students) * 100 if total_bachelor_students > 0 else 0
        weighted_master = (total_abs_master / total_master_students) * 100 if total_master_students > 0 else 0

        pyramiden_data["Altersgruppe"].append(category)
        pyramiden_data["Bachelor (%)"].append(-weighted_bachelor)  # Negativ für linke Darstellung
        pyramiden_data["Master (%)"].append(weighted_master)  # Positiv für rechte Darstellung

# DataFrame erstellen
df_pyramide = pd.DataFrame(pyramiden_data)
df_pyramide = df_pyramide.sort_values(by="Altersgruppe", ascending=True)  # Richtige Reihenfolge

df_pyramide

Unnamed: 0,Altersgruppe,Bachelor (%),Master (%)
1,18 bis 20 Jahre (%),-24.010204,0.0
2,21 bis 23 Jahre (%),-42.586735,17.827815
3,24 bis 26 Jahre (%),-20.55102,39.874172
4,27 bis 29 Jahre (%),-4.704082,25.112583
5,30 bis 32 Jahre (%),-4.183673,5.357616
6,33 bis 35 Jahre (%),-1.72449,3.463576
0,unter 18 Jahre (%),-0.0,0.0
7,älter als 35 Jahre (%),-2.627551,6.754967


# Altersverteilung

In [63]:
import plotly.express as px

fig = px.bar(
    df_pyramide, 
    x=["Bachelor (%)", "Master (%)"], 
    y="Altersgruppe", 
    orientation="h", 
    title="Altersverteilung: <span style='color:#73c6e9'>Bachelorstudierende</span> jünger, <span style='color:#cc5b6e;'>Masterstudierende</span> älter ",
    subtitle="Ergebnisse der Studierendenbefragung 2024 im FB09",
    color_discrete_map={"Bachelor (%)": px.colors.qualitative.Safe[0], "Master (%)": px.colors.qualitative.Safe[1]},
)

# Layout-Anpassungen
fig.update_layout(
    margin=dict(l=180),
    template="infoviz",
    xaxis_title="Anteil der Studierenden (Bachelor/Master)",
    yaxis_title="",
    xaxis=dict(
        tickmode="array",
        tickvals=[-40, -30, -20, -10, 0, 10, 20, 30, 40],  # Achse zentrieren
        ticktext=["40%", "30%","20%", "10%", "0%", "10%", "20%", "30%", "40%"]
    ),
    showlegend=False
)

fig.show()