# Visualisierung der Statistiken

Hierfür werden die CSV-Dateien aus den XQuery Abfragen genutzt: Status-Bearbeiter.csv, Gesendet-Empfangen.csv, Briefstatus.csv

## Bearbeiter:innen und Briefstatus

In [None]:
import pandas as pd, numpy as np, matplotlib.pyplot as plt ,matplotlib.ticker as ticker

bearbeiter_status = pd.read_csv("/Users/Mustermann/Desktop/Status-Bearbeiter.csv", sep=";", encoding="utf-8-sig") # Datei einlesen


dfBearbeiter = bearbeiter_status.rename(columns={ '<?xml version="1.0" encoding="UTF-8"?>Nachname': 'Nachname' }) # UTF-8 Deklaration entfernen

dfBearbeiter['Bearbeiter'] = dfBearbeiter['Nachname'] + ', ' + dfBearbeiter['Vorname'] # Vor-und Nachname in einer neuen Spalte "Bearbeiter" zusammenfügen

dfClean = dfBearbeiter.drop(['Vorname', 'Nachname', 'Anzahl', 'Rolle', 'Einmal kollationierter Druckvolltext ohne Registerauszeichnung', 'Druckvolltext noch nicht zugänglich'], axis=1) # Spalten aus dem Dataframe entfernen, die nicht im Diagramm auftauchen sollen.


fig, ax = plt.subplots(figsize=(40, 20), dpi=300) # Diagrammgröße und Auflösung festlegen. 


dfClean.plot(kind="bar", ax=ax, width=1) # "bar" für horizontal, vgl. https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.plot.html


# Festlegen der Abstände auf der y-Achse (Ticks)
ax.set_xticks(range(len(dfClean)))
ax.set_xticklabels(dfClean["Bearbeiter"], rotation=45, ha='right')
ax.yaxis.set_major_locator(ticker.MultipleLocator(50))  # Ticks alle 50 Einheiten


# Werte über den Balken anzeigen (außer wenn Wert = 0)
for p in ax.patches:
    height = p.get_height()  # Höhe des Balkens (Anzahl der Briefe)
    if height > 0:  # Nur anzeigen, wenn größer als 0
        color = p.get_facecolor()  # Die Farbe des Balkens abrufen
        ax.text(
            p.get_x() + p.get_width() / 2,  # X-Position (mittig über dem Balken)
            height,  # Y-Position (direkt über dem Balken)
            int(height),  # Wert als Ganzzahl
            ha='center', va='bottom', fontsize=10, color=color  # Schriftfarbe = Balkenfarbe
        )


# Grid erstellen, das um die jeweiligen Balken eines Bearbeiters herum entstehen
for x in range(len(dfClean) + 1):  # +1, damit der letzte Balken auch eingerahmt wird
    ax.axvline(x - 0.5, color='gray', linewidth=0.8, alpha=0.5)  # Vertikale Linie an Balkengrenzen



#  Styling der Legende anpassen
plt.legend(
    title="Bearbeitungsstatus",
    title_fontsize=19,       # Schriftgröße des Titels der Legende
    borderpad=1,            # Abstand zwischen dem Inhalt der Legende und dem Rand
    borderaxespad=1.5,      # Abstand zwischen den Achsen und der Legende
    fontsize=19,            # Schriftgröße der Legende
    labelspacing=1.5,       # Abstand zwischen den Legendenbeschriftungen
    loc='upper center',       # Position der Legende
    handlelength=4,         # Länge der Handles (Symbolleisten)
    handleheight=3          # Höhe der Handles
)

plt.xlabel("Bearbeiter:in", labelpad=15, fontsize=16) # Beschriftung x-Achse
plt.ylabel("Anzahl der Briefe", labelpad=15, fontsize=16) # Beschriftung y-Achse
plt.title("Bearbeiter:in und Bearbeitungsstatus", pad=20, fontsize=20) # Beschriftung Diagrammtitel
plt.show() # Diagramm anzeigen

# Speichern des Diagramms
# fig.savefig("/Users/Mustermann/Desktop/Status-Bearbeiter_Visualisierung.png") #'fig'!

## Briefe Gesendet und Empfangen

In [None]:
import pandas as pd, numpy as np, matplotlib.pyplot as plt ,matplotlib.ticker as ticker
import os

briefe_status = pd.read_csv('/Users/Mustermann/Desktop/Gesendet-Empfangen.csv', sep=";", encoding="utf-8-sig")


dfBriefe = briefe_status.rename(columns={'<?xml version="1.0" encoding="UTF-8"?>Von Schlegel empfangen': 'Von Schlegel empfangen'}) # UTF-8 Deklaration entfernen


fig, ax = plt.subplots(figsize=(10, 6), dpi=300) # Diagrammgröße und Auflösung festlegen. 


dfBriefe.plot(kind="bar", ax=ax, width=1) # "bar" für horizontal, vgl. https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.plot.html


# Werte über die Balken schreiben
for container in ax.containers:
    for bar in container:
        # Extrahiere die Farbe des aktuellen Balkens
        color = bar.get_facecolor()
        # Werte über die Balken schreiben und die Farbe verwenden
        ax.bar_label(container, fmt="%d", label_type="edge", fontsize=12, padding=3, color=color)



ax.yaxis.set_major_locator(ticker.MultipleLocator(200))  # Ticks alle 50 Einheiten
# x-Achsen-Beschriftungen entfernen
ax.set_xticklabels([])

#  Styling der Legende anpassen
plt.legend(
    title="Sendungsstatus",
    title_fontsize=10,       # Schriftgröße des Titels der Legende
    borderpad=1,            # Abstand zwischen dem Inhalt der Legende und dem Rand
    borderaxespad=1,      # Abstand zwischen den Achsen und der Legende
    fontsize=9,            # Schriftgröße der Legende
    labelspacing=1,       # Abstand zwischen den Legendenbeschriftungen
    loc='upper right',       # Position der Legende
    handlelength=2,         # Länge der Handles (Symbolleisten)
    handleheight=1          # Höhe der Handles
)


plt.xlabel("Sendungsstatus", labelpad=15) # Beschriftung x-Achse
plt.ylabel("Anzahl der Briefe", labelpad=15) # Beschriftung y-Achse
plt.title("Schlegel als Absender und Empfänger", pad=20) # Beschriftung Diagrammtitel
plt.grid (True, linewidth=0.5, alpha=0.7, axis='y')# Gitterlinien aktivieren, nur horizontale Linien und unter den Balke
ax.set_axisbelow(True) # Legt fest, dass das Gitter hinter den Balken liegt.
plt.show() # Diagramm anzeigen

# Speichern des Diagramms
# fig.savefig("/Users/Mustermann/Desktop/Absender-Empfänger_Visualisierung.png") #'fig'!

## Briefstatus

In [None]:
import pandas as pd, numpy as np, matplotlib.pyplot as plt ,matplotlib.ticker as ticker

briefe_status2 = pd.read_csv("/Users/Mustermann/Desktop/Briefstatus.csv", sep=";", encoding="utf-8-sig")


dfBriefe2 = briefe_status2.rename(columns={'<?xml version="1.0" encoding="UTF-8"?>Status': 'Status'}) # UTF-8 Deklaration entfernen

fig, ax = plt.subplots(figsize=(10, 6), dpi=300) # Diagrammgröße und Auflösung festlegen. 


dfBriefe2.plot(kind="bar", ax=ax, width=1) # "bar" für horizontal, vgl. https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.plot.html


# Werte über die Balken schreiben
for container in ax.containers:
    for bar in container:
        # Extrahiere die Farbe des aktuellen Balkens
        color = bar.get_facecolor()
        # Werte über die Balken schreiben und die Farbe verwenden
        ax.bar_label(container, fmt="%d", label_type="edge", fontsize=12, padding=3, color=color)


ax.yaxis.set_major_locator(ticker.MultipleLocator(100))  # Ticks alle 50 Einheiten
# x-Achsen-Beschriftungen entfernen
ax.set_xticklabels([])

plt.legend(
    title="Briefstatus",
    title_fontsize=9,        # Schriftgröße des Titels der Legende
    borderpad=1,              # Abstand zwischen dem Inhalt der Legende und dem Rand
    borderaxespad=1,          # Abstand zwischen den Achsen und der Legende
    fontsize=6.8,               # Schriftgröße der Legende
    labelspacing=1,           # Abstand zwischen den Legendenbeschriftungen
    loc='upper right',        # Position der Legende
    handlelength=2,           # Länge der Handles (Symbolleisten)
    handleheight=1,           # Höhe der Handles
 
)

plt.xlabel("Briefstatus", labelpad=15) # Beschriftung x-Achse
plt.ylabel("Anzahl der Briefe", labelpad=15) # Beschriftung y-Achse
plt.title("Briefstatus", pad=20) # Beschriftung Diagrammtitel
plt.grid (True, linewidth=0.5, alpha=0.7, axis='y')# Gitterlinien aktivieren, nur horizontale Linien und unter den Balke
ax.set_axisbelow(True) # Legt fest, dass das Gitter hinter den Balken liegt.
plt.show() # Diagramm anzeigen

# Speichern eines objektorientierten Plots
# fig.savefig("/Users/Mustermann/Desktop/Briefstatus_Visualisierung.png") #'fig'!