<a href="https://colab.research.google.com/github/Tefong35/TefongEugene/blob/main/plot_multiple_countplots.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:

06.05.25, 16:20 - Edmond: Ich möchte mehrere Kategoriale Variable aus einem Datensatz mit der Funktion coutplot visualisieren.

Bitte schrieb eine Funktion, um die Grafiken zusammen darzustellen. Dabei gibt die Anzahl jede Kategorie in der Darstellung. Gibt verschiedene farbe.
06.05.25, 16:20 - ChatGPT: Hier ist eine Python-Funktion, mit der du *mehrere kategoriale Variablen* aus einem DataFrame mithilfe von `seaborn.countplot` *nebeneinander visualisieren* kannst. Die Funktion erzeugt für jede Variable ein einzelnes Balkendiagramm mit *Farbvielfalt und Anzahl* je Kategorie.

---

🧾 Funktion: Mehrere Countplots nebeneinander anzeigen

```python
import seaborn as sns
import matplotlib.pyplot as plt

def plot_multiple_countplots(df, kategorische_variablen, farbpalette='Set2'):
    """
    Visualisiert mehrere kategoriale Variablen als Countplots nebeneinander.

    Parameter:
    - df: Pandas DataFrame
    - kategorische_variablen: Liste der Spaltennamen (kategorial)
    - farbpalette: z. B. 'Set2', 'husl', 'pastel', etc.
    """
    anzahl = len(kategorische_variablen)
    fig, axes = plt.subplots(1, anzahl, figsize=(5 * anzahl, 5), tight_layout=True)

    if anzahl == 1:
        axes = [axes]  # Damit iterierbar

    for i, var in enumerate(kategorische_variablen):
        sns.countplot(data=df, x=var, palette=farbpalette, ax=axes[i])
        axes[i].set_title(f'Anzahl pro {var}', fontsize=12)
        axes[i].set_ylabel('Anzahl')
        axes[i].tick_params(axis='x', rotation=45)
        for container in axes[i].containers:
06.05.25, 16:21 - ChatGPT: axes[i].bar_label(container, fmt='%d', label_type='edge')

    plt.show()
```

---

✅ Beispiel-Anwendung

```python
import pandas as pd

Beispiel-Daten
df = pd.DataFrame({
    'Beruf': ['MFA', 'Apotheke', 'Pflege', 'MFA', 'Pflege', 'Apotheke', 'Pflege'],
    'Region': ['Nord', 'Süd', 'Nord', 'West', 'Ost', 'West', 'Ost'],
    'Produkt': ['Wundpad', 'Spray', 'Spray', 'Wundpad', 'Wundpad', 'Spray', 'Spray']
})

Visualisierung
plot_multiple_countplots(df, ['Beruf', 'Region', 'Produkt'])
```

---

💡 *Hinweis:* Du kannst die Palette anpassen z. B. mit `palette='husl'`, `palette='muted'` oder `palette=sns.color_palette("tab10")`.

Möchtest du die Diagramme auch als PDF oder Bild exportieren?
06.05.25, 16:46 - Edmond: Ja
06.05.25, 16:47 - ChatGPT: Hier ist, wie du die Diagramme aus der `plot_multiple_countplots`-Funktion *als PDF oder PNG* speichern kannst:

---

🖼️ Funktion mit Exportoption erweitern

Ergänze die Funktion um einen `save_path`-Parameter und speichere das Diagramm mit `plt.savefig`:

```python
import seaborn as sns
import matplotlib.pyplot as plt

def plot_multiple_countplots(df, kategorische_variablen, farbpalette='Set2', save_path=None):
    """
    Visualisiert mehrere Countplots und speichert optional die Grafik.

    Parameter:
    - df: Pandas DataFrame
    - kategorische_variablen: Liste der Spaltennamen (kategorial)
    - farbpalette: z. B. 'Set2', 'husl', 'pastel'
    - save_path: Dateipfad für die Speicherung (z. B. 'plots.pdf' oder 'bild.png')
    """
    anzahl = len(kategorische_variablen)
    fig, axes = plt.subplots(1, anzahl, figsize=(5 * anzahl, 5), tight_layout=True)

    if anzahl == 1:
        axes = [axes]

    for i, var in enumerate(kategorische_variablen):
        sns.countplot(data=df, x=var, palette=farbpalette, ax=axes[i])
        axes[i].set_title(f'Anzahl pro {var}', fontsize=12)
        axes[i].set_ylabel('Anzahl')
        axes[i].tick_params(axis='x', rotation=45)
        for container in axes[i].containers:
06.05.25, 16:47 - ChatGPT: axes[i].bar_label(container, fmt='%d', label_type='edge')

    if save_path:
        plt.savefig(save_path, bbox_inches='tight', dpi=300)
        print(f"✅ Diagramm gespeichert unter: {save_path}")

    plt.show()
```

---

✅ Nutzung

```python
Beispiel
plot_multiple_countplots(df, ['Beruf', 'Region', 'Produkt'], save_path='nutzergrafik.pdf')
```

Diese Funktion speichert das Diagramm als *PDF, PNG oder JPG* – je nachdem, welche Dateiendung du angibst.

Möchtest du zusätzlich alle Plots in einem interaktiven HTML-Bericht speichern?
06.05.25, 16:48 - Edmond: Ja
06.05.25, 16:48 - ChatGPT: Um *mehrere Countplots als interaktiven HTML-Bericht* zu speichern, eignet sich *Plotly* in Kombination mit *Dash* oder direkt als *Plotly-Offline-HTML*. Hier zeige ich dir eine einfache Lösung mit *Plotly Express* und `plotly.io.write_html`:

---

🧾 Interaktive HTML-Visualisierung mit Plotly

📦 Benötigte Bibliotheken

```bash
pip install plotly pandas
```

---

🐍 Funktion zum Erstellen und Speichern als HTML

```python
import plotly.express as px
import pandas as pd
import plotly.io as pio

def plot_countplots_html(df, kategorische_variablen, dateiname='countplots.html'):
    """
    Erstellt interaktive Countplots für mehrere kategoriale Variablen
    und speichert sie als HTML-Datei.

    Parameter:
    - df: Pandas DataFrame
    - kategorische_variablen: Liste von Spaltennamen
    - dateiname: Speichername der HTML-Datei
    """
    figs = []
    for var in kategorische_variablen:
        fig = px.histogram(df, x=var, color=var,
                           title=f'Anzahl je Kategorie: {var}',
                           text_auto=True)
        fig.update_layout(barmode='group', xaxis_title=var, yaxis_title='Anzahl')
        figs.append(fig)

    # Speichern alle Plots in einer HTML-Datei
    with open(dateiname, 'w') as f:
        for fig in figs:
06.05.25, 16:49 - ChatGPT: inner_html = pio.to_html(fig, include_plotlyjs='cdn', full_html=False)
            f.write(inner_html + '<br><hr><br>')

    print(f"✅ HTML-Bericht gespeichert unter: {dateiname}")
```

---

✅ Nutzung

```python
Beispiel-Daten
df = pd.DataFrame({
    'Beruf': ['MFA', 'Apotheke', 'Pflege', 'MFA', 'Pflege', 'Apotheke', 'Pflege'],
    'Region': ['Nord', 'Süd', 'Nord', 'West', 'Ost', 'West', 'Ost'],
    'Produkt': ['Wundpad', 'Spray', 'Spray', 'Wundpad', 'Wundpad', 'Spray', 'Spray']
})

HTML-Visualisierung erzeugen
plot_countplots_html(df, ['Beruf', 'Region', 'Produkt'], 'kategorische_auswertung.html')
```

---

📁 *Ergebnis:* Eine HTML-Datei mit scrollbarer, interaktiver Darstellung aller Balkendiagramme – ideal zum Teilen oder Einbinden in Dashboards.

Möchtest du die HTML-Datei automatisch im Browser öffnen?
06.05.25, 16:49 - Edmond: Ja
06.05.25, 16:50 - ChatGPT: Du kannst die generierte HTML-Datei automatisch im Standardbrowser öffnen, indem du das `webbrowser`-Modul in Python verwendest. Hier ist eine erweiterte Version der Funktion, die dies ermöglicht:

---

🐍 Automatisches Öffnen im Browser

🔄 Funktion erweitern:

```python
import plotly.express as px
import plotly.io as pio
import webbrowser
import pandas as pd
import os

def plot_countplots_html(df, kategorische_variablen, dateiname='countplots.html', open_browser=True):
    """
    Erstellt interaktive Countplots und speichert sie als HTML.
    Öffnet die Datei optional im Standardbrowser.
    """
    figs = []
    for var in kategorische_variablen:
        fig = px.histogram(df, x=var, color=var,
                           title=f'Anzahl je Kategorie: {var}',
                           text_auto=True)
        fig.update_layout(barmode='group', xaxis_title=var, yaxis_title='Anzahl')
        figs.append(fig)

    with open(dateiname, 'w') as f:
        for fig in figs:
            html = pio.to_html(fig, include_plotlyjs='cdn', full_html=False)
            f.write(html + '<br><hr><br>')

    print(f"✅ HTML-Bericht gespeichert unter: {dateiname}")

    if open_browser:
        abs_path = os.path.abspath(dateiname)
        webbrowser.open(f'file://{abs_path}')
```

---
06.05.25, 16:50 - ChatGPT: ✅ Anwendung:

```python
Beispielaufruf
plot_countplots_html(df, ['Beruf', 'Region', 'Produkt'], 'zielgruppen_auswertung.html')
```

🔓 Damit wird:
- die Datei *gespeichert*,
- und direkt im *Standard-Browser geöffnet*.

Möchtest du zusätzlich Filter-Interaktivität pro Variable in einem Dashboard-Stil?
06.05.25, 16:54 - Edmond: Schreibe eine Funktion, um der Beruf nach Geschlecht zu aggregieren. Dabei sumiere die Verweildauer und visualisiere die Ergebnisse mit der summe.
06.05.25, 16:54 - ChatGPT: Hier ist eine Python-Funktion, die den Beruf nach Geschlecht aggregiert, die *Verweildauer summiert* und das Ergebnis in einem *gruppierten Balkendiagramm* mit den Summenwerten visualisiert:

---

🧮 Funktion: Aggregation und Visualisierung nach Beruf und Geschlecht

```python
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

def plot_verweildauer_beruf_geschlecht(df, beruf_col='Beruf', geschlecht_col='Geschlecht', dauer_col='Verweildauer'):
    """
    Aggregiert die Verweildauer nach Beruf und Geschlecht und visualisiert das Ergebnis.

    Parameter:
    - df: Pandas DataFrame mit Spalten für Beruf, Geschlecht und Verweildauer
    - beruf_col: Name der Berufsspalte
    - geschlecht_col: Name der Geschlechtsspalte
    - dauer_col: Name der Spalte mit Verweildauer (numerisch)
    """
    # Aggregation
    agg_df = df.groupby([beruf_col, geschlecht_col])[dauer_col].sum().reset_index()

    # Visualisierung
    plt.figure(figsize=(10, 6))
    ax = sns.barplot(data=agg_df, x=beruf_col, y=dauer_col, hue=geschlecht_col, palette='Set2')

    # Balkenbeschriftung
    for container in ax.containers:
        ax.bar_label(container, fmt='%.0f', label_type='edge')

    plt.title('Summierte Verweildauer nach Beruf und Geschlecht')
06.05.25, 16:54 - ChatGPT: plt.ylabel('Verweildauer (Summe)')
    plt.xlabel('Beruf')
    plt.legend(title='Geschlecht')
    plt.xticks(rotation=45)
    plt.tight_layout()
    plt.show()
```

---

✅ Beispiel-Datensatz und Nutzung:

```python
Beispiel-Daten
df = pd.DataFrame({
    'Beruf': ['MFA', 'MFA', 'Pflege', 'Pflege', 'Apotheke', 'Apotheke'],
    'Geschlecht': ['Weiblich', 'Männlich', 'Weiblich', 'Männlich', 'Weiblich', 'Männlich'],
    'Verweildauer': [10, 12, 20, 18, 15, 17]
})

Aufruf der Funktion
plot_verweildauer_beruf_geschlecht(df)
```

---

Möchtest du die Visualisierung zusätzlich als PDF oder HTML speichern?
06.05.25, 16:57 - Edmond: Ja
06.05.25, 16:58 - ChatGPT: Hier ist die erweiterte Version der Funktion, mit der du die Visualisierung zusätzlich als *PDF oder PNG-Datei speichern* kannst:

---

🖼️ Funktion mit Speicheroption

```python
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

def plot_verweildauer_beruf_geschlecht(df, beruf_col='Beruf', geschlecht_col='Geschlecht',
                                       dauer_col='Verweildauer', save_path=None):
    """
    Aggregiert die Verweildauer nach Beruf und Geschlecht, visualisiert sie
    und speichert optional das Ergebnis als PDF/PNG.

    Parameter:
    - df: Pandas DataFrame
    - beruf_col, geschlecht_col, dauer_col: Spaltennamen
    - save_path: Dateiname zum Speichern (z. B. 'verweildauer.pdf' oder 'grafik.png')
    """
    # Aggregation
    agg_df = df.groupby([beruf_col, geschlecht_col])[dauer_col].sum().reset_index()

    # Plot erstellen
    plt.figure(figsize=(10, 6))
    ax = sns.barplot(data=agg_df, x=beruf_col, y=dauer_col, hue=geschlecht_col, palette='Set2')

    # Balkenbeschriftung
    for container in ax.containers:
        ax.bar_label(container, fmt='%.0f', label_type='edge')

    plt.title('Summierte Verweildauer nach Beruf und Geschlecht')
    plt.ylabel('Verweildauer (Summe)')
    plt.xlabel('Beruf')
    plt.legend(title='Geschlecht')
06.05.25, 16:58 - ChatGPT: plt.xticks(rotation=45)
    plt.tight_layout()

    # Speichern, falls Pfad angegeben
    if save_path:
        plt.savefig(save_path, bbox_inches='tight', dpi=300)
        print(f"✅ Diagramm gespeichert unter: {save_path}")

    plt.show()
```

---

✅ Nutzung

```python
Beispiel-Daten
df = pd.DataFrame({
    'Beruf': ['MFA', 'MFA', 'Pflege', 'Pflege', 'Apotheke', 'Apotheke'],
    'Geschlecht': ['Weiblich', 'Männlich', 'Weiblich', 'Männlich', 'Weiblich', 'Männlich'],
    'Verweildauer': [10, 12, 20, 18, 15, 17]
})

Funktion aufrufen und Grafik speichern
plot_verweildauer_beruf_geschlecht(df, save_path='verweildauer_visualisierung.pdf')
```

---

Möchtest du alternativ eine *interaktive Version mit Plotly und HTML-Export*?
06.05.25, 16:59 - Edmond: Ja
06.05.25, 16:59 - ChatGPT: Hier ist eine interaktive Version der Verweildauer-Visualisierung mit *Plotly* und *HTML-Export*:

---

🌐 Interaktive Version mit Plotly

📦 Installation (falls noch nicht geschehen)

```bash
pip install plotly pandas
```

---

🐍 Funktion zur interaktiven Darstellung und HTML-Export

```python
import plotly.express as px
import pandas as pd
import webbrowser
import os

def plot_verweildauer_interaktiv(df, beruf_col='Beruf', geschlecht_col='Geschlecht',
                                  dauer_col='Verweildauer', html_dateiname='verweildauer_interaktiv.html',
                                  open_browser=True):
    """
    Interaktive Darstellung der Verweildauer nach Beruf und Geschlecht und optionaler HTML-Export.

    Parameter:
    - df: Pandas DataFrame
    - beruf_col, geschlecht_col, dauer_col: Spaltennamen
    - html_dateiname: Dateiname für Export als HTML
    - open_browser: True öffnet Datei nach Erstellung automatisch im Browser
    """
    # Aggregieren
    agg_df = df.groupby([beruf_col, geschlecht_col])[dauer_col].sum().reset_index()

    # Interaktive Grafik erstellen
    fig = px.bar(
        agg_df,
        x=beruf_col, y=dauer_col, color=geschlecht_col,
        text=dauer_col,
        barmode='group',
06.05.25, 17:00 - ChatGPT: title='Verweildauer nach Beruf und Geschlecht (interaktiv)',
        labels={dauer_col: 'Verweildauer (Summe)'}
    )

    fig.update_traces(texttemplate='%{text:.0f}', textposition='outside')
    fig.update_layout(uniformtext_minsize=8, uniformtext_mode='hide')

    # Speichern als HTML
    fig.write_html(html_dateiname, include_plotlyjs='cdn')
    print(f"✅ Interaktive Grafik gespeichert unter: {html_dateiname}")

    if open_browser:
        webbrowser.open(f'file://{os.path.abspath(html_dateiname)}')
```

---

✅ Anwendung:

```python
Beispiel-Daten
df = pd.DataFrame({
    'Beruf': ['MFA', 'MFA', 'Pflege', 'Pflege', 'Apotheke', 'Apotheke'],
    'Geschlecht': ['Weiblich', 'Männlich', 'Weiblich', 'Männlich', 'Weiblich', 'Männlich'],
    'Verweildauer': [10, 12, 20, 18, 15, 17]
})

plot_verweildauer_interaktiv(df)
```

---

📄 Ergebnis: Eine lokal speicherbare, interaktive HTML-Datei mit Balken für Verweildauer pro Beruf und Geschlecht.

Möchtest du die HTML-Datei auch als PDF drucken oder automatisch versenden?
