#### Module importieren

In [8]:
import os
import matplotlib.pyplot as plt
import pandas as pd
from pathlib import Path

#### Daten in DataFrame speichern

In [12]:
def load_data(folder_sizes_file):
    """
    Lädt die Ordnergrößendaten aus der Datei und gibt ein Pandas-DataFrame zurück.
    """
    try:
        data = []
        with open(folder_sizes_file, 'r', encoding='utf-8') as f:
            lines = f.readlines()
            for line in lines:
                # Sucht nach Zeilen, die Ordner und Größen enthalten
                if line.startswith("Ordner:"):
                    folder = line.replace("Ordner:", "").strip()
                elif line.startswith("Größe:"):
                    size_bytes = int(line.split('(')[1].split()[0].replace(',', ''))
                    data.append((folder, size_bytes))
        return pd.DataFrame(data, columns=["Ordner", "Größe (Bytes)"])
    except FileNotFoundError:
        print(f"Die Datei '{folder_sizes_file}' wurde nicht gefunden.")
        return pd.DataFrame()


#### Visualisierung der Ergebnisse als Balkendiagramm

In [None]:

def plot_folder_sizes(data):
    """
    Erstellt ein Balkendiagramm für die Ordnergrößen.
    """
    if data.empty:
        print("Keine Daten vorhanden, um die Ordnergrößen zu visualisieren.")
        return

    # Konvertiere Bytes in MB für die Anzeige
    data["Größe (MB)"] = data["Größe (Bytes)"] / (1024 * 1024)

    # Sortiere nach Größe
    data = data.sort_values(by="Größe (MB)", ascending=False).head(10)

    # Erstelle das Diagramm
    plt.figure(figsize=(10, 6))
    plt.barh(data["Ordner"], data["Größe (MB)"], color="skyblue")
    plt.xlabel("Größe (MB)")
    plt.ylabel("Ordner")
    plt.title("Top 10 Ordner nach Python-Dateigröße")
    plt.gca().invert_yaxis()  # Ordner mit der größten Größe oben anzeigen
    plt.tight_layout()
    plt.show()

#### Ergebnis: Visualisiserung

In [11]:
def main():
    # Pfad zur Datei mit Ordnergrößen
    folder_sizes_file = os.path.join(os.path.dirname(__file__), 'folder_sizes.txt')
    
    # Lade die Daten und visualisiere sie
    data = load_data(folder_sizes_file)
    plot_folder_sizes(data)

if __name__ == "__main__":
    main()

NameError: name '__file__' is not defined