# Count

Datenerhebung der Anzahl von Zeichen in den Notebooks

In [2]:
import os
import json
import csv
import time

def count_characters_in_notebook(file_path):
    try:
        # Notebook-Datei öffnen und als JSON laden
        with open(file_path, 'r', encoding='utf-8-sig') as f:
            notebook = json.load(f)
        
        char_count = 0
        
        # Durch alle Zellen des Notebooks gehen
        for cell in notebook['cells']:
            # Wir betrachten nur Code- und Markdown-Zellen
            if cell['cell_type'] in ['code', 'markdown']:
                # Jede Zeile der Zelle durchlaufen und die Länge (Anzahl Zeichen) zählen
                for line in cell['source']:
                    char_count += len(line)
        
        return char_count
    
    except Exception as e:
        print(f"Fehler beim Verarbeiten der Datei {file_path}: {e}")
        return 0

def save_to_csv(notebook_results, csv_file):
    try:
        # CSV-Datei öffnen und die Ergebnisse eintragen
        with open(csv_file, 'w', newline='', encoding='utf-8') as file:
            writer = csv.writer(file)
            # Kopfzeile für die CSV-Datei
            writer.writerow(["Notebook Path", "Notebook Name", "Character Count"])
            # Eintrag jeder Datei, Pfad und Anzahl Zeichen
            for result in notebook_results:
                writer.writerow([result['path'], result['name'], result['char_count']])
        print(f"CSV-Datei erfolgreich gespeichert: {csv_file}")
    except Exception as e:
        print(f"Fehler beim Speichern der CSV-Datei: {e}")

def count_notebooks_in_folder(folder_path):
    # Zähle alle Notebooks zuerst
    total_notebooks = 0
    for dirpath, dirnames, filenames in os.walk(folder_path):
        total_notebooks += len([f for f in filenames if f.lower().endswith('.ipynb')])

    if total_notebooks == 0:
        print("Keine Notebooks im Ordner gefunden.")
        return []

    # Fortschrittsbalken für die Anzahl der Notebooks
    notebook_counter = 0
    print("Zähle Notebooks im Verzeichnis...")
    for dirpath, dirnames, filenames in os.walk(folder_path):
        for filename in filenames:
            if filename.lower().endswith('.ipynb'):
                notebook_counter += 1
                progress = (notebook_counter / total_notebooks) * 100
                print(f'Laden der Dateien... {progress:.2f}% abgeschlossen', end='\r')
                time.sleep(0.1)  # Simuliere eine kurze Pause

    print(f"\nFertig: {notebook_counter} Skripte im Verzeichnis.")

    # Ergebnisse speichern
    notebook_results = []
    notebook_counter = 0

    # Fortschrittsbalken für das Zählen der Zeichen
    print("Beginne mit dem Zählen der Zeichen in den Notebooks...")
    for dirpath, dirnames, filenames in os.walk(folder_path):
        for filename in filenames:
            if filename.lower().endswith('.ipynb'):
                file_path = os.path.join(dirpath, filename)
                char_count = count_characters_in_notebook(file_path)

                # Aufteilen in Pfad und Dateinamen
                path, name = os.path.split(file_path)
                
                notebook_results.append({'path': path, 'name': name, 'char_count': char_count})

                # Fortschrittsbalken aktualisieren
                notebook_counter += 1
                progress = (notebook_counter / total_notebooks) * 100
                print(f'Fortschritt der Zählung... {progress:.2f}% abgeschlossen', end='\r')
                time.sleep(0.1)  # Simuliere eine kurze Pause

    print("\nAlle Notebooks verarbeitet!")
    return notebook_results

# Beispielverwendung
if __name__ == "__main__":
    # Das Aktuelle Verzeichnis auswählen
    current_directory = os.getcwd()
    
    # Ordnerpfad, in dem die Notebooks durchsucht werden sollen
    folder_path = current_directory  # Setze das aktuelle Verzeichnis
    
    # Alle Notebooks im Ordner und deren Unterordner zählen und den Fortschritt anzeigen
    notebook_results = count_notebooks_in_folder(folder_path)

    if notebook_results:
        # Ergebnisse in einer CSV-Datei speichern
        csv_file_path = 'notebook_character_counts.csv'
        save_to_csv(notebook_results, csv_file_path)
    else:
        print("Es wurden keine Ergebnisse zum Speichern gefunden.")


Zähle Notebooks im Verzeichnis...
Laden der Dateien... 100.00% abgeschlossen
Fertig: 451 Skripte im Verzeichnis.
Beginne mit dem Zählen der Zeichen in den Notebooks...
Fortschritt der Zählung... 100.00% abgeschlossen
Alle Notebooks verarbeitet!
CSV-Datei erfolgreich gespeichert: notebook_character_counts.csv
