# Preprocessing

In [13]:
def preprocess_audio(audio_path, sample_rate=16000):
    """
    Vorverarbeitung einer Audiodatei: Resampling und Normalisierung.

    Args:
        audio_path (str): Pfad zur Audiodatei.
        sample_rate (int): Ziel-Sampling-Rate (Standard: 16000).

    Returns:
        np.array: Das vorverarbeitete Audio-Signal.
    """
    # Audiodatei laden und resamplen
    audio_signal, _ = librosa.load(audio_path, sr=sample_rate)

    # Zu Mono konvertieren (falls mehrkanalig)
    audio_signal = librosa.to_mono(audio_signal)

    # Normalisieren
    max_val = np.max(np.abs(audio_signal))
    if max_val > 0:
        audio_signal = audio_signal / max_val

    return audio_signal

# Funktion

In [14]:
import numpy as np

def calculate_rms(audio_signal):
    """
    Berechnet den Root Mean Square (RMS) eines Audiosignals.

    Quelle:
        Andreas Friesecke, Die Audio-Enzyklopädie, K. G. Saur, 2007, S. 208,
        ISBN: 978-3-598-11774-9
    
    Args:
        audio_signal (np.array): Das Audio-Signal (1D-Array).

    Returns:
        float: Der RMS-Wert.
    """
    return np.sqrt(np.mean(audio_signal**2))

# Test 1 - Code

In [2]:
# Testsignal: Sinuswelle
fs = 16000  # Sampling-Rate
duration = 1.0  # Sekunden
t = np.linspace(0, duration, int(fs * duration), endpoint=False)
sin_wave = np.sin(2 * np.pi * 440 * t)  # 440 Hz Sinuswelle

# RMS berechnen
rms_value = calculate_rms(sin_wave)
print(f"RMS der Sinuswelle: {rms_value:.4f}")  # Erwarteter Wert: ~0.707

RMS der Sinuswelle: 0.7071


# Test 2 - Code

In [3]:
# Testsignal: Konstantes Signal
constant_signal = np.ones(1000)

# RMS berechnen
rms_value = calculate_rms(constant_signal)
print(f"RMS des konstanten Signals: {rms_value:.4f}")  # Erwarteter Wert: 1.0

RMS des konstanten Signals: 1.0000


# Test 3 - Funktionalität

In [10]:
import librosa

# Audiodatei laden
audio_signal, sample_rate = librosa.load(audio_path, sr=None)

# Normalisieren
audio_signal = normalize_audio(audio_signal)

# RMS berechnen
rms_value = calculate_rms(audio_signal)
print(f"RMS-Wert (normalisiertes Signal): {rms_value}")

RMS-Wert (normalisiertes Signal): 0.09088896960020065


In [11]:
print(f"Maximaler Amplitudenwert: {max(audio_signal)}")
print(f"Minimaler Amplitudenwert: {min(audio_signal)}")

Maximaler Amplitudenwert: 1.0
Minimaler Amplitudenwert: -0.6160569787025452


# Batch

In [28]:
import os
import pandas as pd

def process_audio_files(input_dir, output_csv):
    """
    Berechnet den RMS-Wert für alle Audiodateien in einem Verzeichnis
    und speichert die Ergebnisse in einer alphabetisch sortierten CSV-Datei.

    Args:
        input_dir (str): Pfad zum Verzeichnis mit Audiodateien.
        output_csv (str): Pfad zur Ausgabe-CSV-Datei.

    Returns:
        None
    """
    results = []

    # Dateien im Verzeichnis lesen und sortieren
    file_list = sorted([file_name for file_name in os.listdir(input_dir) if file_name.endswith(".wav")])

    # Über alle Dateien iterieren
    for file_name in file_list:
        file_path = os.path.join(input_dir, file_name)

        # Audiodatei vorverarbeiten
        audio_signal = preprocess_audio(file_path)

        # RMS berechnen
        rms_value = calculate_rms(audio_signal)

        # Ergebnis speichern
        results.append({"file_name": file_name, "rms": rms_value})

    # Ergebnisse in eine CSV-Datei speichern
    df = pd.DataFrame(results)
    df.to_csv(output_csv, index=False)
    print(f"RMS-Werte wurden in '{output_csv}' gespeichert (alphabetisch sortiert).")

In [29]:
# Pfad zum Ordner mit Audiodateien
input_dir = "../audio_files"

# Pfad zur Ausgabe-CSV-Datei
output_csv = "../results/rms_results.csv"

# Batch-Verarbeitung starten
process_audio_files(input_dir, output_csv)

RMS-Werte wurden in '../results/rms_results.csv' gespeichert (alphabetisch sortiert).
