# Preprocessing

In [4]:
import librosa
import numpy as np

def preprocess_audio(audio_path, sample_rate=16000):
    """
    Vorverarbeitung einer Audiodatei: Resampling und Normalisierung.

    Args:
        audio_path (str): Pfad zur Audiodatei.
        sample_rate (int): Ziel-Sampling-Rate (Standard: 16000).

    Returns:
        np.array: Das vorverarbeitete Audio-Signal.
    """
    # Audiodatei laden und resamplen
    audio_signal, _ = librosa.load(audio_path, sr=sample_rate)

    # Zu Mono konvertieren (falls mehrkanalig)
    audio_signal = librosa.to_mono(audio_signal)

    # Normalisieren
    max_val = np.max(np.abs(audio_signal))
    if max_val > 0:
        audio_signal = audio_signal / max_val

    return audio_signal

# Funktion Spectral Rolloff

In [2]:
import librosa
import numpy as np

def calculate_spectral_rolloff(audio_signal, sample_rate=16000, roll_percent=0.85):
    """
    Berechnet den Spectral Rolloff eines Audiosignals.

    Quelle:
        - Librosa: spectral_rolloff
        - https://librosa.org/doc/main/generated/librosa.feature.spectral_rolloff.html

    Args:
        audio_signal (np.array): Vorverarbeitetes Audio-Signal.
        sample_rate (int): Sampling-Rate des Audiosignals.
        roll_percent (float): Anteil der Energie, unterhalb dessen die Grenzfrequenz berechnet wird (Standard: 85%).

    Returns:
        float: Durchschnittlicher Spectral Rolloff-Wert über alle Frames (Hz).
    """
    spectral_rolloff = librosa.feature.spectral_rolloff(y=audio_signal, sr=sample_rate, roll_percent=roll_percent)

    # Mittelwert über alle Frames berechnen
    return np.mean(spectral_rolloff)

# Test

In [5]:
import os

# Verzeichnis mit den Audiodateien
audio_dir = "../audio_files/"

# Alle Audiodateien im Verzeichnis durchsuchen und alphabetisch sortieren
audio_files = sorted([f for f in os.listdir(audio_dir) if f.endswith(".wav")])

# Durch alle Audiodateien iterieren und Spectral Rolloff berechnen
for file_name in audio_files:
    file_path = os.path.join(audio_dir, file_name)

    # Audio vorverarbeiten (Resampling, Mono, Normalisierung)
    audio_signal = preprocess_audio(file_path)

    # Spectral Rolloff berechnen
    rolloff_value = calculate_spectral_rolloff(audio_signal)

    # Ergebnisse ausgeben
    print(f"Spectral Rolloff ({file_name}): {rolloff_value:.2f} Hz")

Spectral Rolloff (_noise_pink.wav): 2954.10 Hz
Spectral Rolloff (_noise_white.wav): 6813.48 Hz
Spectral Rolloff (_signal_constant.wav): 185.30 Hz
Spectral Rolloff (_signal_silence.wav): 0.00 Hz
Spectral Rolloff (_signal_sine.wav): 454.59 Hz
Spectral Rolloff (_snr_03.wav): 2236.93 Hz
Spectral Rolloff (_snr_10.wav): 2230.58 Hz
Spectral Rolloff (_snr_20.wav): 2191.88 Hz
Spectral Rolloff (example1.wav): 1894.18 Hz
Spectral Rolloff (example2.wav): 2041.93 Hz
Spectral Rolloff (example3.wav): 3033.04 Hz
