# Preprocessing

In [11]:
import librosa
import numpy as np

def preprocess_audio(audio_path, sample_rate=16000):
    """
    Vorverarbeitung einer Audiodatei: Resampling und Normalisierung.

    Args:
        audio_path (str): Pfad zur Audiodatei.
        sample_rate (int): Ziel-Sampling-Rate (Standard: 16000).

    Returns:
        np.array: Das vorverarbeitete Audio-Signal.
    """
    # Audiodatei laden und resamplen
    audio_signal, _ = librosa.load(audio_path, sr=sample_rate)

    # Zu Mono konvertieren (falls mehrkanalig)
    audio_signal = librosa.to_mono(audio_signal)

    # Normalisieren
    max_val = np.max(np.abs(audio_signal))
    if max_val > 0:
        audio_signal = audio_signal / max_val

    return audio_signal

# Funktion Spectral Contrast

In [10]:
import librosa
import numpy as np

def calculate_spectral_contrast(audio_signal, sample_rate=16000, n_bands=6):
    """
    Berechnet den Spectral Contrast eines Audiosignals.

    Quelle:
        - Librosa: spectral_contrast
        - https://librosa.org/doc/main/generated/librosa.feature.spectral_contrast.html

    Args:
        audio_signal (np.array): Vorverarbeitetes Audio-Signal.
        sample_rate (int): Sampling-Rate des Audiosignals.
        n_bands (int): Anzahl der Frequenzbänder für die Kontrastanalyse.

    Returns:
        np.array: Mittelwerte der Spektral-Kontraste über die Bänder.
    """
    spectral_contrast = librosa.feature.spectral_contrast(y=audio_signal, sr=sample_rate, n_bands=n_bands)

    # Mittelwert über alle Frames berechnen
    return np.mean(spectral_contrast, axis=1)

# Test

In [14]:
import os

# Verzeichnis mit den Audiodateien
audio_dir = "../audio_files/"

# Alle Audiodateien im Verzeichnis durchsuchen und alphabetisch sortieren
audio_files = sorted([f for f in os.listdir(audio_dir) if f.endswith(".wav")])

# Durch alle Audiodateien iterieren und Spectral Contrast berechnen
for file_name in audio_files:
    file_path = os.path.join(audio_dir, file_name)

    # Audio vorverarbeiten (Resampling, Mono, Normalisierung)
    audio_signal = preprocess_audio(file_path)

    # Spectral Contrast berechnen
    contrast_values = calculate_spectral_contrast(audio_signal)

    # Ergebnisse ausgeben
    print(f"Spectral Contrast ({file_name}): {contrast_values}")

Spectral Contrast (_noise_pink.wav): [11.17749272 10.88178731 13.40570536 13.9151125  14.46764138 15.56643279
 13.60601168]
Spectral Contrast (_noise_white.wav): [10.68308086 10.42286802 13.00083108 13.72479409 13.75556752 13.73387186
 14.16753205]
Spectral Contrast (_signal_constant.wav): [88.84774938 16.79563856 16.7887177  16.78258116 16.76315271 16.67610576
 16.44634426]
Spectral Contrast (_signal_silence.wav): [0. 0. 0. 0. 0. 0. 0.]
Spectral Contrast (_signal_sine.wav): [14.35037237 19.0560177  52.19083564 15.74161393 27.76141804 32.89964285
 34.23472468]
Spectral Contrast (_snr_03.wav): [19.76271681 15.84789306 18.15801705 17.07017609 16.99990256 72.70298276
 17.85105396]
Spectral Contrast (_snr_10.wav): [20.24111823 15.59216318 18.47649562 17.22365475 17.1994794  71.78502208
 17.03782325]
Spectral Contrast (_snr_20.wav): [21.13286943 16.13544647 18.32300457 17.57676338 17.10008386 70.58273928
 17.20763663]
Spectral Contrast (example1.wav): [18.36667891 16.9906002  16.85613224 15