In [None]:
import os
import numpy as np
import soundfile as sf
from sklearn.metrics import mean_squared_error

# Функция для вычисления MSE между двумя аудиофайлами
def compute_mse(clean_file, denoised_file):
    clean_signal, sr_clean = sf.read(clean_file)
    denoised_signal, sr_denoised = sf.read(denoised_file)

    # Для выравнивания длины сигналов используем минимальную длину
    min_len = min(len(clean_signal), len(denoised_signal))
    clean_signal = clean_signal[:min_len]
    denoised_signal = denoised_signal[:min_len]

    # Вычисляем MSE между сигналами
    mse = mean_squared_error(clean_signal, denoised_signal)

    return mse

# Пути к директориям с аудиофайлами
clean_dir = "/content/drive/MyDrive/clean_dataset/clean_street_music"
denoised_dir = "/content/medfilt_dataset/medfilt_street_music"

# Получаем список файлов из каждой директории
clean_files = os.listdir(clean_dir)
denoised_files = os.listdir(denoised_dir)

# Проверяем, что обе директории содержат одинаковое количество файлов
if len(clean_files) != len(denoised_files):
    print("Ошибка: количество файлов в директориях не совпадает.")
    exit()

# Вычисляем среднее MSE между каждой парой файлов
total_mse = 0
for clean_file, denoised_file in zip(clean_files, denoised_files):
    clean_path = os.path.join(clean_dir, clean_file)
    denoised_path = os.path.join(denoised_dir, denoised_file)

    mse = compute_mse(clean_path, denoised_path)
    total_mse += mse

# Вычисляем среднее MSE
mean_mse = total_mse / 5
print("Среднее MSE между парами файлов:", mean_mse)
