Skip to content

Stetsiukkk/final

Repository files navigation

Виявлення синтетичного мовлення

Ensemble_test та Ensemble це записники для тесту ансамблів, у test версії, навчання з різним розподілом навчальгих даних: 60% для тренувальння базових, 20% для тренування мета-мережі та 15% для тестування на записах таких же синтезаторів, і 5% для тестування на нових.

Ensemble_test_Metadata це записник для тесту ансамблю використовуючи додатково метадані аудіозапису. На початку обираєтьс яякі дані використовувати.

Звичайна версія: при 80% для тренування базових, 15% для мета-мережі та 5% для тестування. test_ensemble_CNN та test_ensemble_LSTM це записники для створення передбачень відповідно до розподілу даних, для подальшого навчання мета-мережі.

У записнику test_avg, перевіряється точність за звичайного усереднення результатів базових моделей.

У папці наявні файли для створення та навчання таких мереж як звичайна тришарова мережа, CNN та LSTM. Кожен з записників під відповідний формат аудіо. У одному записнику код для 2 моделей, CNN та LSTM, або у випадку з Raw, звичайна мережа та покращена для запобігання перенавчанню.

Записник display використовується для виведення аудіо у відповідних форматах. Записник model_tests використовується для тестування збережених моделей та побудови матриці невідповідностей.

Для тренування моделей було використано The Fake-or-Real (FoR) Dataset https://www.kaggle.com/datasets/mohammedabdeldayem/the-fake-or-real-dataset.

About

ML Synthetic Speech Detection project

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors