SCREAM DETECTOR (DETECTOR DE GRITOS EN AUDIOS - SITUACIONES DE PELIGRO)

Datos del curso 📘

Proyecto final

Curso: TÉCNICAS AVANZADAS DE DATA MINING Y SISTEMAS INTELIGENTES
Clase del 2020-1
Maestría en informática - Mención en ciencias de la computación

Objetivo 🎯

El proyecto tiene como objetivo la detección de gritos humanos en audios que están basados en sonidos de máquinas o herramientas en funcionamiento encontradas en el conjunto de datos UrbanSound8K. Para el proyecto se añadirá a este conjunto de datos sonidos que resulten de la fusión del conjunto original con gritos humanos, procedentes de otros conjuntos de datos, y se buscará determinar con un modelo en que audios se encuentran gritos y en cuáles no.

Para la aplicación se entrenaron 2 modelos: CNN y LSTM. A continuación se presenta los resultados del entrenamiento de la CNN para el accuracy con los sets de entrenamiento y validación:

Analizando la probabilidad de presencia de gritos en un track de larga duración:

Arquitectura y estructura de archivos 🏢

El proyecto cuentas con las siguientes carpetas:

📁 PRESENTACION PARCIAL (Ver) .- Contiene los archivos que formaron parte de la presentación parcial del trabajo que inspiro este proyecto. Se cuenta con la presentación en PDF y el modelo en un Python Notebook

📁 ENUNCIADO PROYECTO (Ver) .- Contiene el archivo con la propuesta del proyecto.

📁 MEZCLA DE AUDIO (Ver) .- Contienen los scripts que se utilizaron para realizar la mezcla de los audios base con los gritos. En la acción de generar las mezclas se etiqueto el tiempo exacto en el que comienza el grito y se estandarizo que el mismo sea de 1s. Se presenta tambien Base.wav y Grito.wav como representantes de un audio base obtenido del dataset Urban Sound 8K y los datasets de gritos respectivamente.

📁 MODELOS (Ver) .- En esta carpeta se almacenan los cuadernos con las experimentaciones hechas con distintos modelos usando los datasets de audios mezclados.

📁 MODELOS FINALES (Ver) .- En esta carpeta hemos almacenado los modelos con mejor performance en las pruebas, estos contienen gráficas de su entrenamiento y un archivo donde se ponen a prueba.

📁 IMAGENES (Ver) .- Contiene algunas imagenes usadas en este archivo.

Pasos para ejecución (Jupyter Notebook) 🐍

Clonar el proyecto, usar:

git clone https://github.com/fararay/Scream_Detector.git

Instalar las dependencias requeridas por el cuaderno que usted desee ejecutar.

# Instalamos las dependencias del proyecto
!pip install xxxxxxxx'

Descargar los datasets solicitados por el cuaderno de los enlaces listados a continuación.
Ejecutar el cuaderno.

Datasets usados en el proyecto 📑

Dataset de audios mezclados (Dataset) (Etiquetas)
Dataset compilación de gritos (Dataset)
Dataset habla humana no gritos (Dataset)
Dataset de audios base UrbanSound8K (Dataset)

Autores: 💻

ESCUELA DE POSGRADO

Jose Ulises Morales Pariona - Github
Juan Manuel Mendoza Jacinto - Linkedin - Github
Percy Kim Tippe Quintanilla - Linkedin - Github

Licencia 📄

La licencia de este proyecto es del tipo GNU General Public License v3.0 (Ver)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

SCREAM DETECTOR (DETECTOR DE GRITOS EN AUDIOS - SITUACIONES DE PELIGRO)

Datos del curso 📘

Objetivo 🎯

Arquitectura y estructura de archivos 🏢

Pasos para ejecución (Jupyter Notebook) 🐍

Datasets usados en el proyecto 📑

Autores: 💻

ESCUELA DE POSGRADO

Licencia 📄

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
ENUNCIADO PROYECTO		ENUNCIADO PROYECTO
IMAGENES		IMAGENES
MEZCLA DE AUDIO		MEZCLA DE AUDIO
MODELOS FINALES		MODELOS FINALES
MODELOS		MODELOS
PRESENTACION PARCIAL		PRESENTACION PARCIAL
.gitignore		.gitignore
LICENSE.md		LICENSE.md
README.md		README.md

License

MrCycler/Scream_Detector

Folders and files

Latest commit

History

Repository files navigation

SCREAM DETECTOR (DETECTOR DE GRITOS EN AUDIOS - SITUACIONES DE PELIGRO)

Datos del curso 📘

Objetivo 🎯

Arquitectura y estructura de archivos 🏢

Pasos para ejecución (Jupyter Notebook) 🐍

Datasets usados en el proyecto 📑

Autores: 💻

ESCUELA DE POSGRADO

Licencia 📄

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages