# Proyecto Final de Deep Learning: Desenvolviendo el Sonido en la Universidad del Valle de Guatemala

> Este trabajo se basa en distintos proyectos de separación de audio, como por ejemplo el proyecto [Music Source Separation](https://github.com/andabi/music-source-separation) desarrollado durante el [Jeju Machine Learning Camp 2017](http://mlcampjeju.kakao.com). Sin embargo, han servido como base y han sido extensamente modificados y mejorados como parte del proyecto final para la Universidad del Valle de Guatemala por Ale Gómez, Michy Solano, Andrea Lam, Chris García, Gabo Vicente y Rodri Barrera.

## Introducción 🎵

La separación de fuentes musicales es una tarea esencial en el procesamiento de señales de audio, que se centra en separar diferentes componentes de una canción, como la voz y los instrumentos. Este proyecto busca mejorar la arquitectura y la eficacia del modelo inicial propuesto en el repositorio base, explorando técnicas avanzadas en redes neuronales y procesamiento de señales.


### Comparativas con Herramientas Existentes:

- Comparación de rendimiento con herramientas existentes como Splitter AI, validando las mejoras implementadas y proporcionando un benchmark sobre el estado del arte.

## Evaluación y Métricas 📊

- Utilización de métricas estándar en la tarea de separación de fuentes como SDR, SIR y SAR, además de otras métricas relevantes como la precisión y la recall en la detección de componentes vocales e instrumentales.
- Documentación meticulosa de los resultados obtenidos, incluyendo visualizaciones de espectrogramas y comparativas cualitativas.




In [None]:
# Funciones útiles:
# -*- coding: utf-8 -*-
#!/usr/bin/env python
"""
By Dabi Ahn. andabi412@gmail.com.
https://www.github.com/andabi


Modificaciones por Grupo 5 - Proyecto Final Deep Learning
UVG - 2023
"""

from __future__ import division

import numpy as np


class Diff(object):
    def __init__(self, v=0.0):
        self.value = v
        self.diff = 0.0

    def update(self, v):
        if self.value:
            diff = v / self.value - 1
            self.diff = diff
        self.value = v


def shape(tensor):
    s = tensor.get_shape()
    return tuple([s[i].value for i in range(0, len(s))])


# TODO general pretty print
def pretty_list(list):
    return ", ".join(list)


def pretty_dict(dict):
    return "\n".join("{} : {}".format(k, v) for k, v in dict.items())


def closest_power_of_two(target):
    if target > 1:
        for i in range(1, int(target)):
            if 2**i >= target:
                pwr = 2**i
                break
        if abs(pwr - target) < abs(pwr / 2 - target):
            return pwr
        else:
            return int(pwr / 2)
    else:
        return 1


# Write the nd array to txtfile
def nd_array_to_txt(filename, data):
    path = filename + ".txt"
    file = open(path, "w")
    with file as outfile:
        # I'm writing a header here just for the sake of readability
        # Any line starting with "#" will be ignored by numpy.loadtxt
        outfile.write("# Array shape: {0}\n".format(data.shape))

        # Iterating through a ndimensional array produces slices along
        # the last axis. This is equivalent to data[i,:,:] in this case
        for data_slice in data:

            # The formatting string indicates that I'm writing out
            # the values in left-justified columns 7 characters in width
            # with 2 decimal places.
            np.savetxt(outfile, data_slice, fmt="%-7.2f")

            # Writing out a break to indicate different slices...
            outfile.write("# New slice\n")
