# Instalación de bibliotecas para procesamiento de audio en Windows
## Adrián Arnaiz Rodríguez

**Elegiremos las bibliotecas mejores y que más nos ayudan a la extracción de características para el procsamiento de audio con el objetivo de la detección de la enfermedad del Parkinson a través de la voz. Se ha conseguido una instalación satisfactoria con Windows 10 y Python 3.6.8 :: Anaconda custom (64-bit) así como con Google Colaboratory y Python 3.6.7 [para Linux ejecutar pasos incluidos en el apartado Instalación en Linux, no ejecutar las celdas de código de este notebook]**

**De la recopilación de herramientas realizada en pasos anteriores hemos elegido las siguientes:**

In [1]:
!python --version

Python 3.6.8 :: Anaconda custom (64-bit)


## Praat - Parselmouth

Esta librería será utilizada para varias tareas:
- Quitar los silencios iniciales y finales de cada audio
- Dividir el audio en voiced sounds/unvoiced sounds
- Extraer medidas prosódicas fundamentales: medidas asociadas a jitter, shimmer, PPQ, $F$0,...
- HNR, NHR

In [2]:
pip install praat-parselmouth --upgrade

Collecting praat-parselmouth
  Using cached https://files.pythonhosted.org/packages/46/bd/f9b9932bfdcbe473b444093b38ee468e68cd5fbb829ca8c39e23a2fd002e/praat_parselmouth-0.3.2.post2-cp36-cp36m-win_amd64.whl
Installing collected packages: praat-parselmouth
  Found existing installation: praat-parselmouth 0.3.2
    Uninstalling praat-parselmouth-0.3.2:
      Successfully uninstalled praat-parselmouth-0.3.2
Successfully installed praat-parselmouth-0.3.2
Note: you may need to restart the kernel to use updated packages.


In [3]:
import parselmouth
print(parselmouth.PRAAT_VERSION)
print(parselmouth.PRAAT_VERSION_DATE)
print("A 29/03/19 se ha instalado la versión 6.0.37 con release date 03/02/18")

6.0.37
3 February 2018
A 29/03/19 se ha instalado la versión 6.0.37 con release date 03/02/18


------------------

## Disvoice
#### Localización: https://github.com/jcvasquezc/DisVoice 
Módulo de python del grupo de investigadores que lidera **J. R. Orozco-Ayozave** y concretamente encontrado en el Github de **J. C. Vásquez-Correa**. Este módulo es el equivalente al *Erlagen Prosody Module* que se define en [1](#erlangenpm) y es utilizado en [2](#orozco16) para sacar las medidas prosódicas. Según se puede ver en su documentación, es el módulo que utiliza [3](#neurospeech) para su funcionamiento interno.
Esta librería será utilizada para varias tareas:
- Extraer las medidas prosódicas y sus estadísticos: basadas en la duración, energía y frecuencia fundamental.
- Extraer medidas de fonnación como jitter, shimmer, APQ, PPQ...
- Extraer MFCC, BBE, $F$1, $F$2 y medidas derivadas de estas

### Instalación en Linux
**El entorno funciona bien utilizando Google Colaboratory (LINUX) y Python 3.6.7.**

Tras clonar el repositorio de DISVOICE, **hay que comentar líneas de código que utilicen Kaldi, ya que no lo usamos y nos ahorramos su instalación.** Por ejemplo: Disvoice/phonation/phonation.py lineas 71,316 y 330.

**Pasos** : 
1. Clonar el repositorio: 
`!git clone https://github.com/jcvasquezc/DisVoice `
2. Instalar los requerimientos: 
`!DisVoice/install.sh`
3. Comentar líneas que utilizan Kaldi: ver líneas específicas en https://github.com/AdrianArnaiz/DisVoice/commit/330c67fc3b7e9ab59bf4f06e5df3c79f8ff18165


----------------


### Instalación en Windows - Personalización para el proyecto
#### Localización: https://github.com/AdrianArnaiz/DisVoice
**Para poder utilizar Disvoice en nuestro proyecto hemos realizado cambios en el código para utilizarlo en Windows, por ello hemos hecho fork del proyecto y realizado los cambios necesarios:**
>* En windows no funciona comando Praat. En praat_functions.py, cuando construye los comandos cambiar `praat` por `..\\praat\\praat.exe`. Esto es debido a que en windows praat es un ejecutable (no un comando como en linux) que se encuentra en la carpeta DisVoice/praat y nuestro script se ejecuta desde /Disvoice/phonation (y articulation o prosody). **Con este cambio conseguimos que funcione correctamente en Windows.**
* Comentar las líneas de Kaldi al igual que en el caso anterior.
* Cambios al detalle en https://github.com/AdrianArnaiz/DisVoice/commit/330c67fc3b7e9ab59bf4f06e5df3c79f8ff18165

**PASOS para instalarlo:**
1. Clonar el proyecto ya modificado de mi repositorio.
2. Instalar las bibliotecas que aparecen en requirements.txt (**pystptk**, numpy, sklearn, scipy, pandas). **Para ello ejecutar el script de python install.py**

---------------

#### Artículos:
[1](#erlangenpm) V. Zeibler, J. Adelhardt, A. Batliner, C. Frank, E. N€oth, R. Shi, and H. Niemann, “The prosody module,” in SmartKom: Foundations of Multimodal Dialogue Systems, Cognitive Technologies Series (Springer, Berlin, 2006), pp. 139–152 

[2](#orozco16) Orozco-Arroyave, J. R., Hönig, F., Arias-Londoño, J. D., Vargas-Bonilla, J. F., Daqrouq, K., Skodda, S., ... & Nöth, E. (2016). Automatic detection of Parkinson's disease in running speech spoken in three different languages. The Journal of the Acoustical Society of America, 139(1), 481-500.

**[3](#neurospeech) J. R. Orozco-Arroyave, J. C. Vásquez-Correa et al. "NeuroSpeech: An open-source software for Parkinson's speech analysis." Digital Signal Processing (2017).**

In [4]:
!git clone https://github.com/AdrianArnaiz/DisVoice

Cloning into 'DisVoice'...


In [5]:
!python DisVoice\install.py


 
 
 Instalar pysptk:

 
 
 Instalar playsound:

 
 
 Instalar dash_html_components:

 
 
 Instalar plotly:

 
 
 Instalar sounddevice:

 
 
 Instalar scipy:

 
 
 Instalar pandas:

 
 
 Instalar easygui:

 
 
 Instalar dash_core_components:

 
 
 Instalar matplotlib:

 
 
 Instalar dash:

 
 
 Instalar numpy:

 
 
 Instalar scikit_learn:


## Pydub
Esta librería será utilizada para segmentar el audio y poder preprocesar la elominación de silencios iniciales y finales.

In [1]:
!pip install pydub

