# unit selection tts (español) Cuaderno colab de entrenamiento

Este cuaderno es una adaptación para generar voces con selección de unidades.

## créditos:
* Cuaderno hecho por [rmcpantoja](http://github.com/rmcpantoja)

* El repositorio de trabajo es hecho por [pilarOG](https://github.com/pilarOG/unit_selection_tts.git)
* Difurcación de adaptación de código a Python3 por [roedoejet](https://github.com/roedoejet/unit_selection_tts)

In [None]:
#@markdown #1: instalación de las herramientas necesarias: parte 1
#@markdown ---
#@markdown Esto instalará el sintetizador y los componentnes necesarios. Por favor, antes de continuar con el paso 1.1, procura reiniciar el entorno.

import os
from os.path import exists
if (not os.path.exists("/content/unit_selection_tts")):
  print("clonando repositorio...")
  !git clone https://github.com/roedoejet/unit_selection_tts
  !pip install --upgrade pip setuptools wheel ipython jedi
else:
  print("El repositorio de trabajo ya existe. Saltando...")
print("Listo")

In [None]:
#@markdown # 1.1: instalación de herramientas: parte 2
#@markdown ---
#@markdown En este paso se instalarán algunas librerías de audio, así como también algunos compiladores extra en los que podremos trabajar con ellos en los siguientes pasos y requerimientos necesarios de `Python`.
!sudo apt-get install portaudio19-dev
!sudo apt-get install python3-all-dev
!sudo apt-get install libc6-dev-i386
!sudo apt-get install libc6-dev
!sudo apt-get install gcc-multilib
%cd /content/unit_selection_tts
!pip install -r requirements.txt
%cd /content
print("listo")

In [None]:
#@markdown #1.2: instalación de herramientas, parte 3
#@markdown ---
#@markdown En este paso se pretende descargar, configurar y compilar las herramientas de alineamiento forzado, uno de los pasos importantes para crear una voz.
#@markdown ## importante

#@markdown Este paso hace la instalación de la herramienta HTK, por lo que tendrás que **registrarte** en el [sitio WEB](https://htk.eng.cam.ac.uk/). Una vez registrado, completa los campos que se te pedirán a continuación:
#@markdown ---
#@markdown ### nombre de usuario de HTK:
userid = "" #@param {type:"string"}
#@markdown ---
#@markdown ### contraseña:
password = "" #@param {type:"string"}
%cd /content
!curl -O https://"$userid":"$password"@htk.eng.cam.ac.uk/ftp/software/HTK-3.4.1.tar.gz
!tar -xvzf HTK-3.4.1.tar.gz
%cd /content/htk
!export CPPFLAGS=-UPHNALG
!./configure --disable-hlmtools --disable-hslab
!make clean    # necessary if you're not starting from scratch
!make -j4 all
!sudo make -j4 install
!sudo make
!apt install sox
%cd /content
!git clone http://github.com/prosodylab/Prosodylab-Aligner
%cd /content/Prosodylab-Aligner
!pip install -r requirements.txt
#!pip install git+http://github.com/prosodylab/Prosodylab-Aligner.git
%cd /content

In [None]:
# @markdown #2: montar tu drive
#@markdown ---
# @markdown Si tienes los audios y transcripciones en tu Google Drive, ejecuta esta celda para que podamos acceder a ellos.

from google.colab import drive
drive.mount('/content/drive')

In [None]:
#@markdown #3: Procesamiento del conjunto de datos
#@markdown ---
#@markdown ### ¿Ruta de drive de tu conjunto de datos?:
#@markdown Este dataset debe contener archivos `.wav` (los audios) y `.lab` (las transcripciones)
datasetPath = "/content/drive/MyDrive/us/dataset.zip" #@param {type:"string"}
import os
import zipfile
!rm /content/unit_selection_tts/recording_scripts/data/*
if os.path.exists(datasetPath):
  if zipfile.is_zipfile(datasetPath):
    !unzip -j "$datasetPath" -d /content/unit_selection_tts/recording_scripts/data
  else:
    raise Exception("Esto no parece ser un archivo comprimido en zip.")
else:
  raise Exception("Este archivo no existe.")
print("listo")

In [None]:
#@markdown #4: entrenamiento
#@markdown ---
#@markdown Esto creará un diccionario con todas las transcripciones de los audios, convirtiendo los textos a fonemas y reglas de pronunciación de español. Una vez hecho, crea el modelo de voz, comenzando con el alineamiento. ¡Esto puede tomar un tiempo si tienes un conjunto de datos de muchos datos!
#@markdown ### dale un nombre a tu voz:
Voicename = "myvoice" #@param {type:"string"}
#@markdown ---
#@markdown ### la ruta donde se guardará el modelo generado:
Voicepath = "/content/drive/MyDrive/usvoices" #@param {type:"string"}
%cd /content/unit_selection_tts/recording_scripts
!python build_dict.py
!mkdir /content/Prosodylab-Aligner/data
!cp /content/unit_selection_tts/recording_scripts/es.dict /content/Prosodylab-Aligner/es.dict
%cd /content/Prosodylab-Aligner
!gdown 1oUD2pc6nnhk3y3C8-H_imr1lqH18tJR3
!cp -a "/content/unit_selection_tts/recording_scripts/data/" "/content/Prosodylab-Aligner"
print("fase 1: creación del modelo")
!python3 -m aligner -c /content/Prosodylab-Aligner/es.yaml -d /content/Prosodylab-Aligner/es.dict -e 10 -t data/ -w es-mod.zip
print("fase 2: alineamiento")
!python3 -m aligner -r /content/Prosodylab-Aligner/es-mod.zip -a data/ -d /content/Prosodylab-Aligner/es.dict

In [None]:
#@markdown #5: conclusión
#@markdown ---
#@markdown Esto preparará el proyecto final que hemos realizado en todas las celdas anteriores para que pueda ser usado o descargado. Ejecuta esta celda para finalizar la creación del modelo de voz.
#@markdown ### ¿Descargar el modelo?
downloadModel = True #@param {type:"boolean"}
from google.colab import files
import shutil
!rm /content/unit_selection_tts/data/*
!rm /content/unit_selection_tts/wav/*
!cp -a "/content/Prosodylab-Aligner/data/" "/content/unit_selection_tts/"
%cd /content/unit_selection_tts
!python set_diphone_library.py
!mkdir project
%cd /content/unit_selection_tts/project
!mkdir wav
!mv "/content/unit_selection_tts/data/" "/content/unit_selection_tts/project/"
!mv "/content/unit_selection_tts/project/data/*.wav" "/content/unit_selection_tts/project/wav/"
!mv "/content/unit_selection_tts/diphone_library.pckl" "/content/unit_selection_tts/project/"
shutil.make_archive(Voicepath+"/"+Voicename, 'zip', '/content/unit_selection_tts/project')
if downloadModel:
  print("descargando modelo")
  files.download(Voicepath+"/"+Voicename+".zip")
print("listo")