<h1><center>Hito 8</center></h1>

<h1><center>Buffering for dejitterizing</center></h1>

&nbsp;

<center>
Álvaro Garcı́a Garcı́a<br>
Álvaro José Martı́nez Sánchez<br>
José Francisco Castillo Berenguel<br>
</center>
    
    
<hr style="border:1px solid gray"> </hr>

# Introducción


En el presente hito, haremos una pequeña mejora del proyecto InterCom. Dicha mejora consistirá en transmitir los chunks en un buffer y recogerlos en otro distinto. Estos buffers tendrán ciertas propiedades que se explicarán a continuación.  
&nbsp;

# Fundamentos

La siguiente figura muestra las diferencias entre una ejecución sin ningun sistema que permita reducir los efectos del jitter y otra ejecución que dispone de un mecanismo basado en un buffer para reducir dichos efectos.


<center><img src="timelines.svg" align="center"/></center>

&nbsp;

La solución consiste en utilizar un buffer donde se almacenen los chunks que se reciben. Debido a la susceptibilidad de que los paquetes se desordenen por la variación del jitter y la propia latencia, no podemos guardar los paquetes que llegan en el orden de llegada. Por consiguiente, se deberá enviar un índice que permita la ordenación de dichos paquetes.

&nbsp;

## Cola circular

El buffer se implementará mediante una cola circular. Para dicha cola se requiere de un identificador que apunte a la cabeza de la cola desde donde, se recogeran los paquetes que se reproduciran. Sin embargo, no se requiere de un identificador del fin de la cola, ya que los paquetes poseran un identificador propio. 

<center><img src="circular_buffer1.svg" width="240" height="240" align="center"/></center>

&nbsp;

El proceso de dejitterizing con una cola circular requiere que la misma sea de un tamaño de al menos dos veces el jitter. Dado que el jitter es tiempo, para convertirlo en tamaño de cola, lo pasaremos a tiempos de chunk y por consiguiente será una cola de chunks, donde cada celda puede verse como un chunk o un tiempo de reproducción de audio. 

<b>NOTA:</b> La cola debe de estar medio llena antes de reproducir (extraer audio).

## Struct 

Para poder concatenar el índice de los paquetes con el payload de los mismos, se procederá con el uso del paquete struct (aunque es posible concatenarlos únicamente utilizando la librería numpy).

Se utilizarán solamente las funciones `pack` y `unpack`. Dichas funciones requieren de la especificación de un formato. Para nuestros propósitos, el formato viene dado por la concatenación de un entero sin signo de 16 bits junto con vector de enteros con signo 16 bits. Dicho formato se expresa de la siguiente forma.


```Python
pack_format = f"H{args.frames_per_chunk * self.NUMBER_OF_CHANNELS}h"
```

&nbsp;
# Implementación

Se exige realizar una implementación fundamentada en dos funciones. 

$$
\begin{align*}
&\textbf{Record_Send_and_Play()}\\
& \begin{cases}
\text{chunk} ← \text{record()}\\
\text{packed_chunk} ← \text{pack(chunk)}\\
\text{send(packed_chunk)}\\
\text{chunk←unbuffer_next_chunk()}\\
\text{play(chunk)}
\end{cases} \\ \\
&\textbf{Receive_and_Buffer()}\\
& \begin{cases}
\text{packed_chunk←receive()}\\
\text{chunk_number, chunk←unpack(packed_chunk)}\\
\text{buffer(chunk_number, chunk)}
\end{cases}
\end{align*}
$$

&nbsp;

Para ello, se debe crear el módulo buffer que herede de la clase `minimal.py` realizado en el ejercicio 5. Esto reduce el número de métodos que se deben implementar, pero será necesario "sobrecargar" algunos de los métodos de la clase `minimal.py`.

## Constructor

Dado que la clase `buffer.py` hereda de `minimal.py`, lo primero que sebe hacer es llamar al contructor de la clase padre de la forma: `super().__init__()`.

Seguidamente se declaran los atributos necesarios, como la cola o las variables que se necesitan para acceder a ella misma. 

## Variables notorias

Se presentan las siguientes variables:
<br>
1. `head_cell`: Posee el índice de la cabeza de la cola. 
2. `index_remote_cell`: Posee el identificador del siguiente chunk que se va a enviar. 

De forma general, se tiene que:

$$ \text{index_local_cell} \leq \text{index_remote_cell}$$


## Record_Send_and_Play()

Se trata de la función callback que va a utilizar sounddevice. El procedimiento consiste en:

1. Generar el objeto struct que contiene el identificar del paquete que se va a enviar el propio chunk. Dado que el chunk proporcionado por sounddevice es de tipo numpy, se requiere el uso de la función `flatten`, la cual trasnforma un vector de n dimensiones en uno de m dimensión.

```Python
chunk = struct.pack(self.pack_format, self.index_remote_cell, *(data.flatten()))
```

2. Enviar el chunk por medio del socket. Esto puede realizarse por medio de la función de la clase padre.

```Python
super().send(chunk)
```

3. Identificar el siguiente chunk a reproducir. Se presentan los siguientes casos:


        A. No se ha llenado el buffer a la mitad: se reproduce un chunk de ceros. 
    
```Python
to_play = self.zero_chunk
```
        B. Se toma la cabeza de la cola. En última instancia, en caso de que el chunk no ha llegado, se toma un chunk de ceros. 
  
```Python
to_play = self.buffer[self.buffer_head]
self.buffer[position] = self.zero_chunk
self.filled_cells = self.filled_cells - 1
```
  
4. Se le proporciona el chunk correspondiente (chunk resultante del paso 3) al flujo del sounddevice.
```Python
outdata[:] = to_play
```

5. Se actualizan las secuencias de los paquetes local y remoto. 
```Python
self.head_cell = self.update_head()
self.index_remote_cell = self.update_remote_index()
```

## Receive_and_Buffer()

Esta función se ejecuta en la hebra principal tras convocar al método de sounddevice. El procedimiento consiste en: 

1. Recibir un paquete. Pueden ocurrir las siguientes dos situaciones:
```Python
packed_data = self.receive()
```
    A. El paquete llega y se procede a desempaquetarlo y guardarlo en el buffer
    
    
    B. No hay ningún paquete en el socket. Salta una excepción. 

2. Se desempaqueta y reconstruye el vector de numpy con el audio.

```Python
unpacked_data = struct.unpack(self.pack_format, packed_data)
chunk_index = self.to_u16(unpacked_data[0])
data = np.array(unpacked_data[1:])
data = data.reshape(args.frames_per_chunk, self.NUMBER_OF_CHANNELS)
```

3. Se almacena el chunk en el buffer.

```Python
self.buffer[chunk_index % self.buffer_size] = data
self.filled_cells = self.filled_cells + 1
```

# Consideraciones finales

Para el correcto funcionamiento se requiere resolver las siguientes cuestiones:

1. Hay que añadir un argumento que permita la introducción del parámetro asociado al jitter.


2. Antes de ejecutar la función de sounddevice, hay que asegurarse que el socket está en modo no bloqueante.


3. Al introducir exactamente el tiempo de jitter empleado en la regla de `tc`, se reduce notariamente el jitter. No obstante, si se introduce una cota superior de dicho valor, mejorará la calidad del audio pero como consecuencia, aumentará la latencia. 


# Documentación de buffer.py
[`Buffer.py`](buffer.html)