<div style="background-color:#262626; text-align: center;">
<img src="https://fiapfunctions.blob.core.windows.net/datasets/capa.png">
</div>

# Start & Tools

O primeiro passo será realizar o download dos arquivos de áudio que serão utilizados nos experimentos durante as aulas.

In [None]:
!mkdir audios
!mkdir imgs

In [None]:
!curl https://meriatdatasets.blob.core.windows.net/public/digital-audio-processing/seis.wav -o audios/seis.wav
!curl https://meriatdatasets.blob.core.windows.net/public/digital-audio-processing/simple_loop.wav -o audios/simple_loop.wav
!curl https://meriatdatasets.blob.core.windows.net/public/digital-audio-processing/image_423.jpg -o audios/image_423.jpg

In [None]:
!ls audios

# Jupyter Audio Basics

## Audio Libraries

Nos exemplos a seguir, usaremos principalmente duas bibliotecas para aquisição e reprodução de áudio:

### 1. librosa

[`librosa`](https://librosa.github.io/librosa/index.html) é um Python package for music and audio processing criado por [Brian McFee](https://bmcfee.github.io/). Uma grande parte foi portada para o Matlab por [Dan Ellis](http://www.ee.columbia.edu/%7Edpwe/resources/matlab/).

Se necessário, a instalação da versão utilizada nesta aula é a: **`0.8.0`**. 

Para a instalação da versão **`0.7.2`**, utilize os seguintes comandos:

* `pip install librosa==0.7.2`
* `pip install numba==0.48.0`

### 2. IPython.display.Audio

[`IPython.display.Audio`](http://ipython.org/ipython-doc/stable/api/generated/IPython.display.html#IPython.display.Audio) nos permite reproduzir áudio diretamente em um notebook IPython.

## Reading Audio

Usamos a função [`librosa.load`](https://librosa.github.io/librosa/generated/librosa.core.load.html#librosa.core.load) para carregar um arquivo de áudio em uma matriz de áudio. Retorne a matriz de áudio e a taxa de amostragem (sample rate):

In [None]:
import librosa

print(librosa.__version__)

In [None]:
x, sr = librosa.load('audios/seis.wav')

> Caso você receba um erro durante o `librosa.load`, garanta que o [ffmpeg](https://librosa.github.io/librosa/install.html#ffmpeg) esteja instalado.

Exibindo o comprimento da matriz de áudio e a taxa de amostragem:

In [None]:
print(x.shape)

print(sr)

## Visualizing Audio

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt
import librosa.display

Plot do audio array com [`librosa.display.waveplot`](https://librosa.github.io/librosa/generated/librosa.display.waveplot.html#librosa.display.waveplot):

In [None]:
plt.figure(figsize=(16, 6))
librosa.display.waveplot(x, sr=sr)
plt.show()

Plot do espectrograma com [`librosa.display.specshow`](https://librosa.github.io/librosa/generated/librosa.display.specshow.html):

In [None]:
X = librosa.stft(x)
Xdb = librosa.amplitude_to_db(abs(X))

plt.figure(figsize=(16, 6))
librosa.display.specshow(Xdb, sr=sr, x_axis='time', y_axis='hz')
plt.show()

## Playing Audio

### `IPython.display.Audio`

Utilizamos o [`IPython.display.Audio`](http://ipython.org/ipython-doc/2/api/generated/IPython.lib.display.html#IPython.lib.display.Audio), para ouvir um determinado áudio diretamente no notebook.

In [None]:
import IPython.display as ipd

ipd.Audio('audios/seis.wav') # load a local WAV file

A função `IPython.display.Audio` traduz qualquer matriz, como por exemplo uma matriz NumPy. Vamos sintetizar um tom puro em 440 Hz:

In [None]:
import numpy

# sample rate
sr = 22050
# seconds
T = 2.0
# time variable
t = numpy.linspace(0, T, int(T*sr), endpoint=False)
# pure sine wave at 440 Hz
x = 0.5*numpy.sin(2*numpy.pi*440*t)

Ouvindo o áudio recém criado

In [None]:
# load a NumPy array
ipd.Audio(x, rate=sr)

## Writing Audio

Use a funcão [`librosa.output.write_wav`](https://librosa.github.io/librosa/generated/librosa.output.write_wav.html#librosa.output.write_wav) para salvar o array NumPy em um arquivo WAV. **Este comando só está disponível para a versão `0.7.2`**

In [None]:
librosa.output.write_wav('audios/tone_440.wav', x, sr)

In [None]:
import soundfile as sf

In [None]:
sf.write('audios/tone_440.wav', x, sr, 'PCM_16')

## ffmpeg & ffprobe

[ffmpeg](https://www.ffmpeg.org/) is a framework to convert among different audio and video file formats.

In [None]:
!ffmpeg -version

In [None]:
!ffprobe -version

In [None]:
!ffmpeg -encoders

In [None]:
!ffprobe -i 'audios/seis.wav' -show_streams

In [None]:
!ffprobe -i 'audios/simple_loop.wav' -print_format 'json' -show_streams