# CM6 : Données de type signal

In [None]:
import numpy as np
from PIL import Image
import matplotlib.pyplot as plt
import scipy.io.wavfile as wav
import torchaudio
#import torch
from IPython.display import Audio, display
from scipy.fft import fft
from utils import *

# 1) Echantillonnage et dimensions

## cas des images

In [None]:
im = Image.open('figures/lmu.jpg')
plt.figure(figsize=(12,4))
plt.imshow(im)
plt.show()

In [None]:
imn = np.array(im)
print(f"dimensions de l'image (largeur, hauteur, couleur): {imn.shape}")

In [None]:
imnr = imn[85:125,240:270]
plt.imshow(imnr)
plt.show()

In [None]:
imnr_col = imnr.copy()
imnr_col[:,:,1:] =0
plt.imshow(imnr_col)
plt.show()

## cas des fichiers audio

In [None]:
y, fs = torchaudio.load('figures/radio.wav')

print(torchaudio.info('figures/radio.wav'))

In [None]:
plot_waveform(y, fs)

In [None]:
display(Audio(y, rate=fs*2))

In [None]:
#je veux le signal entre 1 et 2s
#puis sur 10 échantillons
n1 = int(1*fs)
n2 = int(2*fs)
#n2 = n1+10
wr = y[0,n1:n2].reshape((1,n2-n1))
plot_waveform(wr, fs, "forme d'onde réduite")

## contenu fréquentiel (kesako ?)

In [None]:
plot_specgram(wr, fs, ylim=[0, 6000])

![toto](./figures/everything_in_its_right_place.png)

Observer le contenu fréquentiel sur un extrait court et **stationnaire** ? 

In [None]:
nfft = 1024
nr1 = int(0.05*fs)
nr2 = int(0.25*fs)
wrr = wr[0,nr1:nr2].numpy()
print(wrr.shape)
tps = np.linspace(0.05, 0.25, nr2-nr1)
plot_temps(tps, wrr)
#TFwrr = fft(wrr, nfft)

#freq = np.linspace(0, fs, nfft)
#plot_freq(freq, np.abs(TFwrr), xlim=[0, 2500])

# 2) Définir des signaux théoriques

On essaye de reproduire deux signaux théoriques : sinus et rectangle sur une durée donnée avec une fréquence d'échantillonnage donnée.

In [None]:
fsm = 2000  # Hz
Tm = 1.2   # secondes

def sinusoide(tps, f0):
    # tps: vecteurs de temps correspondant à l'échantillonnage
    # f0 : fréquence fondamentale, inverse de la période fondamentale
    return np.sin(2*np.pi*f0*tps)

def rectangle(tps, a, fs, m = None):
    # tps: vecteurs de temps correspondant à l'échantillonnage
    # a : largeur de la fenêtre (en secondes) où le rectangle vaut 1.
    # attention ici on placera par défaut le temps t=0 au milieu
    n = len(tps)
    if m:
        n1 = int(m*fs) - int(a*fs/2)
        n2 = int(m*fs) + int(a*fs/2)
    else:
        n1 = n//2 - int(a*fs/2)
        n2 = n//2 + int(a*fs/2)
    rec = np.zeros(n)
    rec[n1:n2] = 1
    return rec
    
t = np.linspace(0, Tm, int(Tm*fsm))
y = sinusoide(t, 10)
z = rectangle(t, 0.4, fsm)
plt.figure(figsize=(12,4))
plt.subplot(1,2,1)
plt.plot(t,y)
plt.xlabel('temps(sec)')
plt.ylabel('amp')
plt.title('sinusoide')
plt.subplot(1,2,2)
plt.plot(t,z)
plt.xlabel('temps(sec)')
plt.ylabel('amp')
plt.title('rectangle')
plt.show()

Quelles fréquences sont contenues dans ces signaux ?? Faisons une transformée de Fourier, car la décomposition en série de Fourier n'est pas évidente à implémenter en python. 

Comme se sont des signaux **stationnaires** qui ne varient pas au cours du temps, on calculera la transformée de Fourier sur l'ensemble de la durée du signal. 

Pour des signaux non stationnaires comme ceux que vous traiterez en TD, on utilisera le concept de **trames** qui correspond à une fenêtre temporelle sur laquelle on considère le signal comme stationnaire. Typiquement dans le traitement audio ces trames durent entre 20 et 40ms.

In [None]:
f = np.linspace(0, fsm, int(Tm*fsm))
TFy = np.abs(fft(y))
TFz = np.abs(fft(z))
plt.figure(figsize=(12,4))
plt.subplot(1,2,1)
plt.plot(f,TFy)
plt.xlabel('freq(Hz)')
plt.ylabel('amp')
plt.xlim([0,100])
plt.title('sinusoide')
plt.subplot(1,2,2)
plt.plot(f,TFz)
plt.xlabel('freq(Hz)')
plt.ylabel('amp')
plt.xlim([0,100])
plt.title('rectangle')
plt.show()

# 3) Reconstruire les premières notes

In [None]:
temps = np.linspace(0, wr.shape[1]/fs, wr.shape[1])
y1 = 0.3 * sinusoide(temps, 261.63) * rectangle(temps, 0.2, fs, m = 0.1)

#plot_temps(temps, y1)

y2 = (0.3 * sinusoide(temps, 261.63) +
      0.4 * sinusoide(temps, 207.65)) * rectangle(temps, 0.2, fs, m = 0.3)

#plot_temps(temps, y2)
freq = np.linspace(0, fs, wr.shape[1])
TFy1 = np.abs(fft(y1, nfft))
plt.plot(freq[:64],TFy1[:64])
#plt.plot(freq[:64], np.abs(TFwrr[0:64]), 'r')
plt.show()

In [None]:
display(Audio(y1+y2, rate=fs))

In [None]:
wav.write('debut.wav', fs, y1+y2)

### On voudrait un signal qui sonne plus "réel"
On va donc créer un signal harmonique, c'est à dire un signal qui contient une sinusoide de fréquence $f_0$ et ses harmoniques.

In [None]:
def harmonique(tps, f0, coef):
    y = np.zeros((len(coef), len(tps)))
    for i, c in enumerate(coef):
        y[i,:] = c * sinusoide(tps, i*f0)
    return np.sum(y, axis=0)

coef = [2/n if n > 0 else 1 for n in range(0,8) if n > 0]
print(coef)
yharmo = harmonique(temps, 10, coef)
r1 = rectangle(temps, 0.2, fs, m = 0.1)
plot_temps(temps,yharmo*r1)

In [None]:
display(Audio(yharmo*r1+y2, rate=fs))