# Vježba 5 - Odmjeravanje i spektralna analiza audio signala

## Osnovni signali u Python-u 

<p>Osnovni signali koji se često koriste u digitalnoj obradi signala su jedinični impuls, eksponencijalne funkcije, sinusne funkcije i njihova generalizacija na kompleksne eksponencijalne funkcije. Budući da je digitalni signal sekvenca (niz) brojeva, onda se ovi signali u Python-u predstavljaju kao Numpy niz reda 1.</p>
<p>Kada se radi sa signalima u Pythonu potrebno je voditi računa o dva pitanja. Prvo je da su svi signali u Python-u konačnog trajanja što se razlikuje od analitičkog rješavanja problema kada je signal beskonačnog trajanja moguće predstaviti matematičkim izrazom. Drugo pitanje se odnosi na korespondenciju vrijednosti indeksa vektora u kojem se nalazi signal i indeksa vremena. U Python-u vrijednosti indeksa niza počinju od 0. Sa druge strane posmatranje signala je moguće da počne u proizvoljnom vremenskom trenutku, koji može odgovarati čak i negativnom vremenskom indeksu, npr. -N. Nažalost, informaciju o vremenskom intervalu, tj. vremenskim indeksima u kojima su definisani odmjerci signala ne možemo pridružiti vektoru u kojem se nalazi signal već se ova informacija mora čuvati odvojeno od signala i koristiti kada je to potrebno. Obično ovo pitanje nije od značaja sve dok se ne dode do grafičke reprezentacije signala. U ovom slučaju potrebno je apscisu označiti na adekvatan način.</p>
<p>Od posebnog značaja su prostoperiodični, sinusni, signali. Diskretna sinusoida je u potpunosti odredena pomoću tri parametra, amplitude ($A$), (digitalne) frekvencije ($\omega$) i početne faze ($\phi$)
$$x(n)=Acos(\omega n+\phi)$$</p>
<p>Često diskretni signali nastaju odmjeravanjem kontinualnih signala, kao što je npr. sinusni signal. U opštem slučaju kontinualna sinusoida je data sledećom jednačinom:
$$x_a(t)=Acos(2\pi Ft+\phi)$$
gdje je $A$ amplituda, $F$ frekvencija u Hercima, a $\phi$ početna faza signala. Ako se diskretni signal dobija odmjeravanjem signala $x_a(t)$, brzinom odmjeravanja $Fs=1/T$, dobijamo
$$x(n)=x_a(nT)=x_a(t)|_{t=nT}=Acos(2\pi \frac{F}{F_s}n+\phi).$$
Poredenjem ove jednačine sa jednačinom diskretne sinusoide vidimo da je frekvencija dobijene diskretne sinusoide (digitalna frekvencija) jednaka
$$\omega = 2\pi \frac{F}{F_s}.$$</p>
<p>Prilikom generisanja signala dobro je nastojati da se iskoriste Numpy-eva mogućnosti za rad sa vektorima kako bi se izbjegle spore for petlje. Primjer kako se može generistai diskretan sinusoida je tad u narednoj ćeliji.</p>

In [1]:
#Naredba koja definiše inline crtanje grafika u Notebook-u
%matplotlib notebook
import matplotlib.pyplot as plt
import numpy as np

Fs = 11025
nsamp = 100
n = np.arange(0, nsamp-1)
x = np.sin(2*np.pi*440*n/Fs)

### Zadaci

<ol>
<li>Generisati vektor $t$ sa vrijednostima iz intervala $[0, 3]$ sa korakom $0.05$.
</li>
</ol>

In [22]:
### KOD
step = 0.05
t = np.arange(0, 3 + step, step)
print(t.shape)
print(t)

(61,)
[0.   0.05 0.1  0.15 0.2  0.25 0.3  0.35 0.4  0.45 0.5  0.55 0.6  0.65
 0.7  0.75 0.8  0.85 0.9  0.95 1.   1.05 1.1  1.15 1.2  1.25 1.3  1.35
 1.4  1.45 1.5  1.55 1.6  1.65 1.7  1.75 1.8  1.85 1.9  1.95 2.   2.05
 2.1  2.15 2.2  2.25 2.3  2.35 2.4  2.45 2.5  2.55 2.6  2.65 2.7  2.75
 2.8  2.85 2.9  2.95 3.  ]


<ol start = "2">
<li> Generisati signal $x_1(t)=cos(2\pi t)$, pri čemu je $t$ vektor definisan u prethodnoj tački. Nacrtati ovaj signal i adekvatno označiti ose. Koliki je period (frekvencija) ovog signala? Na istom grafiku (u istom prozoru) nacrtati ovaj signal korištenjem naredbe stem kako biste vidjeli pojedine odmjerke. Kolika je frekvencija odmjeravanja korištena?
</li>
</ol>

In [24]:
### KOD
x1 = np.cos(2 * np.pi * t)

plt.figure()
plt.subplot(2, 1, 1)
plt.plot(t, x1)
plt.xlabel(r'$t$ [sek]')
plt.ylabel(r'$x(t)$')
plt.title('cosine function')

plt.subplot(2, 1, 2)
plt.stem(t, x1)
plt.xlabel(r'$t$ [sek]')
plt.ylabel(r'$x(t)$')
plt.title('cosine function')
plt.tight_layout()
# period(frekvencija) signala je T=1sek
# frekvencija odmjeravanja je 20 odmjeraka po periodi

<IPython.core.display.Javascript object>

<ol start = "3">
<li> Generisati i nacrtati prethodni signal, ali koristeći frekvenciju odmjeravanja $Fs = 10 Hz$.
</li>
</ol>

In [25]:
### KOD
Fs = 10 
step = 1 / Fs
time = np.arange(0, 3 + step, step)
x = np.cos(2 * np.pi * time)
plt.figure()
plt.plot(time, x)
plt.xlabel(r'$t$ [sek]')
plt.ylabel(r'$x(t)$')
plt.title('Cosine Function For Sampling Frequency Fs = 10Hz')

<IPython.core.display.Javascript object>

Text(0.5,1,'Cosine Function For Sampling Frequency Fs = 10Hz')

<ol start = "4">
<li> Generisati i nacrtati prethodni signal, ali koristeći frekvenciju odmjeravanja $Fs = 2 Hz$.
</li>
</ol>

In [27]:
### KOD
Fs = 2
step = 1 / Fs
time = np.arange(0, 3 + step, step)
x = np.cos(2 * np.pi * time)
plt.figure()
plt.plot(time, x)
plt.xlabel(r'$t$ [sek]')
plt.ylabel(r'$x(t)$')
plt.title('Cosine Function For Sampling Frequency Fs = 2Hz')

<IPython.core.display.Javascript object>

Text(0.5,1,'Cosine Function For Sampling Frequency Fs = 2Hz')

<ol start = "5">
<li> Grafički prikaz signala odmjerenog visokom frekvencijom odmjeravanja možemo smatrati prikazom kontinualnog signala. U ovom slučaju to može biti grafik iz tačke 2. U novim prozorima nacrtati grafike na kojima su na grafik iz tačke 2. dodati odmjerci iz tačaka 3, odnosno, 4.
</li>
</ol>

In [28]:
### KOD
plt.figure()

# first graphic for first plot
step = 0.05
t = np.arange(0, 3 + step, step)
x1 = np.cos(2 * np.pi * t)
plt.subplot(2, 1, 1)
plt.xlabel(r'$t$ [sek]')
plt.ylabel(r'$x(t)$')
plt.title('cosine function')
plt.plot(t, x1)
# second graphic for first plot
Fs = 10
step = 1 / Fs
time = np.arange(0, 3 + step, step)
x = np.cos(2 * np.pi * time)
plt.stem(time, x)

# first graphic for second plot
step = 0.05
t = np.arange(0, 3 + step, step)
x1 = np.cos(2 * np.pi * t)
plt.subplot(2, 1, 2)
plt.plot(t, x1)
plt.xlabel(r'$t$ [sek]')
plt.ylabel(r'$x(t)$')
plt.title('cosine function')
# second graphic for second plot
Fs = 2
step = 1 / Fs
time = np.arange(0, 3 + step, step)
x = np.cos(2 * np.pi * time)
plt.stem(time, x)

plt.tight_layout()

<IPython.core.display.Javascript object>

<ol start = "6">
<li>  Generisati i nacrtati signal $x_2(t)=cos(2\pi 19t)$ koristeći frekvenciju odmjeravanja $Fs = 10 Hz$. Uporediti ovaj signal sa signalom iz tačke 3. i komentarisati rezultat.
</li>
</ol>

In [32]:
### KOD
Fs = 10 # Hz
step = 1 / Fs
time = np.arange(0, 3 + step, step)
print(time.shape)
x2 = np.cos(2 * np.pi * 19 * time)
print(x2.shape)
# drawing
plt.figure()
plt.plot(time, x2)
plt.xlabel(r'$t$ [sek]')
plt.ylabel(r'$x(t)$')
plt.title(r'$x(t)=cos(2*pi*19*t)$')

(31,)
(31,)


<IPython.core.display.Javascript object>

Text(0.5,1,'$x(t)=cos(2*pi*19*t)$')

<ol start = "7">
<li> Generisati $2s$ sinusnog signala frekvencije $440 Hz$ i amplitude $0.5$. Frekvencija odmjeravanja je $11025 Hz$. Reprodukovati ovaj signal pomoću sounddevice biblioteke.
</li>
</ol>

In [35]:
### KOD
from scipy.io import wavfile
import sounddevice as sd

Fs = 11025
frequency = 440
amplitude = 0.5
step = 1 / Fs
time = np.arange(0, 2 + step, step)
x = amplitude * np.sin(2 * np.pi * frequency * time)

plt.figure()
plt.plot(time, x)
plt.xlabel(r'$t$ [sek]')
plt.ylabel(r'$x(t)$')
plt.title(r'$x(t)=cos(2*pi*freq*t)$')
sd.play(x, Fs, blocking=True)

<IPython.core.display.Javascript object>

<ol start = "8">
<li> Ponoviti prethodnu tačku za signale frekvencije $220 Hz$ i $880 Hz$.
</li>
</ol>

In [56]:
### KOD
from scipy.io import wavfile
import sounddevice as sd
plt.figure()

Fs = 11025
frequency = 220
amplitude = 0.5
step = 1 / Fs
time = np.arange(0, 2 + step, step)
x = amplitude * np.sin(2 * np.pi * frequency * time)
plt.subplot(2, 1, 1)
plt.plot(time, x)
plt.xlabel(r'$t$ [sek]')
plt.ylabel(r'$x(t)$')
plt.title(r'$x(t)=cos(2*pi*freq*t)$')
sd.play(x, Fs, blocking=True)

Fs = 11025
frequency = 880
amplitude = 0.5
step = 1 / Fs
time = np.arange(0, 2 + step, step)
x = amplitude * np.sin(2 * np.pi * frequency * time)
plt.subplot(2, 1, 2)
plt.xlabel(r'$t$ [sek]')
plt.ylabel(r'$x(t)$')
plt.title(r'$x(t)=cos(2*pi*freq*t)$')
plt.plot(time, x)
sd.play(x, Fs, blocking=True)

plt.tight_layout()

<IPython.core.display.Javascript object>

##  Spektralna analiza audio signala

<p>Furijeova transformacija diskretnog signala $x(n)$ je
$$X(e^{j\omega})=\sum_{n=- \infty}^{\infty} x(n)e^{-j\omega n}.$$
Važno je uočiti da je Furijeova transformacija diskretnog signala kontinualna funkcija veličine označene sa $\omega$ koja se obično naziva digitalna frekvencija. Veza izmedu digitalne i analogne frekvencije ($F$, izražene u Hercima) data je u prethodnoj sekciji.</p>
<p>Pošto je naš cilj da pomoću računara izračunamo spektar signala onda je neophodno diskretizovati frekvencijsku promjenljivu $\omega$. Pošto je Furijeova transformacija diskretnog signala periodična sa periodom $2\pi$, uobičajeno je da se diskretizacija vrši u $N$ tačaka ravnomjerno rasporedenih na osnovnom periodu Furijeove transformacije, tj. u frekvencijam
$$\omega_{k}=\frac{2\pi k}{N}, k=0,...,N-1.$$
Može se pokazati da ukoliko je broj tačaka $N$ u kojima se odmjerava Furijeova transformacija veći ili jednak od trajanja signala onda odmjerci Furijeove transformacije odgovaraju vrijednostima diskretne Furijeove transformacije (DFT)
$$X(k)=\sum_{n=0}^{N-1} x(n)e^{-j\frac{2\pi kn}{N}}.$$</p>
<p>DFT je obično implementirana pomoću FFT (Fast Fourier Transform) algoritma. Važno je napomenuti da se pomoću FFT tačno izračunava DFT signala. Postoji mnogo implementacija FFT algoritma i, u opštem slučaju, one rade za proizvoljnu dužinu signala, ali najbrže izračunavanje se postiže kada je dužina signala stepen broja 2. Srećom, ovo se uvijek može postići dopunjavanjem uzorka signala nulama do trajanja koje je stepen broja 2. Dodatna korist od dopunjavanja nulama je i finija interpolacija u frekvencijskom domenu. Za izračunavanje FFT u Python-u se koristi Numpy biblioteka i to njen modul fft. Korisne funkcije su:
<ul><li>fft(x, N), brza Furijeova transformacija niza $x$ u $N$ tačaka,</li>
<li>ifft(X, N), inverzna Furijeova transformacija niza $X$ u $N$ tačaka.</li></ul></p>
<p>Ukoliko se ne zada broj tačaka u kojima se računa FFT (parametar $N$), onda se podrazumijeva da je $N$ jednako dužini signala. Ukoliko je $N$ veće od dužine signala, signal se interno dopunjava nulama do dužine $N$. Ukoliko je $N$ manje od dužine signala, FFT se izračunava samo za prvih $N$ odmjeraka signala. Sljedećim primjerom je ilustrovano izračunavanje i crtanje spektra sinusnog signala:</p>

In [36]:
from numpy.fft import fft, ifft

#%% definisati signal
n = np.arange(32)
x = np.cos(np.pi*n/4)

#%% crtanje signala
plt.figure()
plt.stem(n, x)
plt.xlabel(r'$n$')
plt.ylabel(r'$x(n)$')

#%% DFT diskretne sinusoide (bez curenja spektra)
N = len(x)
xdft = fft(x, N)
k = np.arange(N)

#%% crtanje koeficijenata
plt.figure()
plt.stem(k, np.abs(xdft))
plt.xlabel(r'$k$')
plt.ylabel(r'$|X(k)|$')

#%% spektar diskretnog signala je kontinualna funkcija
# crtamo aproksimaciju dobijenu pomocu DFT
# frekvencije u kojima je izracunata DFT
w = 2*np.pi*k/N
plt.figure()
plt.plot(w, np.abs(xdft))
plt.xlabel(r'$\omega$')
plt.ylabel(r'$|X(\omega)|$')

#%% inverzna DFT
xrec = ifft(xdft, N)

# crtanje rekonstruisane sinusoide
plt.figure()
plt.stem(n, xrec.real)
plt.xlabel(r'$n$')
plt.ylabel(r'$x_{rec}(n)$')

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

Text(0,0.5,'$x_{rec}(n)$')

<p>Često se amplitudni spektar crta na logaritamskoj skali i u tom slučaju se izražava u decibelima ($dB$).
$$X_{dB}(\omega) = 20log(\mid X(e^{j\omega}\mid ) [dB].$$
Amplitudni spektar izražen u decibelima se može nacrtati pomoću sljedećeg koda.</p>

In [4]:
plt.figure()
plt.plot(w, 20*np.log10(np.abs(xdft)))
plt.xlabel(r'$\omega$')
plt.ylabel(r'$|X(\omega) [dB]|$')

<IPython.core.display.Javascript object>

Text(0,0.5,'$|X(\\omega) [dB]|$')

<p>U slučaju nestacionarnih signala (kao što su npr. govor i muzika) spektar signala se mijenja sa vremenom. Za analizu takvih signala koristi se kratkotrajna Furijeova transformacija (Short Time Fourier Transform, STFT). Kratkotrajna Furijeova transformacija predstavlja sekvencu DFT primijenjenih na kratke segmente signala. Slična analiza zvučnog signala se vrši i u
čovjekovom uhu. Grafička reprezentacija kratkotrajne Furijeove transformacije u funkciji vremena i frekvencije naziva se spektrogram. Spektrogram se intenzivno koristi u analizi i sintezi govora i muzike. U Python-u spektrogram je implementiran funkcijom <a href="https://docs.scipy.org/doc/scipy/reference/generated/scipy.signal.spectrogram.html">spectrogram</a> u modulu signal biblioteke scipy.
</p>

### Zadaci

<ol start = "1">
<li> Generisati sinusoidu frekvencije $440 Hz$, sa amplitudom $1$ i trajanjem $1 s$. Frekvencija odmjeravanja je $8 kHz$. Izračunati i nacrtati njen spektar. Na apscisi treba da bude označena frekvencija u $Hz$.
</li>
</ol>

In [38]:
### KOD
from numpy.fft import fft, ifft, fftfreq, rfft

Fs = 8000
frequency = 440
step = 1 / Fs
amplitude = 1
time = np.arange(0, 1 + step, step)
x = amplitude * np.sin(2 * np.pi * frequency * time)
N = len(time)
# k = np.arange(N)
freq = fftfreq(N, 1 / Fs)
xdft = fft(x, N)


plt.figure()
plt.plot(freq, np.abs(xdft))
plt.xlabel('$F$ [Hz]')
plt.ylabel('$|X(F)|$')
plt.title(r'$x(t)=A*cos(2*pi*440*t)$')

<IPython.core.display.Javascript object>

Text(0.5,1,'$x(t)=A*cos(2*pi*440*t)$')

<ol start = "2">
<li> Generisati složenoperiodični signal čija je osnovna frekvencija $440 Hz$, trajanje $1 s$, a amplitude harmonika su, redom, $1$, $0.8$, $0.1$ i $0.04$. Frekvencija odmjeravanja je $8 kHz$. Izračunati i nacrtati spektar ovog signala. Na apscisi treba da bude označena frekvencija u $Hz$.
</li>
</ol>

In [58]:
### KOD
Fs = 8000
frequency = 440
step = 1 / Fs
time = np.arange(0, 1 + step, step)
x1 = 1 * np.sin(2 * np.pi * 1 * frequency * time)
x2 = 0.8 * np.sin(2 * np.pi * 2 * frequency * time)
x3 = 0.1 * np.sin(2 * np.pi * 3 * frequency * time)
x4 = 0.04 * np.sin(2 * np.pi * 4 * frequency * time)
N = len(time)
freq = fftfreq(N, 1 / Fs)
x11 = fft(x1, N)
x21 = fft(x2, N)
x31 = fft(x3, N)
x41 = fft(x4, N)
plt.figure()
plt.subplot(2, 2, 1)
plt.plot(freq, np.abs(x11))
plt.xlabel('$F$ [Hz]')
plt.ylabel('$|X(F)|$')
plt.subplot(2, 2, 2)
plt.plot(freq, np.abs(x21))
plt.xlabel('$F$ [Hz]')
plt.ylabel('$|X(F)|$')
plt.subplot(2, 2, 3)
plt.plot(freq, np.abs(x31))
plt.xlabel('$F$ [Hz]')
plt.ylabel('$|X(F)|$')
plt.subplot(2, 2, 4)
plt.plot(freq, np.abs(x41))
plt.xlabel('$F$ [Hz]')
plt.ylabel('$|X(F)|$')
plt.tight_layout()

plt.figure()
x = fft(x1 + x2 + x3 + x4, N)
plt.plot(freq, np.abs(x))
plt.xlabel('$F$ [Hz]')
plt.ylabel('$|X(F)|$')
plt.title(r'$x(t)=A*cos(2*pi*freq*t)$')
plt.tight_layout()

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<ol start = "3">
<li> Generisati pravougaoni signal frekvencije $440 Hz$. Izračunati i nacrtati spektar signala.
</li>
</ol>

In [39]:
### KOD
from scipy import signal

Fs = 44100
frequency = 440
step = 1 / Fs
time = np.arange(0, 1 + step, step)
x = signal.square(2 * np.pi * frequency * time)
N = len(time)
freq = fftfreq(N, 1 /Fs)
xdft = fft(x, N)

plt.figure()
plt.subplot(2, 1, 1)
plt.plot(time, x)
plt.xlabel(r'$t$ [sek]')
plt.ylabel(r'$x(t)$')
plt.title(r'$x(t)=A*cos(2*pi*freq*t)$')
plt.subplot(2, 1, 2)
plt.plot(freq, np.abs(xdft))
plt.xlabel('$F$ [Hz]')
plt.ylabel('$|X(F)|$')
plt.title(r'$x(t)=A*cos(2*pi*freq*t)$')
plt.tight_layout()

<IPython.core.display.Javascript object>

<ol start = "4">
<li> Generisati trougaoni signal frekvencije $440 Hz$. Izračunati i nacrtati spektar signala.
</li>
</ol>

In [60]:
### KOD
from scipy import signal
Fs = 44100
frequency = 440
step = 1 / Fs
time = np.arange(0, 1 + step, step)
x = signal.sawtooth(2 * np.pi * frequency * time)
N = len(time)
freq = fftfreq(N, 1 / Fs)
xdft = fft(x, N)

plt.figure()
plt.subplot(2, 1, 1)
plt.plot(time, x)
plt.xlabel(r'$t$ [sek]')
plt.ylabel(r'$x(t)$')
plt.title(r'$x(t)=A*cos(2*pi*freq*t)$')
plt.subplot(2, 1, 2)
plt.plot(freq, np.abs(xdft))
plt.xlabel('$F$ [Hz]')
plt.ylabel('$|X(F)|$')
plt.title(r'$x(t)=A*cos(2*pi*freq*t)$')
plt.tight_layout()

<IPython.core.display.Javascript object>

<ol start = "5">
<li> Učitati signal <i>piano_C4.wav</i>. Funkcija kojoj je moguće učitati audio je data. Reprodukovati signal, nacrtati talasni oblik i spektar signala. Uporediti dobijene rezultate sa prethodnim signalima. 
</li>
</ol>

In [40]:
### KOD
def read_wav(path):
    from scipy.io import wavfile
    Fs, x = wavfile.read(path)
    x = x.astype('float')
    x -= np.mean(x)
    x /= np.max(x)
    
    return Fs, x

Fs, x = read_wav('piano_C4.wav')
sd.play(x, Fs, blocking=True)

step = 1 / Fs
duration = x.shape[0] / Fs
time = np.arange(0, duration, step)

N = len(time)
freq = fftfreq(N, 1 / Fs)
xdft = fft(x, N)

plt.figure()
plt.subplot(2, 1, 1)
plt.plot(time, x)
plt.xlabel(r'$t$ [sek]')
plt.ylabel(r'$x(t)$')
plt.subplot(2, 1, 2)
plt.plot(freq, np.abs(xdft))
plt.xlabel('$F$ [Hz]')
plt.ylabel('$|X(F)|$')
plt.tight_layout()

<IPython.core.display.Javascript object>

<ol start = "6">
<li> Generisati 4 tona:
$$x_1(t)=cos(2\pi 100t)$$
$$x_2(t)=cos(2\pi 200t)$$
$$x_2(t)=cos(2\pi 500t)$$
$$x_2(t)=cos(2\pi 1000t).$$
Koristiti frekvenciju odmjeravanja od $8000 Hz$. Nacrtati spektrogram signala koji se dobije konkatenacijom ova 4 tona. Koristiti Hemingov (hamming) prozor dužine $256$, preklapanje $128$ odmjeraka, a FFT računati u $1024$ tačke uz dopunjavanje nulama.
</li>
</ol>

In [63]:
### KOD
Fs = 8000
step = 1 / Fs
time = np.arange(0, 2 + step, step)
x1 = np.cos(2 * np.pi * 100 * time)
x2 = np.cos(2 * np.pi * 200 * time)
x3 = np.cos(2 * np.pi * 500 * time)
x4 = np.cos(2 * np.pi * 1000 * time)
x = np.concatenate((x1, x2, x3, x4))

# N = len(time)
# freq = fftfreq(N, 1 / Fs)
# dft = fft(x1 + x2 + x3 + x4, N)

f, t, Sxx = signal.spectrogram(x, fs=Fs, window=np.hamming(M=256), noverlap=128, nfft=1024, mode='magnitude')
plt.figure()
plt.pcolormesh(t, f, Sxx)
plt.xlabel('$F$')
plt.ylabel('$|X(F)|$')
plt.title(r'$x(t)=A*cos(2*pi*freq*t)$')

  output = mkl_fft.rfft_numpy(a, n=n, axis=axis)


<IPython.core.display.Javascript object>

Text(0.5,1,'$x(t)=A*cos(2*pi*freq*t)$')

<ol start = "7">
<li> Dat je frekvencijski modulisan (chirp) signal $x(t)=cos(2\pi \mu t^2)$. Generisati odmjerke ovog signala na intervalu $t = 0$ do $t = 1 s$. Uzeti da je $\mu = 11025$, a frekvencija odmjeravanja iznosi $22050 Hz$. Reprodukovati signal. Nacrtati spektrogram ovog signala. Koristiti Hemingov (hamming) prozor dužine $256$, preklapanje $255$ odmjeraka, a FFT računati u $1024$ tačke uz dopunjavanje nulama.
</li>
</ol>

In [26]:
### KOD
u = 11025
Fs = 22050
step = 1 / Fs
time = np.arange(0, 1 + step, step)
x = np.cos(2 * np.pi * u * time ** 2)

sd.play(x, Fs, blocking=True)

f, t, Sxx = signal.spectrogram(x, fs=Fs, noverlap=255, nfft=1024, window=np.hamming(M=256))
plt.figure()
plt.pcolormesh(t, f, np.abs(Sxx))
plt.xlabel('$F$')
plt.ylabel('$|X(F)|$')

  output = mkl_fft.rfft_numpy(a, n=n, axis=axis)


<IPython.core.display.Javascript object>

Text(0,0.5,'$|X(F)|$')

<ol start = "8">
<li> Učitati signal <i>piano_C4.wav</i>. Nacrtati spektrogram ovog signala. Koristiti Hemingov prozor dužine $512$ i preklapanje $256$ odmjeraka. FFT računati u $1024$ tačke.
</li>
</ol>

In [77]:
### KOD
Fs, x = read_wav('piano_C4.wav')
sd.play(x, Fs, blocking=True)

f, t, Sxx = signal.spectrogram(x, fs=Fs, noverlap=256, nfft=1024, window=np.hamming(M=512))
plt.figure()
plt.pcolormesh(t, f, Sxx)
plt.xlabel('$F$')
plt.ylabel('$|X(F)|$')
plt.title(r'Audio: $piano_C4.wav$')

  output = mkl_fft.rfft_numpy(a, n=n, axis=axis)


<IPython.core.display.Javascript object>

Text(0.5,1,'Audio: $piano_C4.wav$')

<ol start = "9">
<li> Učitati govorni signal u fajlu <i>iaeao.wav</i>. Nacrtati spektrogram ovog signala korištenjem Hemingovog prozora dužine $512$ i preklapanje $480$ odmjeraka. FFT računati u $1024$ tačke. Pošto se govorni signal za vokale u prvoj aproksimaciji može modelirati izlazom iz filtra pobudenog nizom impulsa, njegov talasni oblik je kvaziperiodičan i spektrogram dobijen sa ovim parametrima bi trebalo da se sastoji od mnogo linija na jednakim razmacima zbog kvaziperiodičnosti signala sa periodom (pitch period) od približno $10ms$.
</li>
</ol>

In [76]:
### KOD
Fs, x = read_wav('iaeao.wav')
sd.play(x, Fs, blocking=True)

f, t, Sxx = signal.spectrogram(x, fs=Fs, noverlap=480, nfft=1024, window=np.hamming(M=512), mode='magnitude')
plt.figure()
plt.pcolormesh(t, f, Sxx)
plt.xlabel('$F$ [Hz]')
plt.ylabel('$|X(F)|$')
plt.title(r'Audio: $iaeao.wav$')

  output = mkl_fft.rfft_numpy(a, n=n, axis=axis)


<IPython.core.display.Javascript object>

Text(0.5,1,'Audio: $iaeao.wav$')

<ol start = "10">
<li> Nacrtati spektrogram signala iz prethodne tačke korištenjem Hemingovog prozora dužine $64$ i preklapanje $32$ odmjerka. FFT računati u $1024$ tačke. U ovom slučaju bi spektralni oblik filtra vokalnog trakta trebalo da bude vidljiv u nekoliko (manje od 5) velikih rezonantnih pikova spektrograma.
</li>
</ol>

In [75]:
### KOD
Fs, x = read_wav('iaeao.wav')
sd.play(x, Fs, blocking=True)

f, t, Sxx = signal.spectrogram(x, fs=Fs, noverlap=32, nperseg=64, nfft=1024, window=np.hamming(M=64), mode='magnitude')
plt.figure()
plt.pcolormesh(t, f, Sxx)
plt.xlabel('$F$ [Hz]')
plt.ylabel('$|X(F)|$')
plt.title(r'Audio: $iaeao.wav$')

  output = mkl_fft.rfft_numpy(a, n=n, axis=axis)


<IPython.core.display.Javascript object>

Text(0.5,1,'Audio: $iaeao.wav$')

<ol start = "11">
<li>  Učitati govorni signal u fajlu <i>sat.wav</i>. Pošto je govorni signal nestacionaran njegov spektar je funkcija vremena i najčešće se predstavlja korištenjem spektrograma. Nacrtati spektrogram datog signala korišćenjem Hemingovog prozora dužine $512$ odmjeraka sa preklapanjem sukcesivnih prozora od $481$ odmjeraka. Uočiti kakakteristične strukture koje postoje u govornom signalu.
</li>
</ol>

In [74]:
### KOD
Fs, x = read_wav('sat.wav')
sd.play(x, Fs, blocking=True)

f, t, Sxx = signal.spectrogram(x, fs=Fs, nperseg=512, noverlap=481, nfft=1024, window=np.hamming(M=512), mode='magnitude')
plt.figure()
plt.pcolormesh(t, f, Sxx)
plt.xlabel('$F$ [Hz]')
plt.ylabel('$|X(F)|$')
plt.title(r'Audio: $sat.wav$')

  output = mkl_fft.rfft_numpy(a, n=n, axis=axis)


<IPython.core.display.Javascript object>

Text(0.5,1,'Audio: $sat.wav$')

## Aditivna sinteza zvuka 

<p>Helmholtz je 1859. godine pokazao da je moguće sintetizovati zvukove pomoću elektromagnetno pobudenih muzičkih viljušaka čiju je glasnoću kontrolisao pomoću pokrivača. Najefektnija demonstracija ove ideje je bila sintetizovanje zvukova vokala. Pošto je talasni oblik zvuka koji proizvodi zvučna viljuška približno sinusoida to znači da se sintetizovani signal iz Helmholtzovih eksperimenata može prikazati kao superpozicija sinusoida različitih frekvencija i amplituda. Ovo je osnova aditivne sinteze zvuka. Frekvencije sinusoidalnih komponenata mogu, ali ne moraju, biti harmonijski vezane, tj. biti cjelobrojni umnošci osnovne frekvencije. U slučaju da su frekvencije komponenata harmonijski vezane, sinusoidalne komponente se zovu harmonici. Za datu osnovnu frekvenciju $f_1$ i amplitude harmonika $p_n$, sintetizovani signal je dat sa:
$$x(t)=\sum_{n=1}^{N} p_ncos(2\pi f_1t + \theta_{n}).$$
Početne faze harmonika $\theta_{n}$ ne igraju nikakvu ulogu u sintezi audio signala pa se mogu zanemariti.</p>
<p>Prethodna jednačina predstavlja sumu konačnog broja članova Furijeovog reda sa osnovnom frekvencijom $f_1$. Zbog toga se vrijednosti amplituda harmonika mogu dobiti Furijeovom analizom signala koji želimo da sintetizujemo.</p>
<p>Vrijednosti osnovne frekvencije i amplituda harmonika odreduju visinu i boja sintetizovanog tona. Kako bi se dobilo realistično zvučanje tona potrebno je modelovati i njegovu anvelopu $e(t)$. Konačni ton se dobija množenjem polaznog tona i anvelope
$$y(t)=x(t)e(t).$$</p>

### Zadaci

<ol start = "1">
<li> Na osnovu amplitudnog spektra tona u fajlu <i>piano_C4.wav</i> sintetizovati ton koji ima istu visinu i boju i traje $1 s$. Kako biste izbjegli odsijecanje signala prilikom reprodukcije normalizujte vrijednosti odmjeraka na interval $[−1, +1]$. Reprodukovati sintetizovani signal.
</li>
</ol>

In [23]:
### KOD

<ol start = "2">
<li> Pomnžiti sintetizovani ton eksponencijalnom anvelopom čija je vremenska konstanta jednaka $0.35 s$. Reprodukovati dobijeni signal.
</li>
</ol>

In [24]:
### KOD

<ol start = "3">
<li> Napišite program u Python-u koji će generisati C-dur ljestvicu. Vrijednosti frekvencija pojedinih tonova možete preuzeti iz članka u Vikipediji (http://en.wikipedia.org/wiki/Piano_key_frequencies).
</li>
</ol>

In [25]:
### KOD