Pojam nestacionarnih signala i potrebu za njihovom spektralnom analizom ilustrovaćemo na jednostavnom primjeru.

Posmatrajmo signale date jednačinama
$$
x_1 \left( t \right) = \cos \left( 2 \pi 100 t \right) + \cos \left( 2 \pi 200 t \right) + \cos \left( 2 \pi 500 t \right) + \cos \left( 2 \pi 1000 t \right) 
$$
i
$$
x_2 \left( t \right) = \left\{ \begin{array}{ll}
\cos \left( 2 \pi 100 t \right), & 0 \leq t < 0,1 \text{ s}   \\
\cos \left( 2 \pi 200 t \right), & 0,1 \text{ s} \leq t < 0,2 \text{ s} \\
\cos \left( 2 \pi 500 t \right), & 0,2 \text{ s} \leq t < 0,3 \text{ s} \\
\cos \left( 2 \pi 1000 t \right), & 0,3 \text{ s} \leq t < 0,4 \text{ s}
\end{array} \right..
$$
Prvi signal je složenoperiodičan i sadrži četiri harmonika čije su frekvencije 100, 200, 500 i 1000 Hz, a drugi signal je formiran konkatenacijom prostoperiodičnih signala frekvencija 100, 200, 500 i 1000 Hz i trajanja 0,1 s. Oba signala su odmjerena sa frekvencijom odmjeravanja od 4 kHz. 

In [1]:
%matplotlib notebook
import numpy as np
from scipy import fftpack, signal
from scipy.io import wavfile
import matplotlib.pyplot as plt
from IPython.display import Audio

Generisaćemo i nacrtati signale

In [2]:
F1 = 100
F2 = 200
F3 = 500
F4 = 1000
t0 = 0.1
Fs = 4000
t = np.arange(0, t0, 1./Fs)
xa = np.cos(2*np.pi*F1*t) 
xb = np.cos(2*np.pi*F2*t) 
xc = np.cos(2*np.pi*F3*t) 
xd = np.cos(2*np.pi*F4*t)

Generisaćemo i nacrtati signal $x_1(n)$

In [3]:
x1 = xa + xb + xc + xd

plt.figure()
plt.plot(t, x1)
plt.xlabel('t[s]')
plt.ylabel('x1(t)')

<IPython.core.display.Javascript object>

Text(0,0.5,'x1(t)')

I njegov amplitudni spektar

In [4]:
N1 = len(x1)
X1 = fftpack.fft(x1)
X1 = fftpack.fftshift(X1)
k = np.arange(-N1/2, N1/2, dtype=int)
F = k*Fs/N1

plt.figure()
plt.plot(F, np.abs(X1))
plt.xlabel('F[Hz]')
plt.ylabel('|X1(F)|')

<IPython.core.display.Javascript object>

Text(0,0.5,'|X1(F)|')

Generisaćemo sada i nacrtati i signal $x_2(n)$

In [5]:
x2 = np.concatenate((xa, xb, xc, xd))
t2 = np.arange(0, 4*t0, 1./Fs)

plt.figure()
plt.plot(t2, x2)
plt.xlabel('t[s]')
plt.ylabel('x2(t)')

<IPython.core.display.Javascript object>

Text(0,0.5,'x2(t)')

I njegov amplitudni spektar

In [6]:
N2 = len(x2)
X2 = fftpack.fft(x2)
X2 = fftpack.fftshift(X2)
k = np.arange(-N2/2, N2/2, dtype=int)
F = k*Fs/N2

plt.figure()
plt.plot(F, np.abs(X2))
plt.xlabel('F[Hz]')
plt.ylabel('|X2(F)|')

<IPython.core.display.Javascript object>

Text(0,0.5,'|X2(F)|')

Iako su posmatrani signali različiti, amplitudni spektri dobijeni pomoću DFT su praktično isti. Razlog za ovo je što oba signala sadrže iste prostoperiodične komponente, ali prisutne u različitim vremenskim trenucima. Kod prvog signala, sve četiri komponente su prisutne tokom cijelog trajanja uzorka, odnosno, njegov spektar se ne mijenja tokom vremena -- signal je *stacionaran*. Kod drugog signala u svakom trenutku je prisutna samo jedna od komponenata pa je ovaj signal *nestacionaran* -- njegov spektar se mijenja s vremenom.

Furijeovom analizom možemo da dobijemo samo ukupan spektralni sastav čitavog uzorka signala, a ne i podatak o tome kada je koja komponenta prisutna u nestacionarnom signalu. Ovaj nedostatak čini Furijeovu transformaciju neadekvatnim alatom za analizu nestacionarnih signala, kakvi su, na primjer, govor i muzika. 

Za analizu nestacionarnih signala potrebna nam je reprezentacija koja osim spektralne sadrži i vremensku informaciju. Ova vremensko-frekvencijska reprezentacija je umnogome slična notnom zapisu muzike, u kojem je svakom notom određena visina tona i njegovo trajanje, odnosno, vremenski interval u kojem taj ton postoji. 

Kako bi se ovo postiglo signal se dijeli na kratke segmente, *frejmove*, kao na Slici pri čemu se smatra da je unutar jednog frejma signal stacionaran. Dijeljenje signala na frejmove se može interpretirati i kao pomjeranje prozorske funkcije koja je različita od nule samo u intervalu konačne širine po vremenskoj osi i množenje signala sa tom prozorskom funkcijom. Nakon toga se za svaki frejm računa Furijeova transformacija. Dobija se dekompozicija signala na komponente određene frekvencijom i pozicijom prozora na vremenskoj osi
\begin{equation}
X \left( \omega, m \right) = \sum_{n = -\infty}^{\infty} x \left( n \right) w \left( n - m \right) e^{-j \omega n}.
\end{equation}
Ovako definisana transformacija se naziva vremenski zavisna Furijeova transformacija ili kratkotrajna Furijeova transformacija (eng. Short Time Fourier Transform, STFT).

<img src="prozor.png" width="500">

U realizacijama se za izračunavanje kratkotrajne Furijeove transformacije koristi DFT, odnosno, FFT algoritam. Kao rezultat dobijaju se odmjerci kratkotrajne Furijeove transformacije
\begin{equation}
X \left( n, k \right) = \sum_{m=0}^{N-1} x \left( m \right) w \left( m - n \right) e^{-j \frac{2 \pi }{N}km}.
\end{equation}
Kratkotrajna Furijeova transformacija je tačno predstavljena ovim odmjercima ako je broj tačaka u kojima se računa DFT (broj odmjeraka u frekvenciji) veći ili jednak dužini prozorske funkcije. U tom slučaju moguće je, na osnovu odmjeraka kratkotrajne Furijeove transformacije, rekonstruisati dio signala unutar prozora. 

Dobijena reprezentacija je formirana u ravni vrijeme-frekvencija. Vizuelizacija modula kratkotrajne Furijeove transformacije se naziva *spektrogram* signala.  

Nacrtajmo spektrogram nestacionarnog signala $x_2(n)$

In [9]:
f2, t2, Zxx2 = signal.stft(x2, Fs, nperseg=512, 
                           window=signal.hamming(512),
                           noverlap=511,
                           boundary='even')

plt.figure()
plt.pcolormesh(t2, f2, np.abs(Zxx2))
plt.xlabel('Vrijeme [s]')
plt.ylabel('Frekvencija [Hz]')

  b = a[a_slice]


<IPython.core.display.Javascript object>

Text(0,0.5,'Frekvencija [Hz]')

Na slici je prikazan spektrogram nestacionarnog signala dobijenog konkatenacijom četiri sinusoide. Vrijednosti modula kratkotrajne Furijeove transformacije kodovane su bojom piksela, tako da svjetliji pikseli odgovaraju većim, a tamniji manjim vrijednostima modula Furijeove transformacije. Vidimo da je, korištenjem spektrograma, moguće uočiti frekvencije komponenata, kao i intervale u kojima one postoje.

Spektrogram stacionarnog signala $x_1(n)$

In [13]:
f1, t1, Zxx1 = signal.stft(x1, Fs, nperseg=256, 
                           window=signal.hamming(256),
                           noverlap=255,
                           boundary='even')

plt.figure()
plt.pcolormesh(t1, f1, np.abs(Zxx1))
plt.xlabel('Vrijeme [s]')
plt.ylabel('Frekvencija [Hz]')

  b = a[a_slice]


<IPython.core.display.Javascript object>

Text(0,0.5,'Frekvencija [Hz]')

U ovom slučaju se jasno vidi da su sva četiri harmonika prisutna tokom čitavog trajanja signala.

Na sljedećoj slici je prikazan talasni oblik govornog signala. Izgovorena je riječ *sat*. Jasno je moguće uočiti tri intervala koji odgovaraju glasovima /s/, /a/ i /t/. 

In [14]:
Fs, x = wavfile.read('sat.wav')
t = np.arange(len(x))/Fs

plt.figure()
plt.plot(t, x)
plt.xlabel('t[s]')
plt.ylabel('x(t)')

<IPython.core.display.Javascript object>

Text(0,0.5,'x(t)')

Spektrogram ovog signala je prikazan na sljedećoj slici. Vokal /*a*/ nastaje strujanjem vazduha preko glasnih žica što uzrokuje njihovo treperenje pa je rezultujući signal približno periodičan. Na spektrogramu se ovo vidi kao linijska struktura spektra. Sa druge strane, signal koji odgovara glasovima /*s*/ i /*t*/ je sličniji šumu pa u spektrogramu nema izražene linijske strukture spektra.

In [15]:
# Postavićemo srednju vrijednost na 0 da ne bi izražena DC komponenta
# uticala na skaliranje spektrograma
x = x - np.mean(x)

f, t, Zxx = signal.stft(x, Fs, nperseg=512, noverlap=481, 
                        window=signal.hamming(512),
                        boundary='even')

plt.figure()
plt.pcolormesh(t, f, 20*np.log10(np.abs(Zxx)))
plt.ylabel('Frekvencija [Hz]')
plt.xlabel('Vrijeme [s]')

  b = a[a_slice]


<IPython.core.display.Javascript object>

Text(0.5,0,'Vrijeme [s]')

Pogledaćemo još spektrogram govornog signala koji sadrži muški glas koji izgovara vokale *iaeao*

In [16]:
Fs, x = wavfile.read('iaeao.wav')
x = x[3500:12500].astype('float')
x -= np.mean(x)
x /= np.max(np.abs(x))

Uskopojasni spektrogram nam omogućava da vidimo kvaziperiodičnu prirodu signala

In [17]:
f, t, Zxx = signal.stft(x, Fs, nperseg=512, noverlap=481, 
                        window=signal.hamming(512),
                        boundary='even')

plt.figure()
plt.pcolormesh(t, f, 20*np.log10(np.abs(Zxx)))
plt.ylabel('Frekvencija [Hz]')
plt.xlabel('Vrijeme [s]')

  b = a[a_slice]


<IPython.core.display.Javascript object>

Text(0.5,0,'Vrijeme [s]')

Širokopojasni spektrogram nam omogućava da vidimo formante

In [18]:
f, t, Zxx = signal.stft(x, Fs, nperseg=64, noverlap=63, window=signal.hamming(64),
                        nfft=512, boundary='even')

plt.figure()
plt.pcolormesh(t, f, 20*np.log10(np.abs(Zxx)))
plt.ylabel('Frekvencija [Hz]')
plt.xlabel('Vrijeme [s]')

  b = a[a_slice]
  output = mkl_fft.rfft_numpy(a, n=n, axis=axis)


<IPython.core.display.Javascript object>

  """


Text(0.5,0,'Vrijeme [s]')