# Dyskretna Transformata Fouriera

## Przypomnienie


![](images/fourier_types.png?1)

### Szereg Fouriera

![](images/fourier2.png)

### Transformata Fouriera

![](images/fourier1.png)

### DTFT

![](images/fourier3.png)

### DFT

![](images/fourier4.png)

### Transformata DTFT

\begin{equation}
X(\omega)=\sum_{n=-\infty}^{\infty} x_n e^{-i\omega n} \\
\omega \in \mathbb{R}
\end{equation}

### Transformata DFT

\begin{equation}
X_k=\sum_{n=0}^{N-1} x_n e^{-ik\frac{2\pi}{N} n} \\
k \in 0,1\ldots N-1
\end{equation}


## Uproszczony wzór

- Wprowadźmy zmienną

\begin{equation}
W_N=e^{-i\frac{2\pi}{N}}
\end{equation}

- Znana jako N-ty pierwiastek jedynki

\begin{equation}
(W_N)^N=1
\end{equation}

- Dzięki niej wzór na transformatę można zapisać jako

\begin{equation}
X_k=\sum_{n=0}^{N-1} x_n W_N^{kn} \\
k \in 0,1\ldots N-1
\end{equation}

### DFT jako zmiana bazy

- Ten wzór można interpretować jako zmiana bazy

\begin{equation}
X_k=x_n\cdot W_{(N)}
\end{equation}

- Gdzie $W_{(N)}$ jest bazą DFT, np. dla rozmiaru 4:

|        |         |         |         |
|--------------------------------------|
| 1.+0.j |  1.+0.j | 1.+0.j  |  1.+0.j |
| 1.+0.j |  0.-1.j | -1.+0.j |  0.+1.j |
| 1.+0.j | -1.+0.j |  1.+0.j | -1.+0.j |
| 1.+0.j |  0.+1.j | -1.+0.j |  0.-1.j |

![](images/dftbase_ln.png)

![](images/dftbase_im.png)

## Związek między DFT i DTFT

- DFT jest wartością DTFT próbkowaną używając N próbek

\begin{equation}
X_k^{(DFT)}=X^{(DTFT)}\left(\frac{2\pi k}{N}\right)
\end{equation}

- Na przykład weźmy sygnał o okresie N=10:

\begin{equation}
x_k\left\{
\begin{array}{l l}
 1 & \text{dla }k=0\ldots4 \\
 0 & \text{dla }k=5\ldots9 \\
\end{array}
\right.
\end{equation}

- Jego DTFT wynosi:

\begin{equation}
X(\omega)=e^{-2i\omega}\frac{\sin(5\omega/2)}{\sin(\omega/2))}
\end{equation}

- DFT precyzyjnie odzwierciedla wartości DTFT w określonych punktach:

![](images/dft_samplow.png)

## Zero-padding

- Dodając zera na koniec sygnału można zwiększyć jego próbkowanie:

![](images/dft_samphi.png)

## DC-offset


![](images/fourier_sample4.png)

## Splot kołowy

- W świecie dyskretnym nadal istnieje twierdzenie o splocie

- Ale DFT zarówno w czasie i częstotliwości musi być okresowe

- Dla DFT twierdzenie o splocie jest prawdziwe dla splotu kołowego
    - funkcje nie mają 0 na zewanątrz tylko są okresowe
    
- Splot jest wygodnie implementować jako iloczyn w dziedzinie częstotliwości:

\begin{equation}
f * g = \mathfrak{F}^{-1}[\mathfrak{F}(f)\cdot \mathfrak{F}(g)]
\end{equation}

- Chcąc policzyć zwykły splot za pomocą DFT, musimy dopisać 0 do krótszego sygnału tak żeby obydwa miały taką samą długość

## Okienkowanie

- Ekstrakcja krótkiego segmentu sygnału jest równoważna z iloczynem z funkcją okienkującą

- Domyślna funkcja okienkująca to impuls prostokątny

\begin{equation}
x[b:e] = x \cdot \Pi(b,e)
\end{equation}

- Iloczyn w czasie jest równoważny splotowi w częstotliwości

- Okienkowanie oknem prostokątnym w czasie jest równoważne splotowi funkcją sinc w częstotliwości



- Na przykład, 50 próbek sinusoidy:

![](images/dft_rectwin.png)

- Możemy zamiast tego użyć innego okna, np Hamminga:

![](images/hamming.png)

- Jest szereg innych [okien](http://mathworld.wolfram.com/ApodizationFunction.html)

- Po dokonaniu iloczynu otrzymujemy taki wynik

![](images/dft_hammwin.png)

## FFT

- Wymyślony prze Gaussa w 1806 roku i spoularyzowany w połowie 20 wieku przez J.W. Cooley'a i Johna Tukey'a

- Jest wiele wariantów - tutaj omówimy wersję radix-2 metodą DIT (decimation in time)

- Zacznijmy od definicji DFT

\begin{equation}
X_k = \sum_{n=0}^{N-1} x_n W_{N}^{nk}
\end{equation}

- Jego złożoność obliczeniowa to $O(N)=N^2$

- Do FFT użyjemy strategii "dziel-i-rządź"


- Podzielmy operację sumowania na indeksy parzyste i nieparzyste

\begin{equation}
X_k = \sum_{r=0}^{N/2-1} x_{(2r)} W_{N}^{(2r)k} + \sum_{r=0}^{N/2-1} x_{(2r+1)} W_{N}^{(2r+1)k} = \\
\sum_{r=0}^{N/2-1} x_{(2r)} (W_{N}^{2})^{rk} + W_N^k \sum_{r=0}^{N/2-1} x_{(2r+1)} (W_{N}^2)^{rk} =\\
\sum_{r=0}^{N/2-1} x_{(2r)} W_{N/2}^{rk} + W_N^k \sum_{r=0}^{N/2-1} x_{(2r+1)} W_{N/2}^{rk} =
\end{equation}

- Co jest równoważne liczeniu dwóch krótszych ($N/2$) DFT zamiast jednej dużej

<img src="images/FFT_even_odd.png" style="width: 500px">

<img src="images/FFT_radix2.png" style="width: 500px">

### Podsumowanie FFT

- Jeśli długość sygnału jest potęgą dwójki, procedurę można rozbić na $log_2 N$ kroków

- W każdym kroku mnożymy i dodajmy do siebie $N$ liczb, więc ostateczna złożoność to $O(N)=N \log N$

- Każdy z elementów strukturalnych jest nazywany motylem (butterfly)

- Algorytm może być liczony "w-miejscu" (jest to ułatwione ułożeniem elementów w odpowiedniej kolejności - bit reversal)

- Jednym z najbardziej znanych implementacji w C++ to biblioteka FFTW

- Istnieją algorytmy wielowątkowe wykorzystujące $N$ elementów obliczeniowych i złożoność obliczeniową $O(N) = \log N$ (np. biblioteka cuFFT)

#### DIF

<img src="images/fft_dif.png" style="width: 500px">

## Filtrowanie za pomocą FFT

- Zazwyczaj filtry wdrażamy operacją splotu

- Prosta metoda filtrowania polega na dokonaniu zmiany sygnału w dziedzinie częstotliwości:

1. wykonujemy FFT sygnału
2. dokonujemy iloczynu widma z charakterystyką filtru
3. wykonujemy IFFT widma

- zanim dokonamy krok 3 musimy być pewni że widmo spełnia warunek symetrii Hermitowskiej!


## Analiza czsowo-częstotliwościowa

- Oprócz samego rozkładu częstotliowości, często potrzbujemy informację o czasie rozpoczęcia i ukończenia poszczegółnych skłądowych częstotliwościowych

- Najprostsza metoda analizy czasowo-częstotliwościowej to STFT (short-term Fourier transform)

- Określamy parametry:
    - $Q$ - odstęp między początkami ramek (frame rate, frame step)
    - $K$ - szerokość ramki (frame length, window size)
    
- Na podstawie tego możemy wywnioskować:
    - overlap: $K-Q$
    - ilość ramek w sygnale o długości $N$: $\lfloor (N-K)/Q \rfloor +1$

<img src='images/frames.png' style='width:500px'>

- Dla każdej ramki usuwamy DC-offset

- Dodajemy zero-padding (zwykle do najniższej potęgi 2, ale można i więcej)

- Każdą ramkę mnożymy przez funkcję okienkową

- Kluczowe jest określenie rozmiaru ramki - określa ona kompromis między rozdzielczością w czasie i częstotliwości

- Nie można mieć idealną rozdzielczość zarówno w czasie jak i częstotliwości - zasada nieoznaczoności Heisenberga (ang. Heisenberg Uncertainty Principle)