# Del 4: Sampling og den diskrete Fouriertransformasjonen

Fouriertransformasjonen som vi har hittil sett på er det som kalles den kontinuerlige Fouriertransformasjonen, og er definert for kontinuerlige funksjoner. Dette skaper problemer når vi skal implementere Fouriertransformen på en datamaskin. Datamaskiner kan kun gjennomføre regneoperasjoner på diskrete verider, og vi må derfor ha en diskret versjon av Fouriertransformasjonen som gir en diskret resultat.

Den diskrete Fouriertransformasjonen (DFT) er gitt ved følgende formel:

$$X(k) = \sum_{n=0}^{N - 1} x(n)e^{-i\frac{2\pi nk}{N}}$$

La oss allikevel se hvordan vi kan gå fra den kontinuerlige Fouriertransformasjonen til den diskrete. Vi gjør dette i to steg. Først bytter vi ut den kontinuerlige funksjonen $f(t)$ med en diskret funksjon $x(n)$. I vår tilfelle er det tilskrekkelig å se på denne funksjonen som en tallfølge (ofte representert som en array i Python). Vi må også benytte oss av summetegnet i stedet for integraltenget, siden vi nå har en diskret funksjon.

Fouriertransformasjonen vår ser nå slik ut: 

$$X(\xi) = \sum_{-\infty}^{\infty} x(n)e^{-i 2\pi \xi n}$$

Dette kalles for DTFT-en, eller diskret-tids Fouriertransformasjonen. Merk at $\xi$, altså variablen til frekvens, er fortsatt en kontinuerlig variabel. Så selv om DTFT-en gjennomfører Fouriertransormasjonen på en diskret funksjon, gir den fortsatt en kontinuerlig resultat. I tillegg tar summegrensene rede for at funksjonen er uendelig, som er litt rart når vi skal jobbe med endelige tallfølger på en datamaskin. Vi må altså diskretisere frekvensvariabelen $\xi$, og endre på summegrensene for å få det vi vil. 

Vi diskretiserer $\xi$ på følgende måte: 

$$\xi = \frac{k}{N}$$

hvor $k$ er den k-te "bin-en," eller frequency bin, i $X(k)$. Ved å diskretisere $\xi$, har vi grovt sagt "kuttet opp" frekvensvariabelen $\xi$ inn i $N$ deler, hvor verdien til $N$ er antall punkter i $x(n)$. En slik del av frekvensvariabelen kalles ofte for en "bin," og vi har altså $N$ slike binner.

Vi endrer også summegrensene slik at de summerer over en endelig lengde, altså fra første element i $x(n)$ til den siste. Fouriertransformasjonen vår blir da:

$$X(k) = \sum_{n=0}^{N - 1} x(n)e^{-i\frac{2\pi nk}{N}}$$

Hvor $x(n)$ er en diskret funksjon, og $X(k)$ er den diskrete Fouriertransformasjonen av $x(n)$. $N$ er antall punkter i $x(n)$, og $k$ er den k-te frekvensen. Dette kalles for DFT-en, eller den diskrete Fouriertransformasjonen, og det er akkurat denne vi bruker når vi implementerer Fouriertransformasjonen på en datamaskin. Legg merke til at vi har samme antall binner som antall punkter i $x(n)$, altså $N$ binner.

Prinsippet til DFT-en er da akkurat den samme som med den kontinuerlige Fouriertransformasjonen: vi tar en eller annen funksjon som befinner seg i tidsdomenet, og transformerer den til frekvensdomenet. Allikevel er det noen nyanser med DFT-en som vi må være klar over. For at vi skal kunne forstå oss på disse nyansene, må vi først se på hvordan man diskretiserer en kontinuerlig funksjon, også kalt sampling:

## Sampling



Sampling er når vi tar en kontinuerlig funksjon og gjør den diskret. Intuitivt kan vi si at vi deler opp den kontinuerlige funksjonen i punkter med lik intervall mellom seg, og så tar vi verdien til funksjonen i disse punktene: 

<img src="plots/p4_cont.png" width="400px"> <img src="plots/p4_cont_samp.png" width="400px"> <img src="plots/p4_samp.png" width="400px"> 

Etter vi har gjort dette har vi en diskret tallfølge som kan lagres på og bli behandlet av en datamaskin. 

La oss introdusere noen nye begreper: 

- $N$: Total antall samplepunkter i den diskrete funksjonen. 
- $T$: Samplingsintervall. Også kjent som samplingsperiode. Dette er avstanden mellom hvert samplepunkt, med sekunder som enhet.
- $f_s$: Samplingsfrekvens. Dette er antall samplepunkter per sekund, med enhet Hz. Samplingsfrekvensen er den inverse av samplingsintervallet: $f_s = \frac{1}{T_s}$

Hvis vi tar for oss en sinusfunksjon som vi pleier å se i Python:
```python
t = np.linspace(0, 10, 1000) # tid i sekunder, fra 0 til 10 sekunder med 1000 samplepunkter
sinus = np.sin(t)
```

er $N = 1000$, samplingsintervallet er $T_s = 10/1000 = 0.01$ sekunder, og samplingsfrekvensen er $f_s = 1/T_s = 100$ Hz.

Konverteringen fra kontinuerlig til diskret er en prosess som kalles for analog til digital konvertering, og er noe som skjer på hardwarenivå, for eksempel i en mikrofon som tar inn en lydbølge (en analog / kontinuerlig verdi) og konverterer den til en digital tallfølge ved å sample den. I kodesnutten ovenfor definerer vi arrayet $t$ og bruker den som input inn i Numpy sin sinusfunksjon, som gir oss enda en array med verdiene til sinusfunksjonen i de punktene. Vi har da ikke tatt en analog signal og konvertert den til en digital en, men heller laget en diskret tallfølge fra bunnen av.


## Undersampling og Nyquists samplingsteorem

Hva skjer hvis vi har en kontinuerlig funksjon og hakker den opp (sampler) den med en for lav samplingsfrekvens? La oss ta sinusfunksjonen fra kodesnutten ovenfor som en eksempel:

```python
t = np.linspace(0, 10, 1000) 
sinus = np.sin(t)
```

Hvis vi plotter den rett ut ser den slik ut:

<img src="plots/p4_sine.png" width="400px">

Ser ut som en helt vanlig sinusfunksjon. La oss nå minke samplingsfrekvensen, altså øke samplingsintervallet til noe jeg mener er banalt: 

```python
t = np.linspace(0, 10, 3) 
sinus = np.sin(t)
```

Vi har altså en sinusfunksjon med en frekvens på $2\pi$ Hz, som vi skal prøve å sample med kun tre punkter fordelt på 10 sekunder. Samplingsintervallet er nå $T_s = 10/3$ sekunder, og samplingsfrekvensen er $f_s = 1/T_s = 3/10$ Hz. Hvis vi plotter denne funksjonen så får vi:

<img src="plots/p4_sine_usamp.png" width="400px">

Her kan vi bemerke at grafen er særdeles stygg for å være en sinusfunksjon, og at vi mister informasjon om hvor ofte funksjonen svinger. I det "fine" plottet ser vi tydelig at funksjonen svinger ca. 1.5 ganger i løpet av 10 sekunder, mens ut ifra det stygge plottet så kan vi fort tro at den svinger mindre enn en gang i løpet av samme tid.

Dette kalles for undersampling. Vi har altså en funksjon med en eller annen frekvenskomponent, i dette tilfellet kun en frekvenskomponent med frekvens lik $2\pi$ Hz, og vi sampler den med en samplingsfrekvens som er for lav. Dette fører til at vi mister informasjon om frekvenskomponentene til funksjonen. 

Men hva er "for lav" samplingsfrekvens? Altså, hva er den laveste samplingsfrekvensen vi kan ha før vi begynner å miste informasjon om funksjonen? Da er vi inne på **Nyquists samplingsteorem**, som sier at for å unngå undersampling, så **må samplingsfrekvensen være minst dobbelt så stor som den høyeste frekvenskomponenten i funksjonen**. Den høyeste frekvensen vi kan sample uten å miste informasjon kalles for **Nyquist-frekvensen**, som er da halvparten av samplingsfrekvensen.

Hvis vi tar for oss en funksjon som er en sum av to sinusfunksjoner med frekvenser 1 Hz og 2 Hz, må samplingsfrekvensen være minst 4 Hz for å unngå undersampling. Med en samplingsfrekvens på 4 Hz vil vi få en Nyquist-frekvens på 2 Hz, som er akkurat lik den høyeste frekvenskomponenten i funksjonen. Hvis vi derimot sampler med en samplingsfrekvens på 3 Hz, vil Nyquist-frekvensen være 1.5 Hz, altså lavere enn den høyeste frekvenskomponenten i funksjonen, og vi vil miste informasjon om frekvensinnholdet til funksjonen.

## Konsekvenser av diskretisering og undersampling i frekvensdomenet 

Så langt har vi sett på sampling og undersampling i tidsdomenet. Men har undersampling, og det at vi i det hele tatt har en diskret funksjon, konsekvenser i frekvensdomenet? Svaret er ja, og det er akkurat dette som skiller resultatet til DFT-en fra den kontinuerlige Fouriertransformasjonen. 

### Periodisering

En av konsekvensene av å diskretisere Fouriertransformasjonen og funksjonen vi transformerer er at DFT-en "ser" funksjonen den skal transformere som en periodisk funksjon, uansett om den faktisk er det eller ikke. I tillegg til dette så kommer frekvenspektret til å være periodisk, som er et konsekvens av at vi har transformert en diskret, og ikke kontinuerlig, funksjon:

<img src="plots/cont_disc_spectra.gif" width="800px">

*Forholdet mellom den kontinuerlige Fouriertransformasjonen og den diskrete Fouriertransformasjonen. Fra* *[Wikipedia](https://en.wikipedia.org/wiki/Discrete_Fourier_transform)* *, av bruker Sbyrnes321.*

*Venstre kolonne: En kontinuerlig funksjon i tidsdomenet (øverst) og dens Fourier-transformasjon (nederst).* 

*Midt-venstre kolonne: En kontinuerlig, periodisk funksjon (øverst). Fourier-transformasjonen (nederst) er null unntatt ved diskrete punkter, altså den består av en endelig antall frekvenskomponenter.*

*Midt-høyre kolonne: Den opprinnelige funksjonen er diskretisert (øverst). Vi tar dens Fouriertransformasjon med DTFT-en (ikke DFT-en!), og dens Fouriertransformasjon (nederst) er en repetisjon av frekvensspektret av dens kontinuerlige versjon.*

*Høyre kolonne: Vi tar DTFT-en til den opprinnelige funksjonen og diskretiserer den, og dette blir da en DFT (nederst). I DFT-en sin tilfelle blir funksjonen i tidsdomenet en periodisk repetisjon av den opprinnelige diskrete funksjonen (øverst). Dette er hva DFT-en "ser" når den transformerer en funksjon til frekvensdomenet.*

Oppsumert: selv om en kontinuerlig funksjon er i utgangspunktet aperiodisk og har en aperiodisk frekvensspekter, kommer dens frekvensspekter til å bli periodisk om vi diskretiserer funksjonen og transformerer den med DFT-en. Kort fortalt så er dette fordi i motsetning til DTFT-en, som summerer fra og til uendeligheten og dermed tar rede for en uendelig diskret funksjon, summerer DFT-en kun over en endelig lengde, og dermed må den anta at funksjonen er periodisk. Man kan med andre ord si det slik: det "virkelige" frekvensespekteret kommer til å bli kopiert og plassert med jevne mellomrom i frekvensdomenet:

<img src="plots/p4_fakes.png" width="800px">

Dette er et eksempel på hvordan frekvensspektret kommer til å se etter vi har tatt DFT-en av en funksjon. Kun de "ekte" frekvenskomponentene er til stedet i den opprinnelige funksjonen, mens de falske frekvenskomponentene er en konsekvens av å bruke DFT-en. Denne periodiseringen kommer til å fortsette i det uendelige, og vi kommer til å få en uendelig mengde med falske frekvenskomponenter. Avstanden mellom er lik samplingsfrekvensen.

Så hva skjer når vi undersampler, og avstanden mellom hver periode i frekvensdomenet blir mindre enn den høyeste virkelige frekvenskomponenten? Da vil vi få noe som kalles for aliasing.

### Aliasing

Aliasing skjer når vi undersampler en signal, og de falske frekvenskomponentene begynner å overlappe med de ekte. Som følge av dette får vi villedende informasjon om hvilke frekvenskomponenter inngår i funksjonen:

<img src="plots/p4_alias.png" width="800px">

I eksemplet over er samplingsfrekvensen mindre enn det dobbelte av den høyeste frekvenskomponenten i funksjonen. Resultatet er at de falske frekvenskomponentene overlapper med de ekte, som gir oss feil informasjon om frekvensinnholdet til funksjonen, ergo aliasing. Grafisk sett kan vi legge merke til at de "ekte" frekvenskomponentene som befinner seg over Nyquist-frekvensen blir speilet over Nyquist-frekvensen. For å unngå aliasing må vi altså sørge for at samplingsfrekvensen er minst dobbelt så stor som den høyeste frekvenskomponenten i funksjonen, akkurat som i tidssdomenet.

Det er viktig å huske at aliasing, undersampling, og periodiseringen av frekvensspektret skjer kun når vi bruker DFT-en! Både DTFT-en og den kontinuerlige Fouriertransformasjonen slipper unna disse problemene, og gir oss et korrekt bilde av frekvensinnholdet til funksjonen. Allikevel så har vi ikke noe valg enn å bruke DFT-en når vi skal implementere Fouriertransformasjonen på en datamaskin, så disse nyansene er noe vi må være klar over når vi jobber med DFT-en.

## Litt om FFT-en 

Når man implementerer Fouriertransformasjonen, altså DFT-en, på en datamaskin, bruker vi ofte begrepet FFT. FFT står for fast Fourier transform (rask Fouriertransformasjon) og er en algoritme som regner ut DFT-en på en særdeles rask måte, mye raskere om vi hadde implementert DFT-en rett fram. **Resultatet av en FFT er akkurat den samme som en DFT.** Ikke bli forvirret av at dette er to forskjellige begreper, de regner ut akkurat det samme. Den eneste forskjellen er at FFTen er en optimalisering av DFT formelen vi så tidligere. 