# Próbkowanie i kwantyzacja

## Przypomnienie

### Sygnał Ciągły

![](images/analog.png)

### Próbkowanie

![](images/discrete_time.png)

### Kwantyzacja

![](images/discrete_value.png)

### Sygnał cyfrowy

![](images/digital.png)

## Próbkowanie

- polega na zapisywaniu chwilowej wartości sygnału w regularnych odstępach czasowych
    - uwzględniając dokładność w czasie, chwilowość i szum
- otrzymujemy szereg dyskretnych impulsów reprezentujących ciągły sygnał
- jakie ciągłe sygnały możemy odtworzyć na podstawie wybranych impulsów?
- jak próbkować żeby nie było problemów z odtworzeniem ciągłego sygnału?

### Interpolacja

![](images/interpolation.png?1)

### Wystarczająca ilość próbek

![](images/oversample.png)

### Niedostateczna ilość próbek

![](images/undersample.png)

### Próbkowanie jako iloczyn z szeregiem delt

- Zdefiniujmy próbkowanie w dziedzinie czasu:

\begin{equation}
x_p(t)=x_c(t)\cdot\delta(t)
\end{equation}

- W dziedzinie częstotliowści wygląda ono tak:

\begin{equation}
\begin{array}{ll}
X_p(\omega) & = \frac{1}{2\pi} X_c(\omega)*D(\omega) \\
  & = \frac{1}{2\pi}X_c(\omega)*\left[\frac{2\pi}{T}\sum_{k=-\infty}^{\infty} \delta(\omega-k\omega_p) \right] \\
  & = \frac{1}{T} \sum_{k=\infty}^{\infty}X_c(\omega-k\omega_p)
\end{array}
\end{equation}

### Szereg delt
#### (ang. delta pulse train)

<img src="images/pulsetrain1.png" style="width:400px">
<img src="images/pulsetrain2.png" style="width:400px">

![](images/sampling1.png)

### Zły przypadek

![](images/sampling2.png)

## Twierdzenie o próbkowaniu

- Niech $\omega_p$ to częstotliwość próbkowania
- Niech $\omega_{max}$ to maksymalna częstotliwość ciągłego sygnału
- Wtedy:
\begin{equation}
\omega_p > 2\cdot\omega_{max}
\end{equation}
- Częstotliwość $2\cdot\omega_{max}$ we wzorze powyżej jest znana pod nazwą częstotliwości Nyquista albo Shannona
- Jako dowód, na poprzednim rysunku widzimy, że $\omega_{max}$ musi być mniejsze od $\omega_p-\omega_{max}$

## Aliasing

![](https://upload.wikimedia.org/wikipedia/commons/f/f6/Aliasing-folding.png)

## Czy jest dobrze jeśli $\omega_p = 2\cdot\omega_{max}$?

- Co się stanie w przypadku funkcji $\cos(t)$, a co w przypadku funkcji $\sin(t)$?

## Przykładowe wartości częstotliwości próbkowania

- 8000 Hz - telefoniczna, wystarczająca do przeniesienia informacji o mowie
- 16000 Hz - wideband telephony, transmisja sygnału mowy wyższej jakości (m.in. VoIP, ASR) 
- 32/36 kHz - kasety audio
- 44100 Hz - audio CD, MPEG-1 (na podstawie PAL: 3 próbki, 588 linii, 25 fps)
    * 11025, 22050 - dla formatów audio niskiej wartości
    * 44056 - j/w ale dla NTSC
- 48000 Hz - standard dla wysokiej jakości audio w nagraniach studyjnych
- 96, 192, ... kHz - DVD, BluRay, ultradźwięki?

## Kwantyzacja


![](images/discrete_value.png)

## Kwantyzacja równomierna

(8 poziomów = 3 bity)

![](images/uniform_quant.png)

### Drabinka rezystorów

![](images/R2r-ladder.png)

## Właściwości

- Operację kwantyzacji traktujemy jako $\hat{x}(t) = \lfloor x(t)\cdot L \rfloor$, gdzie $L$ to ilość poziomów
    * zakładamy że sygnał $x(t)$ jest w zakresie $<0,1>$
- Rekonstrukcja sygnału $x(t) = \hat{x}(t)/L+\epsilon(t)$, gdzie $\epsilon$ to błąd kwantyzacji
- Błąd ten jest zmienną losową w zakresie $<0..1/L>$ i ma rozkład równomierny
- Błąd jest niezależny od sygnału, stąd sprawia wrażenie szumu jednorodnego
- Szum wynikający z błędu kwantyzacji jest często nazywany **szumem kwantyzacyjnym**
- Kodowanie PCM wykorzystuję kwantyzację równomierną z 16-bitami na kodowanie poziomów

## SNR jako miara jakości sygnału

- Signal-to-noise ratio - stosunek sygnału do szumu

\begin{equation}
\text{SNR} = \frac{\sigma_{\text{sygnał}}}{\sigma_{\text{szum}}}
\end{equation}

- Pamiętaj że szum zdefiniowaliśmy jako $\epsilon(t)=x(t)-\hat{x}(t)$
- Można go też oszacować na podstawie mocy sygnału

\begin{equation}
\text{SNR} = \frac{P_{\text{sygnał}}}{P_{\text{szum}}}
\end{equation}

- Często podajemy w decybelach: $SNR_{dB} = 10\cdot log_{10}(SNR)$
- Ogólna zasada: każdy 1 bit poprawia SNR o ~6 dB

## Czy można lepiej niż kwantyzacja równomierna?

![](images/log_quant.png)

## Kodowania logarytmiczne

- $\mu$-law  / A-law 
- stosowane w telefonii (8-bitów, T0/POTS 64 kb/s)
- wzór na kodowanie $\mu$-law:

\begin{equation}
\hat{x}=sgn(x)\frac{ln(1+\mu \vert x \vert)}{ln(1+\mu)}
\end{equation}

- gdzie $x\in <-1,1>$, a $\mu$ to maksymlany poziom (czyli 255 dla 8-bitów)
- dekodowanie:

\begin{equation}
x=sgn(\hat{x})(1/\mu)((1+\mu)^{\vert\hat{x}\vert}-1
\end{equation}


## Czy można lepiej?

- dystrybuanta wartości sygnału i algorytm Lloyd-Max
- kodowanie adaptacyjne A-PCM
    - feed-forward - paramter adaptacyjny liczony na $x(t)$ i przesyłany z sygnałem
    - feed-back - parametr adaptacyjny liczony na $\hat{x}(t)$
- kodowanie różnicowe D-PCM
- algorytm ADPCM