# Technische Sprachverarbeitung
## 1 Einführung
### 1.1 Gegenstand

### 1.2 Einsatzgebiete

### 1.3 Teilgebiete

### 1.4 Aufbau und  Wissensquellen

## 2 Wiederholung Wahrscheinlichkeitsrechnung
### 2.1 Begriffe
### 2.2 Verbundwahrscheinlichkeit
### 2.3 Bedingte Wahrscheinlichkeit
### 2.4 Satz von Bayes
### 2.5 Zufallsvariable und Funktionen von Zufallsvariablen
### 2.6 Beschreibungsgrößen für Zufallsvariable
### 2.7 Schätzfunktionen
### 2.8 Beispiel (Ziegenproblem)

## 3 Sprachsignale
### 3.1 Sprachproduktion

### 3.2 Sprachperzeption

### 3.3 Sprachsignalverarbeitung im Gehirn

### Formanten
lokale Maxima des Leistungsdichtespektrums

In [None]:
%matplotlib inline
from IPython.display import Audio
from scipy import signal
import numpy as np
import functions.select as sel
import matplotlib.pyplot as plt

In [None]:
sig_t = sel.Signal()
sig_t.show_tsig()

In [None]:
Audio(data = sig_t.Data, rate = sig_t.fS)

In [None]:
freqs, times, spectrogram = signal.spectrogram(sig_t.Data, nperseg=1024) 
plt.figure(figsize=(10, 5))
plt.imshow(np.round(spectrogram, 2), vmax=1, aspect='auto', origin='lower', extent=[0,len(sig_t.Data)/sig_t.fS,0,0.5*sig_t.fS])
plt.title('Spektrogramm')
plt.ylabel('Frequenz (Hz)')
plt.xlabel('Zeit (s)')
plt.grid(True)
plt.tight_layout()

In [None]:
freqs, psd = signal.welch(sig_t.Data, nperseg=1024)
plt.figure(figsize=(10, 5))
plt.semilogx(freqs*sig_t.fS, psd)
#plt.plot(freqs*sig_t.fS, psd)
plt.title('Leistungsdichtespektrum')
plt.xlabel('Frequenz (Hz)')
plt.ylabel('Leistung')
plt.grid(True)
plt.tight_layout()

#### Demonstration Verdeckungseffekt

In [None]:
from IPython.display import Audio
import functions.signal as sig
import functions.select as sel

#### Auswahl der Parameter
Es werden 2 Signale erzeugt:
- Signal 1: bandpassgefiltertes Gaußsches weißes Rauschen mit vorgegebenem $\mu$ und $\sigma$ (Mittenfrequenz $1000 Hz$, Bandbreite $200 Hz$, Butterworth-TP 4. Ordnung), für dieses Signal kann die maximale Amplitude vorgegeben werden
- Signal 2: Sinuston mit wählbarer Frequenz und Amplitude

In [None]:
mu = 0        #Amplitudenmittelwert
sigma = 0.2   #Standardabweichung
dur = 3       #Signaldauer
fs = 16000    #Abtastfrequenz
smax = 2      #max. Amplitude des Schmalbandrauschens

Das Rausch- und das Schmalbandrauschsignal wird erzeugt und dargestellt.

In [None]:
noise = sig.Noise()
noise.create_Noise(mu, sigma, dur, fs)
noise.filt_noise(smax)
noise.plot_Noise_filt(smax)

Audioausgabe Rauschsignal

In [None]:
Audio(data = noise.Data, rate = fs)

Audioausgabe Schmalbandrauschen

In [None]:
Audio(data = noise.Data_filtered, rate = fs)

Für das Sinussignal kann die Frequenz und Amplitude eingestellt werden. Das erzeugte Signal kann angehört werden.

In [None]:
tsig = sel.Test_sig(fs, dur)
tsig.create_Tsig()

Das Schmalbandrauschen und das Sinussignal werden überlagert und ausgegeben.

**Hinweis:** Die folgende Zelle muss für jede Änderung des Sinussignals erneut abgearbeitet werden.

In [None]:
Audio(data = noise.Data_filtered + tsig.Tsig, rate = fs, autoplay=True)

Für die aktuelle Signalkombination wird das Spektrum angezeigt.

In [None]:
noise.show_spec(noise.Data_filtered, tsig.Tsig)

### 3.4 Modell der Sprachproduktion

### 3.5 Darstellung von Sprachsignalen

In [None]:
from IPython.display import Audio
import functions.signal as sig
import functions.select as sel
from matplotlib.widgets import SpanSelector

#### Schalldruck-Zeit-Verlauf

In [None]:
%matplotlib inline
sig_t = sel.Signal()
sig_t.show_tsig()

In [None]:
Audio(data = sig_t.Data, rate = sig_t.fS)

#### Auswahl von Signalabschnitten
**Hinweis:** Die folgende Zelle muss evtl. zweimal abgearbeitet werden, damit der erzeugte Inhalt sichtbar wird.

In der dann sichtbaren oberen Darstellung kann mit gedrückter linker Maustaste ein Bereich ausgewählt werden, der im unteren Teil gezoomt dargestellt wird.

In [None]:
%matplotlib notebook
ax1, ax2, line2, x, y, fs = sig_t.sel_parts()
onselect = sel.Onselect(ax2, line2, x, y)
span = SpanSelector(ax1, onselect, 'horizontal', useblit=True, rectprops=dict(alpha=0.5, facecolor='red'))

#### Spektrogrammdarstellung

In [None]:
%matplotlib inline
sig_t.show_spec(NFFT=512, noverlap=256)

## 4 Merkmale zur Beschreibung von Sprachlauten
### 4.1 Eigenschaften des Sprachsignals
### 4.2 Kriterien zur Merkmalauswahl
### 4.3 Digitalisierung
### 4.4 Fensterung

Auswirkung der Zeitfensterauswahl  bei Sinussignalen

In [None]:
import functions.select as sel
sel.demo_windowing()

### 4.5 Zeitbereichsmerkmale
#### Energie

In [None]:
import functions.select as sel
sig_t = sel.Signal()
sig_t.energy()

#### Autokorrelation

Für das oben ausgewählte Signal wird die AKF für das mit dem Slider ausgewählte Zeitfenster der Dauer von 25 ms dargestellt.

In [None]:
sig_t.show_akf()

In [None]:
sig_t.show_all_akf(1024, 512)

#### Nulldurchgangsrate

In [None]:
import functions.select as sel
sig_t = sel.Signal()
sig_t.zero_cross()

### 4.6 Merkmale im Frequenzbereich
#### Kurzzeitspektrum
Darstellung des Frequenzgehaltes in jedem Zeitfenster

In [None]:
import functions.select as sel
sig_t = sel.Signal()
sig_t.shorttime_fft()

### 4.7 Cepstrumkoeffizienten