# SCG og mekaniske hændelser: Filtering og feature-timing

**Applied Programming – Biomedicinsk Ingeniør, 2. semester**  
Fokus: *scipy* introduktion, smoothing, peak-detektion, mekanisk hjertetiming.

*Tryk på RISE-knappen i JupyterLab for at starte slideshow.*

In [None]:
# Standardopsætning (kør denne først)
import numpy as np
import matplotlib.pyplot as plt
np.set_printoptions(precision=3, suppress=True)
np.random.seed(42)

# Dansk labels i figurer
plt.rcParams['figure.figsize'] = (9, 4)
plt.rcParams['axes.grid'] = True
plt.rcParams['axes.titlesize'] = 14
plt.rcParams['axes.labelsize'] = 12
plt.rcParams['legend.fontsize'] = 10

## Hvorfor ikke kun NumPy til filtrering?

- `numpy` giver os basale operationer (konvolution, FFT), men **design og stabil implementering af filtre** er lettere med `scipy.signal` (f.eks. Butterworth, Chebyshev, filtfilt).  
- `scipy.signal` har **færdige byggesten**: `butter`, `filtfilt`, `find_peaks`, `welch`, m.fl.  
- Vi holder metoderne **simple** og gennemsigtige.

## Hvad er et smoothing-filter?

- Formål: **reducere højfrekvent støj** uden at ændre for meget på signalkurven.  
- To enkle valg:  
  **Glidende middelværdi (moving average)** – meget enkel, men kan sløre skarpe events.  
  **Butterworth lavpas** – jævn amplitude-respons, kan konfigureres på baggrund af samplerate.

In [None]:
# Syntetisk SCG-lignende signal med støj
fs = 200  # Hz
T = 10    # sekunder
 t = np.arange(0, T, 1/fs)
# Puls-lignende events + lavfrekvent svingning
true_sig = 0.6*np.sin(2*np.pi*1.2*t) + 0.3*np.sin(2*np.pi*2.6*t)
impuls_tidspunkter = np.arange(0.4, T, 0.9)
for tt in impuls_tidspunkter:
    idx = int(tt*fs)
    if 0 <= idx < len(true_sig):
        true_sig[idx:idx+3] += np.array([0.8, 1.2, 0.6])

stoj = 0.4*np.random.randn(len(t))
x = true_sig + stoj

# Glidende middelværdi
N = 5  # lille vindue for at bevare events
kernel = np.ones(N)/N
x_ma = np.convolve(x, kernel, mode='same')

# Butterworth (hvis SciPy findes)
try:
    from scipy.signal import butter, filtfilt
    fc = 15  # Hz
    b, a = butter(4, fc/(fs/2), btype='low')
    x_bw = filtfilt(b, a, x)
except Exception as e:
    x_bw = None
    print("SciPy ikke tilgængelig – Butterworth springes over.")

plt.figure()
plt.plot(t, x, color='0.6', label='Rå data')
plt.plot(t, x_ma, label='Glidende middelværdi (N=5)')
if x_bw is not None:
    plt.plot(t, x_bw, label='Butterworth lavpas (fc=15 Hz)')
plt.title('Smoothing af syntetisk SCG')
plt.xlabel('Tid [s]')
plt.ylabel('Amplitude [a.u.]')
plt.legend(loc='upper right')
plt.tight_layout()
plt.show()

### Mini-øvelse: Glidende middelværdi i praksis

**Opgave:** Du får et støjfyldt signal `x` og et sampling-rate `fs`. Vælg en vindueslængde (N), der **sænker støjen** uden at udviske de skarpe peaks.  
- Hvilken N vælger du, og hvorfor?  
- Vis før/efter i samme plot.

In [None]:
# Svarforslag: justér N og observer trade-off
N = 9  # prøv f.eks. 3, 9, 21
kernel = np.ones(N)/N
x_ma2 = np.convolve(x, kernel, mode='same')

plt.figure()
plt.plot(t, x, color='0.7', label='Rå data')
plt.plot(t, x_ma2, label=f'Glidende middelværdi (N={N})')
plt.title('Mini-øvelse – valg af vindue')
plt.xlabel('Tid [s]')
plt.ylabel('Amplitude [a.u.]')
plt.legend()
plt.tight_layout()
plt.show()

## Hvad er SCG?

- **Seismocardiografi (SCG)** måler mikrovibrationer fra thorax relateret til hjertets mekaniske aktivitet.  
- Centrale events:  
  **IC** (*Isovolumetric Contraction*),  
  **AO** (*Aortic valve Opening*),  
  **AC** (*Aortic valve Closure*).  
- SCG-peaks kan **forskydes i tid** ift. ECG R-peaks, fordi de afspejler **mekanik** frem for **elektrisk aktivitet**.

### Mini-øvelse: Visuelt dominant peak

**Opgave:** Udpeg det mest dominerende peak i et givent tidsvindue (f.eks. 2–3 s).  
Hvilke kriterier bruger du (højde, bredde, kontekst)?

In [None]:
# Svarforslag: find maks i vindue [2,3] s
win = (t >= 2.0) & (t <= 3.0)
idx_local = np.argmax(x_ma[win])
idx_global = np.where(win)[0][0] + idx_local
plt.figure()
plt.plot(t, x_ma, label='Filtreret (MA)')
plt.axvspan(2.0, 3.0, color='orange', alpha=0.2, label='Vindue')
plt.plot(t[idx_global], x_ma[idx_global], 'ro', label='Dominant peak')
plt.title('Dominant peak i valgt vindue')
plt.xlabel('Tid [s]')
plt.ylabel('Amplitude [a.u.]')
plt.legend()
plt.tight_layout()
plt.show()

## Workflow for feature-udtræk fra SCG

1. **Filtrering** (støjdæmpning uden at miste events).  
2. **Peak-detektion** (udpeg kandidater til IC/AO/AC).  
3. **Timing-intervaller** (f.eks. R→AO, AO→AC).  
4. **Relation til ECG** (elektrisk vs. mekanisk timing).

In [None]:
# Peak-detektion med scipy.signal.find_peaks (hvis tilgængelig)
try:
    from scipy.signal import find_peaks
    y = x_bw if x_bw is not None else x_ma
    peaks, props = find_peaks(y, height=np.percentile(y, 80), distance=int(0.3*fs))
    plt.figure()
    plt.plot(t, y, label='Filtreret signal')
    plt.plot(t[peaks], y[peaks], 'rx', label='Peaks')
    plt.title('Peak-detektion')
    plt.xlabel('Tid [s]')
    plt.ylabel('Amplitude [a.u.]')
    plt.legend()
    plt.tight_layout()
    plt.show()
except Exception as e:
    print('find_peaks ikke tilgængelig. Brug alternativ: manuelt tærskel + afstand.')

## Histogram: hvornår er det stærkt?

- Et **histogram** beskriver fordelingen af værdier (f.eks. timingintervaller).  
- Stærkt når vi vil **sammenligne variation** og **udpege outliers**.  
- Relaterer til **middelværdi** (center) og **standardafvigelse** (spredning).  
- Vælg bin-størrelse med omtanke: for få bins skjuler detaljer, for mange giver støj.

In [None]:
# Eksempel: histogram af peak-til-peak intervaller
try:
    y = x_bw if x_bw is not None else x_ma
    from scipy.signal import find_peaks
    peaks, _ = find_peaks(y, height=np.percentile(y, 80), distance=int(0.3*fs))
    intervals = np.diff(peaks)/fs  # sekunder
    mu = np.mean(intervals)
    sigma = np.std(intervals, ddof=1) if len(intervals) > 1 else 0.0

    plt.figure()
    n, bins, _ = plt.hist(intervals, bins=10, alpha=0.7, color='C0', edgecolor='k')
    plt.axvline(mu, color='C3', linestyle='--', label=f'Middelværdi = {mu:.3f} s')
    plt.axvspan(mu - sigma, mu + sigma, color='C3', alpha=0.2, label=f'±1 std = {sigma:.3f} s')
    plt.title('Histogram af mekaniske intervaller (peak–peak)')
    plt.xlabel('Tid [s]')
    plt.ylabel('Antal')
    plt.legend()
    plt.tight_layout()
    plt.show()
except Exception as e:
    print('Kan ikke beregne intervaller (for få peaks?). Kør peak-detektion først.')

## Etik-mini: Dataproveniens og metadata

- **Enhed**: sensor-type, placering, følsomhed.  
- **Samplerate**: nødvendig for korrekt filtervalg og timing.  
- **Kalibreringsdrift**: ændrer amplituder over tid → påvirker detektionstærskler.  
- **Metadata** skal gemmes sammen med data for reproducerbarhed.

# Øvelsessession (2–3 timer)

Tre opgaver med fokus på filtrering, peak-detektion og synkronisering af ECG og SCG.

## Filtrering af SCG

**1. Hvad handler opgaven om (scene):**  
Du arbejder med et SCG-signal forurenet af højfrekvent støj. Målet er at producere en version, der bevarer mekaniske events.

**2. Hvad ved I/skal bruge/forventet udbytte:**  
- Kendskab: glidende middelværdi og Butterworth lavpas.  
- Værktøjer: `numpy` (konvolution), `scipy.signal` (`butter`, `filtfilt`).  
- Udbytte: forstå trade-offs mellem simple og lidt mere avancerede filtre.

**3. Opgave (problemformulering):**  
Design **to filtre** (glidende middelværdi og Butterworth), anvend dem på et SCG-signal (rigtigt eller syntetisk), og **argumentér** for hvilket der bedst bevarer events givet jeres data.

In [None]:
# Svarforslag – filtrering
# Forsøg først at indlæse rigtige data hvis tilgængelig: 'scg.npy' (1D) og samplerate i 'fs.npy'
try:
    scg = np.load('scg.npy')
    fs = float(np.load('fs.npy'))
    t = np.arange(len(scg))/fs
    print('Indlæste rigtige data: scg.npy')
except Exception:
    print('Ingen rigtige data fundet – genererer syntetisk SCG.')
    fs = 200
    T = 10
    t = np.arange(0, T, 1/fs)
    scg_true = 0.5*np.sin(2*np.pi*1.0*t)
    scg = scg_true + 0.4*np.random.randn(len(t))
    for tt in np.arange(0.5, T, 1.0):
        i = int(tt*fs)
        if i+3 < len(scg):
            scg[i:i+3] += [0.8, 1.1, 0.6]

# Glidende middelværdi
N = 9
scg_ma = np.convolve(scg, np.ones(N)/N, mode='same')

# Butterworth lavpas
try:
    from scipy.signal import butter, filtfilt
    fc = 15
    b, a = butter(4, fc/(fs/2), btype='low')
    scg_bw = filtfilt(b, a, scg)
except Exception:
    scg_bw = None

plt.figure()
plt.plot(t, scg, color='0.6', label='Rå SCG')
plt.plot(t, scg_ma, label=f'Moving Average (N={N})')
if scg_bw is not None:
    plt.plot(t, scg_bw, label='Butterworth (fc=15 Hz)')
plt.title('Sammenligning af filtre')
plt.xlabel('Tid [s]')
plt.ylabel('Amplitude [a.u.]')
plt.legend()
plt.tight_layout(); plt.show()

## Peak-detektion af mekaniske beats

**1. Hvad handler opgaven om (scene):**  
Du skal udpege gentagne mekaniske events (beats) i et filtreret SCG-signal.

**2. Hvad ved I/skal bruge/forventet udbytte:**  
- Kendskab: peak-kriterier (højde, afstand).  
- Værktøjer: `scipy.signal.find_peaks`.  
- Udbytte: robust identifikation af beats og afledning af gennemsnitligt interval.

**3. Opgave (problemformulering):**  
Definér **rimelige tærskler** for højde og minimumsafstand, detektér peaks, og **beregn** det gennemsnitlige mekaniske interval.

In [None]:
# Svarforslag – peak-detektion
try:
    from scipy.signal import find_peaks
    y = scg_bw if 'scg_bw' in globals() and scg_bw is not None else scg_ma
    height_thr = np.percentile(y, 80)
    distance_s = 0.4  # min afstand i sekunder
    peaks, props = find_peaks(y, height=height_thr, distance=int(distance_s*fs))

    intervals = np.diff(peaks)/fs
    mean_int = np.mean(intervals) if len(intervals) else np.nan

    plt.figure()
    plt.plot(t, y, label='Filtreret SCG')
    plt.plot(t[peaks], y[peaks], 'rx', label='Peaks')
    plt.title(f'Peaks og mekaniske intervaller (gennemsnit = {mean_int:.3f} s)')
    plt.xlabel('Tid [s]')
    plt.ylabel('Amplitude [a.u.]')
    plt.legend(); plt.tight_layout(); plt.show()

    # Histogram af intervaller
    if len(intervals) > 0:
        mu, sd = np.mean(intervals), np.std(intervals, ddof=1) if len(intervals)>1 else 0.0
        plt.figure()
        plt.hist(intervals, bins=10, edgecolor='k', alpha=0.7)
        plt.axvline(mu, color='C3', linestyle='--', label=f'Middelværdi = {mu:.3f} s')
        plt.axvspan(mu-sd, mu+sd, color='C3', alpha=0.2, label=f'±1 std = {sd:.3f} s')
        plt.title('Histogram af mekaniske intervaller')
        plt.xlabel('Tid [s]'); plt.ylabel('Antal'); plt.legend(); plt.tight_layout(); plt.show()
except Exception as e:
    print('find_peaks ikke tilgængelig:', e)

## Synkronisering af ECG og SCG

**1. Hvad handler opgaven om (scene):**  
Vi relaterer elektriske R-peaks (ECG) til mekanisk AO-timing (SCG) og estimerer **mekanisk forsinkelse**.

**2. Hvad ved I/skal bruge/forventet udbytte:**  
- Kendskab: forskel på elektrisk og mekanisk aktivitet.  
- Værktøjer: `numpy` til indeks/tidsberegning, `scipy.signal.find_peaks` til AO-kandidater.  
- Udbytte: forståelse for R→AO som en fysiologisk relevant timing.

**3. Opgave (problemformulering):**  
Givet en liste af **R-peak-indekser** og et filtreret SCG-signal: vælg et fornuftigt vindue efter hver R-peak, find **AO-kandidat** og beregn **R→AO** for alle slag. Fortolk fordelingen.

In [None]:
# Svarforslag – R til AO timing
try:
    from scipy.signal import find_peaks
    fs = float(fs)
    y = scg_bw if 'scg_bw' in globals() and scg_bw is not None else scg_ma

    # Indlæs R-peaks hvis tilgængelig, ellers syntetisk baseret på peaks i y
    try:
        r_peaks = np.load('r_peaks.npy')  # heltalsindekser
        print('Indlæste rigtige R-peaks: r_peaks.npy')
    except Exception:
        print('Ingen R-peaks fundet – genererer syntetiske R-peaks ud fra signalets rytme.')
        # Brug peak-intervallet som proxy for puls og forskyd en smule bagud
        pks, _ = find_peaks(y, height=np.percentile(y, 80), distance=int(0.5*fs))
        r_peaks = (pks - int(0.1*fs))
        r_peaks = r_peaks[r_peaks>0]

    # For hvert R-peak: søg AO-kandidat i vindue [60, 200] ms efter R
    r2ao = []
    ao_idx = []
    for rp in r_peaks:
        start = rp + int(0.06*fs)
        stop  = rp + int(0.20*fs)
        if stop >= len(y):
            continue
        seg = y[start:stop]
        if len(seg)==0:
            continue
        loc = np.argmax(seg)  # simpel kandidat
        ao = start + loc
        ao_idx.append(ao)
        r2ao.append((ao - rp)/fs)

    r2ao = np.array(r2ao)

    # Plot eksempel
    plt.figure()
    plt.plot(t, y, label='Filtreret SCG')
    sel = slice(0, min(len(t), int(4*fs)))
    plt.plot(t[sel], y[sel])
    plt.plot(t[r_peaks], y[r_peaks], 'k|', markersize=10, label='R-peaks (givet)')
    plt.plot(t[ao_idx], y[ao_idx], 'ro', label='AO-kandidater')
    plt.title('ECG–SCG synkronisering: R og AO')
    plt.xlabel('Tid [s]'); plt.ylabel('Amplitude [a.u.]'); plt.legend(); plt.tight_layout(); plt.show()

    # Fordeling og beskrivelse
    if len(r2ao) > 0:
        mu, sd = np.mean(r2ao), np.std(r2ao, ddof=1) if len(r2ao)>1 else 0.0
        plt.figure()
        plt.hist(r2ao, bins=10, edgecolor='k', alpha=0.7)
        plt.axvline(mu, color='C3', linestyle='--', label=f'Middelværdi = {mu*1e3:.1f} ms')
        plt.axvspan(mu-sd, mu+sd, color='C3', alpha=0.2, label=f'±1 std = {sd*1e3:.1f} ms')
        plt.title('Histogram af R→AO timing')
        plt.xlabel('Tid [s]'); plt.ylabel('Antal'); plt.legend(); plt.tight_layout(); plt.show()
except Exception as e:
    print('Fejl i R→AO beregning:', e)

## Refleksion og takeaways

- Simple filtre kan være tilstrækkelige – men **valider mod fysiologi**.  
- **Histogrammer** hjælper med at kommunikere variabilitet (relatér til middelværdi og std).  
- **Metadata** (enhed, samplerate) er nødvendige for reproducerbar timing.