# Prosessering av Scanning Electron Diffraction (SED) data

Denne Jupyter Notebooken viser hvordan Scanning Electron Diffraction (SED) data kan analyseres. Sammenlignet med analyse av "standard" TEM data som dere så på i forrige Notebook, så er dette mer komplisert på grunn av datastørrelsen: det er veldig enkelt å gå tom for minne, noe som (mest sannsynlig) gjør at datamaskinen deres kræsjer.

### Målet med denne notebooken

- Dere skal kunne prosessere SED datasettene fra TEM-laben
- Bli komfortable med å jobbe med 4-dimensjonelle datasett
- Lære litt enkle verktøy og strategier for å jobbe med store datasett, som ofte er mye større en tilgjengelig minne

### Notebook-planen

- "Åpne" datasettet uten å laste det inn i minnet, "lazily"
- Utforske datasettet, via å redusere datamengden
- Redusere datamengden, slik at vi kan laste det inn i minnet
- Finne, og hente ut, individuelle diffraksjonsmønster

Eksempel på bilde:

<img src="bilder/sed_plot_example.jpg" width=600 height=600 />

Selve datasettene dere skal se på her er på ca. 8 GB, noe som er ganske smått i "4-D STEM" verdenen: disse kan lett være 100+ GB. Så selv om dere har en datamaskin som takler 8 GB, så anbefaler jeg at dere følger prosedyren for å redusere datastørrelsen.

## Importere biblioteker

Først, plotte-biblioteket. Dette kan enten være `%matplotlib qt` for egne vinduer for plottene, eller `%matplotlib widget` for å få plottene i selve Jupyter Notebooken.

Så importere HyperSpy

In [None]:
%matplotlib qt
from hyperspy import api as hs

## Åpne dataset

Dette gjøres via `hs.load`, som kan åpne en rekke dataformater, spesielt innenfor elektronmikroskopi. Velg et av STEM-DPC datasettene deres, disse skal ha:

- `.hspy` filformat
- Ha filnavn som IKKE inneholder: `stem_dpc`, `STEMDPC`, `LowMag`, `Low_Mag`, `lowmag`, `obj_off` eller `OBJOFF`
- Som KAN inneholde: `SED` eller `sed`

Siden disse er ganske store, så husk å bruk `lazy=True`. Lag et objekt som heter `s`.

Tips: sjekk docstring for informasjon om hvordan `hs.load` virker.

In [None]:
lazy = True
s = hs.load("data/STEM SED 10cm camlength 256x256 4ms exposure 200 ms flyback lines.hspy", lazy = lazy)

Skriv `s` i cellen under, og kjør cellen.

Her ser vi at dette er et `LazyElectronDiffraction2D` signal. `Lazy` betyr at dataene er ikke overført til RAM, ergo at dataene ennå bare er på harddisken. I tillegg ser vi at datasettet har `256 x 256` probe-posisjoner, og `256 x 256` detektorposisjoner. Hvert datapunkt er en 16-bit heltall, som gir 2 bytes. Dette gir en datastørrelse på: `256 * 256 * 256 * 256 * 2`, som er ca. 8.6 gigabytes.

En del av dere har nok en datamaskin som kan takle dette, men la oss prøve å redusere datamengden litt.

**VIKTIG:** det er veldig lett å kræsje datamaskinen når man holder på med såpass store datasett. Så pass på at dere har lagret ting dere har åpent.

## Plotting av dataen

`s` er et signal objekt som inneholder mange funksjoner. Et av disse er `plot`, prøv denne med argumentet `norm="symlog"`. Dette gjør at signal dimensjonen blir plottet i log-log, som gjør det lettere å se de svake diffraksjonsdiskene. Siden dette er et `lazy` signal, så må HyperSpy kalkulere et navigasjonsbilde ved å hente ut deler (`chunks`) av gangen.

Denne navigeringen kommer (mest sannsynlig) til å være ganske treg, dette fordi alt må leses fra harddisken. Planen nå er å redusere datastørrelsen, slik at vi kan laste alt inn i minnet, men først vil vi utforske datasettet litt for å se hvor mye vi kan redusere datasettet.

Dere får opp to bilder: "navigeringsplot" og "signalplot".

<img src="bilder/SED_plot_nav_og_sig.jpg" width=700 height=700 />

- Tips 1: navigatoren kan gjøres større ved å trykke på `+` knappen på **tastaturet**. Og mindre med å trykke på `-` knappen på **tastaturet**. Dette summerer IKKE flere piksler, men er bare en måte å lettere treffe navigator-markøren.
- Tips 2: dere kan også flytte rundt med pil-tastene.

(Siden folk har litt forskjellige datasett, så er det sannsynlig at ikke alt dette er relevant for alle.)

In [None]:
#s.plot(norm = "symlog")

Det som er mest interessant i disse datasettene, er hvordan diffraksjonsbildene ser ut i de forskjellige områdene.

Dette brukes til å finne ut hva slags krystall-struktur vi har.

Men først, så lager vi et litt mindre datasett, som brukes til å utforske datasettet.

Finn senter-posisjonen til senter-disken:

<img src="bilder/sed_senter_av_senterdisk.jpg" width=700 height=700 />

Så bruk `radial_average` med `x` som `centre_x` og `y` som `centre_y` parameterne, til å lage en ny variabel `s_r`.

In [None]:
s_r = s.radial_average(centre_x=128, centre_y=128)

Dette nye `s_r` signalet er antall elektroner som en funksjon av spredningsvinkel, og er mye mindre enn `s`. Dette fordi vi har redusert datasettet fra 4-dimensjoner til 3-dimensjoner.

Nå kan vi utforske datasettet på en enkel og rask måte, siden det er lite nok til å lastes inn i minnet.

Bruk `s_r.T.plot()` for å visualisere prøven. Med denne kan vi navigere datasettet som en funksjon av spredningsvinkelen, som gjør at vi lett kan bytte mellom virtuell "bright field", virtuell "annular dark field (ADF)" og "medium angle ADF (MAADF)" og "high angle ADF (HAADF)". Dette gjøres ved å trykke på og dra den røde navigator linjen (se bilde), eller ved å bruke piltastene på tastaturet.

<img src="bilder/radial_average_example.jpg" width=500 height=500 />

In [None]:
#s_r.plot()


## Finne diffraksjonsmønstre

Etter å ha utforsket materialet litt, så finn noen interessante områder. Noter ned x- og y-posisjonene til disse.

<img src="bilder/sed_get_xy_position.jpg" width=900 height=900 />

Så, bruk `.inav` til å plukke ut disse posisjonene, som du kan bruke til å lage signal med diffraksjonsbilder. Dette bruker dere så til å lage plot med både navigasjonssignal, og med diffraksjonsbildene. Dette for å vise hva slags strukturer vi har.

Bruk `.inav[x, y]` til å lage signaler: `s_diff0`, `s_diff1`, ... som viser hvordan strukturen er på forskjellige steder.

For noen av disse posisjonen, så kan signalet være litt dårlig. Hvis dette er tilfellet, så kan dere summere de nærliggende probe-posisjonene. F.eks. ved å bruke `s.inav[x0:x1, y0:y1].sum()`.

Merk: disse er `lazy` signaler, så kjør `.compute()` på dem!

In [None]:
s_d1 = s.inav[183, 48]
s_d2 = s.inav[150, 145]
s_d3 = s.inav[10, 142]
s_d4 = s.inav[80, 80]

s_d1.compute()
s_d2.compute()
s_d3.compute()
s_d4.compute()

### Lage oversiktsbilde

En enkel måte å lage et oversiktsbilde, er å summere intensiteten i diffraksjonsmønsteret. Gjør dette med `sum` funksjonen i `s`, bruk argumentet `axis=(-1, -2)`.

Lag en ny variabel: `s_oversikt`

Så kjør `compute()` funksjonen i `s_oversikt`

In [None]:
s_o = s.sum(axis = (-1, -2))
s_o.compute()

## Lage figur

Bruk disse til å lage en figur med oversiktsbilde + diffraksjonsbilder.

Noe som ligner på eksemplet helt i starten av denne Notebooken.

### Plotting av diffraksjonsbilder

Disse har ofte veldig store variasjoner i intensitet, så det er best å plotte disse i log-log plot. Gjør dette med:

```python
import matplotlib.colors as colors
norm = colors.SymLogNorm(1, vmin=1, vmax=s_diff0.data.max())
```

Så bruk `ax.imshow(..., norm=norm)`. Ergo så må dette gjøres for hvert diffraksjonsbilde

In [None]:
s.axes_manager

In [None]:
import matplotlib.colors as colors
from matplotlib import pyplot as plt
from mpl_toolkits.axes_grid1.anchored_artists import AnchoredSizeBar
import matplotlib.font_manager as fm
import matplotlib.patheffects as patheffects


fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2)

ax1.imshow(s_d1, norm = colors.SymLogNorm(1, vmin=1, vmax=s_d1.data.max()), extent = s_d1.axes_manager.signal_extent)
ax2.imshow(s_d2, norm = colors.SymLogNorm(1, vmin=1, vmax=s_d2.data.max()), extent = s_d2.axes_manager.signal_extent)
ax3.imshow(s_d3, norm = colors.SymLogNorm(1, vmin=1, vmax=s_d3.data.max()), extent = s_d3.axes_manager.signal_extent)
ax4.imshow(s_d4, norm = colors.SymLogNorm(1, vmin=1, vmax=s_d4.data.max()), extent = s_d4.axes_manager.signal_extent)

fontprops = fm.FontProperties(size=10)
scalebar_kwargs = {
    'size': 1, 
    'label': '1 µm', 
    'loc': 4, 
    'frameon': False, 
    'color': 'white', 
    'size_vertical': 0.2, 
    'label_top': False, 
    'fontproperties': fontprops
    }

scalebar1 = AnchoredSizeBar(transform=ax1.transData, **scalebar_kwargs)
scalebar1.txt_label._text.set_path_effects([patheffects.withStroke(linewidth=2, foreground='black', capstyle="round")])
ax1.add_artist(scalebar1)

scalebar2 = AnchoredSizeBar(transform=ax2.transData, **scalebar_kwargs)
scalebar2.txt_label._text.set_path_effects([patheffects.withStroke(linewidth=2, foreground='black', capstyle="round")])
ax2.add_artist(scalebar2)

scalebar3 = AnchoredSizeBar(transform=ax3.transData, **scalebar_kwargs)
scalebar3.txt_label._text.set_path_effects([patheffects.withStroke(linewidth=2, foreground='black', capstyle="round")])
ax3.add_artist(scalebar3)

scalebar4 = AnchoredSizeBar(transform=ax3.transData, **scalebar_kwargs)
scalebar4.txt_label._text.set_path_effects([patheffects.withStroke(linewidth=2, foreground='black', capstyle="round")])
ax4.add_artist(scalebar4)

fig.savefig("tmp.png", dpi = 300)

f,a=plt.subplots(1,1)
a.imshow(s_o)
f.savefig("tmp2.png")