# Prosessering av STEM-DPC data

Denne Jupyter Notebooken viser hvordan Scanning Transmission Electron Microscopy - Differential Phase Contrast (STEM-DPC) data kan analyseres. Sammenlignet med analyse av "standard" TEM data som dere så på i forrige Notebook, så er dette mer komplisert på grunn av datastørrelsen: det er veldig enkelt å gå tom for minne, noe som (mest sannsynlig) gjør at datamaskinen deres kræsjer.

### Målet med denne notebooken

- Dere skal kunne prosessere de magnetiske STEM-DPC dataene deres fra TEM-laben
- Bli komfortable med å jobbe med 4-dimensjonelle datasett
- Lære litt enkle verktøy og strategier for å jobbe med store datasett, som ofte er mye større en tilgjengelig minne

### Notebook-planen

- "Åpne" datasettet uten å laste det inn i minnet, "lazily"
- Utforske datasettet, uten å laste det inn i minnet. Via "lazy plotting"
- Redusere datamengden, slik at vi kan laste det inn i minnet
- Bruk center of mass til å finne den magnetiske vektoren i hver probe-posisjon
- Visualisere den magnetiske domenestrukturen i en bildefil

Eksempel på bilde:

<img src="bilder/eksempelbilde_dpc.jpg" width=300 height=300 />

Selve datasettene dere skal se på her er på ca. 8 GB, noe som er ganske smått i "4-D STEM" verdenen: disse kan lett være 100+ GB. Så selv om dere har en datamaskin som takler 8 GB, så anbefaler jeg at dere følger prosedyren for å redusere datastørrelsen.

## Importere biblioteker

Først, plotte-biblioteket. Dette kan enten være `%matplotlib qt` for egne vinduer for plottene, eller `%matplotlib widget` for å få plottene i selve Jupyter Notebooken.

In [1]:
import matplotlib.pyplot as plt
import hyperspy.api as hs 
import numpy as np

%matplotlib qt5

Så importere HyperSpy

## Åpne dataset

Dette gjøres via `hs.load`, som kan åpne en rekke dataformater, spesielt innenfor elektronmikroskopi. Velg `datasett/stem_dpc_data.zspy` datasettet.

- `.zspy` "fileformat", denne er egentlig en mappe, men skriv den inn som om det er en fil.
- Ha filnavn som inneholder noe med: `stem_dpc`, `STEMDPC`, `LowMag`, `Low_Mag`, `lowmag`, `obj_off` eller `OBJOFF`

Siden disse er ganske store, så husk å bruk `lazy=True`. Lag et objekt som heter `s`.

Tips: sjekk docstring for informasjon om hvordan `hs.load` virker.

(Det er mulig at dere får en `WARNING` melding om `pyOpenCl`. Dette er en `WARNING` ikke en `ERROR`, så her kan den ignoreres.)

In [2]:
spook = hs.load("example_data/stem_dpc_data.zspy", lazy=True)



Skriv `print(s)` i cellen under, og kjør cellen.

In [3]:
print(spook)

<LazyElectronDiffraction2D, title: , dimensions: (256, 256|256, 256)>


Her ser vi at dette er et `LazyElectronDiffraction2D` signal. `Lazy` betyr at dataene er ikke overført til RAM, ergo at dataene ennå bare er på harddisken. 

Den siste delen, `(256, 256|256, 256)` er dimensjonene til datasettet. Tallene til venstre for `|` er navigasjons-dimensjonene (probe-posisjoner), mens de til høyre er signal-dimensjonene (detektor-posisjoner). Ergo, vi har et 4-dimensjonalt datasett, som består av `256 x 256` probe-posisjoner, og `256 x 256` detektorposisjoner.

For å få mer informasjon om dette, kjør `s` i cellen:

In [5]:
spook

Title:,Unnamed: 1_level_0,Unnamed: 2_level_0
SignalType:,electron_diffraction,Unnamed: 2_level_1
Unnamed: 0_level_2,Array,Chunk
Navigation Axes,Signal Axes,Unnamed: 2_level_3
Bytes,8.00 GiB,2.00 MiB
Shape,"(256, 256|256, 256)","(32,32|32,32)"
Count,4097 Tasks,4096 Chunks
Type,uint16,numpy.ndarray
256  256,256  256,
"Title: SignalType: electron_diffraction Array Chunk Bytes 8.00 GiB 2.00 MiB Shape (256, 256|256, 256) (32,32|32,32) Count 4097 Tasks 4096 Chunks Type uint16 numpy.ndarray",Navigation Axes Signal Axes 256  256  256  256,

Title:,Unnamed: 1_level_0,Unnamed: 2_level_0
SignalType:,electron_diffraction,Unnamed: 2_level_1
Unnamed: 0_level_2,Array,Chunk
Bytes,8.00 GiB,2.00 MiB
Shape,"(256, 256|256, 256)","(32,32|32,32)"
Count,4097 Tasks,4096 Chunks
Type,uint16,numpy.ndarray

Navigation Axes,Signal Axes
256  256,256  256


Her ser vi at den totale størrelsen på datasettet er 8 GiB, og at dataene er lagret i 16 usigned integer. Dette gir 2 bytes per datapunkt (8 bits i en byte).

En del av dere har nok en datamaskin som kan takle dette, men la oss prøve å redusere datamengden litt.

**VIKTIG:** det er veldig lett å kræsje datamaskinen når man holder på med såpass store datasett. Så pass på at dere har lagret ting dere har åpent.

## Plotting av dataen

`s` er et signal objekt som inneholder mange funksjoner. En av disse er `plot`, som lar oss visualisere dataene. Kjør denne funksjonen.

In [7]:
spook.plot()

[########################################] | 100% Completed | 329.09 ms


Siden dette er et `lazy` signal, så må HyperSpy kalkulere et navigasjonsbilde ved å hente ut deler (`chunks`) av gangen.

Denne navigeringen kan "hakke" litt, dette fordi alt må leses fra harddisken. Planen nå er å redusere datastørrelsen, slik at vi kan laste alt inn i minnet, men først vil vi utforske datasettet litt for å se hvor mye vi kan redusere datasettet.

Dere får opp to bilder: "navigeringsplot" og "signalplot".

<img src="bilder/nav_og_sig.jpg" width=700 height=700 />

- Tips 1: navigatoren kan gjøres større ved å trykke på `+` knappen på **tastaturet**. Og mindre med å trykke på `-` knappen på **tastaturet**. Dette summerer IKKE flere piksler, men er bare en måte å lettere treffe navigator-markøren.
- Tips 2: dere kan også flytte rundt med pil-tastene.

(Siden folk har litt forskjellige datasett, så er det sannsynlig at ikke alt dette er relevant for alle.)

Som dere kanskje har sett allerede, så er bildet i eksemplet over, annerledes enn bildet i plottene deres.

Dette er fordi HyperSpy bare bruker den midterste "chunken" i signal-dimensjonen for å lage navigasjonsbildet. For de fleste datasett, så virker dette greit nok. Men her er det litt suboptimalt, fordi elektronproben flytter seg ganske mye.

Så la oss lage et bedre "navigasjonsbilde".

For å gjøre dette, så lager vi først et "bright field" bilde av datasettet. Ergo, vi summerer hele diffraksjonsmønsteret i hver eneste probeposisjon. For å gjøre dette bruker vi `sum` funksjonen som er i `s`. Men vi må spesifisere at vi vil summere over de to siste dimensjonene, for å gjøre dette. Bruk `axis=(-1, -2)` i `sum` funksjonen.

Resultatet i denne skal så lagres i en ny variabel: `s_sum`

In [8]:
s_sum = spook.sum(axis=(-1, -2))

Så kan vi se hva dette nye signalet er, kjør `print(s_sum)`

In [11]:
s_sum

Title:,Unnamed: 1_level_0,Unnamed: 2_level_0
SignalType:,Unnamed: 1_level_1,Unnamed: 2_level_1
Unnamed: 0_level_2,Array,Chunk
Navigation Axes,Signal Axes,Unnamed: 2_level_3
Bytes,256.00 kiB,16.00 kiB
Shape,"(256, 256|)","(64,64|)"
Count,4689 Tasks,16 Chunks
Type,uint32,numpy.ndarray
256  256,,
"Title: SignalType: Array Chunk Bytes 256.00 kiB 16.00 kiB Shape (256, 256|) (64,64|) Count 4689 Tasks 16 Chunks Type uint32 numpy.ndarray",Navigation Axes Signal Axes 256  256,

Title:,Unnamed: 1_level_0,Unnamed: 2_level_0
SignalType:,Unnamed: 1_level_1,Unnamed: 2_level_1
Unnamed: 0_level_2,Array,Chunk
Bytes,256.00 kiB,16.00 kiB
Shape,"(256, 256|)","(64,64|)"
Count,4689 Tasks,16 Chunks
Type,uint32,numpy.ndarray

Navigation Axes,Signal Axes
256  256,


Her ser vi at `s_sum` har 2 navigasjonsdimensjoner, og 0 signaldimensjoner. Disse vil vi "flippe", ergo å få 0 navigasjonsdimensjoner, og 2 signaldimensjoner.

Gjør dette ved å bruk `transpose` funksjonen i `s_sum`, og lagre den til en ny variabel `s_nav`.

In [12]:
s_nav = s_sum.transpose()
s_nav

Så kjør `print(s_nav)` for å se hvordan den ser ut.

Nå dar den riktige dimensjoner, men den er ennå `LazyElectronDiffraction2D`. Ergo, vi har ikke egentlig gjort alle operasjonene ennå. For å gjøre dette, kjør `compute` funksjonen i `s_nav`.

In [14]:
s_nav.compute()
s_nav

[########################################] | 100% Completed | 12.73 s


<ElectronDiffraction2D, title: , dimensions: (|256, 256)>

Så kjør `print(s_nav)`

Nå er `ElectronDiffraction2D`, ergo at vi har gjort alle kalkuleringene, og lastet dataene inn i minnet.

Kjør så `plot` funksjonen i `s_nav`.

In [16]:
s_nav.plot()

Dette er et "bright field" bilde av strukturen, som vi skal bruke som navigasjonsbilde.

Dette gjøres ved å sette `navigator` attribute i `s` lik `s_nav`.

In [17]:
spook.navigator = s_nav

Deretter kan vi bruke `plot` funksjonen i `s`. Da blir `s_nav` automatisk brukt som navigasjonsbilde.

In [19]:
spook.plot()

Siden vi bare er interessert i senter-disken, så kan vi fjerne alt "tomrommet" (det grønne i bildet her) hvor elektronstrålen ikke er. Ergo: vi beskjærer datasettet, slik at vi bare får de delene vi bryr oss om.

<img src="bilder/01_diffraksjonsbilde_senterdisk.jpg" width=300 height=300 />

Et vanlig problem, er at elektronstrålen flytter seg som funksjon av probe-posisjon. Så vi kan ikke bare beskjære akkurat rundt der den er i en enkeltposisjon, vi må ha litt "ekstra" rom på sidene.

<img src="bilder/01_finn_senter.jpg" width=500 height=500 />

- Plasser navigatoren midt i datasettet, som vist i bildet over.
- Se hva `x` og `y` er i senterpunktet av disken (øverst til høyre i signal plottet)
- Bruk `isig` til å beskjære. Syntaksen er: `s.isig[x0:x1, y0:y1]`, hvor dere kan for eksempel ha +- 50 rundt senterposisjonen. Ergo at det beskjærte området blir 100 x 100 piksler tilsammen.
    * Eksempel: `s.isig[128 - 50 : 128 + 50, 128 - 50 : 128 + 50]`
- Lagre dette som en ny variabel: `s1`. 

Hvis deler av datasettet er "dekket" av tykke deler av prøven, som dere ikke bryr dere om, så bare gjør dette med de områdene som er tynne nok. Hvis du har sånne "uinteressante" områder, så bruk `inav` til å fjerne dem på en tilsvarende måte.

In [22]:
cx, cy = (122, 116)
smigel = spook.isig[cx-50:cx+50, cy-50:cy+50]

Skriv `s1` i cellen under, og kjør cellen.

In [23]:
smigel

Title:,Unnamed: 1_level_0,Unnamed: 2_level_0
SignalType:,electron_diffraction,Unnamed: 2_level_1
Unnamed: 0_level_2,Array,Chunk
Navigation Axes,Signal Axes,Unnamed: 2_level_3
Bytes,1.22 GiB,2.00 MiB
Shape,"(256, 256|100, 100)","(32,32|32,32)"
Count,5121 Tasks,1024 Chunks
Type,uint16,numpy.ndarray
256  256,100  100,
"Title: SignalType: electron_diffraction Array Chunk Bytes 1.22 GiB 2.00 MiB Shape (256, 256|100, 100) (32,32|32,32) Count 5121 Tasks 1024 Chunks Type uint16 numpy.ndarray",Navigation Axes Signal Axes 256  256  100  100,

Title:,Unnamed: 1_level_0,Unnamed: 2_level_0
SignalType:,electron_diffraction,Unnamed: 2_level_1
Unnamed: 0_level_2,Array,Chunk
Bytes,1.22 GiB,2.00 MiB
Shape,"(256, 256|100, 100)","(32,32|32,32)"
Count,5121 Tasks,1024 Chunks
Type,uint16,numpy.ndarray

Navigation Axes,Signal Axes
256  256,100  100


Her ser vi at dette er et `LazyElectronDiffraction2D` signal, men med færre detektor-posisjoner! Hvis dere brukt 50 piksler som eksemplet ovenfor, så vil dette nye signalet `s1` bare være 15% av `s` sin størrelse.

Her kan vi gjenbruke navigasjonsbildet fra tidligere `s_nav`, via `navigator` attributen.

In [24]:
smigel.navigator = s_nav

For å sjekke hvordan dette ser ut, så bruk: `s1.plot()`

In [25]:
smigel.plot()

Sjekk at den hele senterdisken ennå er i datasettet, ved å flytte navigatoren til de ytre hjørnene.

Nå er navigeringen mye raskere, fordi vi laster en mye mindre del av datasettet inn i minnet per probeposisjon.

<img src="bilder/02_senter_posisjon.jpg" width=800 height=800 />

Hvis dette ser bra ut så bruk `compute` funksjonen i `s1`.

**VIKTIG:** dette vil laste hele `s1` datasettet inn i minnet, og hvis du ikke har gjort de forrige stegene riktig, så kan det kræsje datamaskinen din!

In [27]:
smigel.compute()

[########################################] | 100% Completed | 1.85 sms


Nå vil plottingen være mye raskere, siden alt er i minnet. Bruk `plot` i `s1`, for å se hvordan prøven og datasettet ser ut.

## Magnetisk kontrast

Nå som datasettet er litt mer håndterbart, så kan vi prøve å se de magnetiske domenene.

En enkel måte å gjøre dette på, er å bytte om på "navigasjon" og "signal" dimensjonene. Ergo: istedet for at vi endrer på probe-posisjonen, så endrer vi heller på detektorposisjonen.

Kjør: `s1.T.plot()`, og flytt navigatoren rundt senterstrålen. Dette vil se litt rart ut, på grunn av at elektronstrålen flytter på seg, men dere burde kunne se litt magnetisk kontrast på grensen mellom de lyse og mørke områdene.

In [28]:
smigel.T.plot()

## Mer avansert analyse

En litt mer avansert måte å analysere dette, er å bruk `center_of_mass` funksjonen i `s1`. Lagre dette som `s1_com`. Dette regner ut hvor senter-posisjonen er for alle probe-posisjonene.

In [29]:
cum = smigel.center_of_mass()

[########################################] | 100% Completed | 5.65 sms


Dette gir et `DPCSignal2D`, hvor x- og y-posisjonene er i navigasjonsposisjonene.

Bruk `plot` i `s1_com`. I navigasjons dimensjon så er det x- og y-posisjonen til elektronstrålen, dette kan kobles direkte til det magnetiske feltet i prøven. Bytt mellom x og y med piltastene på tastaturet.

Dette skal ca. se sånn ut:

<img src="bilder/center_of_mass_raw.jpg" width=800 height=800 />

Tips: hvis det er vanskelig å se bruk kontrast-editoren, ved å trykke på `H`-knappen.

In [30]:
cum.plot()

Her ser vi at vi har et problem med at senter-strålen har flyttet seg, som gir et "plan" i både x- og y-retningen.

Dette kan korrigeres ved å bruk `correct_ramp` funksjonen i `s1_com`.

Bruk denne, og lagre den som `s1_com_corr`.

In [31]:
coomer = cum.correct_ramp()

Så plot `s1_com_corr`, ved å bruke `get_color_signal().plot()`.

In [32]:
coomer.get_color_signal().plot()

Dette skal se noe ut som dette:

<img src="bilder/center_of_mass_color.jpg" width=200 height=200 />

Hvis det ser ut som dette (se under), se har `correct_ramp` ikke virket ordentlig. Det magnetiske området som er i midten på y-aksen på figuren under, skal ha mange forskjellige farger.

<img src="bilder/center_of_mass_bad_corrected_ramp.jpg" width=200 height=200 />

I dette tilfellet er det fordi områdene over og under det tynne området er så tykke at center of mass ikke virker særlig bra. Da må disse områdene fjernes ved å bruke `s_com.isig[: y0:y1]`, FØR man kjører `s1_com.correct_ramp`.

Så i dette tilfellet:
```python
s1_com_corr = s1_com.isig[:, 40:190].correct_ramp()
s1_com_corr.get_color_signal().plot()
```
<img src="bilder/center_of_mass_color_corrected_good.jpg" width=300 height=300 />

## Plotting av disse dataene

Nå kan dette kombineres med kunnskapen og koden dere brukte i TEM-bildedata notebooken, og FIB notebooken, til å lage en figur som ligner på den i starten av denne Jupyter Notebooken.

For å få disse fargeplottene i en matplotlib-figur, så først lag en `fig` og en `ax` via matplotlib.

Så bruk `get_color_image_with_indicator` i `s1_com_corr` med `ax=ax`.

In [38]:
fig, ax = plt.subplots()
coomer.get_color_image_with_indicator?
# fig.show()

AttributeError: 'str' object has no attribute 'imshow'

Tips: posisjonen til fargehjulet kan styres med `ax_indicator` parameteren, se docstringen for mer informasjon.