# Miljø (conda/venv) = reproducerbar forskning (kritisk i bachelor)

Disse notatene forklarer *hvorfor* miljø og versjoner betyr mye, spesielt i LLM/NLP-sikkerhet (backdoors/defenses).


## 1) Hvorfor miljø er så viktig

I bachelor på post-training defenses vil du ofte:

- kjøre samme forsøk mange ganger
- sammenligne før/etter defense (pruning, unlearning, filtering, clustering)
- måle **ASR** (attack success rate) og **utility** (clean accuracy/F1)

Hvis miljøet “flyter” (ulike versjoner av `torch`/`transformers`), kan du få **spøkelsesforskjeller**:

- tokenisering kan endre seg
- defaults for generation kan endre seg
- resultatene dine kan bli vanskelig å reprodusere

> I backdoor-testing kan en liten versjonsendring endre trigger-effekt, og du kan feilaktig tro at en defense virker.


## 2) Conda eksempel (ryddig)

```bash
conda create --name nlp_course_env python=3.11
conda activate nlp_course_env

# basis
pip install ipykernel jupyterlab notebook
python -m ipykernel install --user --name nlp_course_env --display-name "nlp_course_env"
```

> Du kan også bruke `venv` (som i `python-for-ai/03-setting-up-the-env.ipynb`). Poenget er isolasjon + konsistente versjoner.


## 3) “Forklar pakkene” — med backdoor-vinkling

### `transformers` + `torch`

- last modell/checkpoint
- inference med/uten trigger
- finetune/unlearn/prune
- mål ASR + utility

### `spacy` (POS/NER)

- kan brukes som observasjonsverktøy
- kan måle “entity drift” / avvik i output

### `nltk` (preprocessing + n-grams)

- stopwords/tokenisering/n-grams
- n-grams kan avsløre mistenkelige fraser i poisoning

### `scikit-learn`

- baselines (LogReg/SVM/TF-IDF)
- clustering for å finne “poisoned subpopulation”
- metrikker og CV

### `pandas` + plotting

- logg resultater (ASR/CACC/F1)
- plott før/etter defense


## 4) Preprocessing som kontrollvariabel (backdoor-sikkerhet)

I backdoor-forskning kan preprocessing både hjelpe og ødelegge.

### Lowercasing

- kan fjerne case-sensitive triggere
- kan også gjøre triggere lettere å trigge

### Stopword removal

- kan ødelegge triggere som er avhengige av ordkombinasjoner (n-grams)

### Punctuation/regex cleaning

- triggere kan være tegnsekvenser ("@@", "!!!", unicode)

**Bachelor-regel:** Evaluer alltid både:

- rå tekst
- normalisert tekst

…og rapporter forskjellen i ASR/utility.
