# üß† Tr√§ning & ONNX Export - F√∂rst√• vad som h√§nder

**M√•l**: F√∂rst√• hur tr√§ning fungerar och experimentera med olika inst√§llningar.

I detta notebook kommer vi att:
- F√∂rst√• vad FakeData √§r och varf√∂r vi anv√§nder det
- Se hur dataset-pipeline ‚Üí modell ‚Üí loss/accuracy fungerar
- Experimentera med olika hyperparametrar
- F√∂rst√• varf√∂r vi exporterar till ONNX

> **üí° Tips**: K√∂r cellerna i ordning och l√§s f√∂rklaringarna. Experimentera g√§rna med v√§rdena!


## ü§î Vad √§r FakeData och varf√∂r anv√§nder vi det?

**FakeData** √§r syntetiska bilder som PyTorch genererar automatiskt. Det √§r perfekt f√∂r:
- **Snabb prototyping** - ingen nedladdning av stora dataset
- **Reproducerbarhet** - samma data varje g√•ng
- **Undervisning** - fokus p√• algoritmer, inte datahantering

<details>
<summary>üîç Klicka f√∂r att se vad FakeData inneh√•ller</summary>

```python
# FakeData genererar:
# - Slumpm√§ssiga RGB-bilder (64x64 pixlar)
# - Slumpm√§ssiga klasser (0, 1, 2, ...)
# - Samma struktur som riktiga bilddataset
```

</details>


In [None]:
# L√•t oss skapa en liten FakeData f√∂r att se vad den inneh√•ller
import torch
from torchvision import datasets
import matplotlib.pyplot as plt

# Skapa FakeData med 2 klasser
fake_data = datasets.FakeData(size=10, num_classes=2, transform=None)

# Visa f√∂rsta bilden
image, label = fake_data[0]
print(f"Bildstorlek: {image.size}")
print(f"Klass: {label}")
print(f"Pixelv√§rden: {image.getextrema()}")

# Visa bilden
plt.figure(figsize=(6, 4))
plt.imshow(image)
plt.title(f"FakeData - Klass {label}")
plt.axis('off')
plt.show()


## üéØ Experimentera med Tr√§ning

Nu ska vi tr√§na en modell och se hur olika inst√§llningar p√•verkar resultatet.

**Hyperparametrar att experimentera med**:
- `epochs` - antal genomg√•ngar av datasetet
- `batch_size` - antal bilder per tr√§ningssteg
- `--no-pretrained` - b√∂rja fr√•n noll vs f√∂rtr√§nade vikter


In [None]:
# Experiment 1: Snabb tr√§ning (1 epoch, ingen pretrained)
print("üß™ Experiment 1: Snabb tr√§ning")
!python -m piedge_edukit.train --fakedata --no-pretrained --epochs 1 --batch-size 128 --output-dir ./models_exp1


In [None]:
# Visa tr√§ningsresultat fr√•n Experiment 1
import json
import os

if os.path.exists("./models_exp1/training_info.json"):
    with open("./models_exp1/training_info.json", "r") as f:
        info = json.load(f)
    
    print("üìä Tr√§ningsresultat (Experiment 1):")
    print(f"Final accuracy: {info.get('final_accuracy', 'N/A'):.3f}")
    print(f"Final loss: {info.get('final_loss', 'N/A'):.3f}")
    print(f"Epochs: {info.get('epochs', 'N/A')}")
    print(f"Batch size: {info.get('batch_size', 'N/A')}")
else:
    print("‚ùå Tr√§ningsinfo saknas")


## ü§î Reflektionsfr√•gor

<details>
<summary>üí≠ Vad h√§nder med √∂verfitting n√§r du h√∂jer epochs?</summary>

**Svar**: Med fler epochs kan modellen l√§ra sig tr√§ningsdata f√∂r bra och d√•ligt generalisera till nya data. Detta kallas √∂verfitting.

**Experiment**: K√∂r samma tr√§ning men med `--epochs 5` och j√§mf√∂r accuracy p√• tr√§nings- vs valideringsdata.

</details>

<details>
<summary>üí≠ Varf√∂r exporterar vi till ONNX (f√∂r Pi/edge)?</summary>

**Svar**: ONNX √§r ett standardformat som fungerar p√• m√•nga plattformar (CPU, GPU, mobil, edge). Det g√∂r modellen portabel och optimerad f√∂r inference.

**F√∂rdelar**:
- Snabbare inference √§n PyTorch
- Mindre minnesanv√§ndning
- Fungerar p√• Raspberry Pi
- St√∂d f√∂r kvantisering (INT8)

</details>


## üéØ Ditt eget experiment

**Uppgift**: Tr√§na en modell med andra inst√§llningar och j√§mf√∂r resultaten.

**F√∂rslag**:
- √ñka epochs till 3-5
- √Ñndra batch_size till 64 eller 256
- Testa med och utan `--no-pretrained`

**Kod att modifiera**:
```python
# √Ñndra dessa v√§rden:
EPOCHS = 3
BATCH_SIZE = 64
USE_PRETRAINED = False  # True f√∂r f√∂rtr√§nade vikter

!python -m piedge_edukit.train --fakedata --epochs {EPOCHS} --batch-size {BATCH_SIZE} --output-dir ./models_myexp
```


In [None]:
# TODO: Implementera ditt experiment h√§r
# √Ñndra v√§rdena nedan och k√∂r tr√§ningen

EPOCHS = 3
BATCH_SIZE = 64
USE_PRETRAINED = False

print(f"üß™ Mitt experiment: epochs={EPOCHS}, batch_size={BATCH_SIZE}, pretrained={USE_PRETRAINED}")

# TODO: K√∂r tr√§ningen med dina inst√§llningar
# !python -m piedge_edukit.train --fakedata --epochs {EPOCHS} --batch-size {BATCH_SIZE} --output-dir ./models_myexp


## üéâ Sammanfattning

Du har nu l√§rt dig:
- Vad FakeData √§r och varf√∂r vi anv√§nder det
- Hur tr√§ning fungerar med olika hyperparametrar
- Varf√∂r ONNX-export √§r viktigt f√∂r edge deployment

**N√§sta steg**: G√• till `02_latency_benchmark.ipynb` f√∂r att f√∂rst√• hur vi m√§ter modellens prestanda.

**Viktiga begrepp**:
- **Epochs**: Antal genomg√•ngar av datasetet
- **Batch size**: Antal bilder per tr√§ningssteg
- **Pretrained weights**: F√∂rtr√§nade vikter fr√•n ImageNet
- **ONNX**: Standardformat f√∂r edge deployment
