# ü•ã Lekcja 28: Model Surgery (Przeszczepianie Warstw)

Bierzemy gotowy model (`pretrained=True`), ale musimy go dostosowaƒá do naszych danych.

1.  **Head Replacement (Proste):** Podmieniamy ostatniƒÖ warstwƒô liniowƒÖ (`fc` lub `classifier`), ≈ºeby zmieniƒá liczbƒô klas.
2.  **Stem Replacement (Trudne):** Podmieniamy pierwszƒÖ warstwƒô konwolucyjnƒÖ (`conv1`), ≈ºeby zmieniƒá liczbƒô kana≈Ç√≥w wej≈õciowych.

**Black Belt Trick:**
Je≈õli zmieniamy wej≈õcie z 3 kana≈Ç√≥w (RGB) na 1 kana≈Ç (Grayscale), nie inicjalizujemy nowej warstwy losowo!
Bierzemy wagi z oryginalnej warstwy RGB, **u≈õredniamy je** i wk≈Çadamy do nowej warstwy.
Dziƒôki temu model od razu "umie" wykrywaƒá krawƒôdzie i kszta≈Çty, zamiast uczyƒá siƒô widzenia od nowa.

In [1]:
import torch
import torch.nn as nn
from torchvision import models

# 1. Pacjent: ResNet18 (Wytrenowany na ImageNet)
# W nowych wersjach torchvision u≈ºywamy weights=...
model = models.resnet18(weights='IMAGENET1K_V1')

print("--- ORYGINA≈Å ---")
print(f"Wej≈õcie (conv1): {model.conv1}")
print(f"Wyj≈õcie (fc):    {model.fc}")

--- ORYGINA≈Å ---
Wej≈õcie (conv1): Conv2d(3, 64, kernel_size=(7, 7), stride=(2, 2), padding=(3, 3), bias=False)
Wyj≈õcie (fc):    Linear(in_features=512, out_features=1000, bias=True)


## Operacja 1: Wymiana G≈Çowy (Output Layer)

To standardowy Fine-Tuning.
ResNet18 ma na ko≈Ñcu warstwƒô `Linear(512, 1000)`.
My chcemy klasyfikowaƒá np. **2 klasy** (Kot vs Pies).

In [2]:
# Sprawdzamy ile cech wchodzi do ostatniej warstwy
in_features = model.fc.in_features

# Podmieniamy warstwƒô (Stara idzie do ≈õmieci, nowa jest losowa)
model.fc = nn.Linear(in_features, 2)

print("--- PO WYMIANIE G≈ÅOWY ---")
print(model.fc)
# Teraz model zwraca 2 logity zamiast 1000.

--- PO WYMIANIE G≈ÅOWY ---
Linear(in_features=512, out_features=2, bias=True)


## Operacja 2: Wymiana Oczu (Input Layer) + Przeszczep Wag

To jest trudniejsze.
Mamy zdjƒôcia Rentgenowskie (1 kana≈Ç). ResNet chce 3 kana≈Çy.
Je≈õli zrobimy `nn.Conv2d(1, 64, ...)`, nowa warstwa bƒôdzie losowa. Zniszczymy ca≈ÇƒÖ wiedzƒô o wykrywaniu krawƒôdzi, kt√≥rƒÖ ResNet zdoby≈Ç na ImageNet.

**Trik:**
Wagi w `conv1` majƒÖ kszta≈Çt `[64, 3, 7, 7]` (64 filtry, 3 kana≈Çy, kernel 7x7).
Mo≈ºemy zsumowaƒá (lub u≈õredniƒá) te 3 kana≈Çy, ≈ºeby dostaƒá `[64, 1, 7, 7]`.
To zadzia≈Ça, bo krawƒôd≈∫ na zdjƒôciu czarno-bia≈Çym wyglƒÖda tak samo jak na kolorowym.

In [3]:
# 1. Zapisujemy starƒÖ warstwƒô
old_conv = model.conv1

# 2. Tworzymy nowƒÖ warstwƒô (1 kana≈Ç wej≈õciowy zamiast 3)
# Musimy zachowaƒá te same parametry (kernel, stride, padding, bias)
new_conv = nn.Conv2d(
    in_channels=1, 
    out_channels=old_conv.out_channels, 
    kernel_size=old_conv.kernel_size, 
    stride=old_conv.stride, 
    padding=old_conv.padding,
    bias=old_conv.bias is not None
)

print(f"Stare wagi: {old_conv.weight.shape}")
print(f"Nowe wagi (losowe): {new_conv.weight.shape}")

# 3. PRZESZCZEP WAG (Surgical Transplant)
with torch.no_grad():
    # Sumujemy wagi po wymiarze kana≈Ç√≥w (dim=1) i dzielimy przez 3 (≈õrednia)
    # [64, 3, 7, 7] -> [64, 1, 7, 7]
    weight_avg = old_conv.weight.mean(dim=1, keepdim=True)
    
    # Wstrzykujemy do nowej warstwy
    new_conv.weight.copy_(weight_avg)

# 4. Podmieniamy warstwƒô w modelu
model.conv1 = new_conv

print("\n‚úÖ Przeszczep udany. Wagi z ImageNet zosta≈Çy zachowane (jako Grayscale).")

Stare wagi: torch.Size([64, 3, 7, 7])
Nowe wagi (losowe): torch.Size([64, 1, 7, 7])

‚úÖ Przeszczep udany. Wagi z ImageNet zosta≈Çy zachowane (jako Grayscale).


In [4]:
# TEST ≈ªYWY
# Generujemy losowy obrazek w skali szaro≈õci (1 kana≈Ç)
dummy_xray = torch.randn(1, 1, 224, 224)

try:
    output = model(dummy_xray)
    print("\n--- TEST PRZEP≈ÅYWU ---")
    print(f"Wej≈õcie: {dummy_xray.shape}")
    print(f"Wyj≈õcie: {output.shape} (Oczekiwane: [1, 2])")
    print("Pacjent prze≈ºy≈Ç operacjƒô.")
except Exception as e:
    print(f"üíÄ B≈ÇƒÖd: {e}")


--- TEST PRZEP≈ÅYWU ---
Wej≈õcie: torch.Size([1, 1, 224, 224])
Wyj≈õcie: torch.Size([1, 2]) (Oczekiwane: [1, 2])
Pacjent prze≈ºy≈Ç operacjƒô.


## ü•ã Black Belt Summary

1.  **Nie trenuj od zera**, je≈õli nie musisz. Nawet je≈õli masz inny rozmiar wej≈õcia, mo≈ºesz zaadaptowaƒá wagi.
2.  **Suma wag:** Je≈õli zmieniasz wej≈õcie z 3 kana≈Ç√≥w na 4 (np. RGB + Podczerwie≈Ñ), mo≈ºesz wziƒÖƒá wagi z RGB, a dla 4. kana≈Çu zainicjowaƒá zerami (lub ≈õredniƒÖ). Wtedy model na starcie dzia≈Ça jak zwyk≈Çy ResNet, a z czasem uczy siƒô u≈ºywaƒá podczerwieni.
3.  **Model Surgery** to codzienno≈õƒá w pracy z obrazami medycznymi i satelitarnymi.