
<a href="https://colab.research.google.com/github/takzen/pytorch-black-belt/blob/main/38_TensorBoard_Logging.ipynb" target="_parent">
    <img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/>
</a>


# ðŸ¥‹ Lekcja 38: TensorBoard & Logging (Oczy InÅ¼yniera)

Kiedy trenujesz model przez 3 dni, nie chcesz patrzeÄ‡ na tekstowe logi w konsoli.
Chcesz widzieÄ‡ wykresy:
*   Czy Loss spada?
*   Czy Accuracy roÅ›nie?
*   Czy histogramy wag wyglÄ…dajÄ… zdrowo (Gausowsko)?

**TensorBoard** to narzÄ™dzie do wizualizacji, ktÃ³re dziaÅ‚a w przeglÄ…darce.
PyTorch Lightning integruje siÄ™ z nim automatycznie. Wystarczy uÅ¼yÄ‡ metody `self.log()`.

W tej lekcji nauczymy siÄ™ logowaÄ‡ nie tylko liczby, ale teÅ¼ **Histogramy Wag** i **Graf Modelu**.

In [2]:
# Instalacja TensorBoard (jeÅ›li nie masz)
# !uv add tensorboard

import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.utils.data import DataLoader, TensorDataset
import lightning as L
from lightning.pytorch.loggers import TensorBoardLogger

# Konfiguracja
BATCH_SIZE = 64
torch.set_float32_matmul_precision('medium') # Fix dla Twojego RTX 4060!

## Rozbudowany Model z Logowaniem

Zmodyfikujemy nasz model z poprzedniej lekcji.
1.  Dodamy `log_graph=True` w loggerze.
2.  UÅ¼yjemy `self.logger.experiment.add_histogram`, Å¼eby Å›ledziÄ‡, czy wagi nie wybuchajÄ….

In [4]:
class VisModel(L.LightningModule):
    def __init__(self):
        super().__init__()
        self.net = nn.Sequential(
            nn.Linear(10, 64),
            nn.ReLU(),
            nn.Linear(64, 64),
            nn.ReLU(),
            nn.Linear(64, 1)
        )
        # Zapisujemy przykÅ‚adowe wejÅ›cie, Å¼eby TensorBoard mÃ³gÅ‚ narysowaÄ‡ graf
        self.example_input_array = torch.randn(1, 10)

    def forward(self, x):
        return self.net(x)

    def training_step(self, batch, batch_idx):
        x, y = batch
        y_hat = self(x)
        loss = F.mse_loss(y_hat, y)
        
        # 1. Logowanie Skalara (Wykres liniowy)
        # on_step=True: Rysuj kropkÄ™ co kaÅ¼dy batch (poszarpany wykres)
        # on_epoch=True: Rysuj Å›redniÄ… co epokÄ™ (gÅ‚adki wykres)
        self.log("train_loss", loss, on_step=False, on_epoch=True, prog_bar=True)
        
        return loss

    def on_train_epoch_end(self):
        # 2. Logowanie Histogramu Wag (Co epokÄ™)
        # DostÄ™p do "surowego" obiektu TensorBoard
        tensorboard = self.logger.experiment
        
        for name, params in self.named_parameters():
            tensorboard.add_histogram(name, params, self.current_epoch)

    def configure_optimizers(self):
        return torch.optim.Adam(self.parameters(), lr=0.001)

print("Model gotowy do obserwacji.")

Model gotowy do obserwacji.


In [8]:
# Dane (Szum)
dataset = TensorDataset(torch.randn(1000, 10), torch.randn(1000, 1))
loader = DataLoader(dataset, batch_size=BATCH_SIZE, num_workers=0)

# Logger
logger = TensorBoardLogger(save_dir=".", name="moj_eksperyment")

# Trener
trainer = L.Trainer(
    max_epochs=5,
    logger=logger,
    enable_checkpointing=False,
    accelerator="auto",
    devices=1,
    # --- POPRAWKA ---
    # Loguj co 1 krok (bo mamy malutki dataset i kroki lecÄ… szybko)
    log_every_n_steps=1
)

print("ðŸš€ Start treningu z wizualizacjÄ…...")
trainer.fit(model=VisModel(), train_dataloaders=loader)
print(f"âœ… Koniec. Logi zapisane w folderze: {logger.log_dir}")

GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0]

  | Name | Type       | Params | Mode  | FLOPs | In sizes | Out sizes
---------------------------------------------------------------------------
0 | net  | Sequential | 4.9 K  | train | 9.6 K | [1, 10]  | [1, 1]   
---------------------------------------------------------------------------
4.9 K     Trainable params
0         Non-trainable params
4.9 K     Total params
0.020     Total estimated model params size (MB)
6         Modules in train mode
0         Modules in eval mode
9.6 K     Total Flops


ðŸš€ Start treningu z wizualizacjÄ…...
Epoch 4: 100%|â–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆ| 16/16 [00:00<00:00, 244.43it/s, v_num=1, train_loss=0.996]

`Trainer.fit` stopped: `max_epochs=5` reached.


Epoch 4: 100%|â–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆ| 16/16 [00:00<00:00, 208.61it/s, v_num=1, train_loss=0.996]
âœ… Koniec. Logi zapisane w folderze: .\moj_eksperyment\version_1


## Jak zobaczyÄ‡ wyniki?

TensorBoard to osobna aplikacja webowa. Aby jÄ… uruchomiÄ‡, masz dwie opcje:

**Opcja A: WewnÄ…trz Notebooka (Magic Command)**
```python
%load_ext tensorboard
%tensorboard --logdir .
```
**Opcja B: W terminalu (VS Code)**
OtwÃ³rz terminal w folderze projektu i wpisz:
```python
tensorboard --logdir .
```
A potem wejdÅº w przeglÄ…darce na http://localhost:6006.
Tam zobaczysz zakÅ‚adki:
Scalars: Wykres train_loss.
Graphs: Schemat Twojej sieci neuronowej.
Histograms: RozkÅ‚ad wag (czy sÄ… "zdrowe", czy np. wszystkie zbiegÅ‚y do zera).

In [9]:
# PrÃ³ba uruchomienia w notatniku (moÅ¼e wymagaÄ‡ restartu kernela jeÅ›li masz extensions issue)
# JeÅ›li to nie zadziaÅ‚a, uÅ¼yj terminala!

try:
    %load_ext tensorboard
    %tensorboard --logdir .
except Exception as e:
    print(f"Nie udaÅ‚o siÄ™ uruchomiÄ‡ w notatniku: {e}")
    print("Uruchom w terminalu: tensorboard --logdir .")

The tensorboard extension is already loaded. To reload it, use:
  %reload_ext tensorboard


Reusing TensorBoard on port 6006 (pid 27028), started 0:01:26 ago. (Use '!kill 27028' to kill it.)

## ðŸ¥‹ Black Belt Summary

1.  **Logger:** W Lightning logger jest oddzielony od modelu. MoÅ¼esz zamieniÄ‡ `TensorBoardLogger` na `WandbLogger` (Weights & Biases) lub `CSVLogger` jednÄ… linijkÄ….
2.  **Artifacts:** OprÃ³cz `loss`, warto logowaÄ‡ histogramy wag.
    *   JeÅ›li histogram "rozlewa siÄ™" bardzo szeroko -> EksplodujÄ…ce gradienty.
    *   JeÅ›li histogram kurczy siÄ™ do cienkiej szpilki na zerze -> ZnikajÄ…ce gradienty (albo za duÅ¼e L2).
3.  **Graf:** DziÄ™ki `example_input_array` TensorBoard narysuje Ci architekturÄ™ sieci. To super przydatne przy debugowaniu skomplikowanych modeli.