# Eines de ML

En aquesta pràctica explorarem el procés complet necessari per preparar i gestionar dades en projectes de *machine learning* orientats a la visió per computador. Treballarem amb tres eines fonamentals en el flux de treball modern:

- **Label Studio**, per generar el *ground truth* mitjançant l’etiquetatge manual.
- **Weights & Biases (W&B)**, per monitorar, analitzar i comparar els experiments.
- **YOLO amb Ultralytics**, per entrenar i provar models de detecció i segmentació.

L’objectiu principal és entendre com es construeix un pipeline real: des de l’anotació del conjunt de dades fins a l’avaluació del model mitjançant mètriques com la *mAP*. Aquest procés és essencial per desenvolupar models robustos i reproducibles, i reflecteix el funcionament habitual en entorns professionals i projectes de recerca.

## Creant el nostre GT - Label Studio
Fins ara tant a teoria com a les anteriors sessions de pràctiques hem vist com emprar models de segmentació i detecció amb *datasets* ja preparats. Però com feim la tasca de crear les màscares pel *ground truth* és una tasca que no hem vist fins ara. A la sessió d'aquesta setmana combinarem aquesta feina amb l'ús de la xarxa YOLO, emprant les versions d'[Ultralytics](https://docs.ultralytics.com/)

En aquesta pràctica, aprendrem a utilitzar [*Label Studio*](https://labelstud.io/guide), una eina versàtil i de codi obert que facilita l'etiquetatge de dades per a projectes d'aprenentatge automàtic. L'objectiu principal serà comprendre com podem generar ground truth (GT) per a tasques de segmentació i detecció d'objectes, un pas crític per entrenar models precisos i robustos.

Durant la sessió:

1. Definirem etiquetes i esquemes: Establirem les categories d'objectes i regles per a la segmentació o detecció.
2. Practicarem amb etiquetatge manual: Crearem etiquetes manualment, identificant regions o delimitant objectes dins d'un conjunt d'imatges.
3. Exportarem les etiquetes generades: Coneixerem com exportar el ground truth en formats compatibles amb llibreries com ``PyTorch`` o ``Ultralythics``.

Aquesta pràctica ens ajudarà a entendre millor el procés d'etiquetatge i a generar dades de qualitat per a experiments en segmentació semàntica o detecció d'objectes.

**NOTA:** Farem la generació del GT en local
**Instal·lació**

```
pip install label-studio
```

**Execució**

```
label-studio start
```

Una vegada iniciat haureu de crear un compte de l'aplicació.

**GUI**

![](screen.png)


**NOTA**:


| Info            | Enllaços                                                                     |
|-----------------|------------------------------------------------------------------------------|
| Codi per classe | [Enllaç](https://gist.github.com/rcland12/dc48e1963268ff98c8b2c4543e7a9be8)  |
| Format COCO8    | [Enllaç](https://docs.ultralytics.com/es/datasets/detect/coco8/#introduction) |


## W&B

Weights & Biases és una plataforma destinada a facilitar el seguiment, l’anàlisi i la gestió d’experiments en *machine learning*. Proporciona eines perquè investigadors, equips de dades i desenvolupadors puguin monitorar els seus models, compartir resultats i optimitzar processos de forma eficient.

W&B permet registrar:
- Hiperparàmetres
- Mètriques d’entrenament (loss, accuracy, etc.)
- Artifacts (models, datasets, prediccions)
- Gràfiques interactives generades en temps real

El tracking es fa amb unes poques línies de codi, com ara:

```python
import wandb

# Inici d'un projecte
wandb.init(project="demo")

# Registre d'hiperparàmetres
config = wandb.config
config.learning_rate = 0.001
config.epochs = 10

for epoch in range(config.epochs):
    loss = 1 / (epoch + 1)
    wandb.log({"epoch": epoch, "loss": loss})

```

## YOLO i Ultralytics

Emprarem exhaustivament la llibreria d'Ultralytics. Per instal·lar-la:

```
pip install ultralytics
```

Una vega obtenim el conjunt de dades podem emprar-ho per fer dues tasques diferents: predicció i entrenament. En ambdues tasques l'ús de mètriques és fonamental, ja sigui per emprar-ho com a funció de pèrdua o bé com a mesura de qualitat.

## Tasques a fer (si hi ha temps)

1. Descarregar el conjunt de dades de [Cans Vs Moixos](https://www.kaggle.com/c/dogs-vs-cats/overview) de Kaggle i segmenta una part d'aquestes imatges.
2. Fer inferència emprant [YOLOv5](https://docs.ultralytics.com/modes/predict/#key-features-of-predict-mode).
3. Obté l'*mAP* de les imatges.
4. Fer un procés de *fine-tunning* emprant [YOLOv5](https://docs.ultralytics.com/modes/train/) amb les dades emprades.
5. Obté l'*mAP* de les imatges.

**NOTA:** Intenta emprar W&B per gestionar els resultats

