# Varroa Counter
## 1.  D√©finition du probl√®me

Les colonies d'abeilles du monde entier sont infest√©es par un parasite qui s'appelle le varroa destructor.
Ce parasite au nom barbare se fixe sur le corps des abeilles adultes et se nourrit de l'h√©molymphe. Les femelles p√©n√®trent aussi dans les cellules opercul√©es pour se reproduire sur les larves, ce qui cr√©e plusieurs g√©n√©rations au sein d'une m√™me cellule.
Le varroa transmet des virus aux abeilles et affaiblit leur syst√®me immunitaire.
Si rien n'est entrepris pour stopper leur prolif√©ration, les colonies finissent par s'effondrer durant l'automne ou l'hiver.


<img src="varroa_destructor.jpg" width="50%">

Une fois la r√©colte du miel effectu√©e, les apiculteurs effectuent diff√©rents traitements sur les colonies, notamment en utilisant de l'acide formique et de l'acide oxalique.
Une fois le traitement effectu√©, l'apiculteur d√©pose une planchette sous la ruche afin d'√©valuer le degr√© d'infestation des colonies. Quelques jours apr√®s le traitement, les varroas morts tombent sur le fond de la ruche. 
Les varroas ayant une taille de 1 √† 2 mm, il devient tr√®s difficile de les compter lorsqu'ils sont nombreux. De plus, des r√©sidus de cires d'abeilles tombent √©galement des cadres, ce qui complique encore plus le comptage.

<img src="fond_varroas.jpg" width="50%">

Les varroas sont les petites formes sombres allong√©es et arrondies.

L'objectif de ce projet est d'estimer automatiquement le niveau d'infestation par les varroas √† partir d'une image. Il ne s'agit pas d'obtenir un d√©compte exact, notamment lorsque les varroas sont peu nombreux, mais plut√¥t de fournir un ordre de grandeur fiable en cas d'infestation importante ‚Äî par exemple, distinguer une image contenant 50 varroas d'une autre en contenant 200. Ce type d'√©valuation, difficile et fastidieux √† r√©aliser manuellement, est ainsi automatis√© pour faciliter le travail de l'apiculteur.

## 2. Collecte de donn√©es
J'aimerais pouvoir simplement faire une photo de la planche complete et donn√© cette image assez large √† un mod√®le pour l'inf√©rence.
J'ai donc recherch√© des sets de donn√©es sur les varroas et j'en ai trouv√© plusieurs disponibles sur https://universe.roboflow.com/. Malheureusement aucun dataset ne correspondait parfaitement √† mes besoins:
* Images de varroas sur les abeilles et non sur la planche
* Images d'entra√Ænement trop petites
* Images avec des varroas labellis√©s mais qui ne ressemblent pas vraiment √† des varroas

J'ai donc cr√©√© un dataset avec mes propres images et j'ai upload√© le dataset sur roboflow sous le projet suivant: https://app.roboflow.com/varroa-counter/varroa-counter-large/2

### Inspection des donn√©es
Le dataset de donn√©es comprend des
* 32 images d'entra√Ænement (71%)
* 13 images de validation (19%)
* 7 images de test (12%)

## 3. Pr√©paration des Donn√©es
J'ai labellis√© les 32 images en identifiant plus 1000 varroas. J'ai effectu√© ce travail tr√®s chronophage directement sur roboflow.


Chaque image de ce set a donc maintenant un label associ√©. Un seul nom de classe est utilis√© pour ce dataset: **varroa**
Les labels associ√©s √† une image sont sauvegard√©s au format YOLO et comprennent simplement une suite de nombres comme ceci:
* 0 0.02587890625 0.25439453125 0.0107421875 0.0166015625
* 0 0.021484375 0.27880859375 0.009765625 0.0166015625
* 0 0.0751953125 0.3349609375 0.009765625 0.015625
* ...

#### Explication du format YOLO

```
0 0.02587890625 0.25439453125 0.0107421875 0.0166015625
‚îÇ      ‚îÇ              ‚îÇ            ‚îÇ            ‚îÇ
‚îÇ      ‚îÇ              ‚îÇ            ‚îÇ            ‚îî‚îÄ‚îÄ height (hauteur normalis√©e de la bounding box)
‚îÇ      ‚îÇ              ‚îÇ            ‚îî‚îÄ‚îÄ width (largeur normalis√©e de la bounding box)
‚îÇ      ‚îÇ              ‚îî‚îÄ‚îÄ y_center (position Y du centre, normalis√©e)
‚îÇ      ‚îî‚îÄ‚îÄ x_center (position X du centre, normalis√©e)
‚îî‚îÄ‚îÄ class_id (identifiant de la classe = 0 = varroa)
```

| Valeur | Signification | Exemple |
|--------|---------------|---------|
| `0` | ID de la classe | varroa (seule classe du dataset) |
| `0.0259` | x_center | Le centre est √† 2.6% de la largeur de l'image (tr√®s √† gauche) |
| `0.2544` | y_center | Le centre est √† 25.4% de la hauteur de l'image |
| `0.0107` | width | La box fait 1.07% de la largeur de l'image |
| `0.0166` | height | La box fait 1.66% de la hauteur de l'image |

## 4. Analyse Exploratoire des Donn√©es (AED)
Les donn√©es contiennent des images avec des fonds de diff√©rentes couleurs et mati√®res.

## 5. Feature Engineering
Le mod√®le devra faire de la d√©tection d'objets. Un des challenges sera de d√©tecter des objets tr√®s petits dans les images.
Les 2 features importantes de la d√©tection d'objets seront:
* Classification d'image: d√©terminer si des varroas sont pr√©sents dans l'image
* Localisation d'objet: trouver la position des varroas √† l'aide de _bounding boxes_

## 6. Mod√©lisation
Je choisi la classification comme mod√®le d'apprentissage.

Je divise mon ensemble de donn√©e comme ceci:
* 26 images d'entra√Ænement (80%)
* 4 images de validation (12%)
* 2 images de test (8%)

In [1]:
!pip install roboflow

import os
from roboflow import Roboflow
rf = Roboflow(api_key=str(os.getenv("ROBOFLOW_API_KEY")))

project = rf.workspace("varroa-counter").project("varroa-counter-large")
version = project.version(3)
dataset = version.download("yolov11")


[notice] A new release of pip is available: 25.3 -> 26.0
[notice] To update, run: python.exe -m pip install --upgrade pip


loading Roboflow workspace...
loading Roboflow project...


KeyboardInterrupt: 

## 7. Entra√Ænement du mod√®le
### üìå Version de Python recommand√©e

Pour cet exercice de r√©seaux de neurones convolutifs (CNN) avec YOLO11n, je vais utiliser **Python 3.12.7**, car c‚Äôest l‚Äôune des versions les mieux support√©es par YOLO.

In [6]:
# V√©rifions la version de Python et du chemin de l'ex√©cutable
import sys
print(sys.version)
print(sys.executable)

3.12.7 (tags/v3.12.7:0b05ead, Oct  1 2024, 03:06:41) [MSC v.1941 64 bit (AMD64)]
d:\dev\python\Python312\python.exe


In [None]:
!pip install ultralytics

# import the needed librairies
import ultralytics

In [2]:
from ultralytics import YOLO
# entrainement du mod√®le 
# Je cr√©er un nouveau mod√®le depuis z√©ro
model = YOLO('yolo11n.pt')

# lancement de l'entra√Ænement avec seulement 1 seul passage et en abaissant le nombre de batch (nombre d'images trait√©es simultan√©ment).
# le but est de tester si les capacit√©es de ma machine sont suffisantes pour entra√Æner mon mod√®le
results = model.train(data="varroa-counter-large-3\data.yaml", epochs=1, imgsz=5000, batch=2,
                      max_det=2000, conf=0.1, iou = 0.5)
print (results)


invalid escape sequence '\d'
invalid escape sequence '\d'
invalid escape sequence '\d'


New https://pypi.org/project/ultralytics/8.4.11 available  Update with 'pip install -U ultralytics'
Ultralytics 8.3.249  Python-3.12.7 torch-2.9.1+cpu CPU (Intel Core(TM) i7-10510U 1.80GHz)
[34m[1mengine\trainer: [0magnostic_nms=False, amp=True, augment=False, auto_augment=randaugment, batch=2, bgr=0.0, box=7.5, cache=False, cfg=None, classes=None, close_mosaic=10, cls=0.5, compile=False, conf=0.1, copy_paste=0.0, copy_paste_mode=flip, cos_lr=False, cutmix=0.0, data=varroa-counter-large-3\data.yaml, degrees=0.0, deterministic=True, device=cpu, dfl=1.5, dnn=False, dropout=0.0, dynamic=False, embed=None, epochs=1, erasing=0.4, exist_ok=False, fliplr=0.5, flipud=0.0, format=torchscript, fraction=1.0, freeze=None, half=False, hsv_h=0.015, hsv_s=0.7, hsv_v=0.4, imgsz=5000, int8=False, iou=0.5, keras=False, kobj=1.0, line_width=None, lr0=0.01, lrf=0.01, mask_ratio=4, max_det=2000, mixup=0.0, mode=train, model=yolo11n.pt, momentum=0.937, mosaic=1.0, multi_scale=False, name=train27, nbs=64,

: 

Impossible d'entra√Æner mon mod√®le sur ma machine, car elle n'a pas de GPU et le kernel crash. 
J'ai fait un essai en utilisant google colab, qui permet gratuitement d'entra√Æner des mod√®les avec un peu de GPU. Malheureusement j'ai le m√™me probl√®me sur google colab qui m'indique que ma session a plant√© apr√®s avoir utilis√© toute la RAM disponible.

Le probl√®me est l'entra√Ænement de mod√®le avec des images de grandes tailles car cela n√©cessite beaucoup de m√©moire.

### Changement de strat√©gie: recherche d'un mod√®le existant
Je d√©cide donc de rechercher un mod√®le existant pouvant couvrir mes besoins et j'ai trouv√© le travail de recherche suivant: https://www.mdpi.com/2077-0472/15/9/969

**R√©f√©rence:**
> Y√°niz, J.; Casalongue, M.; Martinez-de-Pison, F.J.; Silvestre, M.A.; Consortium, B.; Santolaria, P.; Divas√≥n, J. *An AI-Based Open-Source Software for Varroa Mite Fall Analysis in Honeybee Colonies*. Agriculture 2025, 15, 969. https://doi.org/10.3390/agriculture15090969

Leurs mod√®le a √©t√© entra√Æn√© avec un dataset de 357 images sur plus de 500 epochs. Ils ont √©galement livr√© un programme √©crit en python permettant d'upload ses images et d'effectuer la d√©tection des varroas avec leurs mod√®le.
Le code source est disponible sous github ainsi que leurs mod√®le entra√Æn√©: https://github.com/jodivaso/varrodetector/blob/main/model/weights/best.pt

En analysant le code j'ai trouv√© particuli√®rement int√©ressant qu'ils utilisent une taille d'image assez grande de 6016 pixels (https://github.com/jodivaso/varrodetector/blob/main/varroa_mite_gui.py#L2507C42-L2507C46).



## 8. Evaluation du mod√®le
Je d√©cide de rebalancer toutes les images de mon dataset en set de test et de n'appliquer aucun redimensionnement d'image

In [3]:
from roboflow import Roboflow
rf = Roboflow(api_key="tEQkmVJiCxGOZMuDLR6d")
project = rf.workspace("varroa-counter").project("varroa-counter-v3")
version = project.version(3)
dataset = version.download("yolov11")

loading Roboflow workspace...
loading Roboflow project...


Et de lancer le test du mod√®le avec mon dataset de test comprenant 32 images

In [1]:
from ultralytics import YOLO

# Charger le mod√®le entra√Æn√©
model = YOLO('model_mdpi_3291496/weights/best.pt')

# Effectuer la d√©tection sur l'image
results = model.val(
    data="varroa-counter-large-3/data.yaml",
    split='train',  # or 'val' for validation set
    imgsz=6016, # m√™me valeur celle utilis√©e dans le code https://github.com/jodivaso/varrodetector/blob/main/varroa_mite_gui.py#L2507
    batch=4,    
    conf=0.1,  # Seuil de confiance
    iou=0.5,
    max_det=2000,
    save_json=True,
    save=True,
    show_labels=False,
    show_conf=False,
    line_width=2
)

# Afficher les r√©sultats
# Print results
print(f"Precision: {results.box.p}")
print(f"Recall: {results.box.r}")
print(f"mAP50: {results.box.map50}")
print(f"mAP50-95: {results.box.map}")

Ultralytics 8.3.249  Python-3.12.7 torch-2.9.1+cpu CPU (Intel Core(TM) i7-10510U 1.80GHz)
Model summary (fused): 72 layers, 3,005,843 parameters, 0 gradients, 8.1 GFLOPs
[34m[1mval: [0mFast image access  (ping: 0.10.0 ms, read: 632.795.6 MB/s, size: 1693.7 KB)
[K[34m[1mval: [0mScanning D:\dev\ia\cours\varroacounter\varroa-counter-large-3\train\labels.cache... 19 images, 0 backgrounds, 0 corrupt: 100% ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ 19/19  0.0s
[K                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100% ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ 5/5 29.9s/it 2:2940.4s2
                   all         19       1595      0.414      0.401      0.352     0.0985
Speed: 124.8ms preprocess, 6928.0ms inference, 0.0ms loss, 14.1ms postprocess per image
Saving D:\dev\runs\detect\val70\predictions.json...
Results saved to [1mD:\dev\runs\detect\val70[0m
Precision: [    0.41353]
Recall: [    0.40125]
mAP50: 0.3521537608756259
mAP50-95: 0.09846878398398631

*En r√©sum√© la qualit√© de ce mod√®le par rapport √† mon probl√®me est faible*

**Precision : 0.4135 (41%)**
Sur toutes les d√©tections faites par le mod√®le, seulement 41% sont correctes. Cela signifie que ~59% des d√©tections sont des faux positifs (le mod√®le d√©tecte un varroa l√† o√π il n'y en a pas).

**Recall : 0.4013 (40%)**
Sur tous les varroas r√©ellement pr√©sents dans les images, le mod√®le n'en d√©tecte que 40%. Il rate donc ~60% des varroas r√©els.

**mAP50 : 0.352**
La pr√©cision moyenne (mean Average Precision) avec un seuil IoU de 50%. C'est la m√©trique standard de performance en d√©tection d'objets. Un score de 0.35 est faible.

**mAP50-95 : 0.098**
La m√™me m√©trique mais moyenn√©e sur des seuils IoU de 50% √† 95% (plus strict sur la pr√©cision de localisation). Un score de ~0.10 est tr√®s faible, ce qui indique que m√™me quand le mod√®le trouve un varroa, la bo√Æte englobante est souvent mal positionn√©e.

Je d√©cide donc de faire un test avec 1 seule image afin de d√©terminer plus pr√©cis√©ment o√π le probl√®me se trouve

In [3]:
from ultralytics import YOLO

# Charger le mod√®le entra√Æn√©
model = YOLO('model_mdpi_3291496/weights/best.pt')

# Effectuer la d√©tection sur l'image
results = model.predict(
    source="varroa-counter-large-3/train/images/IMG_0223_cropped_jpg.rf.0e4c7399e5f9e2e6287c52cd865bae46.jpg",
    imgsz=6016,
    max_det=2000,
    conf=0.1,
    iou=0.5,
    save=True,
    show_labels=False,
    show_conf=False,
    line_width=2
)

print(f"Varroas d√©tect√©s: {len(results[0].boxes)}")


image 1/1 d:\dev\ia\cours\varroacounter\varroa-counter-large-3\train\images\IMG_0223_cropped_jpg.rf.0e4c7399e5f9e2e6287c52cd865bae46.jpg: 6016x4544 250 varroas, 4753.5ms
Speed: 343.0ms preprocess, 4753.5ms inference, 27.0ms postprocess per image at shape (1, 3, 6016, 4544)
Results saved to [1mD:\dev\runs\detect\predict16[0m
Varroas d√©tect√©s: 250


Voici un zoom sur l'image g√©n√©r√©e par la d√©tection
![image annot√© apr√®s pr√©diction](IMG_0223_cropped_predict_16_zoom.jpg)

On constate les probl√®mes suivants:
- le mod√®le confond les gouttes d'eau et les varroas
- le mod√®le oublie des varroas pourtant bien visibles




In [2]:
from ultralytics import YOLO
# entrainement du mod√®le 
# Je cr√©er un nouveau mod√®le depuis z√©ro
model = YOLO('model_mdpi_3291496/weights/best.pt')

# lancement de l'entra√Ænement avec seulement 1 seul passage et en abaissant le nombre de batch (nombre d'images trait√©es simultan√©ment).
# le but est de tester si les capacit√©es de ma machine sont suffisantes pour entra√Æner mon mod√®le
results = model.train(data="varroa-counter-large-3\data.yaml", epochs=150, imgsz=6016, batch=1,
                      freeze=10, max_det=2000, conf=0.1, iou = 0.5)
print (results)

  results = model.train(data="varroa-counter-large-3\data.yaml", epochs=150, imgsz=6016, batch=1,


New https://pypi.org/project/ultralytics/8.4.11 available  Update with 'pip install -U ultralytics'
Ultralytics 8.3.249  Python-3.12.7 torch-2.9.1+cpu CPU (Intel Core(TM) i7-10510U 1.80GHz)
[34m[1mengine\trainer: [0magnostic_nms=False, amp=True, augment=False, auto_augment=randaugment, batch=1, bgr=0.0, box=7.5, cache=False, cfg=None, classes=None, close_mosaic=10, cls=0.5, compile=False, conf=0.1, copy_paste=0.0, copy_paste_mode=flip, cos_lr=False, cutmix=0.0, data=varroa-counter-large-3\data.yaml, degrees=0.0, deterministic=True, device=cpu, dfl=1.5, dnn=False, dropout=0.0, dynamic=False, embed=None, epochs=150, erasing=0.4, exist_ok=False, fliplr=0.5, flipud=0.0, format=torchscript, fraction=1.0, freeze=10, half=False, hsv_h=0.015, hsv_s=0.7, hsv_v=0.4, imgsz=6016, int8=False, iou=0.5, keras=False, kobj=1.0, line_width=None, lr0=0.01, lrf=0.01, mask_ratio=4, max_det=2000, mixup=0.0, mode=train, model=model_mdpi_3291496/weights/best.pt, momentum=0.937, mosaic=1.0, multi_scale=Fals

: 

Je d√©cide de faire une pr√©diction valider le mod√®le avec uniquement les images provenant du site espagnol. Je ne sais pas si elles ont √©t√© utilis√©es lors de l'entra√Ænement du mod√®le, mais d√©cide de faire une comparaison.

In [None]:
import os
import shutil
import yaml
from pathlib import Path


def create_filtered_dataset(source_dir, dest_dir, prefix="IMG_6"):
    """
    Cr√©e une copie d'un dataset YOLO en ne gardant que les images
    dont le nom commence par le pr√©fixe sp√©cifi√©.
    
    Args:
        source_dir: Chemin du dataset source (ex: "varroa-counter-v3-3")
        dest_dir: Chemin du dataset destination
        prefix: Pr√©fixe des images √† conserver (ex: "IMG_6")
    """
    source_dir = Path(source_dir)
    dest_dir = Path(dest_dir)

    # Copier data.yaml et fichiers README
    dest_dir.mkdir(parents=True, exist_ok=True)
    for f in source_dir.glob("*.yaml"):
        shutil.copy2(f, dest_dir / f.name)
    for f in source_dir.glob("*.txt"):
        shutil.copy2(f, dest_dir / f.name)

    total_copied = 0

    # Parcourir les splits (train, valid, test)
    for split_dir in source_dir.iterdir():
        if not split_dir.is_dir():
            continue

        images_dir = split_dir / "images"
        labels_dir = split_dir / "labels"

        if not images_dir.exists():
            continue

        # Cr√©er les dossiers de destination
        dest_images = dest_dir / split_dir.name / "images"
        dest_labels = dest_dir / split_dir.name / "labels"
        dest_images.mkdir(parents=True, exist_ok=True)
        dest_labels.mkdir(parents=True, exist_ok=True)

        # Copier les images correspondant au pr√©fixe et leurs labels
        for img_file in images_dir.iterdir():
            if img_file.name.startswith(prefix):
                shutil.copy2(img_file, dest_images / img_file.name)

                # Copier le label correspondant (.txt)
                label_file = labels_dir / (img_file.stem + ".txt")
                if label_file.exists():
                    shutil.copy2(label_file, dest_labels / label_file.name)

                total_copied += 1

    print(f"Dataset filtr√© cr√©√© dans: {dest_dir}")
    print(f"Images copi√©es: {total_copied}")

    # Lister le contenu
    for split_dir in sorted(dest_dir.iterdir()):
        if split_dir.is_dir():
            imgs = list((split_dir / "images").glob("*"))
            print(f"  {split_dir.name}: {len(imgs)} images")


# Cr√©er le dataset filtr√© avec uniquement les images IMG_6xxx
create_filtered_dataset(
    source_dir="varroa-counter-v3-3",
    dest_dir="varroa-counter-v3-3-IMG6",
    prefix="IMG_6"
)

Dataset filtr√© cr√©√© dans: varroa-counter-v3-3-IMG6
Images copi√©es: 5
  test: 5 images
  valid: 0 images


In [None]:
from ultralytics import YOLO

# Charger le mod√®le entra√Æn√©
model = YOLO('model_mdpi_3291496/weights/best.pt')

# Effectuer la d√©tection sur l'image
results = model.val(
    data="varroa-counter-v3-3-IMG6/data.yaml",
    split='test',  # or 'val' for validation set
    imgsz=6016, # m√™me valeur celle utilis√©e dans le code https://github.com/jodivaso/varrodetector/blob/main/varroa_mite_gui.py#L2507
    batch=16,    
    conf=0.1,  # Seuil de confiance
    iou=0.5,
    max_det=2000,
    save_json=True,
    save=True,
    show_labels=False,
    show_conf=False,
    line_width=2
)

# Afficher les r√©sultats
# Print results
print(f"Precision: {results.box.p}")
print(f"Recall: {results.box.r}")
print(f"mAP50: {results.box.map50}")
print(f"mAP50-95: {results.box.map}")


Ultralytics 8.3.249  Python-3.12.7 torch-2.9.1+cpu CPU (Intel Core(TM) i7-10510U 1.80GHz)
Model summary (fused): 72 layers, 3,005,843 parameters, 0 gradients, 8.1 GFLOPs
[34m[1mval: [0mFast image access  (ping: 0.10.1 ms, read: 85.96.4 MB/s, size: 1745.4 KB)
[K[34m[1mval: [0mScanning D:\dev\ia\cours\varroacounter\varroa-counter-v3-3-IMG6\test\labels... 5 images, 0 backgrounds, 0 corrupt: 100% ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ 5/5 118.5it/s 0.0s
[34m[1mval: [0mNew cache created: D:\dev\ia\cours\varroacounter\varroa-counter-v3-3-IMG6\test\labels.cache
[K                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100% ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ 1/1 123.3s/it 2:03
                   all          5        745      0.609      0.483      0.483      0.148
Speed: 890.8ms preprocess, 22679.2ms inference, 0.3ms loss, 49.0ms postprocess per image
Saving D:\dev\runs\detect\val65\predictions.json...
Results saved to [1mD:\dev\runs\detect\val65[

Ces r√©sultats montrent une performance am√©lior√©e par rapport √† la validation du set complet, mais quand-m√™me une performance relativement faible.

Precision (0.61) ‚Äî Sur toutes les d√©tections faites, 61% sont correctes. Environ 4 d√©tections sur 10 sont des faux positifs.

Recall (0.48) ‚Äî Le mod√®le ne d√©tecte que 48% des varroas r√©ellement pr√©sents. Il en rate plus de la moiti√©.

mAP50 (0.48) ‚Äî Performance globale √† IoU 50% insuffisante. Un mod√®le correct vise >0.5, un bon mod√®le >0.7.

mAP50-95 (0.15) ‚Äî La localisation pr√©cise est tr√®s faible. M√™me quand le mod√®le trouve un varroa, la bounding box est souvent mal positionn√©e.

In [None]:
from ultralytics import YOLO

# Charger le mod√®le entra√Æn√©
model = YOLO('model_mdpi_3291496/weights/best.pt')

# Effectuer la d√©tection sur l'image
results = model.predict(
    source="varroas/Sample images/IMG_6187.jpg",
    imgsz=6016,
    max_det=2000,
    conf=0.1,
    iou=0.5,
    save=True,
    show_labels=False,
    show_conf=False,
    line_width=2
)

print(f"Varroas d√©tect√©s: {len(results[0].boxes)}")


image 1/1 d:\dev\ia\cours\varroacounter\varroas\Sample images\IMG_6187.jpg: 6016x4512 85 varroas, 7622.3ms
Speed: 525.4ms preprocess, 7622.3ms inference, 28.9ms postprocess per image at shape (1, 3, 6016, 4512)
Results saved to [1mD:\dev\runs\detect\predict15[0m
Varroas d√©tect√©s: 85


On constate sur l'image r√©sultant de la pr√©diction les probl√®mes suivants:
- lorsque le varroa est pos√© sur de la cire, il est mal d√©tect√©
- lorsque 2 varroas sont c√¥te √† c√¥te, parfois un seul varroa est d√©tect√©

![image de l'√©tude annot√©](IMG_6187_predict_15_zoom.jpg)


In [None]:
!pip install sahi

from sahi import AutoDetectionModel
from sahi.predict import get_sliced_prediction

model = AutoDetectionModel.from_pretrained(
    model_type="yolov8",  # Compatible YOLO11
    model_path="model_mdpi_3291496/weights/best.pt",
    confidence_threshold=0.1
)

result = get_sliced_prediction(
    image="varroa-counter-v3-3/test/images/IMG_0223_jpg.rf.a0db71f36b6b62fd38a1deca87b0a1f0.jpg",
    detection_model=model,
    slice_height=1024,
    slice_width=1024,
    overlap_height_ratio=0.2,
    overlap_width_ratio=0.2
)

result.export_visuals(export_dir="results/")


Performing prediction on 35 slices.


In [None]:
from ultralytics import YOLO

model = YOLO('model_mdpi_3291496/weights/best.pt')
results = model.train(
    data="varroa-counter-v3-2/data.yaml",
    epochs=150,
    imgsz=2048,
    batch=4,
    freeze=10  # G√®le les premi√®res couches, ajuste seulement les derni√®res
)

In [None]:
# 2. Tester le mod√®le fine-tun√©
# Le meilleur mod√®le est automatiquement sauvegard√© dans runs/detect/trainX/weights/best.pt
model_finetuned = YOLO('runs/train23/weights/best.pt')

# Validation sur le set de test
results = model_finetuned.val(
    data="varroa-counter-v3-3/data.yaml",
    split='test',  # ou 'val'
    imgsz=2048,
    conf=0.1,
    iou=0.5,
    max_det=2000,
    save=True
)

print(f"Precision: {results.box.p}")
print(f"Recall: {results.box.r}")
print(f"mAP50: {results.box.map50}")
print(f"mAP50-95: {results.box.map}")

Ultralytics 8.3.249  Python-3.12.7 torch-2.9.1+cpu CPU (Intel Core(TM) i7-10510U 1.80GHz)
Model summary (fused): 72 layers, 3,005,843 parameters, 0 gradients, 8.1 GFLOPs
[34m[1mval: [0mFast image access  (ping: 0.20.1 ms, read: 138.130.7 MB/s, size: 1597.2 KB)
[K[34m[1mval: [0mScanning D:\dev\ia\cours\varroacounter\varroa-counter-v3-3\test\labels... 32 images, 0 backgrounds, 0 corrupt: 100% ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ 32/32 228.3it/s 0.1s.2s
[34m[1mval: [0mNew cache created: D:\dev\ia\cours\varroacounter\varroa-counter-v3-3\test\labels.cache
[K                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100% ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ 2/2 14.3s/it 28.6s49.4s
                   all         32       1057      0.566      0.459       0.51      0.268
Speed: 18.7ms preprocess, 592.8ms inference, 0.0ms loss, 2.2ms postprocess per image
Results saved to [1mD:\dev\runs\detect\val34[0m
Precision: [    0.56554]
Recall: [    0.45885]
mAP

In [None]:
# Test du mod√®le avec le dataset Varroa-board-1
from ultralytics import YOLO

model = YOLO('model_mdpi_3291496/weights/best.pt')

results = model.val(
    data="Varroa-board-1/data.yaml",
    split='test',  # Utiliser le split 'test'
    imgsz=(6016), max_det=2000, conf=0.1, iou = 0.5,
    save=True, show_labels=False, line_width=2, save_txt=True, save_conf=True
)

print("\nR√©sultats de validation sur Varroa-board-1:")
print(f"Pr√©cision: {results.box.p}")
print(f"Recall: {results.box.r}")
print(f"mAP50: {results.box.map50}")
print(f"mAP50-95: {results.box.map}")

#R√©sultats de validation sur Varroa-board-1:
#Pr√©cision: [    0.80237]
#Recall: [    0.42177]
#mAP50: 0.584942355545071
#mAP50-95: 0.2293648037166341

Ultralytics 8.3.249  Python-3.12.7 torch-2.9.1+cpu CPU (Intel Core(TM) i7-10510U 1.80GHz)
Model summary (fused): 72 layers, 3,005,843 parameters, 0 gradients, 8.1 GFLOPs


FileNotFoundError: [34m[1mval: [0mError loading data from None
See https://docs.ultralytics.com/datasets for dataset formatting guidance.

In [None]:
# Installation de SAHI pour la d√©tection par d√©coupage
!pip install sahi

In [None]:
# D√©tection avec SAHI (Slicing Aided Hyper Inference)
from sahi import AutoDetectionModel
from sahi.predict import get_sliced_prediction
from sahi.utils.cv import read_image
import os

# Charger le mod√®le via SAHI
detection_model = AutoDetectionModel.from_pretrained(
    model_type="yolov8",  # Compatible avec YOLO11
    model_path="model_mdpi_3291496/weights/best.pt",
    confidence_threshold=0.1,
    device="cpu"
)

# Image √† analyser
image_path = 'varroa-counter-v3-3/test/images/IMG_6098_jpg.rf.eb517a2863fbb704a84afce55b287455.jpg'

# Effectuer la pr√©diction par d√©coupage
result = get_sliced_prediction(
    image_path,
    detection_model,
    slice_height=4096,
    slice_width=4096,
    overlap_height_ratio=0.2,
    overlap_width_ratio=0.2,
    postprocess_type="NMS",
    postprocess_match_metric="IOU",
    postprocess_match_threshold=0.5
)

# Cr√©er le dossier de r√©sultats
output_dir = "results"
os.makedirs(output_dir, exist_ok=True)

# Exporter l'image avec SEULEMENT les bounding boxes (sans texte de classe)
result.export_visuals(
    export_dir=output_dir,
    file_name="detection_result",
    hide_labels=True,      # Masque le texte de classe
    hide_conf=True,        # Masque le score de confiance
    rect_th=1              # √âpaisseur des rectangles
)

print(f"Image export√©e dans: {output_dir}/detection_result.png")

# ============================================================
# INFORMATIONS D√âTAILL√âES SUR LES R√âSULTATS
# ============================================================

print(f"\n{'='*70}")
print("R√âSUM√â DE LA D√âTECTION")
print(f"{'='*70}")

object_predictions = result.object_prediction_list
print(f"\nNombre total de varroas d√©tect√©s: {len(object_predictions)}")

# Statistiques sur les scores de confiance
if object_predictions:
    confidences = [pred.score.value for pred in object_predictions]
    print(f"\nStatistiques de confiance:")
    print(f"  - Confiance moyenne: {sum(confidences)/len(confidences):.3f}")
    print(f"  - Confiance min: {min(confidences):.3f}")
    print(f"  - Confiance max: {max(confidences):.3f}")
    
    # Distribution par tranches de confiance
    print(f"\nDistribution par niveau de confiance:")
    ranges = [(0.1, 0.3), (0.3, 0.5), (0.5, 0.7), (0.7, 0.9), (0.9, 1.0)]
    for low, high in ranges:
        count = sum(1 for c in confidences if low <= c < high)
        print(f"  - {low:.1f} - {high:.1f}: {count} d√©tections")

    # Statistiques sur les tailles des bounding boxes
    areas = []
    for pred in object_predictions:
        bbox = pred.bbox
        width = bbox.maxx - bbox.minx
        height = bbox.maxy - bbox.miny
        areas.append(width * height)
    
    print(f"\nStatistiques des bounding boxes (en pixels):")
    print(f"  - Aire moyenne: {sum(areas)/len(areas):.1f} px¬≤")
    print(f"  - Aire min: {min(areas):.1f} px¬≤")
    print(f"  - Aire max: {max(areas):.1f} px¬≤")

# Afficher les d√©tails des 10 premi√®res d√©tections
print(f"\n{'='*70}")
print("D√âTAILS DES 10 PREMI√àRES D√âTECTIONS")
print(f"{'='*70}")

for i, pred in enumerate(object_predictions[:10]):
    bbox = pred.bbox
    print(f"\nD√©tection #{i+1}:")
    print(f"  - Classe: {pred.category.name}")
    print(f"  - Confiance: {pred.score.value:.3f}")
    print(f"  - Bounding box: x1={bbox.minx:.0f}, y1={bbox.miny:.0f}, x2={bbox.maxx:.0f}, y2={bbox.maxy:.0f}")
    print(f"  - Dimensions: {bbox.maxx - bbox.minx:.0f}x{bbox.maxy - bbox.miny:.0f} pixels")
    print(f"  - Centre: ({(bbox.minx + bbox.maxx)/2:.0f}, {(bbox.miny + bbox.maxy)/2:.0f})")

Performing prediction on 6 slices.
Image export√©e dans: results/detection_result.png

R√âSUM√â DE LA D√âTECTION

Nombre total de varroas d√©tect√©s: 245

Statistiques de confiance:
  - Confiance moyenne: 0.629
  - Confiance min: 0.101
  - Confiance max: 0.939

Distribution par niveau de confiance:
  - 0.1 - 0.3: 61 d√©tections
  - 0.3 - 0.5: 26 d√©tections
  - 0.5 - 0.7: 15 d√©tections
  - 0.7 - 0.9: 98 d√©tections
  - 0.9 - 1.0: 45 d√©tections

Statistiques des bounding boxes (en pixels):
  - Aire moyenne: 3428.8 px¬≤
  - Aire min: 294.6 px¬≤
  - Aire max: 8172.9 px¬≤

D√âTAILS DES 10 PREMI√àRES D√âTECTIONS

D√©tection #1:
  - Classe: varroa
  - Confiance: 0.939
  - Bounding box: x1=2194, y1=3837, x2=2257, y2=3906
  - Dimensions: 63x69 pixels
  - Centre: (2226, 3871)

D√©tection #2:
  - Classe: varroa
  - Confiance: 0.932
  - Bounding box: x1=1761, y1=1243, x2=1821, y2=1311
  - Dimensions: 60x68 pixels
  - Centre: (1791, 1277)

D√©tection #3:
  - Classe: varroa
  - Confiance: 0.925
 

In [None]:
# Exporter les r√©sultats d√©taill√©s en CSV
import csv

csv_path = os.path.join(output_dir, "detections.csv")

with open(csv_path, 'w', newline='', encoding='utf-8') as f:
    writer = csv.writer(f)
    writer.writerow(['id', 'classe', 'confiance', 'x1', 'y1', 'x2', 'y2', 'largeur', 'hauteur', 'aire', 'centre_x', 'centre_y'])
    
    for i, pred in enumerate(object_predictions):
        bbox = pred.bbox
        width = bbox.maxx - bbox.minx
        height = bbox.maxy - bbox.miny
        area = width * height
        center_x = (bbox.minx + bbox.maxx) / 2
        center_y = (bbox.miny + bbox.maxy) / 2
        
        writer.writerow([
            i + 1,
            pred.category.name,
            f"{pred.score.value:.4f}",
            f"{bbox.minx:.1f}",
            f"{bbox.miny:.1f}",
            f"{bbox.maxx:.1f}",
            f"{bbox.maxy:.1f}",
            f"{width:.1f}",
            f"{height:.1f}",
            f"{area:.1f}",
            f"{center_x:.1f}",
            f"{center_y:.1f}"
        ])

print(f"R√©sultats export√©s en CSV: {csv_path}")
print(f"\nLe fichier contient {len(object_predictions)} d√©tections avec:")
print("  - ID unique")
print("  - Classe d√©tect√©e")
print("  - Score de confiance")
print("  - Coordonn√©es du bounding box (x1, y1, x2, y2)")
print("  - Dimensions (largeur, hauteur)")
print("  - Aire en pixels¬≤")
print("  - Coordonn√©es du centre")

In [None]:
# Test avec d√©coupage d'image en 4 parties
from ultralytics import YOLO
from PIL import Image
import os

# Charger le mod√®le
model = YOLO('model_mdpi_3291496/weights/best.pt')

# Chemin de l'image √† tester
image_path = 'Varroa-board-1/test/images/IMG_0226_jpg.rf.c97161f83bb98300231bd6318d7dee3b.jpg'

# Charger l'image
img = Image.open(image_path)
width, height = img.size
print(f"Taille originale de l'image: {width}x{height}")

# Cr√©er un dossier pour les images d√©coup√©es
output_dir = 'temp_tiles'
os.makedirs(output_dir, exist_ok=True)

# D√©couper l'image en 4 parties (2x2)
half_width = width // 2
half_height = height // 2

tiles = []
positions = [
    (0, 0, half_width, half_height, "top_left"),
    (half_width, 0, width, half_height, "top_right"),
    (0, half_height, half_width, height, "bottom_left"),
    (half_width, half_height, width, height, "bottom_right")
]

# D√©couper et sauvegarder chaque partie
for i, (x1, y1, x2, y2, name) in enumerate(positions):
    tile = img.crop((x1, y1, x2, y2))
    tile_path = os.path.join(output_dir, f'tile_{i+1}_{name}.jpg')
    tile.save(tile_path)
    tiles.append((tile_path, name, x1, y1))
    print(f"Partie {i+1} ({name}): {tile.size[0]}x{tile.size[1]} sauvegard√©e")

print(f"\n{'='*60}")
print("D√âTECTION SUR CHAQUE PARTIE")
print(f"{'='*60}\n")

# Tester le mod√®le sur chaque partie
total_detections = 0
all_results = []

for tile_path, name, offset_x, offset_y in tiles:
    print(f"\n--- D√©tection sur {name} ---")
    results = model.predict(
        source=tile_path,
   imgsz=(6016), max_det=2000, conf=0.1, iou = 0.5,
    save=True, show_labels=False, line_width=2, save_txt=True, save_conf=True
    )
    
    detections = len(results[0].boxes)
    total_detections += detections
    all_results.append((name, detections, results[0]))
    
    print(f"Varroas d√©tect√©s: {detections}")

print(f"\n{'='*60}")
print(f"R√âSUM√â DES D√âTECTIONS")
print(f"{'='*60}")
print(f"\nNombre total de varroas d√©tect√©s: {total_detections}")
print("\nD√©tail par partie:")
for name, count, _ in all_results:
    print(f"  - {name:15s}: {count:3d} varroas")

print(f"\nImages d√©coup√©es sauvegard√©es dans: {output_dir}/")
print(f"R√©sultats de d√©tection sauvegard√©s dans: runs/detect/predict*/")


FileNotFoundError: [Errno 2] No such file or directory: 'Varroa-board-1/test/images/IMG_0226_jpg.rf.c97161f83bb98300231bd6318d7dee3b.jpg'

In [None]:
import os
import shutil
import yaml
from pathlib import Path


def create_filtered_dataset(source_dir, dest_dir, prefix="IMG_6"):
    """
    Cr√©e une copie d'un dataset YOLO en ne gardant que les images
    dont le nom commence par le pr√©fixe sp√©cifi√©.
    
    Args:
        source_dir: Chemin du dataset source (ex: "varroa-counter-v3-3")
        dest_dir: Chemin du dataset destination
        prefix: Pr√©fixe des images √† conserver (ex: "IMG_6")
    """
    source_dir = Path(source_dir)
    dest_dir = Path(dest_dir)

    # Copier data.yaml et fichiers README
    dest_dir.mkdir(parents=True, exist_ok=True)
    for f in source_dir.glob("*.yaml"):
        shutil.copy2(f, dest_dir / f.name)
    for f in source_dir.glob("*.txt"):
        shutil.copy2(f, dest_dir / f.name)

    total_copied = 0

    # Parcourir les splits (train, valid, test)
    for split_dir in source_dir.iterdir():
        if not split_dir.is_dir():
            continue

        images_dir = split_dir / "images"
        labels_dir = split_dir / "labels"

        if not images_dir.exists():
            continue

        # Cr√©er les dossiers de destination
        dest_images = dest_dir / split_dir.name / "images"
        dest_labels = dest_dir / split_dir.name / "labels"
        dest_images.mkdir(parents=True, exist_ok=True)
        dest_labels.mkdir(parents=True, exist_ok=True)

        # Copier les images correspondant au pr√©fixe et leurs labels
        for img_file in images_dir.iterdir():
            if img_file.name.startswith(prefix):
                shutil.copy2(img_file, dest_images / img_file.name)

                # Copier le label correspondant (.txt)
                label_file = labels_dir / (img_file.stem + ".txt")
                if label_file.exists():
                    shutil.copy2(label_file, dest_labels / label_file.name)

                total_copied += 1

    print(f"Dataset filtr√© cr√©√© dans: {dest_dir}")
    print(f"Images copi√©es: {total_copied}")

    # Lister le contenu
    for split_dir in sorted(dest_dir.iterdir()):
        if split_dir.is_dir():
            imgs = list((split_dir / "images").glob("*"))
            print(f"  {split_dir.name}: {len(imgs)} images")


# Cr√©er le dataset filtr√© avec uniquement les images IMG_6xxx
create_filtered_dataset(
    source_dir="varroa-counter-v3-3",
    dest_dir="varroa-counter-v3-3-IMG6",
    prefix="IMG_6"
)