# Varroa Counter
## 1.  D√©finition du probl√®me

Les colonies d'abeilles du monde entier sont infest√©es par un parasite qui s'appelle le varroa destructor.
Ce parasite au nom barbare se fixe sur le corps des abeilles adultes et se nourrit de l'h√©molymphe. Les femelles p√©n√®trent aussi dans les cellules opercul√©es pour se reproduire sur les larves, ce qui cr√©e plusieurs g√©n√©rations au sein d'une m√™me cellule.
Le varroa transmet des virus aux abeilles et affaiblit leur syst√®me immunitaire.
Si rien n'est entrepris pour stopper leur prolif√©ration, les colonies finissent par s'effondrer durant l'automne ou l'hiver.


<img src="https://github.com/geda/varroacounter/blob/main/varroa_destructor.jpg?raw=1" width="50%">

Une fois la r√©colte du miel effectu√©e, les apiculteurs effectuent diff√©rents traitements sur les colonies, notamment en utilisant de l'acide formique et de l'acide oxalique.
Une fois le traitement effectu√©, l'apiculteur d√©pose une planchette sous la ruche afin d'√©valuer le degr√© d'infestation des colonies. Quelques jours apr√®s le traitement, les varroas morts tombent sur le fond de la ruche.
Les varroas ayant une taille de 1 √† 2 mm, il devient tr√®s difficile de les compter lorsqu'ils sont nombreux. De plus, des r√©sidus de cires d'abeilles tombent √©galement des cadres, ce qui complique encore plus le comptage.

<img src="https://github.com/geda/varroacounter/blob/main/fond_varroas.jpg?raw=1" width="50%">

Les varroas sont les petites formes sombres allong√©es et arrondies.

## 2. Collecte de donn√©es
En recherchant des sets de donn√©es, j'en ai trouv√© plusieurs disponibles sur https://universe.roboflow.com/, mais aucun dataset ne correspondait parfaitement √† mes besoins:
* Images de varroas sur les abeilles et non sur la planche
* Images d'entra√Ænement trop petites
* Images avec des varroas labellis√©s mais qui ne ressemblent pas vraiment √† des varroas

J'ai donc cr√©√© un dataset avec mes propres images et j'en ai rajout√© quelques-une trouv√© sur le net. J'ai uploader le dataset sur roboflow sous le projet suivant: https://app.roboflow.com/varroa-counter/varroa-counter-v3/browse

### Inspection des donn√©es
Le dataset de donn√©es comprend des
* 32 images d'entra√Ænement (71%)
* 13 images de validation (19%)
* 7 images de test (12%)

## 3. Pr√©paration des Donn√©es
La taille maximal pour le redimmensionnent √©tant de 2048 sur Roboflow, j'ai redimensionn√© les images 1536 x 2048 pixels.

J'ai labellis√© les 32 images en identifiant plus 1000 varroas. J'ai effectu√© ce travail tr√®s chronophage directement sur roboflow.


Chaque image de ce set a donc maintenant un label associ√©. Un seul nom de classe est utilis√© pour ce dataset: **varroa**
Les labels associ√©s √† une image sont sauvegard√©s au format YOLO et comprennent simplement une suite de nombres comme ceci:
* 0 0.02587890625 0.25439453125 0.0107421875 0.0166015625
* 0 0.021484375 0.27880859375 0.009765625 0.0166015625
* 0 0.0751953125 0.3349609375 0.009765625 0.015625
* ...

#### Explication du format YOLO

```
0 0.02587890625 0.25439453125 0.0107421875 0.0166015625
‚îÇ      ‚îÇ              ‚îÇ            ‚îÇ            ‚îÇ
‚îÇ      ‚îÇ              ‚îÇ            ‚îÇ            ‚îî‚îÄ‚îÄ height (hauteur normalis√©e de la bounding box)
‚îÇ      ‚îÇ              ‚îÇ            ‚îî‚îÄ‚îÄ width (largeur normalis√©e de la bounding box)
‚îÇ      ‚îÇ              ‚îî‚îÄ‚îÄ y_center (position Y du centre, normalis√©e)
‚îÇ      ‚îî‚îÄ‚îÄ x_center (position X du centre, normalis√©e)
‚îî‚îÄ‚îÄ class_id (identifiant de la classe = 0 = varroa)
```

| Valeur | Signification | Exemple |
|--------|---------------|---------|
| `0` | ID de la classe | varroa (seule classe du dataset) |
| `0.0259` | x_center | Le centre est √† 2.6% de la largeur de l'image (tr√®s √† gauche) |
| `0.2544` | y_center | Le centre est √† 25.4% de la hauteur de l'image |
| `0.0107` | width | La box fait 1.07% de la largeur de l'image |
| `0.0166` | height | La box fait 1.66% de la hauteur de l'image |

## 4. Analyse Exploratoire des Donn√©es (AED)
Les donn√©es contiennent des images avec des fonds de diff√©rentes couleurs et mati√®res.

## 5. Feature Engineering
Le mod√®le devra faire de la d√©tection d'objets. Un des challenges sera de d√©tecter des objets tr√®s petits dans les images.
Les 2 features importantes de la d√©tection d'objets seront:
* Classification d'image: d√©terminer si des varroas sont pr√©sents dans l'image
* Localisation d'objet: trouver la position des varroas √† l'aide de _bounding boxes_

## 6. Mod√©lisation
Je choisi la classification comme mod√®le d'apprentissage.

Je divise mon ensemble de donn√©e comme ceci:
* 26 images d'entra√Ænement (80%)
* 4 images de validation (12%)
* 2 images de test (8%)

In [None]:
!pip install roboflow

import os
from roboflow import Roboflow
rf = Roboflow(api_key=str(os.getenv("ROBOFLOW_API_KEY")))

project = rf.workspace("varroa-counter").project("varroa-counter-large")
version = project.version(3)
dataset = version.download("yolov11")

loading Roboflow workspace...
loading Roboflow project...


## 7. Entra√Ænement du mod√®le
### üìå Version de Python recommand√©e

Pour cet exercice de r√©seaux de neurones convolutifs (CNN) avec YOLO11n, je vais utiliser **Python 3.12.7**, car c‚Äôest l‚Äôune des versions les mieux support√©es par YOLO.

In [None]:
# V√©rifions la version de Python et du chemin de l'ex√©cutable
import sys
print(sys.version)
print(sys.executable)

3.12.7 (tags/v3.12.7:0b05ead, Oct  1 2024, 03:06:41) [MSC v.1941 64 bit (AMD64)]
d:\dev\python\Python312\python.exe


In [None]:
!pip install ultralytics

# import the needed librairies
import ultralytics

In [None]:
from ultralytics import YOLO
# entrainement du mod√®le
# Je cr√©er un nouveau mod√®le depuis z√©ro
model = YOLO('yolo11n.pt')

# lancement de l'entra√Ænement avec seulement 1 seul passage et en abaissant le nombre de batch (nombre d'images trait√©es simultan√©ment).
# le but est de tester si les capacit√©es de ma machine sont suffisantes pour entra√Æner mon mod√®le
results = model.train(data="varroa-counter-v3-2/data.yaml", epochs=1, imgsz=2048, batch=8,
                      max_det=2000, conf=0.1, iou = 0.5)
print (results)


New https://pypi.org/project/ultralytics/8.4.8 available  Update with 'pip install -U ultralytics'
Ultralytics 8.3.249  Python-3.12.7 torch-2.9.1+cpu CPU (Intel Core(TM) i7-10510U 1.80GHz)
[34m[1mengine\trainer: [0magnostic_nms=False, amp=True, augment=False, auto_augment=randaugment, batch=16, bgr=0.0, box=7.5, cache=False, cfg=None, classes=None, close_mosaic=10, cls=0.5, compile=False, conf=0.1, copy_paste=0.0, copy_paste_mode=flip, cos_lr=False, cutmix=0.0, data=varroa-counter-v3-2/data.yaml, degrees=0.0, deterministic=True, device=cpu, dfl=1.5, dnn=False, dropout=0.0, dynamic=False, embed=None, epochs=1, erasing=0.4, exist_ok=False, fliplr=0.5, flipud=0.0, format=torchscript, fraction=1.0, freeze=None, half=False, hsv_h=0.015, hsv_s=0.7, hsv_v=0.4, imgsz=2048, int8=False, iou=0.5, keras=False, kobj=1.0, line_width=None, lr0=0.01, lrf=0.01, mask_ratio=4, max_det=2000, mixup=0.0, mode=train, model=yolo11n.pt, momentum=0.937, mosaic=1.0, multi_scale=False, name=train22, nbs=64, nm

: 

Impossible d'entra√Æner mon mod√®le sur ma machine, car elle n'a pas de GPU et le kernel crash.
J'ai fait un essai en utilisant google colab, qui permet gratuitement d'entra√Æner des mod√®les avec un peu de GPU. Malheureusement j'ai le m√™me probl√®me sur google colab qui m'indique que ma session a plant√© apr√®s avoir utilis√© toute la RAM disponible.

### Changement de strat√©gie: recherche d'un mod√®le existant
Je d√©cide donc de rechercher un mod√®le existant pouvant couvrir mes besoins et j'ai trouv√© le travail de recherche suivant: https://www.mdpi.com/2077-0472/15/9/969

**R√©f√©rence:**
> Y√°niz, J.; Casalongue, M.; Martinez-de-Pison, F.J.; Silvestre, M.A.; Consortium, B.; Santolaria, P.; Divas√≥n, J. *An AI-Based Open-Source Software for Varroa Mite Fall Analysis in Honeybee Colonies*. Agriculture 2025, 15, 969. https://doi.org/10.3390/agriculture15090969

Leurs mod√®le a √©t√© entra√Æn√© avec un dataset de 357 images sur plus de 500 epochs. Ils ont √©galement livr√© un programme √©crit en python permettant d'upload ses images et d'effectuer la d√©tection des varroas avec leurs mod√®le.
Le code source est disponible sous github ainsi que leurs mod√®le entra√Æn√©: https://github.com/jodivaso/varrodetector/blob/main/model/weights/best.pt

En analysant le code j'ai trouv√© particuli√®rement int√©ressant qu'ils utilisent une taille d'image assez grande de 6016 pixels (https://github.com/jodivaso/varrodetector/blob/main/varroa_mite_gui.py#L2507C42-L2507C46).



## 8. Evaluation du mod√®le
Je d√©cide de rebalancer toutes les images de mon dataset en set de test et de n'appliquer aucun redimensionnement d'image

In [None]:
from roboflow import Roboflow
rf = Roboflow(api_key="tEQkmVJiCxGOZMuDLR6d")
project = rf.workspace("varroa-counter").project("varroa-counter-v3")
version = project.version(3)
dataset = version.download("yolov11")

loading Roboflow workspace...
loading Roboflow project...


Downloading Dataset Version Zip in varroa-counter-v3-3 to yolov11:: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 50577/50577 [00:02<00:00, 20475.28it/s]





Extracting Dataset Version Zip to varroa-counter-v3-3 in yolov11:: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 70/70 [00:00<00:00, 555.15it/s]


Il faut maintenant tester le mod√®le cr√©er par l'√©tude espagnole avec mon dataset

In [None]:
from ultralytics import YOLO

# Charger le mod√®le entra√Æn√©
model = YOLO('model_mdpi_3291496/weights/best.pt')

# Effectuer la d√©tection sur l'image
results = model.val(
    data="varroa-counter-v3-2/data.yaml",
    split='val',  # or 'val' for validation set
    imgsz=3000,
    batch=8,
    conf=0.1,  # Seuil de confiance
    iou=0.5,
    max_det=2000
)

# Afficher les r√©sultats
# Print results
print(f"Precision: {results.box.p}")
print(f"Recall: {results.box.r}")
print(f"mAP50: {results.box.map50}")
print(f"mAP50-95: {results.box.map}")

Ultralytics 8.3.249  Python-3.12.7 torch-2.9.1+cpu CPU (Intel Core(TM) i7-10510U 1.80GHz)
Model summary (fused): 72 layers, 3,005,843 parameters, 0 gradients, 8.1 GFLOPs
[34m[1mval: [0mFast image access  (ping: 0.00.0 ms, read: 1561.7254.2 MB/s, size: 282.8 KB)
[K[34m[1mval: [0mScanning D:\dev\ia\cours\varroacounter\varroa-counter-v3-2\valid\labels.cache... 4 images, 0 backgrounds, 0 corrupt: 100% ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ 4/4  0.0s


: 

In [None]:
# Test du mod√®le avec le dataset Varroa-board-1
from ultralytics import YOLO

model = YOLO('model_mdpi_3291496/weights/best.pt')

results = model.val(
    data="Varroa-board-1/data.yaml",
    split='test',  # Utiliser le split 'test'
    imgsz=(6016), max_det=2000, conf=0.1, iou = 0.5,
    save=True, show_labels=False, line_width=2, save_txt=True, save_conf=True
)

print("\nR√©sultats de validation sur Varroa-board-1:")
print(f"Pr√©cision: {results.box.p}")
print(f"Recall: {results.box.r}")
print(f"mAP50: {results.box.map50}")
print(f"mAP50-95: {results.box.map}")

#R√©sultats de validation sur Varroa-board-1:
#Pr√©cision: [    0.80237]
#Recall: [    0.42177]
#mAP50: 0.584942355545071
#mAP50-95: 0.2293648037166341

Ultralytics 8.3.249  Python-3.12.7 torch-2.9.1+cpu CPU (Intel Core(TM) i7-10510U 1.80GHz)
Model summary (fused): 72 layers, 3,005,843 parameters, 0 gradients, 8.1 GFLOPs


FileNotFoundError: [34m[1mval: [0mError loading data from None
See https://docs.ultralytics.com/datasets for dataset formatting guidance.

In [None]:
# Test avec d√©coupage d'image en 4 parties
from ultralytics import YOLO
from PIL import Image
import os

# Charger le mod√®le
model = YOLO('model_mdpi_3291496/weights/best.pt')

# Chemin de l'image √† tester
image_path = 'Varroa-board-1/test/images/IMG_0226_jpg.rf.c97161f83bb98300231bd6318d7dee3b.jpg'

# Charger l'image
img = Image.open(image_path)
width, height = img.size
print(f"Taille originale de l'image: {width}x{height}")

# Cr√©er un dossier pour les images d√©coup√©es
output_dir = 'temp_tiles'
os.makedirs(output_dir, exist_ok=True)

# D√©couper l'image en 4 parties (2x2)
half_width = width // 2
half_height = height // 2

tiles = []
positions = [
    (0, 0, half_width, half_height, "top_left"),
    (half_width, 0, width, half_height, "top_right"),
    (0, half_height, half_width, height, "bottom_left"),
    (half_width, half_height, width, height, "bottom_right")
]

# D√©couper et sauvegarder chaque partie
for i, (x1, y1, x2, y2, name) in enumerate(positions):
    tile = img.crop((x1, y1, x2, y2))
    tile_path = os.path.join(output_dir, f'tile_{i+1}_{name}.jpg')
    tile.save(tile_path)
    tiles.append((tile_path, name, x1, y1))
    print(f"Partie {i+1} ({name}): {tile.size[0]}x{tile.size[1]} sauvegard√©e")

print(f"\n{'='*60}")
print("D√âTECTION SUR CHAQUE PARTIE")
print(f"{'='*60}\n")

# Tester le mod√®le sur chaque partie
total_detections = 0
all_results = []

for tile_path, name, offset_x, offset_y in tiles:
    print(f"\n--- D√©tection sur {name} ---")
    results = model.predict(
        source=tile_path,
   imgsz=(6016), max_det=2000, conf=0.1, iou = 0.5,
    save=True, show_labels=False, line_width=2, save_txt=True, save_conf=True
    )

    detections = len(results[0].boxes)
    total_detections += detections
    all_results.append((name, detections, results[0]))

    print(f"Varroas d√©tect√©s: {detections}")

print(f"\n{'='*60}")
print(f"R√âSUM√â DES D√âTECTIONS")
print(f"{'='*60}")
print(f"\nNombre total de varroas d√©tect√©s: {total_detections}")
print("\nD√©tail par partie:")
for name, count, _ in all_results:
    print(f"  - {name:15s}: {count:3d} varroas")

print(f"\nImages d√©coup√©es sauvegard√©es dans: {output_dir}/")
print(f"R√©sultats de d√©tection sauvegard√©s dans: runs/detect/predict*/")


Taille originale de l'image: 4284x5712
Partie 1 (top_left): 2142x2856 sauvegard√©e
Partie 2 (top_right): 2142x2856 sauvegard√©e
Partie 3 (bottom_left): 2142x2856 sauvegard√©e
Partie 4 (bottom_right): 2142x2856 sauvegard√©e

D√âTECTION SUR CHAQUE PARTIE


--- D√©tection sur top_left ---

image 1/1 d:\dev\ia\cours\varroacounter\temp_tiles\tile_1_top_left.jpg: 6016x4512 108 varroas, 7910.5ms
Speed: 315.9ms preprocess, 7910.5ms inference, 13.1ms postprocess per image at shape (1, 3, 6016, 4512)
Results saved to [1mD:\dev\runs\detect\predict4[0m
1 label saved to D:\dev\runs\detect\predict4\labels
Varroas d√©tect√©s: 108

--- D√©tection sur top_right ---

image 1/1 d:\dev\ia\cours\varroacounter\temp_tiles\tile_2_top_right.jpg: 6016x4512 109 varroas, 6570.5ms
Speed: 272.7ms preprocess, 6570.5ms inference, 10.5ms postprocess per image at shape (1, 3, 6016, 4512)
Results saved to [1mD:\dev\runs\detect\predict4[0m
2 labels saved to D:\dev\runs\detect\predict4\labels
Varroas d√©tect√©s: 109

