<a href="https://colab.research.google.com/github/Didier06/IA_licence_pro_chimie/blob/main/yolo_molecules_aromatiques.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [11]:
# ============================================================
# üå∏ TP IA & Chimie - Reconnaissance de mol√©cules de parfumerie
# Universit√© C√¥te d‚ÄôAzur ‚Äî Fablab Valrose
# ============================================================

# --- 1Ô∏è‚É£ Installation des d√©pendances ---
!pip install rdkit ultralytics tqdm



In [12]:
# --- 2Ô∏è‚É£ Importations ---
from rdkit import Chem
from rdkit.Chem import Draw
import os, random, shutil
from tqdm import tqdm
from ultralytics import YOLO
import pandas as pd
import matplotlib.pyplot as plt
from IPython.display import Image, display

Classes utilis√©es dans la dataset
| ID (index) | Classe (nom de la mol√©cule) | Famille olfactive associ√©e | Exemple d‚Äôodeur          |
| ---------- | --------------------------- | -------------------------- | ------------------------ |
| `0`        | **Vanillin**                | Sweet üçØ                   | Vanille, sucre, gourmand |
| `1`        | **Limonene**                | Citrus üçä                  | Orange, citron           |
| `2`        | **Geraniol**                | Floral üå∏                  | Rose, g√©ranium           |
| `3`        | **Eugenol**                 | Spicy üå∂Ô∏è                  | Clou de girofle          |
| `4`        | **Menthol**                 | Fresh ‚ùÑÔ∏è                   | Menthe, fra√Æcheur        |
| `5`        | **Citral**                  | Citrus üçã                  | Citronnelle              |
| `6`        | **Coumarin**                | Sweet / Woody üåø           | F√®ve tonka, amande, foin |


Chaque ligne du fichier .txt suit cette structure :

class_id, x_center, y_center, width, height et toutes les valeurs sont normalis√©es entre 0 et 1 par rapport √† la taille de l‚Äôimage.

| √âl√©ment      | Signification                                      | Exemple |
| ------------ | -------------------------------------------------- | ------- |
| `<class_id>` | identifiant de la classe (ex. 5 pour Citral)       | `5`     |
| `<x_center>` | position du centre de la bo√Æte (axe X, de 0 √† 1)   | `0.5`   |
| `<y_center>` | position du centre (axe Y, de 0 √† 1)               | `0.5`   |
| `<width>`    | largeur de la bo√Æte, fraction de la largeur totale | `1.0`   |
| `<height>`   | hauteur de la bo√Æte, fraction de la hauteur totale | `1.0`   |


In [13]:
# --- 3Ô∏è‚É£ Cr√©ation du dataset (avec variations visuelles RDKit) ---
from rdkit.Chem import AllChem, Draw
from PIL import Image, ImageOps, ImageEnhance

molecules = {
    "Vanillin": "COC1=CC(=CC=C1O)C=O",
    "Limonene": "CC1=CCC(CC1)C(=C)C",
    "Geraniol": "CC(C)=CCCC(C)=CCO",
    "Eugenol": "CC=C(CC1=CC=C(O)C=C1)OC",
    "Menthol": "CC(C)C1CCC(C)CC1O",
    "Citral": "CC(C)=CCC=C(C)C=O",
    "Coumarin": "C1=CC=C2C(=O)OC=CC2=C1"
}

os.makedirs("dataset/images", exist_ok=True)
os.makedirs("dataset/labels", exist_ok=True)

print("üß¨ G√©n√©ration des images mol√©culaires vari√©es...")
for i, (name, smi) in enumerate(tqdm(molecules.items())):
    for j in range(10):  # 10 variantes par mol√©cule
        mol = Chem.MolFromSmiles(smi)

        # üí° Recalcul des coordonn√©es 2D (permet une orientation al√©atoire)
        AllChem.Compute2DCoords(mol)

        # üîÄ Options al√©atoires de dessin RDKit
        opts = Draw.MolDrawOptions()
        opts.addAtomIndices = random.choice([True, False])
        opts.addStereoAnnotation = random.choice([True, False])
        opts.useBWAtomPalette()

        # üé® Sauvegarde image temporaire
        img_path = f"dataset/images/{name}_{j}.png"
        Draw.MolToFile(
            mol,
            img_path,
            size=(512,512),
            kekulize=random.choice([True, False]),
            wedgeBonds=random.choice([True, False]),
            includeAtomNumbers=random.choice([True, False]),
            options=opts
        )

        # üì∏ Petit traitement visuel al√©atoire (rotation, contraste, miroir)
        img = Image.open(img_path)
        if random.random() < 0.5:
            img = ImageOps.mirror(img)
        if random.random() < 0.5:
            img = img.rotate(random.randint(-15, 15))
        if random.random() < 0.5:
            enhancer = ImageEnhance.Contrast(img)
            img = enhancer.enhance(random.uniform(0.8, 1.3))
        img.save(img_path)

        # üè∑Ô∏è Fichier label YOLO
        with open(f"dataset/labels/{name}_{j}.txt", "w") as f:
            f.write(f"{i} 0.5 0.5 0.9 0.9\n")  # bo√Æte centr√©e 90%

print("‚úÖ Dataset g√©n√©r√© avec variations visuelles.")


üß¨ G√©n√©ration des images mol√©culaires vari√©es...


100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 7/7 [00:02<00:00,  3.30it/s]

‚úÖ Dataset g√©n√©r√© avec variations visuelles.





In [14]:
# --- 4Ô∏è‚É£ Cr√©ation des dossiers train / val ---
for split in ["train", "val"]:
    os.makedirs(f"dataset/images/{split}", exist_ok=True)
    os.makedirs(f"dataset/labels/{split}", exist_ok=True)

images = [f for f in os.listdir("dataset/images") if f.endswith(".png")]
random.shuffle(images)
split_idx = int(0.8 * len(images))
train_imgs, val_imgs = images[:split_idx], images[split_idx:]

def move_files(img_list, split):
    for img_name in img_list:
        label_name = img_name.replace(".png", ".txt")
        shutil.move(os.path.join("dataset/images", img_name), f"dataset/images/{split}/{img_name}")
        shutil.move(os.path.join("dataset/labels", label_name), f"dataset/labels/{split}/{label_name}")

move_files(train_imgs, "train")
move_files(val_imgs, "val")
print(f"üì¶ {len(train_imgs)} images d'entra√Ænement, {len(val_imgs)} images de validation.")


üì¶ 56 images d'entra√Ænement, 14 images de validation.


In [15]:
# --- 5Ô∏è‚É£ Fichier data.yaml ---
%%writefile data.yaml
train: dataset/images/train
val: dataset/images/val

nc: 7
names: ["Vanillin", "Limonene", "Geraniol", "Eugenol", "Menthol", "Citral", "Coumarin"]

Overwriting data.yaml


In [16]:
!apt install tree -y
!tree dataset -L 3



Reading package lists... Done
Building dependency tree... Done
Reading state information... Done
The following NEW packages will be installed:
  tree
0 upgraded, 1 newly installed, 0 to remove and 38 not upgraded.
Need to get 47.9 kB of archives.
After this operation, 116 kB of additional disk space will be used.
Get:1 http://archive.ubuntu.com/ubuntu jammy/universe amd64 tree amd64 2.0.2-1 [47.9 kB]
Fetched 47.9 kB in 0s (105 kB/s)
Selecting previously unselected package tree.
(Reading database ... 126675 files and directories currently installed.)
Preparing to unpack .../tree_2.0.2-1_amd64.deb ...
Unpacking tree (2.0.2-1) ...
Setting up tree (2.0.2-1) ...
Processing triggers for man-db (2.10.2-1) ...
[01;34mdataset[0m
‚îú‚îÄ‚îÄ [01;34mimages[0m
‚îÇ¬†¬† ‚îú‚îÄ‚îÄ [01;34mtrain[0m
‚îÇ¬†¬† ‚îÇ¬†¬† ‚îú‚îÄ‚îÄ [00mCitral_0.png[0m
‚îÇ¬†¬† ‚îÇ¬†¬† ‚îú‚îÄ‚îÄ [00mCitral_1.png[0m
‚îÇ¬†¬† ‚îÇ¬†¬† ‚îú‚îÄ‚îÄ [00mCitral_2.png[0m
‚îÇ¬†¬† ‚îÇ¬†¬† ‚îú‚îÄ‚îÄ [00mCitral_3.png[0m
‚îÇ¬†¬† ‚îÇ

In [9]:
# --- 6Ô∏è‚É£ Entra√Ænement YOLOv8s (Small) ---
model = YOLO("yolov8s.pt")
model.train(
    data="data.yaml",
    epochs=100,
    imgsz=512,
    batch=8,
    name="mol_recognition_advanced",
    augment=True,
    degrees=15,
    scale=0.2,
    flipud=0.2,
    fliplr=0.5,
    shear=5,
    hsv_h=0.05,
    hsv_s=0.4,
    hsv_v=0.4
)

[KDownloading https://github.com/ultralytics/assets/releases/download/v8.3.0/yolov8s.pt to 'yolov8s.pt': 100% ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ 21.5MB 168.9MB/s 0.1s
Ultralytics 8.3.217 üöÄ Python-3.12.12 torch-2.8.0+cu126 CPU (AMD EPYC 7B12)
[34m[1mengine/trainer: [0magnostic_nms=False, amp=True, augment=True, auto_augment=randaugment, batch=8, bgr=0.0, box=7.5, cache=False, cfg=None, classes=None, close_mosaic=10, cls=0.5, compile=False, conf=None, copy_paste=0.0, copy_paste_mode=flip, cos_lr=False, cutmix=0.0, data=data.yaml, degrees=15, deterministic=True, device=cpu, dfl=1.5, dnn=False, dropout=0.0, dynamic=False, embed=None, epochs=100, erasing=0.4, exist_ok=False, fliplr=0.5, flipud=0.2, format=torchscript, fraction=1.0, freeze=None, half=False, hsv_h=0.05, hsv_s=0.4, hsv_v=0.4, imgsz=512, int8=False, iou=0.7, keras=False, kobj=1.0, line_width=None, lr0=0.01, lrf=0.01, mask_ratio=4, max_det=300, mixup=0.0, mode=train, model=yolov8s.pt, momentum=0.937, mosaic=1.0, multi_s

KeyboardInterrupt: 

In [None]:
# --- 7Ô∏è‚É£ √âvaluation du mod√®le ---
metrics = model.val()
print("üìä R√©sultats finaux :")
print(metrics)

# --- 8Ô∏è‚É£ Visualisation des courbes d'entra√Ænement ---
display(Image(filename="runs/detect/mol_recognition_advanced/results.png"))
display(Image(filename="runs/detect/mol_recognition_advanced/confusion_matrix.png"))

In [None]:
# --- 9Ô∏è‚É£ Analyse des performances ---
df = pd.read_csv("runs/detect/mol_recognition_advanced/results.csv")
plt.figure(figsize=(7,4))
plt.plot(df["epoch"], df["metrics/mAP50"], label="mAP@50")
plt.plot(df["epoch"], df["metrics/precision"], label="Pr√©cision")
plt.plot(df["epoch"], df["metrics/recall"], label="Rappel")
plt.xlabel("Epoch")
plt.ylabel("Score")
plt.legend()
plt.title("√âvolution des performances du mod√®le")
plt.show()

In [4]:
# --- üîü  Test sur quelques images ---
test_model = YOLO("runs/detect/mol_recognition_advanced/weights/best.pt")
results = test_model.predict(source="dataset/images/val", show=True, save=True)
print("‚úÖ R√©sultats enregistr√©s dans runs/predict/")


Collecting rdkit
  Downloading rdkit-2025.9.1-cp312-cp312-manylinux_2_28_x86_64.whl.metadata (4.1 kB)
Collecting ultralytics
  Downloading ultralytics-8.3.217-py3-none-any.whl.metadata (37 kB)
Collecting ultralytics-thop>=2.0.0 (from ultralytics)
  Downloading ultralytics_thop-2.0.17-py3-none-any.whl.metadata (14 kB)
Downloading rdkit-2025.9.1-cp312-cp312-manylinux_2_28_x86_64.whl (36.2 MB)
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m36.2/36.2 MB[0m [31m54.5 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading ultralytics-8.3.217-py3-none-any.whl (1.1 MB)
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m1.1/1.1 MB[0m [31m39.0 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading ultralytics_thop-2.0.17-py3-none-any.whl (28 kB)
Installing collected packages: rdkit, ultralytics-thop, ultralytics
Successfull

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 7/7 [00:01<00:00,  5.94it/s]

‚úÖ Dataset g√©n√©r√©.
üì¶ 56 images d'entra√Ænement, 14 images de validation.



UsageError: Line magic function `%%writefile` not found.


R√©sum√© des actions :

| √âl√©ment          | D√©tail                                       |
| ---------------- | -------------------------------------------- |
| üîß Mod√®le        | YOLOv8s (Small, plus pr√©cis que Nano)        |
| üß¨ Donn√©es       | 7 mol√©cules √ó 10 variations = 70 images      |
| üé® Augmentation  | rotation, zoom, couleur, sym√©trie            |
| üì¶ Dataset       | split automatique train/val                  |
| üìà √âvaluation    | mAP, pr√©cision, rappel, confusion matrix     |
| üí° Visualisation | courbes d‚Äôapprentissage et r√©sultats annot√©s |


In [None]:
# --- 11Ô∏è‚É£ Export du mod√®le pour la MaixCam Pro ---
from ultralytics import YOLO

# Charger le mod√®le final entra√Æn√©
model = YOLO("runs/detect/mol_recognition_advanced/weights/best.pt")

# Exporter en format .kmodel (pour NPU Kendryte K210/K230)
model.export(format="kmodel")  # ‚ö†Ô∏è n√©cessite Ultralytics ‚â• 8.1.0



Une fois l‚Äôexport termin√©, tu obtiens un fichier :

runs/detect/mol_recognition_advanced/weights/best.kmodel

Code Python (MaixPy) pour ex√©cuter le mod√®le sur la MaixCam

Cr√©e un fichier sur la carte SD, par ex. main.py :

# main.py ‚Äî MaixCam Pro (K230)
from maix import nn, camera, display
import time

# Charger le mod√®le YOLO export√©
model = nn.load("/sd/olfactive_model.kmodel")

while True:
    img = camera.capture()
    if img is None:
        continue

    # Ex√©cution du mod√®le (inf√©rence)
    res = model.forward(img)

    # Affichage √† l‚Äô√©cran
    display.show(img)
    if res:
        print("R√©sultats bruts :", res)
        try:
            obj = res[0]  # premi√®re d√©tection
            label = obj['class_name']
            conf = obj['confidence']
            print(f"üß™ Mol√©cule d√©tect√©e : {label} ({conf:.2f})")
        except:
            pass

    time.sleep(0.1)

üñ•Ô∏è 14Ô∏è‚É£ Affichage HDMI (optionnel)

Si ta MaixCam est reli√©e √† un √©cran :

tu verras la mol√©cule captur√©e par la cam√©ra,

avec le nom d√©tect√© affich√© dans le terminal ou sur l‚Äô√©cran.

üß† 1Ô∏è‚É£ Que signifie mAP ?

mAP = mean Average Precision
‚Üí c‚Äôest la moyenne de la pr√©cision sur toutes les classes, en tenant compte de la qualit√© de localisation des objets.

Autrement dit :

‚ÄúLe mod√®le d√©tecte-t-il la bonne mol√©cule, au bon endroit, avec la bonne confiance ?‚Äù

üì¶ 2Ô∏è‚É£ Les notions de base : Precision, Recall et IoU
Terme	Signification	En d√©tection
Precision (P)	parmi toutes les d√©tections faites, combien sont correctes ?	peu de faux positifs
Recall (R)	parmi toutes les vraies mol√©cules pr√©sentes, combien sont trouv√©es ?	peu d‚Äôoublis
IoU (Intersection over Union)	superposition entre la bo√Æte pr√©dite et la bo√Æte r√©elle	mesure de ‚Äúvis√©e‚Äù

Exemple sch√©matique :


IoU = aire de l‚Äôintersection / aire de l‚Äôunion

si IoU > 0.5 ‚Üí la d√©tection est consid√©r√©e correcte (assez bien localis√©e)

üßÆ 3Ô∏è‚É£ Qu‚Äôest-ce que mAP@50 ?
‚û§ D√©finition :

mAP@50 (ou mAP50) = moyenne de la pr√©cision pour IoU ‚â• 0.5.

Cela signifie :

Si la bo√Æte pr√©dite recouvre au moins 50 % de la vraie bo√Æte, elle est compt√©e comme ‚Äúbonne‚Äù.

C‚Äôest donc une mesure de pr√©cision ‚Äútol√©rante‚Äù, id√©ale pour voir si le mod√®le reconna√Æt bien les bons objets.

üí° Interpr√©tation :

mAP@50 = 1.00 ‚Üí d√©tections parfaites.

mAP@50 = 0.80 ‚Üí 80 % des mol√©cules bien d√©tect√©es.

mAP@50 = 0.58 (ton cas actuel) ‚Üí d√©tection correcte mais pas encore stable.

üìä 4Ô∏è‚É£ Qu‚Äôest-ce que mAP@50‚Äì95 ?
‚û§ D√©finition :

Moyenne des mAP calcul√©s pour IoU de 0.5 √† 0.95, par pas de 0.05.

# ============================================================
# üíæ Entra√Ænement YOLOv8 robuste (sauvegarde + reprise auto)
# ============================================================

# 1Ô∏è‚É£ Monter Google Drive pour sauvegarder le mod√®le et les logs
from google.colab import drive
drive.mount('/content/drive')

# 2Ô∏è‚É£ D√©finir le chemin de sauvegarde sur ton Drive
project_path = "/content/drive/MyDrive/Yolo_Molecules_Project"
os.makedirs(project_path, exist_ok=True)

# 3Ô∏è‚É£ Charger YOLOv8 (s ou m pour plus de pr√©cision)
from ultralytics import YOLO

# V√©rifie si un mod√®le pr√©c√©dent existe pour reprendre l‚Äôentra√Ænement
resume_model = f"{project_path}/mol_recognition/weights/last.pt"

if os.path.exists(resume_model):
    print("üîÅ Reprise √† partir du dernier checkpoint enregistr√©.")
    model = YOLO(resume_model)
    model.train(
        data="data.yaml",
        epochs=50,          # tu peux prolonger l‚Äôentra√Ænement
        imgsz=512,
        batch=8,
        resume=True,        # reprend le training
        project=project_path,
        name="mol_recognition",
        save_period=5       # sauvegarde tous les 5 epochs
    )
else:
    print("üöÄ Nouveau d√©part d‚Äôentra√Ænement (aucun checkpoint trouv√©).")
    model = YOLO("yolov8s.pt")
    model.train(
        data="data.yaml",
        epochs=100,
        imgsz=512,
        batch=8,
        project=project_path,
        name="mol_recognition",
        save_period=5,      # sauvegarde r√©gulier sur Drive
        augment=True,
        degrees=15,
        scale=0.2,
        flipud=0.2,
        fliplr=0.5,
        shear=5,
        hsv_h=0.05,
        hsv_s=0.4,
        hsv_v=0.4
    )

print("‚úÖ Entra√Ænement termin√© ou en cours de reprise.")
print("üóÇÔ∏è Tous les r√©sultats sont enregistr√©s dans :", project_path)
