# Модуль Б. Разработка модели машинного обучения

## Импортирование библиотек

In [1]:
# библиотека с предобученной моделью YOLO
from ultralytics import YOLO

# библиотека для работы с регулярными выражениями
import re

# библиотеки для работы с изображениями
import cv2
from PIL import Image
import matplotlib.pyplot as plt

**Основная задача нейронной сети - `определение и распознавание человеческих лиц на фотографии`. Для того чтобы решить эту задачу, нужно реализовать 2 модели:**
- Модель детекции лица
- Модель распознавания лица

## Модель детекции

Существуют несльколько различных предобученных моделей детекции, такие как:
- `EfficientNet`
- `ResNet`
- `YOLO`
- и многие другие

**В качестве модели для своей задачи, я буду использовать предобученную модель `YOLOv8n` (где n - nano) - это легкая и достаточно точная модель, которая способна решать задачи `детекции`, а так же в качестве улучшенной версии можно использовать `YOLOv8s` (где s - small), как более мощную модель**

Для начала, надо загрузить сам предобученную модель в формате `.pt`

**Структура модели `YOLOv8n` (3.2M):**

- task=detect 
- mode=train 
- model=yolov8n.pt 
- data=D:\Helper\MLBazyak\homework\06_01\06_01_hw\data.yaml 
- epochs=3 
- time=None 
- patience=100 
- batch=8 
- imgsz=640 
- save=True 
- save_period=-1 
- cache=False 
- device=None 
- workers=8 
- project=None 
- name=price_detection_v3 
- exist_ok=False 
- pretrained=True 
- optimizer=auto 
- verbose=True 
- seed=0 
- deterministic=True 
- single_cls=False 
- rect=False 
- cos_lr=True 
- close_mosaic=10 
- resume=False 
- amp=True 
- fraction=1.0 
- profile=False 
- freeze=None 
- multi_scale=False 
- overlap_mask=True 
- mask_ratio=4 
- dropout=0.0 
- val=True 
- split=val 
- save_json=False 
- save_hybrid=False 
- conf=None  
- iou=0.7 
- max_det=300 
- half=False 
- dnn=False 
- plots=True 
- source=None 
- vid_stride=1 
- stream_buffer=False 
- visualize=False 
- augment=False 
- agnostic_nms=False 
- classes=None 
- retina_masks=False 
- embed=None 
- show=False 
- save_frames=False 
- save_txt=False 
- save_conf=False 
- save_crop=False 
- show_labels=True 
- show_conf=True 
- show_boxes=True 
- line_width=None 
- format=torchscript 
- keras=False 
- optimize=False 
- int8=False 
- dynamic=False 
- simplify=True 
- opset=None 
- workspace=None 
- nms=False 
- lr0=0.01 
- lrf=0.01 
- momentum=0.937 
- weight_decay=0.0005 
- warmup_epochs=3.0 
- warmup_momentum=0.8 
- warmup_bias_lr=0.1 
- box=7.5 
- cls=0.5 
- dfl=1.5 
- pose=12.0 
- kobj=1.0 
- nbs=64 
- hsv_h=0.015 
- hsv_s=0.7 
- hsv_v=0.4 
- degrees=0.0 
- translate=0.1 
- scale=0.5 
- shear=0.0 
- perspective=0.0 
- flipud=0.0 
- fliplr=0.5 
- bgr=0.0 
- mosaic=1.0 
- mixup=0.0 
- copy_paste=0.0 
- copy_paste_mode=flip 
- auto_augment=randaugment 
- erasing=0.4 
- crop_fraction=1.0 
- cfg=None 
- tracker=botsort.yaml 
- save_dir=runs\detect\price_detection_v3

In [2]:
# инициализируем модель YOLOv8 nano
model = YOLO('yolov8n.pt') 

Downloading https://github.com/ultralytics/assets/releases/download/v8.3.0/yolov8n.pt to 'yolov8n.pt'...


100%|██████████| 6.25M/6.25M [00:01<00:00, 3.60MB/s]


*Для начала, попробую обучить модель на 3х эпохах*

In [3]:
# тестовое обучение
results_test = model.train(
    data = r'D:\Helper\MLBazyak\homework\face_recognition\Module_2\data.yaml',  # путь к yaml файлу
    epochs=2,                                                                   # количество эпох
    imgsz=1024,                                                                 # размер изображений в данных
    batch=8,                                                                    # количество батчей
    cos_lr=True,                                                                # косинусный планировщик кривой скорости обучении
    lr0=0.01,                                                                   # скорость обучения
    name='face_detection_v1'                                                    # название эксперимента
)

New https://pypi.org/project/ultralytics/8.3.65 available  Update with 'pip install -U ultralytics'
Ultralytics 8.3.61  Python-3.11.9 torch-2.5.1+cpu CPU (11th Gen Intel Core(TM) i5-1135G7 2.40GHz)
[34m[1mengine\trainer: [0mtask=detect, mode=train, model=yolov8n.pt, data=D:\Helper\MLBazyak\homework\face_recognition\Module_2\data.yaml, epochs=2, time=None, patience=100, batch=8, imgsz=1024, save=True, save_period=-1, cache=False, device=None, workers=8, project=None, name=face_detection_v1, exist_ok=False, pretrained=True, optimizer=auto, verbose=True, seed=0, deterministic=True, single_cls=False, rect=False, cos_lr=True, close_mosaic=10, resume=False, amp=True, fraction=1.0, profile=False, freeze=None, multi_scale=False, overlap_mask=True, mask_ratio=4, dropout=0.0, val=True, split=val, save_json=False, save_hybrid=False, conf=None, iou=0.7, max_det=300, half=False, dnn=False, plots=True, source=None, vid_stride=1, stream_buffer=False, visualize=False, augment=False, agnostic_nms=Fa

[34m[1mtrain: [0mScanning D:\Helper\MLBazyak\homework\some_data\face_rec_data\face_det\train\labels... 699 images, 0 backgrounds, 0 corrupt: 100%|██████████| 699/699 [00:02<00:00, 310.11it/s]


[34m[1mtrain: [0mNew cache created: D:\Helper\MLBazyak\homework\some_data\face_rec_data\face_det\train\labels.cache


[34m[1mval: [0mScanning D:\Helper\MLBazyak\homework\some_data\face_rec_data\face_det\valid\labels... 150 images, 0 backgrounds, 0 corrupt: 100%|██████████| 150/150 [00:00<00:00, 321.16it/s]

[34m[1mval: [0mNew cache created: D:\Helper\MLBazyak\homework\some_data\face_rec_data\face_det\valid\labels.cache





Plotting labels to runs\detect\face_detection_v1\labels.jpg... 
[34m[1moptimizer:[0m 'optimizer=auto' found, ignoring 'lr0=0.01' and 'momentum=0.937' and determining best 'optimizer', 'lr0' and 'momentum' automatically... 
[34m[1moptimizer:[0m AdamW(lr=0.002, momentum=0.9) with parameter groups 57 weight(decay=0.0), 64 weight(decay=0.0005), 63 bias(decay=0.0)
Image sizes 1024 train, 1024 val
Using 0 dataloader workers
Logging results to [1mruns\detect\face_detection_v1[0m
Starting training for 2 epochs...

      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


        1/2         0G      1.152      2.371      1.854          9       1024: 100%|██████████| 88/88 [13:55<00:00,  9.49s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 10/10 [01:10<00:00,  7.10s/it]

                   all        150        163      0.635      0.651      0.647      0.217






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


        2/2         0G     0.9416      1.638      1.633          5       1024: 100%|██████████| 88/88 [12:45<00:00,  8.69s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 10/10 [01:07<00:00,  6.76s/it]

                   all        150        163      0.901      0.895       0.96      0.608






2 epochs completed in 0.483 hours.
Optimizer stripped from runs\detect\face_detection_v1\weights\last.pt, 6.3MB
Optimizer stripped from runs\detect\face_detection_v1\weights\best.pt, 6.3MB

Validating runs\detect\face_detection_v1\weights\best.pt...
Ultralytics 8.3.61  Python-3.11.9 torch-2.5.1+cpu CPU (11th Gen Intel Core(TM) i5-1135G7 2.40GHz)
Model summary (fused): 168 layers, 3,005,843 parameters, 0 gradients, 8.1 GFLOPs


                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 10/10 [01:02<00:00,  6.24s/it]


                   all        150        163      0.902      0.903      0.959      0.607
Speed: 7.8ms preprocess, 310.6ms inference, 0.0ms loss, 60.4ms postprocess per image
Results saved to [1mruns\detect\face_detection_v1[0m


Тестирование модели

In [2]:
model = YOLO(r'D:\Helper\MLBazyak\homework\face_recognition\Module_2\runs\detect\face_detection_v1\weights\best.pt')

In [11]:
# пути к фотографиям, на которых буду тестировать свою функцию
photos = [
    # r'D:\Helper\MLBazyak\homework\face_recognition\Module_2\test1.jpg',
    # r'D:\Helper\MLBazyak\homework\face_recognition\Module_2\test2.jpg',
    r'D:\Helper\MLBazyak\homework\face_recognition\Module_2\test6.jpg',
]
# прохожусь по каждой фотографии используя цикл for
for photo in photos:
    result_fin = model(photo)
    for result in result_fin:
        img = result.plot()  
        img = Image.fromarray(img)  
        img.show()  


image 1/1 D:\Helper\MLBazyak\homework\face_recognition\Module_2\test6.jpg: 1024x1024 1 price, 345.5ms
Speed: 16.3ms preprocess, 345.5ms inference, 4.6ms postprocess per image at shape (1, 3, 1024, 1024)
