Основная цель проекта - детекция и распознавание автомобильных номеров.
В ноутбуке inference_notebook.ipynb написан поэтапный запуск инференса ALPR. В качестве модели для детекции могут быть использованы FasterRCNN или Yolov5. Для распознавания номеров используется связка ResNet + LSTM + CTC из библиотеки EasyOCR.
Скорость инференса ~ 10-11 изображений в секунду.
Для запуска FasterRCNN необходимо добавить веса в папку DetactionModels. Веса можно скачать по ссылке: https://disk.yandex.ru/d/NlvmdsBvbNbltQ .
| Model | mAP 0.5 | mAP 0.5_0.95 | Precision | Recall |
|---|---|---|---|---|
| FasterRCNN | 0.946 | 0.78 | 0.907 | 0.989 |
| YOLOv5 | 0.986 | 0.815 | 0.967 | 0.958 |
Метрики обучения на каждой эпохе можно посмотреть в faster_rcnn_v5.txt.
Гиперпараметры, метрики и другое для YOLO можно посмотреть в wandb.
Пробовали: разные оптимизаторы (AdamW > SGD), фризить слои, разные начальные LR.
EasyOCR
| Model | Best_accuracy | Best_norm_ED |
|---|---|---|
| EasyOCR | 95.927 | 0.9905 |
Метрики обучения на каждой эпохе можно посмотреть в log_train.py.
Для обучения использовались следующие датасеты:
- Kaggle - VKCV 2022 Contest_02
- Kaggle - Nomeroff Russian License plates