Tài liệu tham khảo

Hướng dẫn chạy

python yolo_image.py --image images/traffic.jpg --yolo yolo-coco

hoặc là cho file video

python yolo_video.py --input videos/traffic_monitor.mp4 --output output/traffic_monitor_out.avi --yolo yolo-coco

hoặc là từ webcam

python yolo_video.py --output output/webcam.avi --yolo yolo-coco

Trong bài này mình không đi vào lý thuyết mà sử dụng luôn pre-trained model YOLO v3 có sẵn để thực hiện phát hiện vật thể trong ảnh và video.

Đối với bài này các bạn cần tải 3 file sau:

coco.names: chứa tên các class mà YOLO được huấn luyện link
yolov3.cfg: configuration file chứa các cài đặt cho YOLO link
yolov3.weights: các pre-trained weights link. Do file lớn quá các bạn không upload lên Github được, các bạn tải về theo link mình đính kèm.

Các bước chính khi triển khai pre-trained YOLO v3:

Load model (cần file weights và configuration)
Load ảnh, tiền xử lý trước khi đưa vào model
Lấy tên các output layers, dựa vào đây chúng ta sẽ xác định được các bounding boxes
Thực hiện Non-max suppression để loại bỏ các bounding boxes chồng chập
Vẽ các bounding boxes và confidence lên ảnh.

Các bạn có thể xem code chi tiết ở github của mình YOLO3 Object Detection

Nhược điểm của YOLOv3:

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
images		images
videos		videos
yolo-coco		yolo-coco
README.md		README.md
outputs_YOLO.png		outputs_YOLO.png
yolo_ham.py		yolo_ham.py
yolo_image.py		yolo_image.py
yolo_video.py		yolo_video.py

Provide feedback