In [1]:
from ultralytics import YOLO
import cv2

# Tải mô hình YOLOv8 (có thể là yolov8n, yolov8s, yolov8m, yolov8l, hoặc yolov8x)
model = YOLO("main_model_v2.pt")  # Tải model nhỏ (n - nano)

# Đường dẫn tới video
video_path = r"tmp_videos\video_20250110_011030.mp4"

# Mở video
cap = cv2.VideoCapture(video_path)

if not cap.isOpened():
    print("Không thể mở video!")
    exit()

# Lấy thông tin video
frame_width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
frame_height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
fps = cap.get(cv2.CAP_PROP_FPS)

print(f"Thông tin video: {frame_width}x{frame_height}, FPS: {fps}")

video_results = [] 

# Vòng lặp đọc từng frame của video
while cap.isOpened():
    ret, frame = cap.read()
    if not ret:
        break

    # Nhận diện đối tượng trong frame
    results_frame = model(frame, verbose=False)  # Dự đoán với YOLOv8

    frame_classes = []

    for result in results_frame[0].boxes:
        if float(result.conf) >= 0.6:  # Apply confidence threshold
            frame_classes.append(model.names[int(result.cls)])

    if frame_classes:  # Chỉ thêm vào nếu có phát hiện
        video_results.extend(frame_classes)

    # Vẽ kết quả lên khung hình
    annotated_frame = results_frame[0].plot()  # Vẽ các box và label vào frame

    # Hiển thị khung hình
    cv2.imshow("YOLOv8 Detection", annotated_frame)

    # Thoát nếu nhấn phím 'q'
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Giải phóng tài nguyên
cap.release()
cv2.destroyAllWindows()


Thông tin video: 720x480, FPS: 25.0


In [2]:
video_results

['j',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'd',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'o',
 'w',
 'w',
 'w',
 'w']

In [10]:
results = ""
if video_results:  # Chỉ thêm kết quả nếu không rỗng
    results += ", ".join(video_results)

# Loại bỏ dấu phẩy không cần thiết (nếu có)
results = results.replace(", ", "")

# Chuẩn bị response
response = {"results": results}
print("response: ", response)


response:  {'results': 'joooooooooooooodooooooooooooooooooooooooowwww'}


In [18]:
if video_results:  # Chỉ thêm kết quả nếu không rỗng
    results += "".join(video_results)

results

[ultralytics.engine.results.Results object with attributes:
 
 boxes: ultralytics.engine.results.Boxes object
 keypoints: None
 masks: None
 names: {0: 'a', 1: 'b', 2: 'c', 3: 'd', 4: 'e', 5: 'f', 6: 'g', 7: 'h', 8: 'i', 9: 'j', 10: 'k', 11: 'l', 12: 'm', 13: 'n', 14: 'o', 15: 'p', 16: 'q', 17: 'r', 18: 's', 19: 't', 20: 'u', 21: 'v', 22: 'w', 23: 'x', 24: 'y', 25: 'z', 26: '27', 27: '28', 28: '29', 29: '30'}
 obb: None
 orig_img: array([[[ 59,  64,  64],
         [ 59,  64,  64],
         [ 59,  64,  64],
         ...,
         [107, 104, 103],
         [107, 104, 103],
         [107, 104, 103]],
 
        [[ 59,  64,  64],
         [ 59,  64,  64],
         [ 59,  64,  64],
         ...,
         [107, 104, 103],
         [107, 104, 103],
         [107, 104, 103]],
 
        [[ 59,  64,  64],
         [ 59,  64,  64],
         [ 59,  64,  64],
         ...,
         [107, 104, 103],
         [107, 104, 103],
         [107, 104, 103]],
 
        ...,
 
        [[ 59,  62,  62],
      