In [13]:
import cv2
from ultralytics import YOLO
import time
import mss
import numpy as np
import pyautogui
import keyboard
from pynput.mouse import Button, Controller

# Загрузка модели
# model = YOLO("yolov8n.pt")  # Загрузка официальной модели
model = YOLO(r"runs\detect\train2\weights\best.pt")  # Загрузка пользовательской модели

# Задание области захвата экрана
monitor = {"top": 362, "left": 551, "width": 801, "height": 481}

mouse = Controller()
prev_frame_time = 0
new_frame_time = 0

# Флаг для завершения цикла
exit_flag = False

def on_press_q(e):
    global exit_flag
    if e.name == 'q':
        exit_flag = True

# Установка обработчика нажатия клавиши 'q'
keyboard.on_press(on_press_q)

with mss.mss() as sct:
    while not exit_flag:
        # Захват области экрана
        sct_img = sct.grab(monitor)
        
        # Преобразование изображения в формат numpy
        frame = np.array(sct_img)
        
        # Изменение цветового пространства с BGRA на BGR
        frame = cv2.cvtColor(frame, cv2.COLOR_BGRA2BGR)

        # Запись времени начала обработки кадра
        start_time = time.time()

        # Детектирование объектов на кадре
        results = model(frame)

        # Отображение результатов на кадре
        annotated_frame = results[0].plot()
        
        # Вывод координат xyxy для каждого обнаруженного объекта
        for r in results:
            for box in r.boxes:
                xyxy = box.xyxy  # Предполагается, что xyxy - атрибут объекта box
                if xyxy.shape[1] == 4:  # Проверка, что xyxy содержит 4 элемента
                    x_min, y_min, x_max, y_max = xyxy[0, 0], xyxy[0, 1], xyxy[0, 2], xyxy[0, 3]
                    print(f"x_min: {x_min:.2f}, y_min: {y_min:.2f}, x_max: {x_max:.2f}, y_max: {y_max:.2f}")
                else:
                    print("Invalid box coordinates format")
                
                abs_x_min = monitor["left"] + x_min
                abs_y_min = monitor["top"] + y_min
                abs_x_max = monitor["left"] + x_max
                abs_y_max = monitor["top"] + y_max
                
                x_center = (abs_x_min + abs_x_max) / 2
                y_center = (abs_y_min + abs_y_max) / 2
                mouse.position = (x_center, y_center)
                mouse.click(Button.left)

        # Расчет и отображение FPS
        new_frame_time = time.time()
        fps = 1 / (new_frame_time - prev_frame_time)
        prev_frame_time = new_frame_time
        cv2.putText(annotated_frame, f'{int(fps)}', (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2, cv2.LINE_AA)

        # Вывод кадра в окно
        cv2.imshow('YOLO Object Detection', annotated_frame)

        # Печать времени обработки кадра (опционально, для анализа производительности)
        print(f'Time per frame: {time.time() - start_time} seconds')

        # Проверка нажатия клавиши 'q' для выхода
        if exit_flag:
            break

# Освобождение ресурсов
cv2.destroyAllWindows()



0: 384x640 32 <aim>s, 117.0ms
Speed: 2.0ms preprocess, 117.0ms inference, 0.0ms postprocess per image at shape (1, 3, 384, 640)
x_min: 593.93, y_min: 398.93, x_max: 656.52, y_max: 458.60
x_min: 646.65, y_min: 82.21, x_max: 711.09, y_max: 151.10
x_min: 558.58, y_min: 44.86, x_max: 606.51, y_max: 94.29
x_min: 158.45, y_min: 322.44, x_max: 210.18, y_max: 375.41
x_min: 31.28, y_min: 28.36, x_max: 88.56, y_max: 85.57
x_min: 229.40, y_min: 76.70, x_max: 282.53, y_max: 129.47
x_min: 626.01, y_min: 179.89, x_max: 676.73, y_max: 231.29
x_min: 743.69, y_min: 232.64, x_max: 792.21, y_max: 284.31
x_min: 214.81, y_min: 315.39, x_max: 251.85, y_max: 352.66
x_min: 513.88, y_min: 225.41, x_max: 556.93, y_max: 269.96
x_min: 24.31, y_min: 194.75, x_max: 57.41, y_max: 228.02
x_min: 731.57, y_min: 70.05, x_max: 767.32, y_max: 106.09
x_min: 95.74, y_min: 107.94, x_max: 170.05, y_max: 181.30
x_min: 576.05, y_min: 351.94, x_max: 633.13, y_max: 407.09
x_min: 733.08, y_min: 122.14, x_max: 766.55, y_max: 156.2