## Подготовка фотографий к обучению

In [None]:
import os
import shutil
from tqdm.auto import tqdm

# Исходная директория, где находятся папки с изображениями
src_dir = '/home/jupyter/datasphere/project/data/SoccerNetGS/gamestate-2024/challenge'

# Целевая директория, куда будут скопированы все изображения
dst_dir = '/home/jupyter/datasphere/train_football'

# Убедимся, что целевая директория существует, если нет - создаем её
os.makedirs(dst_dir, exist_ok=True)

# Расширения файлов изображений, которые нужно копировать
image_extensions = ['.jpg', '.jpeg', '.png']

# Проход по всем папкам и подпапкам исходной директории
for root, dirs, files in tqdm(os.walk(src_dir)):
    for file in files:
        # Проверяем, является ли файл изображением по его расширению
        if any(file.lower().endswith(ext) for ext in image_extensions):
            # Полный путь к исходному файлу
            src_file = os.path.join(root, file)
            
            # Путь к целевому файлу (копируем в целевую директорию)
            dst_file = os.path.join(dst_dir, file)
            
            # Копирование файла
            shutil.copy2(src_file, dst_file)

print('Все изображения успешно скопированы.')


48it [02:52,  3.97s/it]

In [None]:
import os
import shutil
from tqdm.auto import tqdm

# Пути к папкам
source_dir = '/home/jupyter/datasphere/project/data/SoccerNetGS/gamestate-2024/train'
train_dir = '/home/jupyter/datasphere/BigData/images/train'
val_dir = '/home/jupyter/datasphere/BigData/images/val'

# Получаем список всех папок SNGS в source_dir
folders = sorted([os.path.join(source_dir, d) for d in os.listdir(source_dir) if os.path.isdir(os.path.join(source_dir, d)) and 'SNGS' in d])

# Проход по всем папкам SNGS
for i, folder in (enumerate(tqdm(folders))):
    img1_dir = os.path.join(folder, 'img1')
    
    # Проверяем, существует ли папка img1 внутри папки SNGS
    if os.path.exists(img1_dir):
        # Каждая пятая папка перемещается в val
        if (i + 1) % 5 == 0:
            target_dir = os.path.join(val_dir, os.path.basename(folder))
        else:
            # Остальные папки перемещаем в train
            target_dir = os.path.join(train_dir, os.path.basename(folder))
        
        # Копирование папки
        shutil.copytree(img1_dir, target_dir)
        


 88%|████████▊ | 50/57 [05:47<00:49,  7.09s/it]

## Для каждой фотографии создаем текстовый файл, каждую пятую папку копируем в валидацию.

In [12]:
import os
import shutil
import json
from tqdm.auto import tqdm

# Пути к папкам
source_dir = '/home/jupyter/datasphere/project/data/SoccerNetGS/gamestate-2024/valid'
train_dir = '/home/jupyter/datasphere/BigData/images/train'
val_dir = '/home/jupyter/datasphere/BigData/images/val'
train_labels_dir = '/home/jupyter/datasphere/BigData/labels/train'
val_labels_dir = '/home/jupyter/datasphere/BigData/labels/val'

# Создаем директории для train и val, если они не существуют
os.makedirs(train_labels_dir, exist_ok=True)
os.makedirs(val_labels_dir, exist_ok=True)

# Получаем список всех папок SNGS в source_dir
folders = sorted([os.path.join(source_dir, d) for d in os.listdir(source_dir) if os.path.isdir(os.path.join(source_dir, d)) and 'SNGS' in d])

# Переменная для отслеживания последовательных имен
image_counter = 42751

# Функция для игнорирования скрытых файлов и папок
def is_hidden_file_or_dir(filename):
    return filename.startswith('.')

# Проход по всем папкам SNGS
for i, folder in enumerate(tqdm(folders)):
    img1_dir = os.path.join(folder, 'img1')
    json_file = os.path.join(folder, 'Labels-GameState.json')  # Предполагаем, что в каждой папке есть JSON файл
    
    # Определяем целевые директории для изображений и аннотаций
    if (i + 1) % 5 == 0:
        target_dir = val_dir
        target_labels_dir = val_labels_dir
    else:
        target_dir = train_dir
        target_labels_dir = train_labels_dir

    # Читаем JSON файл один раз для всех изображений в текущей папке
    if os.path.exists(json_file):
        with open(json_file, 'r') as f:
            data = json.load(f)

        # Поиск ID для класса мяча
        ball_class_id = None
        for category in data['categories']:
            if category['name'].lower() == 'ball':
                ball_class_id = category['id']
                break

        if ball_class_id is None:
            raise ValueError("Не удалось найти класс 'ball' в аннотациях.")
    
        # Создаем словарь для быстрого поиска аннотаций по image_id
        annotations_by_image = {}
        for ann in data['annotations']:
            if ann['category_id'] == ball_class_id:
                if ann['image_id'] not in annotations_by_image:
                    annotations_by_image[ann['image_id']] = ann

        # Работа с изображениями
        if os.path.exists(img1_dir):
            for img_name in sorted(os.listdir(img1_dir)):
                # Пропускаем скрытые файлы и папки, включая .ipynb_checkpoints
                if is_hidden_file_or_dir(img_name):
                    continue
                
                img_path = os.path.join(img1_dir, img_name)
                new_img_name = f"{image_counter:06}.jpg"
                new_img_path = os.path.join(target_dir, new_img_name)
                shutil.copy(img_path, new_img_path)
                
                # Найти соответствующее изображение в аннотациях
                image_info = next((img for img in data['images'] if img['file_name'] == img_name), None)
                if image_info:
                    image_id = image_info['image_id']
                    img_width = image_info['width']
                    img_height = image_info['height']

                    # Поиск аннотации для мяча
                    annotation = annotations_by_image.get(image_id, None)
                    
                    if annotation:
                        # Координаты bounding box
                        bbox = annotation['bbox_image']
                        x, y, width, height = bbox['x'], bbox['y'], bbox['w'], bbox['h']

                        # Нормализация координат для YOLO
                        x_center = (x + width / 2) / img_width
                        y_center = (y + height / 2) / img_height
                        width_norm = width / img_width
                        height_norm = height / img_height

                        # Создание аннотации в формате YOLO
                        annotation_file = os.path.join(target_labels_dir, new_img_name.replace('.jpg', '.txt'))
                        with open(annotation_file, 'w') as af:
                            af.write(f"0 {x_center} {y_center} {width_norm} {height_norm}\n")
                
                image_counter += 1


100%|██████████| 58/58 [07:45<00:00,  8.02s/it]


## Первый эксперимент с использованием yolo11-nano

In [None]:
from ultralytics import YOLO

# Загрузка модели
model = YOLO('yolo11n.pt')  # Используем наиболее легкую модель для начала

# Обучение модели
model.train(data='/home/jupyter/datasphere/BigData/data.yaml', epochs=3, imgsz=640)


New https://pypi.org/project/ultralytics/8.3.18 available 😃 Update with 'pip install -U ultralytics'
Ultralytics 8.3.4 🚀 Python-3.10.12 torch-2.0.1+cu118 CPU (Intel Xeon Processor (Icelake))
[34m[1mengine/trainer: [0mtask=detect, mode=train, model=yolo11n.pt, data=/home/jupyter/datasphere/BigData/data.yaml, epochs=3, time=None, patience=100, batch=16, imgsz=640, save=True, save_period=-1, cache=False, device=None, workers=8, project=None, name=train21, exist_ok=False, pretrained=True, optimizer=auto, verbose=True, seed=0, deterministic=True, single_cls=False, rect=False, cos_lr=False, close_mosaic=10, resume=False, amp=True, fraction=1.0, profile=False, freeze=None, multi_scale=False, overlap_mask=True, mask_ratio=4, dropout=0.0, val=True, split=val, save_json=False, save_hybrid=False, conf=None, iou=0.7, max_det=300, half=False, dnn=False, plots=True, source=None, vid_stride=1, stream_buffer=False, visualize=False, augment=False, agnostic_nms=False, classes=None, retina_masks=False

[34m[1mtrain: [0mScanning /home/jupyter/datasphere/BigData/labels/train.cache... 69488 images, 3373 backgrounds, 3 corrupt: 100%|██████████| 72864/72864 [00:00<?, ?it/s]






[34m[1malbumentations: [0mBlur(p=0.01, blur_limit=(3, 7)), MedianBlur(p=0.01, blur_limit=(3, 7)), ToGray(p=0.01), CLAHE(p=0.01, clip_limit=(1, 4.0), tile_grid_size=(8, 8))


[34m[1mval: [0mScanning /home/jupyter/datasphere/BigData/labels/val.cache... 20605 images, 1510 backgrounds, 1 corrupt: 100%|██████████| 22116/22116 [00:00<?, ?it/s]






Plotting labels to runs/detect/train21/labels.jpg... 
[34m[1moptimizer:[0m 'optimizer=auto' found, ignoring 'lr0=0.01' and 'momentum=0.937' and determining best 'optimizer', 'lr0' and 'momentum' automatically... 
[34m[1moptimizer:[0m AdamW(lr=0.002, momentum=0.9) with parameter groups 81 weight(decay=0.0), 88 weight(decay=0.0005), 87 bias(decay=0.0)
[34m[1mTensorBoard: [0mmodel graph visualization added ✅
Image sizes 640 train, 640 val
Using 0 dataloader workers
Logging results to [1mruns/detect/train21[0m
Starting training for 3 epochs...

      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


        1/3         0G      3.131      9.676     0.8398         24        640: 100%|██████████| 4554/4554 [3:04:15<00:00,  2.43s/it]  
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 692/692 [15:58<00:00,  1.38s/it]


                   all      22115      20605      0.502      0.203      0.203     0.0652

      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


        2/3         0G      2.886      2.122     0.8156         21        640: 100%|██████████| 4554/4554 [3:03:53<00:00,  2.42s/it]  
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 692/692 [15:52<00:00,  1.38s/it]


                   all      22115      20605      0.472      0.253      0.233     0.0805

      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


        3/3         0G      2.698      1.914     0.8076         18        640: 100%|██████████| 4554/4554 [3:03:46<00:00,  2.42s/it]  
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 692/692 [16:04<00:00,  1.39s/it]


                   all      22115      20605      0.552      0.287      0.281        0.1

3 epochs completed in 10.000 hours.
Optimizer stripped from runs/detect/train21/weights/last.pt, 5.4MB
Optimizer stripped from runs/detect/train21/weights/best.pt, 5.4MB

Validating runs/detect/train21/weights/best.pt...
Ultralytics 8.3.4 🚀 Python-3.10.12 torch-2.0.1+cu118 CPU (Intel Xeon Processor (Icelake))
YOLO11n summary (fused): 238 layers, 2,582,347 parameters, 0 gradients, 6.3 GFLOPs


                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 692/692 [15:17<00:00,  1.33s/it]


                   all      22115      20605      0.552      0.287      0.281        0.1
Speed: 0.2ms preprocess, 19.9ms inference, 0.0ms loss, 0.2ms postprocess per image
Results saved to [1mruns/detect/train21[0m


wandb:                                                                                
wandb: 
wandb: Run history:
wandb:                  lr/pg0 ▁█▁
wandb:                  lr/pg1 ▁█▁
wandb:                  lr/pg2 ▁█▁
wandb:        metrics/mAP50(B) ▁▄█
wandb:     metrics/mAP50-95(B) ▁▄█
wandb:    metrics/precision(B) ▄▁█
wandb:       metrics/recall(B) ▁▅█
wandb:            model/GFLOPs ▁
wandb:        model/parameters ▁
wandb: model/speed_PyTorch(ms) ▁
wandb:          train/box_loss █▄▁
wandb:          train/cls_loss █▁▁
wandb:          train/dfl_loss █▃▁
wandb:            val/box_loss █▄▁
wandb:            val/cls_loss █▄▁
wandb:            val/dfl_loss █▄▁
wandb: 
wandb: Run summary:
wandb:                  lr/pg0 0.00068
wandb:                  lr/pg1 0.00068
wandb:                  lr/pg2 0.00068
wandb:        metrics/mAP50(B) 0.28116
wandb:     metrics/mAP50-95(B) 0.10008
wandb:    metrics/precision(B) 0.55201
wandb:       metrics/recall(B) 0.28678
wandb:            model/GFLOPs

ultralytics.utils.metrics.DetMetrics object with attributes:

ap_class_index: array([0])
box: ultralytics.utils.metrics.Metric object
confusion_matrix: <ultralytics.utils.metrics.ConfusionMatrix object at 0x7fd2e26d99c0>
curves: ['Precision-Recall(B)', 'F1-Confidence(B)', 'Precision-Confidence(B)', 'Recall-Confidence(B)']
curves_results: [[array([          0,    0.001001,    0.002002,    0.003003,    0.004004,    0.005005,    0.006006,    0.007007,    0.008008,    0.009009,     0.01001,    0.011011,    0.012012,    0.013013,    0.014014,    0.015015,    0.016016,    0.017017,    0.018018,    0.019019,     0.02002,    0.021021,    0.022022,    0.023023,
          0.024024,    0.025025,    0.026026,    0.027027,    0.028028,    0.029029,     0.03003,    0.031031,    0.032032,    0.033033,    0.034034,    0.035035,    0.036036,    0.037037,    0.038038,    0.039039,     0.04004,    0.041041,    0.042042,    0.043043,    0.044044,    0.045045,    0.046046,    0.047047,
          0.048048, 

## Второй эксперимент (yolov11-medium, добавил регуляризацию, размер батча - 16)

In [None]:
from ultralytics import YOLO

model = YOLO('yolo11m.pt') 

model.train(
    data='/home/jupyter/datasphere/BigData/data.yaml', 
    epochs=4,              # Количество эпох
    imgsz=640,              # Размер изображений
    batch=16,               # Размер батча
    optimizer='AdamW',      # Оптимизатор
    weight_decay=0.0005  # Регуляризация
)

New https://pypi.org/project/ultralytics/8.3.18 available 😃 Update with 'pip install -U ultralytics'
Ultralytics 8.3.4 🚀 Python-3.10.12 torch-2.0.1+cu118 CUDA:0 (Tesla T4, 15102MiB)
[34m[1mengine/trainer: [0mtask=detect, mode=train, model=yolo11m.pt, data=/home/jupyter/datasphere/BigData/data.yaml, epochs=4, time=None, patience=100, batch=16, imgsz=640, save=True, save_period=-1, cache=False, device=None, workers=8, project=None, name=train24, exist_ok=False, pretrained=True, optimizer=AdamW, verbose=True, seed=0, deterministic=True, single_cls=False, rect=False, cos_lr=False, close_mosaic=10, resume=False, amp=True, fraction=1.0, profile=False, freeze=None, multi_scale=False, overlap_mask=True, mask_ratio=4, dropout=0.0, val=True, split=val, save_json=False, save_hybrid=False, conf=None, iou=0.7, max_det=300, half=False, dnn=False, plots=True, source=None, vid_stride=1, stream_buffer=False, visualize=False, augment=False, agnostic_nms=False, classes=None, retina_masks=False, embed=

wandb: Using wandb-core as the SDK backend. Please refer to https://wandb.me/wandb-core for more information.
wandb: Currently logged in as: chubov-ilya2003 (iliiich). Use `wandb login --relogin` to force relogin
wandb: Tracking run with wandb version 0.18.2
wandb: Run data is saved locally in /home/jupyter/datasphere/wandb/run-20241020_131446-yzqnlv3c
wandb: Run `wandb offline` to turn off syncing.
wandb: Syncing run train24
wandb: ⭐️ View project at https://wandb.ai/iliiich/YOLOv8
wandb: 🚀 View run at https://wandb.ai/iliiich/YOLOv8/runs/yzqnlv3c


Freezing layer 'model.23.dfl.conv.weight'
[34m[1mAMP: [0mrunning Automatic Mixed Precision (AMP) checks with YOLO11n...
[34m[1mAMP: [0mchecks passed ✅


[34m[1mtrain: [0mScanning /home/jupyter/datasphere/BigData/labels/train.cache... 69488 images, 3373 backgrounds, 3 corrupt: 100%|██████████| 72864/72864 [00:00<?, ?it/s]






[34m[1malbumentations: [0mBlur(p=0.01, blur_limit=(3, 7)), MedianBlur(p=0.01, blur_limit=(3, 7)), ToGray(p=0.01), CLAHE(p=0.01, clip_limit=(1, 4.0), tile_grid_size=(8, 8))


[34m[1mval: [0mScanning /home/jupyter/datasphere/BigData/labels/val.cache... 20605 images, 1510 backgrounds, 1 corrupt: 100%|██████████| 22116/22116 [00:00<?, ?it/s]






Plotting labels to runs/detect/train24/labels.jpg... 
[34m[1moptimizer:[0m AdamW(lr=0.01, momentum=0.937) with parameter groups 106 weight(decay=0.0), 113 weight(decay=0.0005), 112 bias(decay=0.0)
[34m[1mTensorBoard: [0mmodel graph visualization added ✅
Image sizes 640 train, 640 val
Using 4 dataloader workers
Logging results to [1mruns/detect/train24[0m
Starting training for 4 epochs...

      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


        1/4      9.36G      3.296      2.788     0.8746         17        640: 100%|██████████| 4554/4554 [36:27<00:00,  2.08it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 692/692 [04:49<00:00,  2.39it/s]


                   all      22115      20605      0.364      0.138      0.107      0.033

      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


        2/4      9.41G       2.98      2.288     0.8532         19        640: 100%|██████████| 4554/4554 [35:21<00:00,  2.15it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 692/692 [04:51<00:00,  2.37it/s]


                   all      22115      20605      0.377      0.234      0.179     0.0609

      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


        3/4      9.56G      2.769      2.073     0.8426         14        640: 100%|██████████| 4554/4554 [34:58<00:00,  2.17it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 692/692 [04:51<00:00,  2.37it/s]


                   all      22115      20605      0.516      0.235      0.226     0.0841

      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


        4/4      9.41G      2.635      1.918     0.8349         16        640: 100%|██████████| 4554/4554 [34:48<00:00,  2.18it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 692/692 [04:52<00:00,  2.37it/s]


                   all      22115      20605       0.41      0.274      0.229     0.0823

4 epochs completed in 2.692 hours.
Optimizer stripped from runs/detect/train24/weights/last.pt, 40.5MB
Optimizer stripped from runs/detect/train24/weights/best.pt, 40.5MB

Validating runs/detect/train24/weights/best.pt...
Ultralytics 8.3.4 🚀 Python-3.10.12 torch-2.0.1+cu118 CUDA:0 (Tesla T4, 15102MiB)
YOLO11m summary (fused): 303 layers, 20,030,803 parameters, 0 gradients, 67.6 GFLOPs


                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95):  95%|█████████▌| 659/692 [04:34<00:13,  2.51it/s]

# Отчет по качеству модели:

## Первая модель (yolo nano)

![image.png](attachment:4c29cda2-fc2a-4a66-be75-fde94e630958.png)

В целом, можем наблюдать, что с каждой эпохой все метрики демонстрируют неплохой рост. Потери на валидационном наборе данных также снижаются, что позволяет нам говорить о том, что модель не переобучается и способна обобщать данные. При этом мы наблюдаем рост metrics/precision(B), metrics/recall(B) и metrics/mAP50(B), что свидетельствует о повышении качества детекции объектов. Например, metrics/mAP50(B) увеличился с 0.20252 до 0.28099, что является значительным улучшением. В силу того, что фотографий было много, аугментации не применял. Обучение шло относительно долго, поэтому было принято остановиться на 3-х эпохах. Считаю, что продолжив обучение, метрики продолжили бы расти, точность стала бы выше.

## Вторая модель (yolo medium)

![image.png](attachment:0bce3b5f-b1d9-4a79-880c-a0176d2abc46.png)

train/box_loss, train/cls_loss и train/dfl_loss имеют тенденцию к снижению с каждой эпохой, что указывает на улучшение обучения модели. Например, train/box_loss снизился с 3.2963 до 2.635, что свидетельствует о более точном определении границ объектов.
Несмотря на снижение потерь, метрики качества, такие как metrics/mAP50(B), остаются ниже, чем в предыдущем эксперименте, где использовалась более простая модель YOLO. На первой эпохе значение metrics/mAP50(B) составляет 0.10736, что ниже, чем даже на первом этапе предыдущего обучения (0.20252). Скорее всего, это связано с тем, что yolo medium более сложная модель и требует больше эпох для качественного обучения. В целом рост метрик заметен, поэтому продолжить обучение имеет смысл.


## Оценка работы модели на наборе challenge (оценка проводилась на основе фотографий в следующей папке: '/home/jupyter/datasphere/project/data/SoccerNetGS/gamestate-2024/challenge/SNGS-002/img1'

In [None]:
import cv2
import os
from ultralytics import YOLO

# Загрузка обученной модели
model = YOLO('/home/jupyter/datasphere/runs/detect/train21/weights/best.pt')  # Укажите путь к весам модели

# Путь к тестовым изображениям
test_images_path = '/home/jupyter/datasphere/project/data/SoccerNetGS/gamestate-2024/challenge/SNGS-002/img1'  # Укажите директорию с тестовыми изображениями

# Получаем список всех изображений в папке
image_files = [os.path.join(test_images_path, img) for img in os.listdir(test_images_path) if img.endswith(('.png', '.jpg', '.jpeg'))]

# Проходим по всем изображениям
for img_path in image_files:
    # Загружаем изображение
    img = cv2.imread(img_path)

    # Применяем модель YOLO для детекции
    results = model(img)
    
    # Извлекаем координаты детекций
    for result in results:
        boxes = result.boxes.xyxy  # Достаем координаты боксов (x_min, y_min, x_max, y_max)
        for box in boxes:
            # Центр бокса мяча
            x_center = int((box[0] + box[2]) / 2)
            y_center = int((box[1] + box[3]) / 2)

            # Координаты для начала и конца стрелки
            start_point = (x_center, y_center + 20)  # Точка чуть ниже центра мяча
            end_point = (x_center, y_center)  # Центр мяча

            # Рисуем зеленую стрелку, указывающую на мяч
            cv2.arrowedLine(img, start_point, end_point, (0, 255, 0), 3, tipLength=0.5)

    # Генерируем путь для сохранения результатов
    output_img_path = os.path.join(test_images_path, 'results', os.path.basename(img_path))
    os.makedirs(os.path.dirname(output_img_path), exist_ok=True)

    # Сохраняем изображение с нарисованной стрелкой
    cv2.imwrite(output_img_path, img)

print(f'Обработанные изображения сохранены в папке: {os.path.join(test_images_path, "results")}')



0: 384x640 1 boal, 68.6ms
Speed: 2.5ms preprocess, 68.6ms inference, 0.8ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 64.9ms
Speed: 2.2ms preprocess, 64.9ms inference, 0.5ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 1 boal, 66.2ms
Speed: 2.2ms preprocess, 66.2ms inference, 0.7ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 65.5ms
Speed: 2.2ms preprocess, 65.5ms inference, 0.4ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 65.2ms
Speed: 2.3ms preprocess, 65.2ms inference, 0.5ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 60.8ms
Speed: 2.1ms preprocess, 60.8ms inference, 0.4ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 1 boal, 60.7ms
Speed: 2.2ms preprocess, 60.7ms inference, 0.6ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 60.9ms
Speed: 2.4ms preprocess, 60.9ms inference, 0.4ms postprocess

# Детекция мяча + трекинг + интерполяция (Исходный фрагмент взял из интернета, его прикреплю в письме)

In [4]:
import cv2
import numpy as np
import pandas as pd
from ultralytics import YOLO

# Загрузка обученной модели
model = YOLO('/home/jupyter/datasphere/runs/detect/train21/weights/best.pt')  # Путь к лучшим весам

# Путь к видео
video_path = '/home/jupyter/datasphere/New Project — сделано в Clipchamp.mp4'
output_video_path = '/home/jupyter/datasphere/runs/detect/train4/output_with_tracking.mp4'  # Указываем путь с расширением .mp4

# Открываем видео
cap = cv2.VideoCapture(video_path)

# Проверяем, открылось ли видео
if not cap.isOpened():
    print("Ошибка: не удалось открыть видео.")
    exit()

# Получаем параметры видео
width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
fps = cap.get(cv2.CAP_PROP_FPS)

# Подготовка для записи видео с результатами
fourcc = cv2.VideoWriter_fourcc(*'mp4v')  # Используем кодек mp4v для записи в формате mp4
out = cv2.VideoWriter(output_video_path, fourcc, fps, (width, height))

# Координаты для визуализации трека
track_points = []

# Порог для выбросов (размер, на сколько текущая точка может отличаться от предыдущей)
threshold_distance = 250

# Функция для проверки выбросов
def is_outlier(new_point, last_point, threshold=threshold_distance):
    if last_point is None:
        return False
    dist = np.sqrt((new_point[0] - last_point[0]) ** 2 + (new_point[1] - last_point[1]) ** 2)
    return dist > threshold

# Функция для интерполяции пропущенных значений
def interpolate_track_points(points):
    # Удаляем точки с None
    valid_points = [(x, y) if x is not None and y is not None else (np.nan, np.nan) for x, y in points]
    
    # Преобразуем список в DataFrame для интерполяции
    df_points = pd.DataFrame(valid_points, columns=['x', 'y'])
    df_points = df_points.interpolate()  # Интерполируем пропущенные значения
    df_points = df_points.bfill()  # Заполняем значения до интерполяции, если начало данных отсутствует
    df_points = df_points.ffill()  # Заполняем значения после интерполяции, если есть пропуски в конце
    return df_points.to_numpy().tolist()

# Чтение кадров и детекция мяча
while cap.isOpened():
    ret, frame = cap.read()
    if not ret:
        break

    # Применяем модель YOLO для детекции мяча на каждом кадре
    results = model(frame)
    
    # Извлекаем координаты детекций
    for result in results:
        boxes = result.boxes.xyxy  # Достаем координаты боксов (x_min, y_min, x_max, y_max)
        for box in boxes:
            # Центр бокса мяча
            x_center = int((box[0] + box[2]) / 2)
            y_center = int((box[1] + box[3]) / 2)

            # Проверяем, если координаты сильно отличаются от предыдущих, то это выброс
            if track_points and is_outlier((x_center, y_center), track_points[-1]):
                print("Обнаружен выброс, интерполяция...")
                track_points.append((np.nan, np.nan))  # Добавляем NaN для последующей интерполяции
            else:
                # Добавляем в список точек для трека
                track_points.append((x_center, y_center))

            # Рисуем детекцию на кадре
            cv2.circle(frame, (x_center, y_center), 5, (0, 255, 0), -1)

            # Рисуем треугольник над мячом
            triangle_points = np.array([[x_center, y_center - 10], 
                                         [x_center - 5, y_center - 15], 
                                         [x_center + 5, y_center - 15]], np.int32)
            cv2.fillPoly(frame, [triangle_points], (0, 255, 0))  # Зеленый треугольник

    # Интерполируем координаты для корректного трека
    track_points = interpolate_track_points(track_points)

    # Рисуем градиентный трек на каждом кадре
    for i in range(1, len(track_points)):
        if np.isnan(track_points[i - 1][0]) or np.isnan(track_points[i][0]):
            continue
        
        # Генерация цвета на основе индекса точки
        color = (255, int(255 * (i / len(track_points))), 0)  # Плавный переход от красного к зеленому
        cv2.line(frame, tuple(map(int, track_points[i - 1])), tuple(map(int, track_points[i])), color, 2)

    # Записываем обработанный кадр в видео
    out.write(frame)

# Завершаем работу с видео
cap.release()
out.release()

print(f'Видео с трекингом и интерполяцией сохранено по адресу: {output_video_path}')



0: 384x640 (no detections), 67.6ms
Speed: 3.1ms preprocess, 67.6ms inference, 0.5ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 64.3ms
Speed: 2.0ms preprocess, 64.3ms inference, 0.5ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 63.8ms
Speed: 2.3ms preprocess, 63.8ms inference, 0.5ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 65.7ms
Speed: 2.0ms preprocess, 65.7ms inference, 0.5ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 70.8ms
Speed: 2.2ms preprocess, 70.8ms inference, 0.5ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 63.8ms
Speed: 2.0ms preprocess, 63.8ms inference, 0.4ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 64.8ms
Speed: 2.3ms preprocess, 64.8ms inference, 0.5ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 66.8ms
Speed: 2.1ms preprocess, 66.8ms i

# Отчет по траектории движения мяча

Алгоритм трекинга мяча с использованием модели YOLO реализует подход к детекции и визуализации движения объекта на видео. Он включает в себя загрузку предварительно обученной модели YOLO и обработку видеофайла, где каждый кадр анализируется для нахождения мяча. Координаты детекций используются для отрисовки на видео треугольников, обозначающих положение мяча. Для обработки выбросов, вызванных резкими изменениями в позициях, применяется интерполяция пропущенных значений, что позволяет создать плавный трек движения. Для улучшения качества отслеживания мяча, можно попробовать изменить порог threshold (чтобы отрисовка была в пределах предыдущего положения мяча). Также можно попробовать другой способ интерполяции, чтобы сглаживание выбросов было более плавным.