In [1]:
import torch
print(torch.__version__)
print(torch.cuda.is_available())
print(torch.version.cuda)

2.8.0+cu129
True
12.9


In [None]:
from ultralytics import YOLO
from comet_ml import start

experiment = start(
  api_key="",
  project_name="tree-detector",
  workspace="cheshirsml"
)

model = YOLO('yolo11n-seg.pt')

model.train(
    # --- Основные параметры ---
    data='1/data.yaml',          # путь к файлу датасета в формате YOLO
    epochs=100,                  # количество эпох обучения
    imgsz=1024,                  # размер изображения (int или (h, w))
    batch=4,                     # размер батча (-1 = авто)
    name='tree_detector',        # имя эксперимента (сохраняется в runs/segment/name)
    resume=False,                # возобновить обучение из последнего checkpoint

    # --- Оптимизатор и обучение ---
    optimizer='auto',            # оптимизатор ('SGD', 'Adam', 'AdamW', 'auto')
    lr0=0.01,                    # начальная скорость обучения (для SGD)
    lrf=0.01,                    # конечный коэффициент LR (lr_final = lr0 * lrf)
    momentum=0.937,              # импульс для SGD
    weight_decay=0.0005,         # L2 регуляризация
    warmup_epochs=3.0,           # эпохи прогрева LR
    warmup_momentum=0.8,         # начальный импульс при прогреве
    warmup_bias_lr=0.1,          # LR для bias-слоёв при прогреве
    box=7.5,                     # вес лосса bbox
    cls=0.5,                     # вес лосса классификации
    dfl=1.5,                     # вес Distribution Focal Loss (для bbox регрессии)
    pose=12.0,                   # вес лосса позы (только для pose-моделей)
    kobj=1.0,                    # вес лосса ключевых объектов (pose)
    label_smoothing=0.0,         # сглаживание меток (label smoothing)
    nbs=64,                      # nominal batch size для нормализации градиентов
    hsv_h=0.015,                 # насыщенность Hue (аугментация)
    hsv_s=0.7,                   # насыщенность Saturation (аугментация)
    hsv_v=0.4,                   # яркость Value (аугментация)
    degrees=0.0,                 # поворот (± градусов)
    translate=0.1,               # сдвиг (доли изображения)
    scale=0.5,                   # масштаб (±)
    shear=0.0,                   # сдвиг (± градусов)
    perspective=0.0,             # перспектива (±)
    flipud=0.0,                  # вертикальный флип
    fliplr=0.5,                  # горизонтальный флип
    bgr=0.0,                     # вероятность BGR-перестановки (для симуляции OpenCV)
    mosaic=1.0,                  # вероятность мозаичной аугментации
    mixup=0.0,                   # вероятность MixUp
    copy_paste=0.0,              # вероятность Copy-Paste аугментации (только для сегментации)
    auto_augment='randaugment',  # автоматическая аугментация ('randaugment', 'autoaugment', None)
    erasing=0.4,                 # вероятность случайного стирания (Random Erasing)
    crop_fraction=1.0,           # доля изображения после случайного кадрирования

    # --- Валидация и логирование ---
    val=True,                    # выполнять валидацию каждую эпоху
    plots=True,                  # сохранять графики обучения/валидации
    verbose=True,                # подробный вывод в консоль
    save=True,                   # сохранять чекпоинты
    save_period=-1,              # сохранять каждые N эпох (-1 = только лучший и последний)
    cache=False,                 # кэшировать изображения в RAM/диск ('ram', 'disk', False)
    device='',                   # устройство: 'cpu', 0, '0,1,2,3' и т.д.
    workers=8,                   # число потоков DataLoader (0 = без многопоточности)
    project='runs/segment',      # корневая папка для сохранения результатов
    exist_ok=False,              # разрешить перезапись существующей папки с тем же именем
    pretrained=True,             # использовать предобученные веса (если указан путь к .pt — игнорируется)
    optimizer=None,              # (уже указан выше, оставлено для совместимости; лучше использовать строку)
    seed=0,                      # фиксированный seed для воспроизводимости
    deterministic=True,          # использовать детерминированные алгоритмы (может замедлить обучение)
    single_cls=False,            # обучать как single-class dataset
    rect=False,                  # прямоугольная (rectangular) загрузка изображений для ускорения
    cos_lr=False,                # использовать косинусное затухание LR вместо linear
    close_mosaic=10,             # отключить мозаику за N эпох до конца
    amp=True,                    # использовать автоматическое смешанное точностное обучение (AMP)
    fraction=1.0,                # доля данных для обучения (например, 0.1 = 10% датасета)
    profile=False,               # профилировать ONNX и TensorRT (для экспорта)
    freeze=None,                 # заморозить слои (например, [0, 1, 2] или None)
    multi_scale=False,           # использовать мульти-масштабную загрузку (±50% от imgsz)
    overlap_mask=True,           # разрешить перекрытие масок при аугментации (для сегментации)
    mask_ratio=4,                # уменьшение разрешения маски (маска = imgsz / mask_ratio)
    dropout=0.0,                 # dropout для head-слоёв (только если поддерживается моделью)
    val_freq=1,                  # частота валидации (каждые N эпох)
)

Ultralytics 8.3.203  Python-3.11.0 torch-2.8.0+cu129 CUDA:0 (NVIDIA GeForce RTX 3050, 8191MiB)
[34m[1mengine\trainer: [0magnostic_nms=False, amp=True, augment=False, auto_augment=randaugment, batch=4, bgr=0.0, box=7.5, cache=False, cfg=None, classes=None, close_mosaic=10, cls=0.5, compile=False, conf=None, copy_paste=0.0, copy_paste_mode=flip, cos_lr=False, cutmix=0.0, data=1/data.yaml, degrees=0.0, deterministic=True, device=None, dfl=1.5, dnn=False, dropout=0.0, dynamic=False, embed=None, epochs=100, erasing=0.4, exist_ok=False, fliplr=0.5, flipud=0.0, format=torchscript, fraction=1.0, freeze=None, half=False, hsv_h=0.015, hsv_s=0.7, hsv_v=0.4, imgsz=1024, int8=False, iou=0.7, keras=False, kobj=1.0, line_width=None, lr0=0.01, lrf=0.01, mask_ratio=4, max_det=300, mixup=0.0, mode=train, model=yolo11n-seg.pt, momentum=0.937, mosaic=1.0, multi_scale=False, name=tree_detector2, nbs=64, nms=False, opset=None, optimize=False, optimizer=auto, overlap_mask=True, patience=100, perspective=0

ultralytics.utils.metrics.SegmentMetrics object with attributes:

ap_class_index: array([1])
box: ultralytics.utils.metrics.Metric object
confusion_matrix: <ultralytics.utils.metrics.ConfusionMatrix object at 0x000001F9DCD87810>
curves: ['Precision-Recall(B)', 'F1-Confidence(B)', 'Precision-Confidence(B)', 'Recall-Confidence(B)', 'Precision-Recall(M)', 'F1-Confidence(M)', 'Precision-Confidence(M)', 'Recall-Confidence(M)']
curves_results: [[array([          0,    0.001001,    0.002002,    0.003003,    0.004004,    0.005005,    0.006006,    0.007007,    0.008008,    0.009009,     0.01001,    0.011011,    0.012012,    0.013013,    0.014014,    0.015015,    0.016016,    0.017017,    0.018018,    0.019019,     0.02002,    0.021021,    0.022022,    0.023023,
          0.024024,    0.025025,    0.026026,    0.027027,    0.028028,    0.029029,     0.03003,    0.031031,    0.032032,    0.033033,    0.034034,    0.035035,    0.036036,    0.037037,    0.038038,    0.039039,     0.04004,    0.0410

In [None]:
from ultralytics import YOLO
from comet_ml import start

experiment = start(
    api_key="",
    project_name="tree-detector",
    workspace="cheshirsml"
)

pretrained_weights = "runs/segment/tree_detector2/weights/best.pt"
model = YOLO(pretrained_weights)

train_config = {
    "data": "Segmentation 1.50/sort/1_split/data.yaml",
    "epochs": 1000,
    "imgsz": 1024,
    "batch": 4,
    "workers": 0,
    "name": "tree_detector4",
    "resume": False,
    "pretrained": pretrained_weights,
    "device": "",
    "cache": False,
    "rect": False,
    "amp": True,
    "optimizer": "auto",
    "lr0": 0.01,
    "lrf": 0.01,
    "momentum": 0.937,
    "weight_decay": 0.0005,
    "warmup_epochs": 3.0,
    "warmup_momentum": 0.8,
    "warmup_bias_lr": 0.1,
    "cos_lr": False,
    "box": 7.5,
    "cls": 0.5,
    "dfl": 1.5,
    "overlap_mask": True,
    "mask_ratio": 4,
    "hsv_h": 0.015,
    "hsv_s": 0.7,
    "hsv_v": 0.4,
    "degrees": 0.0,
    "translate": 0.1,
    "scale": 0.5,
    "shear": 0.0,
    "perspective": 0.0,
    "flipud": 0.0,
    "fliplr": 0.5,
    "mosaic": 1.0,
    "mixup": 0.0,
    "copy_paste": 0.0,
    "erasing": 0.4,
    "close_mosaic": 10,
    "val": True,
    "plots": True,
    "verbose": True,
    "save": True,
    "save_period": -1,
    "project": "runs/segment",
    "exist_ok": False,
    "seed": 0,
    "deterministic": True,
    "single_cls": False,
    "fraction": 1.0,
    "multi_scale": False,
    "dropout": 0.0,
    "val_freq": 1,
}

experiment.log_parameters(train_config)

results = model.train(**train_config)

experiment.end()

[1;38;5;39mCOMET INFO:[0m An experiment with the same configuration options is already running and will be reused.


New https://pypi.org/project/ultralytics/8.3.204 available  Update with 'pip install -U ultralytics'
Ultralytics 8.3.203  Python-3.11.0 torch-2.8.0+cu129 CUDA:0 (NVIDIA GeForce RTX 3050, 8191MiB)
[34m[1mengine\trainer: [0magnostic_nms=False, amp=True, augment=False, auto_augment=randaugment, batch=4, bgr=0.0, box=7.5, cache=False, cfg=None, classes=None, close_mosaic=10, cls=0.5, compile=False, conf=None, copy_paste=0.0, copy_paste_mode=flip, cos_lr=False, cutmix=0.0, data=Segmentation 1.50/sort/1_split/data.yaml, degrees=0.0, deterministic=True, device=None, dfl=1.5, dnn=False, dropout=0.0, dynamic=False, embed=None, epochs=1000, erasing=0.4, exist_ok=False, fliplr=0.5, flipud=0.0, format=torchscript, fraction=1.0, freeze=None, half=False, hsv_h=0.015, hsv_s=0.7, hsv_v=0.4, imgsz=1024, int8=False, iou=0.7, keras=False, kobj=1.0, line_width=None, lr0=0.01, lrf=0.01, mask_ratio=4, max_det=300, mixup=0.0, mode=train, model=yolo11n-seg.pt, momentum=0.937, mosaic=1.0, multi_scale=False,

[1;38;5;39mCOMET INFO:[0m An experiment with the same configuration options is already running and will be reused.


Overriding model.yaml nc=80 with nc=4

                   from  n    params  module                                       arguments                     
  0                  -1  1       464  ultralytics.nn.modules.conv.Conv             [3, 16, 3, 2]                 
  1                  -1  1      4672  ultralytics.nn.modules.conv.Conv             [16, 32, 3, 2]                
  2                  -1  1      6640  ultralytics.nn.modules.block.C3k2            [32, 64, 1, False, 0.25]      
  3                  -1  1     36992  ultralytics.nn.modules.conv.Conv             [64, 64, 3, 2]                
  4                  -1  1     26080  ultralytics.nn.modules.block.C3k2            [64, 128, 1, False, 0.25]     
  5                  -1  1    147712  ultralytics.nn.modules.conv.Conv             [128, 128, 3, 2]              
  6                  -1  1     87040  ultralytics.nn.modules.block.C3k2            [128, 128, 1, True]           
  7                  -1  1    295424  ultralytics

[1;38;5;39mCOMET INFO:[0m ---------------------------------------------------------------------------------------
[1;38;5;39mCOMET INFO:[0m Comet.ml Experiment Summary
[1;38;5;39mCOMET INFO:[0m ---------------------------------------------------------------------------------------
[1;38;5;39mCOMET INFO:[0m   Data:
[1;38;5;39mCOMET INFO:[0m     display_summary_level : 1
[1;38;5;39mCOMET INFO:[0m     name                  : innocent_sturgeon_474
[1;38;5;39mCOMET INFO:[0m     url                   : https://www.comet.com/cheshirsml/tree-detector/7b7a294a447e4509a1a71b0eaa856446
[1;38;5;39mCOMET INFO:[0m   Metrics [count] (min, max):
[1;38;5;39mCOMET INFO:[0m     loss [730]                 : (6100.8330078125, 2702337.25)
[1;38;5;39mCOMET INFO:[0m     lr/pg0 [229]               : (0.00038750000000000004, 0.0012462875)
[1;38;5;39mCOMET INFO:[0m     lr/pg1 [229]               : (0.00038750000000000004, 0.0012462875)
[1;38;5;39mCOMET INFO:[0m     lr/pg2 [229]           

In [None]:
model_test = YOLO('runs/segment/tree_detector4/weights/best.pt')  

results = model_test('2/SljyGjDewaw.jpg')  

results[0].show() 


image 1/1 g:\IDE_hakatons\LCT_2025\2\SljyGjDewaw.jpg: 1024x640 3 s, 10.1ms
Speed: 4.0ms preprocess, 10.1ms inference, 2.0ms postprocess per image at shape (1, 3, 1024, 640)
