Обновление библиотеки transformers и импорт неольходимых библиотек

In [None]:
!pip install --upgrade -q git+https://github.com/huggingface/transformers

  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone
  Building wheel for transformers (pyproject.toml) ... [?25l[?25hdone


In [None]:
!pip install ultralytics

Collecting ultralytics
  Downloading ultralytics-8.3.201-py3-none-any.whl.metadata (37 kB)
Collecting ultralytics-thop>=2.0.0 (from ultralytics)
  Downloading ultralytics_thop-2.0.17-py3-none-any.whl.metadata (14 kB)
Downloading ultralytics-8.3.201-py3-none-any.whl (1.1 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.1/1.1 MB[0m [31m28.6 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading ultralytics_thop-2.0.17-py3-none-any.whl (28 kB)
Installing collected packages: ultralytics-thop, ultralytics
Successfully installed ultralytics-8.3.201 ultralytics-thop-2.0.17


In [None]:
import random
from dataclasses import dataclass
from typing import Any, List, Dict, Optional, Union, Tuple

import cv2
import torch
import requests
import numpy as np
from PIL import Image
import plotly.express as px
import matplotlib.pyplot as plt
import plotly.graph_objects as go
from transformers import AutoModelForMaskGeneration, AutoProcessor, pipeline
from glob import glob
import os
import time
from ultralytics import FastSAM
from google.colab import files

Классы BoundingBox и DetectionResult структурируют данные детекции: первый хранит координаты рамки объекта, второй — всю информацию об обнаруженном объекте (уверенность, метка, рамка, маска).

In [None]:
@dataclass
class BoundingBox:
    xmin: int
    ymin: int
    xmax: int
    ymax: int

    @property
    def xyxy(self) -> List[float]:
        return [self.xmin, self.ymin, self.xmax, self.ymax]

@dataclass
class DetectionResult:
    score: float
    label: str
    box: BoundingBox
    mask: Optional[np.array] = None

    @classmethod
    def from_dict(cls, detection_dict: Dict) -> 'DetectionResult':
        return cls(score=detection_dict['score'],
                   label=detection_dict['label'],
                   box=BoundingBox(xmin=detection_dict['box']['xmin'],
                                   ymin=detection_dict['box']['ymin'],
                                   xmax=detection_dict['box']['xmax'],
                                   ymax=detection_dict['box']['ymax']))

In [None]:
def plot_detections(
    image: Union[Image.Image, np.ndarray],
    detections: List[DetectionResult],
    save_name: Optional[str] = None
) -> None:
    """
    Визуализирует изображение с наложенными результатами детекции: рисует контуры масок и подписывает объекты.
    При указании save_name — сохраняет визуализацию в файл, иначе отображает в текущем окне matplotlib.
    """
    annotated_image = annotate(image, detections)
    plt.imshow(annotated_image)
    plt.axis('off')
    if save_name:
        plt.savefig(save_name, bbox_inches='tight')
    plt.show()

In [None]:
def random_named_css_colors(num_colors: int) -> List[str]:
    """
    Возвращает список случайно выбранных именованных CSS-цветов.

    Аргументы:
        num_colors (int): Количество цветов для генерации.

    Возвращает:
        List[str]: Список случайных именованных CSS-цветов.
    """
    named_css_colors = [
        'aliceblue', 'antiquewhite', 'aqua', 'aquamarine', 'azure', 'beige', 'bisque', 'black', 'blanchedalmond',
        'blue', 'blueviolet', 'brown', 'burlywood', 'cadetblue', 'chartreuse', 'chocolate', 'coral', 'cornflowerblue',
        'cornsilk', 'crimson', 'cyan', 'darkblue', 'darkcyan', 'darkgoldenrod', 'darkgray', 'darkgreen', 'darkgrey',
        'darkkhaki', 'darkmagenta', 'darkolivegreen', 'darkorange', 'darkorchid', 'darkred', 'darksalmon', 'darkseagreen',
        'darkslateblue', 'darkslategray', 'darkslategrey', 'darkturquoise', 'darkviolet', 'deeppink', 'deepskyblue',
        'dimgray', 'dimgrey', 'dodgerblue', 'firebrick', 'floralwhite', 'forestgreen', 'fuchsia', 'gainsboro', 'ghostwhite',
        'gold', 'goldenrod', 'gray', 'green', 'greenyellow', 'grey', 'honeydew', 'hotpink', 'indianred', 'indigo', 'ivory',
        'khaki', 'lavender', 'lavenderblush', 'lawngreen', 'lemonchiffon', 'lightblue', 'lightcoral', 'lightcyan', 'lightgoldenrodyellow',
        'lightgray', 'lightgreen', 'lightgrey', 'lightpink', 'lightsalmon', 'lightseagreen', 'lightskyblue', 'lightslategray',
        'lightslategrey', 'lightsteelblue', 'lightyellow', 'lime', 'limegreen', 'linen', 'magenta', 'maroon', 'mediumaquamarine',
        'mediumblue', 'mediumorchid', 'mediumpurple', 'mediumseagreen', 'mediumslateblue', 'mediumspringgreen', 'mediumturquoise',
        'mediumvioletred', 'midnightblue', 'mintcream', 'mistyrose', 'moccasin', 'navajowhite', 'navy', 'oldlace', 'olive',
        'olivedrab', 'orange', 'orangered', 'orchid', 'palegoldenrod', 'palegreen', 'paleturquoise', 'palevioletred', 'papayawhip',
        'peachpuff', 'peru', 'pink', 'plum', 'powderblue', 'purple', 'rebeccapurple', 'red', 'rosybrown', 'royalblue', 'saddlebrown',
        'salmon', 'sandybrown', 'seagreen', 'seashell', 'sienna', 'silver', 'skyblue', 'slateblue', 'slategray', 'slategrey',
        'snow', 'springgreen', 'steelblue', 'tan', 'teal', 'thistle', 'tomato', 'turquoise', 'violet', 'wheat', 'white',
        'whitesmoke', 'yellow', 'yellowgreen'
    ]

    return random.sample(named_css_colors, min(num_colors, len(named_css_colors)))

def plot_detections_plotly(
    image: np.ndarray,
    detections: List[DetectionResult],
    class_colors: Optional[Dict[str, str]] = None
) -> None:
    """
    Интерактивная визуализация детекций с масками и рамками на изображении с помощью Plotly.
    Поддерживает переключение отображения отдельных детекций через кнопки управления.
    Если цвета не заданы — генерируются случайные CSS-цвета для каждой детекции.
    Отображает полигон маски, bounding box и метку с уверенностью. Легенда и управление — сверху графика.
    """
    if class_colors is None:
        num_detections = len(detections)
        colors = random_named_css_colors(num_detections)
        class_colors = {}
        for i in range(num_detections):
            class_colors[i] = colors[i]


    fig = px.imshow(image)

    shapes = []
    annotations = []
    for idx, detection in enumerate(detections):
        label = detection.label
        box = detection.box
        score = detection.score
        mask = detection.mask

        polygon = mask_to_polygon(mask)

        fig.add_trace(go.Scatter(
            x=[point[0] for point in polygon] + [polygon[0][0]],
            y=[point[1] for point in polygon] + [polygon[0][1]],
            mode='lines',
            line=dict(color=class_colors[idx], width=2),
            fill='toself',
            name=f"{label}: {score:.2f}"
        ))

        xmin, ymin, xmax, ymax = box.xyxy
        shape = [
            dict(
                type="rect",
                xref="x", yref="y",
                x0=xmin, y0=ymin,
                x1=xmax, y1=ymax,
                line=dict(color=class_colors[idx])
            )
        ]
        annotation = [
            dict(
                x=(xmin+xmax) // 2, y=(ymin+ymax) // 2,
                xref="x", yref="y",
                text=f"{label}: {score:.2f}",
            )
        ]

        shapes.append(shape)
        annotations.append(annotation)

    button_shapes = [dict(label="None",method="relayout",args=["shapes", []])]
    button_shapes = button_shapes + [
        dict(label=f"Detection {idx+1}",method="relayout",args=["shapes", shape]) for idx, shape in enumerate(shapes)
    ]
    button_shapes = button_shapes + [dict(label="All", method="relayout", args=["shapes", sum(shapes, [])])]

    fig.update_layout(
        xaxis=dict(visible=False),
        yaxis=dict(visible=False),
        showlegend=True,
        updatemenus=[
            dict(
                type="buttons",
                direction="up",
                buttons=button_shapes
            )
        ],
        legend=dict(
            orientation="h",
            yanchor="bottom",
            y=1.02,
            xanchor="right",
            x=1
        )
    )

    fig.show()


In [None]:
def mask_to_polygon(mask: np.ndarray) -> List[List[int]]:
    """
    Преобразует бинарную маску объекта в список координат вершин внешнего контура (полигона).
    Используется для визуализации или постобработки формы объекта.
    """
    contours, _ = cv2.findContours(mask.astype(np.uint8), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

    largest_contour = max(contours, key=cv2.contourArea)

    polygon = largest_contour.reshape(-1, 2).tolist()

    return polygon

def polygon_to_mask(polygon: List[Tuple[int, int]], image_shape: Tuple[int, int]) -> np.ndarray:
    """
    Преобразует полигон в бинарную сегментационную маску заданного размера.
    Заполняет область внутри полигона значением 255, остальное — 0.
    Используется для восстановления маски после геометрической обработки.
    """
    mask = np.zeros(image_shape, dtype=np.uint8)

    pts = np.array(polygon, dtype=np.int32)

    cv2.fillPoly(mask, [pts], color=(255,))

    return mask

def load_image(image_str: str) -> Image.Image:
    """
    Загружает изображение из локального пути или URL и конвертирует в RGB-формат.
    Универсальная функция для обработки входных данных пайплайна.
    """
    if image_str.startswith("http"):
        image = Image.open(requests.get(image_str, stream=True).raw).convert("RGB")
    else:
        image = Image.open(image_str).convert("RGB")

    return image

def get_boxes(results: DetectionResult) -> List[List[List[float]]]:
      """
    Извлекает bounding box'ы из списка результатов детекции в формате [xmin, ymin, xmax, ymax].
    Возвращает вложенный список для совместимости с некоторыми API (например, SAM).
    """
    boxes = []
    for result in results:
        xyxy = result.box.xyxy
        boxes.append(xyxy)

    return [boxes]

def refine_masks(masks: torch.BoolTensor, polygon_refinement: bool = False) -> List[np.ndarray]:
      """
    Преобразует тензор масок в список бинарных numpy-масок, опционально улучшая их форму
    через преобразование в полигон и обратно — для сглаживания или удаления шума.
    """
    masks = masks.cpu().float()
    masks = masks.permute(0, 2, 3, 1)
    masks = masks.mean(axis=-1)
    masks = (masks > 0).int()
    masks = masks.numpy().astype(np.uint8)
    masks = list(masks)

    if polygon_refinement:
        for idx, mask in enumerate(masks):
            shape = mask.shape
            polygon = mask_to_polygon(mask)
            mask = polygon_to_mask(polygon, shape)
            masks[idx] = mask

    return masks

In [None]:
_dino_pipeline = None
_sam_model = None
_sam_processor = None

DINO_MODEL_ID = "IDEA-Research/grounding-dino-tiny"

def _get_dino_pipeline(device: str):
        """
    Ленивая загрузка пайплайна Grounding DINO — модель загружается один раз при первом вызове.
    Экономит память и ускоряет повторные запуски.
    """
    global _dino_pipeline
    if _dino_pipeline is None:
        print("⏬ Загружаю Grounding DINO...")
        _dino_pipeline = pipeline(
            model=DINO_MODEL_ID,
            task="zero-shot-object-detection",
            device=device
        )
    return _dino_pipeline

In [None]:
def detect(
    image: Image.Image,
    labels: List[str],
    threshold: float = 0.3,
    detector_id: Optional[str] = None
) -> List[Dict[str, Any]]:
    """
    Детектирует объекты на изображении по текстовым описаниям с помощью Grounding DINO (zero-shot).
    Автоматически добавляет точку к меткам, если её нет. Возвращает структурированные результаты.
    """
    device = "cuda" if torch.cuda.is_available() else "cpu"
    detector_id = detector_id or DINO_MODEL_ID

    object_detector = _get_dino_pipeline(device)

    labels = [label if label.endswith(".") else label + "." for label in labels]

    results = object_detector(image, candidate_labels=labels, threshold=threshold)
    return [DetectionResult.from_dict(result) for result in results]

In [None]:
def segment(
    image: Image.Image,
    detection_results: List[DetectionResult],
    device: str = "cuda"
) -> List[DetectionResult]:
    """
    Использует FastSAM для генерации масок по bounding boxes от DINO.
    """
    img_array = np.array(image)

    for det in detection_results:
        box = det.box.xyxy

        results = fastsam_model.predict(
            source=img_array,
            bboxes=[box],
            device=device,
            retina_masks=True,
            imgsz=max(img_array.shape[:2]),
            conf=0.4,
            iou=0.9,
            verbose=False
        )

        masks = results[0].masks
        if masks is not None:
            mask = masks.data.cpu().numpy()
            mask = cv2.resize(mask[0].astype(np.uint8), (img_array.shape[1], img_array.shape[0]))
            det.mask = (mask > 0).astype(np.uint8)
        else:
            det.mask = None

    return detection_results

In [None]:
def grounded_segmentation(
    image: Union[Image.Image, str],
    labels: List[str],
    threshold: float = 0.3,
    polygon_refinement: bool = False,
    detector_id: Optional[str] = None,
    segmenter_id: Optional[str] = None
) -> Tuple[np.ndarray, List[DetectionResult]]:
    """
    Полный пайплайн: загружает изображение, детектирует объекты по тексту, затем сегментирует их.
    Возвращает массив изображения и список детекций с масками. Готово к визуализации или сохранению.
    """
    if isinstance(image, str):
        image = load_image(image)

    detections = detect(image, labels, threshold)

    detections = segment(image, detections)

    return np.array(image), detections

In [None]:
def annotate(image: np.ndarray, detections: List[DetectionResult]) -> np.ndarray:
    """
    Наносит на изображение контуры масок и подписи с метками и уверенностью.
    Для каждой детекции рисует случайный цвет контура и текст в центре массы маски.
    Возвращает аннотированное изображение в виде массива NumPy.
    """
    image_vis = image.copy()

    for det in detections:
        if det.mask is None:
            continue

        mask_uint8 = (det.mask * 255).astype(np.uint8)

        contours, _ = cv2.findContours(mask_uint8, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

        color = tuple(np.random.randint(0, 255, size=3).tolist())
        cv2.drawContours(image_vis, contours, -1, color, 2)

        M = cv2.moments(contours[0])
        if M["m00"] != 0:
            cx = int(M["m10"] / M["m00"])
            cy = int(M["m01"] / M["m00"])
            cv2.putText(image_vis, f"{det.label}: {det.score:.2f}", (cx, cy - 10),
                        cv2.FONT_HERSHEY_SIMPLEX, 0.5, color, 2)

    return image_vis

In [None]:
import cv2
import numpy as np

def is_shield_shape(contour, tolerance=0.05):
    """
    Проверяет, похож ли контур на щит Т-Банка:
    - аппроксимируется в 5-угольник
    - самый нижний угол острый
    - ось симметрии примерно вертикальная
    """
    perimeter = cv2.arcLength(contour, True)
    approx = cv2.approxPolyDP(contour, tolerance * perimeter, True)

    if len(approx) != 5:
        return False, 0.0

    points = approx.reshape(-1, 2)

    bottom_point = points[np.argmax(points[:, 1])]

    others = np.array([p for p in points if not np.all(p == bottom_point)])

    vectors = others - bottom_point
    angles = []
    for i in range(len(vectors)):
        for j in range(i+1, len(vectors)):
            v1 = vectors[i]
            v2 = vectors[j]
            cos_angle = np.dot(v1, v2) / (np.linalg.norm(v1) * np.linalg.norm(v2) + 1e-6)
            angle = np.arccos(np.clip(cos_angle, -1.0, 1.0))
            angles.append(np.degrees(angle))

    sharp_angle = any(a < 70 for a in angles)

    left_points = [p for p in points if p[0] < bottom_point[0]]
    right_points = [p for p in points if p[0] > bottom_point[0]]
    symmetric = abs(len(left_points) - len(right_points)) <= 1

    score = 1.0 if (sharp_angle and symmetric) else 0.3

    return sharp_angle and symmetric, score


def filter_by_shield_shape(detections: List[DetectionResult], min_area=100):
    """
    Возвращает детекцию с маской, наиболее похожей на щит.
    """
    best_detection = None
    best_score = 0.0

    for det in detections:
        if det.mask is None:
            continue

        mask = det.mask.astype(np.uint8)
        contours, _ = cv2.findContours(mask, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

        if not contours:
            continue

        contour = max(contours, key=cv2.contourArea)

        if cv2.contourArea(contour) < min_area:
            continue

        is_shield, score = is_shield_shape(contour)

        if is_shield and score > best_score:
            best_score = score
            best_detection = det

    return best_detection

Загрузка изображений

In [None]:
!git clone https://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@github.com/KotGregor/bank.git

Cloning into 'bank'...
remote: Enumerating objects: 31140, done.[K
remote: Total 31140 (delta 0), reused 0 (delta 0), pack-reused 31140 (from 1)[K
Receiving objects: 100% (31140/31140), 1.57 GiB | 24.39 MiB/s, done.
Resolving deltas: 100% (1375/1375), done.
Updating files: 100% (20466/20466), done.


Загрузка модели

In [None]:
device = "cuda" if torch.cuda.is_available() else "cpu"
fastsam_model = FastSAM("FastSAM-s.pt")

Creating new Ultralytics Settings v0.0.6 file ✅ 
View Ultralytics Settings with 'yolo settings' or at '/root/.config/Ultralytics/settings.json'
Update Settings with 'yolo settings key=value', i.e. 'yolo settings runs_dir=path/to/dir'. For help see https://docs.ultralytics.com/quickstart/#ultralytics-settings.
[KDownloading https://github.com/ultralytics/assets/releases/download/v8.3.0/FastSAM-s.pt to 'FastSAM-s.pt': 100% ━━━━━━━━━━━━ 22.7MB 89.0MB/s 0.3s


In [None]:
fastsam_model = None

def get_fastsam_model():
    global fastsam_model
    if fastsam_model is None:
        print("Загружаем FastSAM модель...")
        fastsam_model = FastSAM("FastSAM-s.pt")
    return fastsam_model

In [None]:
def process_folder_in_batches(
    input_folder: str,
    output_labels_folder: str,
    batch_index: int = 1,
    batch_size: int = 1000,
    image_extensions: List[str] = ["*.jpg", "*.jpeg", "*.png"],
    model_threshold: float = 0.11,
    imgsz: int = 640
):
    """
    Обрабатывает изображения из папки пачками: детектирует щит Т-Банка, сегментирует, фильтрует по форме,
    сохраняет bounding box в формате YOLO. Пропускает уже обработанные файлы. Логирует ошибки и статистику.
    Оптимизировано для работы на GPU с обработкой OOM-ошибок.
    """
    os.makedirs(output_labels_folder, exist_ok=True)

    image_files = []
    for ext in image_extensions:
        image_files.extend(glob(os.path.join(input_folder, ext)))
    image_files = sorted(image_files)
    print(f"Найдено {len(image_files)} изображений.")

    start_idx = batch_index * batch_size
    end_idx = start_idx + batch_size
    batch_files = image_files[start_idx:end_idx]

    if not batch_files:
        print(f"Нет изображений в батче {batch_index} (files {start_idx}–{end_idx}). Exiting.")
        return

    print(f"Обработка {batch_index}: {len(batch_files)} изображений ({start_idx}–{end_idx-1})...")

    results_log = []
    total_inference_time = 0.0
    total_postprocess_time = 0.0
    processed_count = 0

    fastsam_model = get_fastsam_model()
    device = "cuda" if torch.cuda.is_available() else "cpu"

    for img_path in batch_files:
        try:
            base_name = os.path.splitext(os.path.basename(img_path))[0]
            label_path = os.path.join(output_labels_folder, f"{base_name}.txt")

            if os.path.exists(label_path):
                results_log.append(f"{base_name}.jpg: пропущен (уже существует)")
                continue

            print(f"Обработка: {base_name}")

            t_start = time.time()
            image = load_image(img_path)
            detections = detect(image, ["coat of arms with the letter T in the center"], threshold=model_threshold)
            dino_time = time.time() - t_start

            if not detections:
                with open(label_path, "w") as f:
                    f.write("")
                results_log.append(f"{base_name}.jpg: нет объектов")
                continue

            boxes = [det.box.xyxy for det in detections]
            img_array = np.array(image)

            t_start = time.time()
            try:
                results = fastsam_model.predict(
                    source=img_array,
                    bboxes=boxes,
                    device=device,
                    retina_masks=True,
                    imgsz=imgsz,
                    conf=0.4,
                    iou=0.7,
                    verbose=False
                )

                masks_tensor = results[0].masks
                if masks_tensor is not None:
                    masks = masks_tensor.data.cpu().numpy()
                    orig_h, orig_w = img_array.shape[:2]
                    for i, det in enumerate(masks):
                        mask_resized = cv2.resize(det.astype(np.uint8), (orig_w, orig_h))
                        detections[i].mask = (mask_resized > 0).astype(np.uint8)
                else:
                    for det in detections:
                        det.mask = None
            except torch.cuda.OutOfMemoryError:
                print(f" OOM на {img_path}, пропускаем сегментацию")
                torch.cuda.empty_cache()
                for det in detections:
                    det.mask = None
            fastsam_time = time.time() - t_start
            total_inference_time += dino_time + fastsam_time

            t_start = time.time()
            best_det = filter_by_shield_shape(detections)

            if best_det is None:
                with open(label_path, "w") as f:
                    f.write("")
                results_log.append(f"{base_name}.jpg: not found (shield shape)")
                total_postprocess_time += time.time() - t_start
                continue

            mask = best_det.mask.astype(np.uint8)
            contours, _ = cv2.findContours(mask, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
            if not contours:
                with open(label_path, "w") as f:
                    f.write("")
                results_log.append(f"{base_name}.jpg: no contours after mask")
                total_postprocess_time += time.time() - t_start
                continue

            contour = max(contours, key=cv2.contourArea)
            x_min, y_min, w_bbox, h_bbox = cv2.boundingRect(contour)

            # Нормализация под YOLO
            cv_img = cv2.imread(img_path)
            if cv_img is None:
                raise ValueError("Cannot load image")
            img_h, img_w = cv_img.shape[:2]

            x_center_norm = round((x_min + w_bbox / 2) / img_w, 6)
            y_center_norm = round((y_min + h_bbox / 2) / img_h, 6)
            width_norm = round(w_bbox / img_w, 6)
            height_norm = round(h_bbox / img_h, 6)

            class_id = 0
            yolo_line = f"{class_id} {x_center_norm} {y_center_norm} {width_norm} {height_norm}"

            with open(label_path, "w") as f:
                f.write(yolo_line + "\n")

            print(f"Сохранено: {yolo_line}")
            results_log.append(f"{base_name}.jpg: {yolo_line}")

            postprocess_time = time.time() - t_start
            total_postprocess_time += postprocess_time
            processed_count += 1

            print(f"Инфиренс {dino_time+fastsam_time:.3f}s Постобработка : {postprocess_time:.3f}s")

        except Exception as e:
            print(f"Ошибка на {img_path}: {e}")
            results_log.append(f"{base_name}.jpg: error - {str(e)}")
            with open(label_path, "w") as f:
                f.write("")

    if processed_count > 0:
        avg_inf = total_inference_time / processed_count
        avg_post = total_postprocess_time / processed_count
    else:
        avg_inf = avg_post = 0.0

    # summary = (
    #     f"\n Batch {batch_index} Summary:\n"
    #     f"   Total processed: {processed_count} images\n"
    #     f"   Average inference time (DINO+FastSAM): {avg_inf:.3f} s/image\n"
    #     f"   Average postprocessing time: {avg_post:.3f} s/image\n"
    #     f"   Total time: {total_inference_time + total_postprocess_time:.2f} seconds"
    # )
    # print(summary)
    # results_log.append(summary)

    # Сохраняем лог
    log_path = os.path.join(output_labels_folder, f"log_batch_{batch_index}.txt")
    with open(log_path, "w") as f:
        f.write("\n".join(results_log))

    print(f"\nБатч {batch_index} обработан! Метки сохранены в: {output_labels_folder}")
    print(f"Лог сохранен в: {log_path}")

In [None]:
process_folder_in_batches(
    # input_folder="/content/bank/data_sirius/",
    input_folder='/content/bank/unlabeled/',
    # input_folder="/content/example/",
    output_labels_folder="labels",
    batch_index=0,
    batch_size=5000,
    model_threshold=0.11
)

Скачивание полученных меток

In [None]:
!zip -r 'folder_name.zip' 'labels'

  adding: labels/ (stored 0%)
  adding: labels/00b9158ae93900096c6294ec005979f7.txt (stored 0%)
  adding: labels/000b155124d0b69b7a87329b839506ba.txt (stored 0%)
  adding: labels/000fa3249170062ebebdfa1150ca9f93.txt (deflated 8%)
  adding: labels/log.txt (deflated 43%)
  adding: labels/b0aba3ba849b18c9181326a93d6355f2.txt (deflated 8%)
  adding: labels/00bcf08d00279a3f4b31e3738933638f.txt (deflated 5%)
  adding: labels/00a2d2a83e5457f126624a6301195ac5.txt (stored 0%)


In [None]:
files.download('folder_name.zip')

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>