# тз
done with help of llm

1. Аффинные преобразования
    1. зеркалить
    2. крутить
    3. приближать
    4. растягивать и сжимать (аля с боков)
2. разрешение
3. обрезать
4. дрожь
5. шумы
6. цветофильтры
7. менять скорость
8. изменение яркости и контрастности
9. Гауссово размытие

In [2]:
import os
import cv2
import numpy as np
import random


# Афинные преобразования

In [5]:
def mirror_frame(frame):
    return cv2.flip(frame, 1)

def rotate_frame(frame, angle):
    (h, w) = frame.shape[:2]
    center = (w // 2, h // 2)

    # Матрица поворота
    M = cv2.getRotationMatrix2D(center, angle, 1.0)
    # Применяем аффинное преобразование
    rotated = cv2.warpAffine(frame, M, (w, h), flags=cv2.INTER_LINEAR, borderMode=cv2.BORDER_REFLECT_101)
    return rotated

def zoom_frame(frame, zoom_factor):
    """
    "Зум" кадра с помощью обрезки (crop) и последующего масштабирования к исходному размеру.
    zoom_factor > 1.0 означает увеличение (приближение).
    Например, при zoom_factor=1.2 - кадр обрезается по краям на 20%, затем ресайзится назад.
    """
    if zoom_factor <= 1.0:
        return frame

    (h, w) = frame.shape[:2]

    new_h = int(h / zoom_factor)
    new_w = int(w / zoom_factor)

    top = (h - new_h) // 2
    left = (w - new_w) // 2

    cropped = frame[top:top+new_h, left:left+new_w]

    zoomed = cv2.resize(cropped, (w, h), interpolation=cv2.INTER_LINEAR)
    return zoomed

def stretch_frame(frame, stretch_x, stretch_y):
    """
    Растягивание (или сжатие) кадра независимо по осям X и Y.
    stretch_x и stretch_y — коэффициенты > 0.
    Например, stretch_x=1.2, stretch_y=1.3.
    """
    (h, w) = frame.shape[:2]

    # Матрица для аффинного преобразования
    # Берём за основу единичную матрицу, далее масштабируем по осям
    # Обычно:  [ sx   0    0  ]
    #          [  0  sy    0  ]
    # Но в OpenCV надо указывать через getAffineTransform или warpAffine с M 2x3.
    # Упростим: используем cv2.resize, т.к. это тоже корректное масштабирование.
    
    # Новый размер
    new_w = int(w * stretch_x)
    new_h = int(h * stretch_y)

    stretched = cv2.resize(frame, (new_w, new_h), interpolation=cv2.INTER_LINEAR)
    
    # Чтобы вернуть обратно к исходным габаритам и сохранить форму кадра (если нужно),
    # можно либо сохранить stretched как есть (тогда размеры видео меняются),
    # либо вписать растянутый кадр обратно в исходный размер.
    # Предположим, что мы хотим "фиксированный" размер (h, w) на выходе.
    final = cv2.resize(stretched, (w, h), interpolation=cv2.INTER_LINEAR)

    return final

In [8]:

def process_video(input_path, output_dir, 
                  rotate_count=2,
                  zoom_count=2,
                  stretch_count=2,
                  rotate_range=(-10, 10),
                  zoom_range=(1.0, 1.5),
                  stretch_range=(1.0, 1.5)
                 ):
    """
    Считывает видео input_path и записывает:
      - rotate_count версий со случайным поворотом из rotate_range
      - zoom_count версий со случайным зумом из zoom_range
      - stretch_count версий со случайными независимыми растяжениями по x и y из stretch_range

    Для каждой полученной версии дополнительно создаётся зеркальная (mirror) копия.
    Итого получаем 2 * (rotate_count + zoom_count + stretch_count) новых видео.
    """
    os.makedirs(output_dir, exist_ok=True)
    
    cap = cv2.VideoCapture(input_path)
    if not cap.isOpened():
        print(f"Не удалось открыть видео: {input_path}")
        return
    
    # Общие параметры исходного видео
    fps = cap.get(cv2.CAP_PROP_FPS)
    width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
    height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
    base_name = os.path.splitext(os.path.basename(input_path))[0]

    # Кодек и размер кадра для записи .mp4
    fourcc = cv2.VideoWriter_fourcc(*'mp4v')
    size = (width, height)

    # --- 1) Повороты ---
    for i in range(rotate_count):
        # Случайный угол
        angle = random.uniform(*rotate_range)

        # Файлы для записи (обычный и зеркальный вариант)
        rotate_filename = f"{base_name}_rotate_{i+1}_angle_{int(angle)}.mp4"
        rotate_mirror_filename = f"{base_name}_rotate_{i+1}_angle_{int(angle)}_mirror.mp4"
        
        out_rotate = cv2.VideoWriter(os.path.join(output_dir, rotate_filename), fourcc, fps, size)
        out_rotate_mirror = cv2.VideoWriter(os.path.join(output_dir, rotate_mirror_filename), fourcc, fps, size)

        # Сброс на первый кадр
        cap.set(cv2.CAP_PROP_POS_FRAMES, 0)

        while True:
            ret, frame = cap.read()
            if not ret:
                break
            
            rotated_frame = rotate_frame(frame, angle)
            out_rotate.write(rotated_frame)

            mirrored_frame = mirror_frame(rotated_frame)
            out_rotate_mirror.write(mirrored_frame)

        out_rotate.release()
        out_rotate_mirror.release()

    # --- 2) Зумы ---
    for i in range(zoom_count):
        # Случайный zoom
        zoom_factor = random.uniform(*zoom_range)

        zoom_filename = f"{base_name}_zoom_{i+1}_factor_{round(zoom_factor, 2)}.mp4"
        zoom_mirror_filename = f"{base_name}_zoom_{i+1}_factor_{round(zoom_factor, 2)}_mirror.mp4"
        
        out_zoom = cv2.VideoWriter(os.path.join(output_dir, zoom_filename), fourcc, fps, size)
        out_zoom_mirror = cv2.VideoWriter(os.path.join(output_dir, zoom_mirror_filename), fourcc, fps, size)

        cap.set(cv2.CAP_PROP_POS_FRAMES, 0)

        while True:
            ret, frame = cap.read()
            if not ret:
                break

            zoomed_frame = zoom_frame(frame, zoom_factor)
            out_zoom.write(zoomed_frame)

            mirrored_frame = mirror_frame(zoomed_frame)
            out_zoom_mirror.write(mirrored_frame)

        out_zoom.release()
        out_zoom_mirror.release()

    # --- 3) Растяжения ---
    for i in range(stretch_count):
        # Случайные коэффициенты по X и Y
        stretch_x = random.uniform(*stretch_range)
        stretch_y = random.uniform(*stretch_range)

        stretch_filename = f"{base_name}_stretch_{i+1}_x_{round(stretch_x,2)}_y_{round(stretch_y,2)}.mp4"
        stretch_mirror_filename = f"{base_name}_stretch_{i+1}_x_{round(stretch_x,2)}_y_{round(stretch_y,2)}_mirror.mp4"

        out_stretch = cv2.VideoWriter(os.path.join(output_dir, stretch_filename), fourcc, fps, size)
        out_stretch_mirror = cv2.VideoWriter(os.path.join(output_dir, stretch_mirror_filename), fourcc, fps, size)

        cap.set(cv2.CAP_PROP_POS_FRAMES, 0)

        while True:
            ret, frame = cap.read()
            if not ret:
                break

            stretched_frame = stretch_frame(frame, stretch_x, stretch_y)
            out_stretch.write(stretched_frame)

            mirrored_frame = mirror_frame(stretched_frame)
            out_stretch_mirror.write(mirrored_frame)

        out_stretch.release()
        out_stretch_mirror.release()

    cap.release()
    print(f"Обработка видео '{input_path}' завершена.")




In [11]:
if __name__ == "__main__":
    # Пример использования:
    video_paths = [
        "slovo/all/0000f6de-ba06-43fc-9cc7-3a93f4350b04.mp4",
        "slovo/all/000d1ab2-13a7-4d67-8c4c-c4cce3839e5b.mp4"
    ]
    output_dir = "augmented_videos"  # Папка для сохранения результатов

    # Параметры аугментаций
    rotate_count = 3  # 3 случайных поворота
    zoom_count = 2  # 2 зума
    stretch_count = 2  # 2 растяжения
    
    for vp in video_paths:
        process_video(
            vp, 
            output_dir,
            rotate_count=rotate_count, 
            zoom_count=zoom_count, 
            stretch_count=stretch_count,
            rotate_range=(-10, 10),  # угол поворота ±10°
            zoom_range=(1.0, 1.5),   # зум от 1.0 до 1.5
            stretch_range=(1.0, 1.5) # растяжение от 1.0 до 1.5
        )

Обработка видео 'slovo/all/0000f6de-ba06-43fc-9cc7-3a93f4350b04.mp4' завершена.
Обработка видео 'slovo/all/000d1ab2-13a7-4d67-8c4c-c4cce3839e5b.mp4' завершена.
