In [1]:
import numpy as np
import cv2
from PIL import Image
import scipy.ndimage 
import matplotlib.pyplot as plt 
from sklearn.cluster import KMeans
import os
import re
import subprocess
from scipy.ndimage import median_filter

# Блок со всеми используемыми функциями

In [13]:
"""Попробуем реализовать фильтр log + zero-crossing"""
def log_filter(image: np.ndarray) -> np.ndarray:
    """
    Log фильр, возвращает отфильтрованное изоражение
    Параметры:
        image (np.ndarray): изоражение, получаемое на вход для обработки, изображение должно быть в градациях серого!
    Обработка 2х граничных пикселов не будет проводиться.
    """
    kernel_size = 5
    kernel = np.array([0, 0, -1, 0, 0, 0, -1, -2, -1, 0, -1, -2, 16, -2, -1, 0, -1, -2, -1, 0, 0, 0, -1, 0, 0]).reshape(5, 5)
    h, w = image.shape
    filtered_image = np.zeros((h, w))
    # filtered_image = [cv2.filter2D(image, -1, kernel)]
    for row_index in range(2, h - 2):
        for col_index in range(2, w - 2): 
            summ = 0
            for kernel_row in range(kernel_size):
                for kernel_col in range(kernel_size):
                    summ += image[row_index - 2 + kernel_row][col_index - 2 + kernel_col] * kernel[kernel_row][kernel_col]
            filtered_image[row_index][col_index] = summ
    return filtered_image

def linear_filter(image: np.ndarray) -> np.ndarray:
    """
    Линейный фильтры повышения резкости, возвращает отфильтрованное изоражение
    Параметры:
        image (np.ndarray): изоражение, получаемое на вход для обработки
    В фильтре заданный различные свертки, можно написать свою, главное чтобы сумма всех элиментов = 1
    """
    # kernel = np.array([[-1,-1,-1], [-1,16,-1], [-1,-1,-1]]) / 8
    kernel = np.array([[-2,-1,-2], [-1,22,-1], [-2,-1,-2]]) / 10
    # kernel = 0.2 * np.array([0, -1, -1, -1, 0, -1, 1, 1, 1, -1, -1, 1, 9, 1, -1, -1, 1, 1, 1, -1, 0, -1, -1, -1, 0]).reshape(5, 5)
    # kernel = np.array([0, -1, 0, -1, 10, -1, 0, -1, 0]).reshape(3, 3) / 6
    filtered_image = cv2.filter2D(image, -1, kernel)
    return filtered_image

def zero_crossing(image: np.ndarray) -> np.ndarray:
    """
    Для обнаружения границы как бинарного изображения широко
    используется алгоритм поиска пересечения нуля или нулевого уровня
    (zero-crossing).
    Параметры:
        image (np.ndarray): изоражение, получаемое на вход для обработки, отфильтрованное log фильтром. Изображение должно быть в градациях серого!
    """

    h, w = image.shape

    """
    T - автоматический порог для zero-crossing часто так определяют.
    h, w - высота и ширина изображения.
    """

    T = (3 / (4 * w * h)) * np.sum(np.abs(image)) * 20
    # print(T)
    """
    Важный факт - т.к. у нас имеются пороговые пикселы, необходимо определиться для них, как мы будем проводить для них проверку.
    Для этого имеется несколько вариантов:
        1) Добавить граничные пикселы с нулевым значением;
        2) Добавить граничные пикселы со значениями, идентичными анализируемому пикселу;
        3) Не обрабатывать граничные пикселы.
    Граничные пикселы используются только при обработке, в обработанное изображение они не добавляются.
    Мы будем использовать 2й вариант.
    """
    filtered_image = 255 * np.ones((h, w))
    for row_index in range(h):
        for col_index in range(w): 
            """Сравнение с верхним пикселом"""
            try:
                diff_calculation = abs(image[row_index][col_index] - image[row_index + 1][col_index])
                if (diff_calculation >= T) and \
                    (((image[row_index][col_index]) < 0 and (image[row_index + 1][col_index] > 0)) or ((image[row_index][col_index]) > 0 and (image[row_index + 1][col_index] < 0))):
                    filtered_image[row_index][col_index] = 0
            except:
                pass

            """Сравнение с нижним пикселом"""
            try:
                diff_calculation = abs(image[row_index][col_index] - image[row_index - 1][col_index])
                if (diff_calculation >= T) and \
                    (((image[row_index][col_index]) < 0 and (image[row_index - 1][col_index] > 0)) or ((image[row_index][col_index]) > 0 and (image[row_index - 1][col_index] < 0))):
                    filtered_image[row_index][col_index] = 0
            except:
                pass

            """Сравнение с правым пикселом"""
            try:
                diff_calculation = abs(image[row_index][col_index] - image[row_index][col_index + 1])
                if (diff_calculation >= T) and \
                    (((image[row_index][col_index]) < 0 and (image[row_index][col_index + 1] > 0)) or ((image[row_index][col_index]) > 0 and (image[row_index][col_index + 1] < 0))):
                    filtered_image[row_index][col_index] = 0
            except:
                pass

            """Сравнение с левым пикселом"""
            try:
                diff_calculation = abs(image[row_index][col_index] - image[row_index][col_index - 1])
                if (diff_calculation >= T) and \
                (((image[row_index][col_index]) < 0 and (image[row_index][col_index - 1] > 0)) or ((image[row_index][col_index]) > 0 and (image[row_index][col_index - 1] < 0))):
                    filtered_image[row_index][col_index] = 0
            except:
                pass
    return filtered_image

def kmeans_clustering(image: np.ndarray) -> np.ndarray:
    """
    Кластеризация изображения на 2 класса: над фронтом и пож фронтом.
    Параметры:
        image (np.ndarray): изоражение, получаемое на вход для обработки
    Возвращает массив, где ненулевая часть является той, что над фронтом(но на самом деле разницы нет, т.к. нас все равно интересует только граница)
    """
    n_clusters = 2 # т.к. нужно отделить брюки от питжака + фон, то количество кластеров = 3

    KMEANS = KMeans(n_clusters=n_clusters)
    result = KMEANS.fit(image.reshape(-1, 1))

    images = []
    for i in np.unique(result.labels_):
        image_result = np.zeros_like(image)
        # Маски для каждого элемента
        mask = (result.labels_ == i).reshape(image.shape[:])
        image_result[mask] = image[mask]
        images.append(image_result)

    if np.mean(images[0]) == max(np.mean(images[0]), np.mean(images[1])):
        return images[0]
    else:
        return images[1]
    

def create_video_from_images(images_dir: str, image_format: str = 'jpg' , curr_output_dir: str = None, file_name: str = 'output_video'):
    """
    Функция ,которая объединяет фотографии в видиофайл с расширением avi.
    Параметры:
        images_dir (str): директория, из которой используются файлы для создания видиофайла;
        image_format (str): расширение для используемых изображений, по умолчанию jpg; 
        curr_output_dir (str): директория, в котору будет запиисан итоговый файл, по умолчанию запись идет в ту же директорию, в котором находится файл программы;
        file_name: (str): название выходного файла, по умолчанию называется output_video.
    """
    # Задаем пути к директориям
    output_file = file_name + '.avi'
    if curr_output_dir is not None:
        output_file = os.path.join(curr_output_dir, file_name)
        # Проверяем существование директорий
        if not os.path.exists(curr_output_dir):
            print(f"{curr_output_dir} does not exist, directory created.")
            os.makedirs(curr_output_dir)
    else: 
        pass

    # # Проверяем существование директорий
    if not os.path.exists(images_dir):
        raise FileNotFoundError(f"Directory with images '{images_dir}' not found.")
    
    # Формируем команду для ffmpeg
    ffmpeg_command = [
        'ffmpeg',
        '-framerate', '25',  # Частота кадров
        '-i', os.path.join(images_dir, 'image_%d.' + image_format),  # Шаблон имени файлов
        '-c:v', 'rawvideo',  # Кодек видео для несжатого формата
        '-pix_fmt', 'yuv420p',  # Формат пикселей для совместимости
        output_file
    ]

    # Выполняем команду ffmpeg
    try:
        subprocess.run(ffmpeg_command, check=True)
        print(f"Видео успешно создано:")
    except subprocess.CalledProcessError as e:
        print(f"Ошибка при выполнении команды ffmpeg: {e}")
    except Exception as e:
        print(f"Произошла ошибка: {e}")

# Основная часть

In [None]:
"""
Модуль для записи изоображений из видио файлов
"""
video_file_name = '0.715_5.10.avi'
output_dir = 'video_data'
formation = 'jpg'
if not os.path.exists(output_dir):
        os.makedirs(output_dir)

vidcap = cv2.VideoCapture(video_file_name)
success, image = vidcap.read()
count = 1
while success:
    cv2.imwrite(output_dir+ f"/image_{count}." + formation, image)    
    success, image = vidcap.read()
    if count % 100 == 0:
        print('Saved image ', count)
    count += 1

Saved image  100
Saved image  200
Saved image  300
Saved image  400
Saved image  500
Saved image  600
Saved image  700
Saved image  800
Saved image  900
Saved image  1000


In [None]:
"""С фильтрацией изображений"""

source_directory = output_dir
final_directory = 'front_filtered_bilateral_3linear_median'
numbers_of_images = np.sort(np.array([re.findall('[0-9]+', im)[0] for im in sorted(os.listdir(source_directory))], dtype=int))
for im in numbers_of_images:
    if im % 100 == 0:
        print(f'{im} images computed')
    source_path = source_directory + '/' + f'image_{im}.jpg'
    current_image = cv2.imread(source_path, cv2.IMREAD_GRAYSCALE)
    # Предфильтрация
    current_image = cv2.bilateralFilter(current_image, 15, 50, 50)    
    current_image = linear_filter(current_image)
    current_image = linear_filter(current_image)
    current_image = linear_filter(current_image)
    
    median_filtered_image = median_filter(current_image, size=20) 
    current_image = kmeans_clustering(median_filtered_image)
    current_image = log_filter(current_image)
    current_image = zero_crossing(current_image)
    final_path = final_directory + '/' + f'image_{im}.jpg'
    cv2.imwrite(final_path, current_image) 
print('Computation complite')

100 images computed
200 images computed
300 images computed
400 images computed
500 images computed
600 images computed
700 images computed
800 images computed
900 images computed
1000 images computed
Computation complite


In [None]:
"""Без фильтрации изображений"""
source_directory = output_dir
final_directory = 'front'
numbers_of_images = np.sort(np.array([re.findall('[0-9]+', im)[0] for im in sorted(os.listdir(source_directory))], dtype=int))
for im in numbers_of_images:
    if im % 100 == 0:
        print(f'{im} images computed')
    source_path = source_directory + '/' + f'image_{im}.jpg'
    current_image = cv2.imread(source_path, cv2.IMREAD_GRAYSCALE)
    current_image = kmeans_clustering(current_image)
    current_image = log_filter(current_image)
    current_image = zero_crossing(current_image)
    final_path = final_directory + '/' + f'image_{im}.jpg'
    cv2.imwrite(final_path, current_image) 

279.4130859375
281.72314453125
300.75341796875
296.037109375
290.71533203125
299.50146484375
286.79736328125
263.47314453125
270.681640625
253.87011718750003
262.2197265625
261.69287109375
254.5791015625
252.53125
256.998046875
254.06542968750003
250.03466796875003
248.2978515625
258.52294921875
251.26416015625
259.517578125
269.666015625
296.8984375
286.3466796875
281.23583984375
279.56787109375
275.919921875
269.794921875
276.2763671875
271.5927734375
263.8017578125
247.18701171875
252.66699218750003
250.2919921875
244.54736328125
248.1728515625
249.6337890625
242.98144531250003
246.90869140625
256.08544921875
248.1728515625
259.34375
258.5
264.2783203125
278.41259765625
279.0302734375
271.2861328125
272.2080078125
283.38720703125
287.9091796875
288.89111328125
287.5029296875
275.80810546875
262.02734375
253.52734375
254.2421875
249.8720703125
247.744140625
249.10986328125003
244.72460937500003
251.18994140625003
257.337890625
260.2099609375
256.09326171875
260.6572265625
264.4433593

In [None]:
"""Формирование из изображений видиофайла"""
create_video_from_images(images_dir='front_filtered_bilateral_3linear_median', file_name='output_video_new')