О, отлично\! Вы выбрали мощные библиотеки для работы с изображениями и машинным обучением. Давайте создадим подробный гайд по их использованию, включая методы, примеры с NumPy и PyTorch, и объяснения.

## Гайд по использованию библиотек для обработки изображений и машинного обучения

Мы рассмотрим следующие библиотеки:

1.  **`opencv-python` (OpenCV)**: Библиотека с открытым исходным кодом для компьютерного зрения.
2.  **`Pillow` (PIL Fork)**: Мощная библиотека для обработки изображений.
3.  **`torchvision`**: Пакет для PyTorch, содержащий популярные наборы данных, архитектуры моделей и преобразования изображений для компьютерного зрения.
4.  **`scikit-image`**: Коллекция алгоритмов для обработки изображений.

Прежде чем начать, убедитесь, что все библиотеки установлены:

```bash
pip install opencv-python pillow torchvision scikit-image numpy torch
```

Для PyTorch вам может потребоваться установить его с поддержкой CUDA, если у вас есть совместимый GPU. Посетите официальный сайт PyTorch для инструкций: [https://pytorch.org/get-started/locally/](https://pytorch.org/get-started/locally/)

-----

### 1\. `opencv-python` (OpenCV)

**Что это?**
OpenCV (Open Source Computer Vision Library) - это обширная библиотека, предназначенная для решения задач компьютерного зрения. Она предоставляет тысячи оптимизированных алгоритмов, которые могут использоваться для обнаружения и распознавания лиц, идентификации объектов, классификации действий человека в видео, отслеживания движущихся объектов, преобразования изображений и многого другого.

**Основные концепции:**

  * Изображения представляются как многомерные массивы NumPy (обычно `ndarray` с типом `uint8`).
  * Цветовые каналы по умолчанию BGR (синий, зеленый, красный), а не RGB.
  * Координаты пикселей обычно (ширина, высота).

**Примеры использования:**

In [None]:
import cv2
import numpy as np
import torch
import matplotlib.pyplot as plt

# Создаем фиктивное изображение NumPy для примеров
# (Вы можете загрузить свое изображение с помощью cv2.imread('путь/к/изображению.jpg'))
img_np = np.zeros((300, 400, 3), dtype=np.uint8) # Черное изображение 300x400
cv2.rectangle(img_np, (50, 50), (200, 250), (0, 255, 0), -1) # Зеленый прямоугольник
cv2.circle(img_np, (300, 100), 70, (255, 0, 0), -1) # Синий круг
cv2.putText(img_np, 'OpenCV', (50, 40), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 255, 255), 2)


print("--- OpenCV Примеры ---")

# 1. Загрузка и отображение изображения
# img = cv2.imread('путь/к/вашему/изображению.jpg')
# if img is None:
#     print("Ошибка: Не удалось загрузить изображение. Проверьте путь.")
# else:
#     cv2.imshow('Исходное изображение', img)
#     cv2.waitKey(0)
#     cv2.destroyAllWindows()

# Используем наше фиктивное изображение для демонстрации
cv2.imshow('Фиктивное изображение OpenCV', img_np)
cv2.waitKey(0)
cv2.destroyAllWindows()


# 2. Преобразование цветового пространства
img_gray = cv2.cvtColor(img_np, cv2.COLOR_BGR2GRAY)
cv2.imshow('Серое изображение', img_gray)
cv2.waitKey(0)
cv2.destroyAllWindows()

# Преобразование в RGB для отображения с Matplotlib (Matplotlib ожидает RGB)
img_rgb = cv2.cvtColor(img_np, cv2.COLOR_BGR2RGB)
plt.imshow(img_rgb)
plt.title('Изображение RGB (через OpenCV)')
plt.show()


# 3. Изменение размера изображения
resized_img = cv2.resize(img_np, (200, 150)) # (ширина, высота)
cv2.imshow('Измененное изображение', resized_img)
cv2.waitKey(0)
cv2.destroyAllWindows()


# 4. Обрезка изображения (ROI - Region of Interest)
roi = img_np[50:250, 100:300] # [y_start:y_end, x_start:x_end]
cv2.imshow('ROI', roi)
cv2.waitKey(0)
cv2.destroyAllWindows()


# 5. Применение размытия (Gaussian Blur)
blurred_img = cv2.GaussianBlur(img_np, (5, 5), 0) # kernel_size (нечетные), sigmaX
cv2.imshow('Размытое изображение', blurred_img)
cv2.waitKey(0)
cv2.destroyAllWindows()


# 6. Обнаружение краев (Canny Edge Detector)
edges = cv2.Canny(img_gray, 100, 200) # threshold1, threshold2
cv2.imshow('Края', edges)
cv2.waitKey(0)
cv2.destroyAllWindows()


# 7. Работа с NumPy и PyTorch

# OpenCV по умолчанию использует NumPy массивы
print(f"\nТип изображения OpenCV: {type(img_np)}")
print(f"Форма изображения OpenCV: {img_np.shape}") # (высота, ширина, каналы)
print(f"Тип данных изображения OpenCV: {img_np.dtype}")

# Преобразование из NumPy в PyTorch Tensor
# OpenCV использует (H, W, C), PyTorch часто ожидает (C, H, W) для сверточных слоев
img_torch_bgr = torch.from_numpy(img_np).permute(2, 0, 1).float() / 255.0 # Переставляем оси, нормализуем
print(f"Форма изображения PyTorch (BGR): {img_torch_bgr.shape}") # (каналы, высота, ширина)

# Если нужно преобразовать в RGB для PyTorch (часто ожидается)
img_rgb_torch = torch.from_numpy(cv2.cvtColor(img_np, cv2.COLOR_BGR2RGB)).permute(2, 0, 1).float() / 255.0
print(f"Форма изображения PyTorch (RGB): {img_rgb_torch.shape}")

# Обратное преобразование из PyTorch Tensor в NumPy (для отображения OpenCV)
# Предполагаем, что тензор нормализован до [0, 1] и имеет форму (C, H, W)
img_back_to_np = (img_torch_bgr.permute(1, 2, 0).numpy() * 255).astype(np.uint8)
cv2.imshow('Обратно в NumPy из PyTorch', img_back_to_np)
cv2.waitKey(0)
cv2.destroyAllWindows()

# Примеры использования с функцией на PyTorch (фикция)
# Предположим, у нас есть модель PyTorch, которая принимает тензор (C, H, W)
class DummyModel(torch.nn.Module):
    def __init__(self):
        super().__init__()
        self.conv = torch.nn.Conv2d(3, 16, kernel_size=3, padding=1)
        self.pool = torch.nn.MaxPool2d(kernel_size=2)

    def forward(self, x):
        return self.pool(self.conv(x))

model = DummyModel()
# Добавляем измерение батча (N, C, H, W)
input_tensor = img_torch_bgr.unsqueeze(0)
output_tensor = model(input_tensor)
print(f"Выходной тензор PyTorch (модель): {output_tensor.shape}")

print("--- Конец примеров OpenCV ---")

**Объяснение методов:**

  * `cv2.imread(path)`: Загружает изображение с указанного пути. Возвращает `None`, если загрузка не удалась.
  * `cv2.imshow(window_name, image)`: Отображает изображение в окне с заданным именем.
  * `cv2.waitKey(delay)`: Ждет нажатия клавиши. `0` означает бесконечное ожидание. Возвращает код нажатой клавиши.
  * `cv2.destroyAllWindows()`: Закрывает все открытые окна OpenCV.
  * `cv2.cvtColor(src, code)`: Преобразует изображение из одного цветового пространства в другое.
      * `cv2.COLOR_BGR2GRAY`: BGR в оттенки серого.
      * `cv2.COLOR_BGR2RGB`: BGR в RGB.
  * `cv2.resize(src, dsize, fx, fy, interpolation)`: Изменяет размер изображения. `dsize` - новый размер `(width, height)`.
  * `cv2.GaussianBlur(src, ksize, sigmaX)`: Применяет гауссовское размытие. `ksize` - размер ядра (должен быть нечетным). `sigmaX` - стандартное отклонение по X.
  * `cv2.Canny(image, threshold1, threshold2)`: Применяет алгоритм обнаружения краев Канни.
  * Работа с NumPy: Изображения в OpenCV - это массивы NumPy. Вы можете получить доступ к пикселям, срезать ROI и выполнять арифметические операции напрямую.
  * Интеграция с PyTorch: Для использования изображений OpenCV в PyTorch их необходимо преобразовать в тензоры PyTorch. Часто требуется изменить порядок осей (с `(H, W, C)` на `(C, H, W)`) и нормализовать значения пикселей (обычно от `[0, 255]` до `[0, 1]`).

-----

### 2\. `Pillow` (PIL Fork)

**Что это?**
Pillow - это дружественная вилка Python Imaging Library (PIL), добавляющая поддержку нескольких новых функций и форматов файлов, а также предоставляющая более удобный способ установки. Это мощная библиотека для общей обработки изображений, такая как изменение размера, обрезка, поворот, цветокоррекция, применение фильтров и работа с различными форматами изображений.

**Основные концепции:**

  * Изображения представляются как объекты `Image`.
  * Цветовые каналы по умолчанию RGB.
  * Координаты пикселей обычно (x, y) где x - ширина, y - высота.

**Примеры использования:**

In [None]:
from PIL import Image, ImageFilter, ImageDraw, ImageFont
import numpy as np
import torch
import matplotlib.pyplot as plt

# Создаем фиктивное изображение Pillow для примеров
# (Вы можете загрузить свое изображение с помощью Image.open('путь/к/изображению.jpg'))
img_pil = Image.new('RGB', (400, 300), color = (0, 0, 0)) # Черное изображение 400x300
draw = ImageDraw.Draw(img_pil)
draw.rectangle([(50, 50), (200, 250)], fill=(0, 255, 0)) # Зеленый прямоугольник
draw.ellipse([(230, 30), (370, 170)], fill=(255, 0, 0)) # Синий круг
draw.text((50, 20), "Pillow", font=ImageFont.truetype("arial.ttf", 30), fill=(255, 255, 255)) # Текст

print("\n--- Pillow Примеры ---")

# 1. Загрузка и отображение изображения
# img = Image.open('путь/к/вашему/изображению.jpg')
# img.show() # Откроет изображение во внешней программе просмотра

# Используем наше фиктивное изображение
img_pil.show(title='Фиктивное изображение Pillow')
plt.imshow(img_pil)
plt.title('Фиктивное изображение Pillow (Matplotlib)')
plt.show()

# 2. Изменение размера изображения
resized_pil = img_pil.resize((200, 150))
resized_pil.show(title='Измененное изображение')

# 3. Обрезка изображения
cropped_pil = img_pil.crop((100, 50, 300, 250)) # (left, upper, right, lower)
cropped_pil.show(title='Обрезанное изображение')

# 4. Поворот изображения
rotated_pil = img_pil.rotate(45)
rotated_pil.show(title='Повернутое изображение')

# 5. Применение фильтров
blurred_pil = img_pil.filter(ImageFilter.BLUR)
blurred_pil.show(title='Размытое изображение')

edges_pil = img_pil.filter(ImageFilter.FIND_EDGES)
edges_pil.show(title='Края (Pillow)')

# 6. Сохранение изображения
# img_pil.save('output_image.png')

# 7. Работа с NumPy и PyTorch

# Преобразование из Pillow Image в NumPy массив
img_np_from_pil = np.array(img_pil)
print(f"\nТип изображения из Pillow в NumPy: {type(img_np_from_pil)}")
print(f"Форма изображения из Pillow в NumPy: {img_np_from_pil.shape}") # (высота, ширина, каналы)
print(f"Тип данных изображения из Pillow в NumPy: {img_np_from_pil.dtype}")

# Преобразование из NumPy массива в Pillow Image
img_pil_from_np = Image.fromarray(img_np_from_pil)
img_pil_from_np.show(title='Из NumPy обратно в Pillow')

# Преобразование из Pillow Image в PyTorch Tensor
# torchvision.transforms.ToTensor() - удобный способ для Pillow -> PyTorch
import torchvision.transforms as transforms
transform = transforms.ToTensor()
img_torch_from_pil = transform(img_pil)
print(f"Форма изображения PyTorch (из Pillow): {img_torch_from_pil.shape}") # (каналы, высота, ширина)

# Обратное преобразование из PyTorch Tensor в Pillow Image
# Предполагаем, что тензор нормализован до [0, 1] и имеет форму (C, H, W)
img_pil_from_torch = transforms.ToPILImage()(img_torch_from_pil)
img_pil_from_torch.show(title='Из PyTorch обратно в Pillow')

print("--- Конец примеров Pillow ---")

**Объяснение методов:**

  * `Image.open(path)`: Загружает изображение.
  * `Image.new(mode, size, color)`: Создает новое изображение. `mode` (например, 'RGB'), `size` `(width, height)`, `color`.
  * `image.show(title)`: Отображает изображение.
  * `image.resize((width, height))` : Изменяет размер изображения.
  * `image.crop((left, upper, right, lower))`: Обрезает изображение.
  * `image.rotate(angle)`: Поворачивает изображение на заданный угол (в градусах).
  * `image.filter(filter)`: Применяет фильтр из `ImageFilter` (например, `ImageFilter.BLUR`, `ImageFilter.FIND_EDGES`).
  * `image.save(path)`: Сохраняет изображение.
  * `np.array(image_pil)`: Преобразует Pillow Image в NumPy массив.
  * `Image.fromarray(numpy_array)`: Преобразует NumPy массив в Pillow Image.
  * Интеграция с PyTorch: `torchvision.transforms.ToTensor()` очень удобен для преобразования Pillow Image в тензор PyTorch (меняет оси и нормализует). `torchvision.transforms.ToPILImage()` делает обратное.

-----

### 3\. `torchvision`

**Что это?**
`torchvision` - это часть экосистемы PyTorch, специально разработанная для задач компьютерного зрения. Она предоставляет:

  * **Наборы данных**: Готовые к использованию наборы данных, такие как MNIST, CIFAR10, ImageNet, с автоматической загрузкой.
  * **Модели**: Предобученные модели глубокого обучения для компьютерного зрения (например, ResNet, VGG, AlexNet) с их весами, которые можно использовать для тонкой настройки или извлечения признаков.
  * **Преобразования (Transforms)**: Модуль `torchvision.transforms` содержит общие преобразования изображений (изменение размера, обрезка, нормализация, аугментация данных), необходимые для подготовки данных для нейронных сетей.

**Основные концепции:**

  * Работает с тензорами PyTorch.
  * Преобразования могут быть объединены в конвейеры (pipelines).
  * Для тренировки моделей часто требуется нормализация изображений.

**Примеры использования:**

In [None]:
import torch
import torchvision
import torchvision.transforms as transforms
from torchvision import datasets, models, ops
import numpy as np
from PIL import Image
import matplotlib.pyplot as plt

print("\n--- torchvision Примеры ---")

# Создаем фиктивное изображение PyTorch Tensor (как если бы оно пришло из Pillow или OpenCV)
# Предположим, что это изображение RGB, нормализованное до [0, 1]
# (C, H, W)
dummy_image_tensor = torch.rand(3, 256, 256) # Случайное изображение 3x256x256

# 1. Преобразования (Transforms)
# Создаем цепочку преобразований
transform_pipeline = transforms.Compose([
    transforms.Resize((128, 128)), # Изменить размер до 128x128
    transforms.CenterCrop(100),    # Обрезать центр до 100x100
    transforms.RandomHorizontalFlip(), # Случайное горизонтальное отражение
    transforms.ToTensor(),         # Преобразовать в тензор (если еще не тензор) и нормализовать [0, 1]
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) # Нормализация для ImageNet
])

# Пример применения преобразований к Pillow Image
img_pil_for_tv = Image.new('RGB', (256, 256), color=(200, 100, 50)) # Случайный цвет
transformed_img_tensor = transform_pipeline(img_pil_for_tv)
print(f"Форма преобразованного тензора (torchvision): {transformed_img_tensor.shape}")

# Для отображения тензора с Matplotlib, нужно его денормализовать и переставить оси
def imshow_tensor(tensor, title=None):
    # Денормализовать (если применялась нормализация)
    inv_normalize = transforms.Normalize(
        mean=[-0.485/0.229, -0.456/0.224, -0.406/0.225],
        std=[1/0.229, 1/0.224, 1/0.225]
    )
    tensor = inv_normalize(tensor)
    image_np = tensor.numpy().transpose((1, 2, 0)) # Переставить C,H,W на H,W,C
    image_np = np.clip(image_np, 0, 1) # Обрезать значения до [0, 1]
    plt.imshow(image_np)
    if title:
        plt.title(title)
    plt.show()

imshow_tensor(transformed_img_tensor, title='Преобразованное изображение (torchvision)')


# 2. Наборы данных (Datasets)
# Загрузка и использование набора данных CIFAR10
# (Первый запуск может занять время для загрузки данных)
print("\nЗагрузка набора данных CIFAR10...")
train_dataset = datasets.CIFAR10(root='./data', train=True, download=True, transform=transforms.ToTensor())
test_dataset = datasets.CIFAR10(root='./data', train=False, download=True, transform=transforms.ToTensor())
print("CIFAR10 загружен.")

# Доступ к элементу набора данных
image, label = train_dataset[0]
print(f"Форма изображения из CIFAR10: {image.shape}, Метка: {label}")
imshow_tensor(image, title=f'Изображение из CIFAR10 (Класс: {train_dataset.classes[label]})')


# Создание DataLoader для пакетирования и перемешивания данных
train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=64, shuffle=True)
test_loader = torch.utils.data.DataLoader(test_dataset, batch_size=64, shuffle=False)

# Итерация по DataLoader
for images, labels in train_loader:
    print(f"Размер батча изображений: {images.shape}, Размер батча меток: {labels.shape}")
    # Дальнейшая обработка (передача в модель и т.д.)
    break # Просто берем один батч для демонстрации


# 3. Модели (Models)
# Загрузка предобученной модели ResNet18
# (Первый запуск может занять время для загрузки весов)
print("\nЗагрузка предобученной модели ResNet18...")
resnet18 = models.resnet18(weights=models.ResNet18_Weights.IMAGENET1K_V1)
print("ResNet18 загружен.")
print(resnet18) # Показывает архитектуру модели

# Использование модели для предсказания (фиктивный пример)
# Добавляем измерение батча и передаем в модель
input_batch = transformed_img_tensor.unsqueeze(0)
with torch.no_grad(): # Отключаем вычисление градиентов для инференса
    output = resnet18(input_batch)
print(f"Выходной размер ResNet18: {output.shape}") # Вероятности для 1000 классов ImageNet

# Изменение последнего слоя для новой задачи (Transfer Learning)
num_ftrs = resnet18.fc.in_features
resnet18.fc = torch.nn.Linear(num_ftrs, 10) # 10 классов для CIFAR10
print("\nResNet18 после изменения выходного слоя:")
print(resnet18.fc)

print("--- Конец примеров torchvision ---")

**Объяснение методов:**

  * **`torchvision.transforms`**:
      * `transforms.Compose([...])`: Объединяет несколько преобразований в одну последовательность.
      * `transforms.Resize(size)`: Изменяет размер изображения до заданного `size` (кортеж `(height, width)` или int для меньшей стороны).
      * `transforms.CenterCrop(size)`: Обрезает центральную часть изображения.
      * `transforms.RandomHorizontalFlip()`: Случайно отражает изображение по горизонтали.
      * `transforms.ToTensor()`: Преобразует PIL Image или NumPy `ndarray` в PyTorch `FloatTensor` (масштабирует значения пикселей до `[0, 1]` и переставляет оси в `(C, H, W)`).
      * `transforms.Normalize(mean, std)`: Нормализует тензор с использованием заданных средних значений и стандартных отклонений (обычно используется для данных ImageNet: `mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]`).
      * `transforms.ToPILImage()`: Преобразует тензор PyTorch обратно в PIL Image.
  * **`torchvision.datasets`**:
      * `datasets.DatasetName(root, train, download, transform)`: Конструктор для загрузки конкретных наборов данных.
          * `root`: Каталог для сохранения данных.
          * `train`: `True` для тренировочного набора, `False` для тестового.
          * `download`: `True` для загрузки, если данные еще не существуют.
          * `transform`: Преобразования, которые нужно применить к изображениям.
  * **`torch.utils.data.DataLoader`**:
      * `DataLoader(dataset, batch_size, shuffle)`: Используется для итерации по набору данных пакетами (батчами).
          * `dataset`: Объект набора данных.
          * `batch_size`: Количество образцов в каждом батче.
          * `shuffle`: `True` для перемешивания данных в каждом эпохе.
  * **`torchvision.models`**:
      * `models.model_name(weights=...)`: Загружает предобученную модель (например, `models.resnet18`). Параметр `weights` позволяет загрузить веса, предобученные на ImageNet (например, `models.ResNet18_Weights.IMAGENET1K_V1`).
      * Изменение последнего слоя (`model.fc` или `model.classifier`): Для использования предобученной модели в новой задаче, часто необходимо заменить последний слой (полносвязный слой) на новый, соответствующий количеству классов вашей задачи.

-----

### 4\. `scikit-image`

**Что это?**
`scikit-image` - это библиотека обработки изображений с открытым исходным кодом, построенная на основе NumPy, SciPy и Matplotlib. Она предоставляет обширный набор алгоритмов для сегментации, геометрических преобразований, цветового пространства, морфологических операций, извлечения признаков и многого другого. Она хорошо интегрируется с другими библиотеками экосистемы SciPy.

**Основные концепции:**

  * Изображения представляются как массивы NumPy (обычно `float` в диапазоне `[0, 1]` для многих функций).
  * Цветовые каналы по умолчанию RGB.
  * Координаты пикселей обычно (строка, столбец) или (высота, ширина).

**Примеры использования:**

In [None]:
import skimage
from skimage import io, data, transform, color, filters, morphology, feature
import numpy as np
import matplotlib.pyplot as plt
import torch

print("\n--- scikit-image Примеры ---")

# Загрузка фиктивного изображения из scikit-image (или создаем свое)
# img_sk = io.imread('путь/к/вашему/изображению.jpg')
img_sk = data.chelsea() # Загружает изображение кота из встроенных данных
img_sk = skimage.img_as_float(img_sk) # Преобразуем в float [0, 1] для многих функций skimage

print(f"Форма изображения scikit-image: {img_sk.shape}")
print(f"Тип данных изображения scikit-image: {img_sk.dtype}")

plt.imshow(img_sk)
plt.title('Исходное изображение (scikit-image)')
plt.show()

# 1. Изменение размера изображения
resized_sk = transform.resize(img_sk, (150, 200)) # (высота, ширина)
plt.imshow(resized_sk)
plt.title('Измененное изображение')
plt.show()

# 2. Преобразование цветового пространства
img_gray_sk = color.rgb2gray(img_sk)
plt.imshow(img_gray_sk, cmap='gray')
plt.title('Серое изображение')
plt.show()

# 3. Применение фильтров
# Gaussian Blur
blurred_sk = filters.gaussian(img_sk, sigma=2)
plt.imshow(blurred_sk)
plt.title('Размытое изображение (Gaussian)')
plt.show()

# Sobel Edge Detector
sobel_edges = filters.sobel(img_gray_sk)
plt.imshow(sobel_edges, cmap='gray')
plt.title('Края (Sobel)')
plt.show()

# 4. Морфологические операции (на бинарном изображении)
# Сначала бинаризуем для примера
binary_img = img_gray_sk > filters.threshold_otsu(img_gray_sk)
eroded_img = morphology.erosion(binary_img, morphology.square(3)) # Эрозия с ядром 3x3
plt.imshow(eroded_img, cmap='gray')
plt.title('Эрозия (Бинарное)')
plt.show()

# 5. Обнаружение признаков (например, углы Harris)
corners = feature.corner_harris(img_gray_sk)
fig, ax = plt.subplots(ncols=1, nrows=1, figsize=(6, 6))
ax.imshow(img_gray_sk, cmap=plt.cm.gray)
ax.plot(feature.corner_peaks(corners, min_distance=5)[:, 1],
        feature.corner_peaks(corners, min_distance=5)[:, 0],
        'ro', markersize=3)
ax.set_title('Углы Harris')
plt.show()


# 6. Работа с NumPy и PyTorch

# scikit-image работает напрямую с массивами NumPy
print(f"\nТип изображения scikit-image: {type(img_sk)}")
print(f"Форма изображения scikit-image: {img_sk.shape}") # (высота, ширина, каналы)
print(f"Тип данных изображения scikit-image: {img_sk.dtype}") # Обычно float

# Преобразование из NumPy (scikit-image) в PyTorch Tensor
# (H, W, C) -> (C, H, W)
img_torch_from_sk = torch.from_numpy(img_sk).permute(2, 0, 1).float()
print(f"Форма изображения PyTorch (из scikit-image): {img_torch_from_sk.shape}")

# Обратное преобразование из PyTorch Tensor в NumPy (для scikit-image)
# Предполагаем, что тензор нормализован до [0, 1] и имеет форму (C, H, W)
img_np_from_torch = img_torch_from_sk.permute(1, 2, 0).numpy()
plt.imshow(img_np_from_torch)
plt.title('Из PyTorch обратно в NumPy (scikit-image)')
plt.show()

print("--- Конец примеров scikit-image ---")

**Объяснение методов:**

  * `skimage.io.imread(path)`: Загружает изображение.
  * `skimage.data.image_name()`: Загружает встроенные демонстрационные изображения.
  * `skimage.img_as_float(image)`: Преобразует изображение в формат `float` в диапазоне `[0, 1]`, что является предпочтительным для многих алгоритмов `scikit-image`.
  * `skimage.transform.resize(image, output_shape)`: Изменяет размер изображения. `output_shape` - кортеж `(rows, cols)` или `(height, width)`.
  * `skimage.color.rgb2gray(image)`: Преобразует RGB изображение в оттенки серого.
  * `skimage.filters.gaussian(image, sigma)`: Применяет гауссовское размытие.
  * `skimage.filters.sobel(image)`: Применяет оператор Собеля для обнаружения краев.
  * `skimage.filters.threshold_otsu(image)`: Вычисляет порог Оцу для бинаризации изображения.
  * `skimage.morphology.erosion(image, selem)`: Применяет операцию эрозии. `selem` - структурный элемент (например, `morphology.square(3)`).
  * `skimage.feature.corner_harris(image)`: Обнаруживает углы с помощью алгоритма Харриса.
  * `skimage.feature.corner_peaks(corners_image, min_distance)`: Извлекает координаты пиков углов.
  * Работа с NumPy: scikit-image оперирует непосредственно с массивами NumPy.
  * Интеграция с PyTorch: Аналогично OpenCV, вам нужно будет изменить порядок осей (`.permute`) при преобразовании между `scikit-image` (NumPy `(H, W, C)`) и PyTorch (`(C, H, W)`) и убедиться, что значения пикселей находятся в ожидаемом диапазоне (обычно `[0, 1]` для PyTorch).

-----

### Общие рекомендации и выводы:

  * **OpenCV** excels in real-time applications, video processing, and traditional computer vision algorithms. Its BGR default and `uint8` data type are important to remember.
  * **Pillow** is great for general image manipulation, opening, saving, and basic filters. It's often used as the first step to load images before converting them to NumPy or PyTorch.
  * **torchvision** is indispensable for deep learning in computer vision. It provides the necessary tools for data loading, augmentation, and pre-trained models, working seamlessly with PyTorch tensors.
  * **scikit-image** offers a strong scientific computing approach to image processing, with a wide array of algorithms for analysis, feature extraction, and segmentation, all built on NumPy. It generally prefers float images in `[0, 1]`.

Выбор библиотеки зависит от вашей конкретной задачи. Часто вы будете использовать комбинацию этих библиотек: например, Pillow для загрузки/сохранения, torchvision для подготовки данных и моделей PyTorch, а OpenCV или scikit-image для более специфических задач обработки изображений до или после этапа глубокого обучения.

Надеюсь, этот гайд будет для вас полезным\!