# 🧠 Урок 21: Введение в компьютерное зрение (CV)
**Цель урока:** Познакомиться с основами компьютерного зрения, понять его задачи и связь с глубоким обучением, научиться выполнять базовые операции с изображениями. Подходит для новичков.

## 📌 Что такое компьютерное зрение?
- **Компьютерное зрение (CV)** — это область машинного обучения, которая позволяет компьютерам "видеть" и анализировать изображения или видео.
- **Задачи CV:**
  - **Классификация:** Определение, что изображено на картинке (например, кошка/собака).
  - **Детекция:** Поиск объектов на изображении (например, лицо на фото).
  - **Сегментация:** Выделение частей изображения (например, органы на МРТ).
- **Аналогия:** Если компьютер — человек, то CV — это его глаза и мозг, которые обрабатывают визуальную информацию [[7]].

💡 **Почему важно?** CV используется в автономных автомобилях, медицине, соцсетях и даже в фильтрах Instagram.

## 📚 История и развитие CV
- **Классические методы:**
  - Обнаружение краев (Canny, Sobel).
  - Цветовые фильтры (например, HSV для выделения цветов).
  - Формирование признаков (SIFT, HOG).
- **Переход к глубокому обучению:**
  - **CNN (сверточные нейросети):** Обнаруживают локальные паттерны (края, формы) через сверточные слои.
  - **Преимущества:** Не требуют ручного извлечения признаков, лучше обобщают на новых данных.

### Пример: Как работает CNN?
- **Conv2D:** Обнаруживает края и углы.
- **MaxPooling:** Уменьшает размер, сохраняя важные детали.
- **Dense:** Классифицирует на основе признаков.

💡 **Аналогия:** CNN — как детектор признаков: первый слой находит края, второй — формы, третий — комбинации признаков.

## 📦 Типы данных и форматы
- **Изображения:** JPEG, PNG, BMP. JPEG — сжатие с потерями, PNG — без потерь, BMP — сырые данные.
- **Видео:** Последовательность кадров (frames) с аудиодорожкой.
- **3D-модели:** Используются в AR/VR, медицине.

### Пример: Загрузка изображения
```python
from PIL import Image
img = Image.open('example.jpg')
print(img.size)  # Размер изображения
```

## 🧰 Базовые операции с изображениями
- **Чтение и отображение:**
  ```python
  import cv2
  img = cv2.imread('example.jpg')
  plt.imshow(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))  # OpenCV использует BGR, matplotlib — RGB
  plt.axis('off')
  plt.show()
  ```
- **Изменение размера:**
  ```python
  resized_img = cv2.resize(img, (100, 100))  # Изменить до 100x100 пикселей
  ```
- **Поворот:**
  ```python
  rows, cols = img.shape[:2]
  M = cv2.getRotationMatrix2D((cols/2, rows/2), 45, 1)  # Поворот на 45 градусов
  rotated_img = cv2.warpAffine(img, M, (cols, rows))
  ```
- **Изменение яркости:**
  ```python
  import numpy as np
  bright_img = cv2.add(img, np.array([50.0]))  # Увеличение яркости
  ```

## 🧪 Практика: Подсчет цветов на изображении
### Шаг 1: Установка библиотек
```bash
pip install opencv-python matplotlib scikit-learn
```

### Шаг 2: Загрузка изображения
```python
import cv2
from sklearn.cluster import KMeans
import numpy as np
import matplotlib.pyplot as plt

# Загрузка и преобразование
img = cv2.imread('example.jpg')
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)  # Преобразование в RGB
plt.imshow(img)
plt.title('Оригинал')
plt.axis('off')
plt.show()
```

### Шаг 3: Подсчет цветов
```python
# Преобразование изображения в 2D-массив
h, w = img.shape[:2]
img_2D = img.reshape(h * w, 3)

# Кластеризация цветов
kmeans = KMeans(n_clusters=5)
kmeans.fit(img_2D)
colors = kmeans.cluster_centers_

# Отображение цветов
bar = np.zeros((100, 500, 3), dtype='uint8')
for i, color in enumerate(colors):
    bar[:, i*100:(i+1)*100, :] = color

plt.imshow(bar)
plt.title('Цветовая палитра')
plt.axis('off')
plt.show()
```

## 🌐 Популярные датасеты CV
- **ImageNet:** 14 млн изображений, 1000 классов.
- **COCO:** Обнаружение объектов, сегментация.
- **CIFAR-10:** 60 тыс. изображений, 10 классов (самолеты, автомобили и т.д.).
- **MNIST:** Рукописные цифры для обучения.

### Пример: Загрузка CIFAR-10
```python
from keras.datasets import cifar10
(X_train, y_train), (X_test, y_test) = cifar10.load_data()
print("Размер данных:", X_train.shape)  # (50000, 32, 32, 3)
```

## 🧱 Сверточные нейросети (CNN)
- **Conv2D (сверточный слой):** Обнаруживает локальные паттерны (края, текстуры).
- **MaxPooling (пулинг):** Уменкрати изображение, сохраняя важные признаки.
- **Flatten:** Преобразует 2D-данные в 1D для полносвязных слоев.
- **Dropout:** Предотвращает переобучение, случайно отключая нейроны.
- **Пример архитектуры:**
```python
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout

model = Sequential([
    Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)),
    MaxPooling2D((2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    MaxPooling2D((2, 2)),
    Flatten(),
    Dense(64, activation='relu'),
    Dropout(0.5),
    Dense(10, activation='softmax')
])
```

## 📊 Реальные приложения CV
- **Распознавание лиц:** Используется в смартфонах для разблокировки.
- **Автопилоты:** Обнаружение дорог, знаков, пешеходов.
- **Медицина:** Диагностика заболеваний по рентгену или МРТ.
- **Робототехника:** Навигация, распознавание объектов.

💡 **Аналогия:** CV — как очки для компьютера, помогающие ему видеть и понимать мир.

## 📝 Домашнее задание
**Задача 1:** Найдите интересный пример применения CV (например, диагностика болезней по снимкам) и подготовьте короткий рассказ (200–300 слов):
- Опишите, где используется CV.
- Какие задачи решаются.
- Какие технологии применяются.
- Почему это важно.

**Задача 2:** Обработайте несколько изображений:
- Измените размер на 200x200 пикселей.
- Поверните на 30 градусов.
- Увеличьте яркость на 50 единиц.
- Сохраните результаты в новые файлы.

In [None]:
# Шаблон для обработки изображений
import cv2
import numpy as np

# Чтение изображения
img = cv2.imread('example.jpg')
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
plt.imshow(img)
plt.title('Оригинал')
plt.axis('off')
plt.show()

In [None]:
# Изменение размера
resized_img = cv2.resize(img, (200, 200))
plt.imshow(resized_img)
plt.title('Измененный размер')
plt.axis('off')
plt.show()

In [None]:
# Поворот
rows, cols = img.shape[:2]
M = cv2.getRotationMatrix2D((cols/2, rows/2), 30, 1)  # Поворот на 30 градусов
rotated_img = cv2.warpAffine(img, M, (cols, rows))
plt.imshow(rotated_img)
plt.title('Повернутое изображение')
plt.axis('off')
plt.show()

In [None]:
# Изменение яркости
bright_img = cv2.add(img, np.array([50.0]))  # Увеличение яркости
plt.imshow(bright_img)
plt.title('Увеличенная яркость')
plt.axis('off')
plt.show()

In [None]:
# Сохранение измененного изображения
cv2.imwrite('resized.jpg', cv2.cvtColor(resized_img, cv2.COLOR_RGB2BGR))
cv2.imwrite('rotated.jpg', cv2.cvtColor(rotated_img, cv2.COLOR_RGB2BGR))
cv2.imwrite('bright.jpg', cv2.cvtColor(bright_img, cv2.COLOR_RGB2BGR))
print("Изображения сохранены!")

## ✅ Рекомендации по выполнению домашнего задания
- **Задача 1:** Используйте Google или Википедию для поиска примеров (например, диагностика рака по МРТ).
- **Задача 2:** Следуйте шаблону, меняя параметры (угол поворота, яркость, размер).
- **Подсказка:** Для сохранения используйте `cv2.imwrite()` с преобразованием в BGR (OpenCV сохраняет в BGR, а не RGB).