# 🧠 Урок 20: Обучение первой нейросети на изображениях (CIFAR-10)
**Цель урока:** Научиться загружать и готовить датасет CIFAR-10, строить и обучать сверточную нейросеть (CNN) с помощью Keras, понять этапы обработки изображений. Подходит для новичков.

## 📌 Что такое CIFAR-10?
- **CIFAR-10** — это набор данных с 60,000 цветными изображениями размером 32x32 пикселей.
- **Классы:** 10 категорий: самолеты, автомобили, птицы, кошки, олени, собаки, лягушки, лошади, корабли, грузовики.
- **Формат данных:** Каждое изображение представлено массивом 32x32x3 (RGB-каналы).
- **Зачем?** CIFAR-10 — стандартный датасет для обучения компьютерному зрению [[2]](https://example.com ).

💡 **Аналогия:** Представьте, что вы учитесь различать животных по картинкам. CIFAR-10 — это как учебник с заданиями по распознаванию 10 видов животных и транспорта.

In [None]:
# Загрузка CIFAR-10
from keras.datasets import cifar10
import numpy as np

# Загрузка данных
(X_train, y_train), (X_test, y_test) = cifar10.load_data()

# Нормализация пикселей к диапазону [0, 1]
X_train = X_train.astype('float32') / 255.0
X_test = X_test.astype('float32') / 255.0

# One-hot кодирование меток
from keras.utils import to_categorical
y_train = to_categorical(y_train, 10)
y_test = to_categorical(y_test, 10)

## 🧱 Архитектура CNN: почему она работает
- **Сверточные слои (Conv2D):** Ищут локальные признаки (например, края, углы).
- **Пулинг (MaxPooling2D):** Уменьшает размерность, сохраняя важные признаки.
- **Flatten:** Преобразует 2D/3D данные в 1D для полносвязных слоев.
- **Dense:** Полносвязные слои для классификации.
- **Dropout:** Уменьшает переобучение, случайно отключая нейроны.

### Пример архитектуры:
```python
model = Sequential([
    Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)),
    MaxPooling2D((2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    MaxPooling2D((2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    Flatten(),
    Dense(64, activation='relu'),
    Dropout(0.5),
    Dense(10, activation='softmax')
])
```

💡 **Аналогия:** CNN — как детектор признаков: первый слой находит края, второй — формы, третий — комбинации признаков.

## ⚙️ Гиперпараметры: как выбрать?
- **Batch size:** Размер порции данных, обрабатываемых за один шаг.
  - Маленький (32–64): быстрее, но дольше обучение.
  - Большой (128–256): стабильнее, но требует больше памяти.
- **Epochs:** Число проходов по данным.
  - Слишком мало: недообучение.
  - Слишком много: переобучение.
- **Learning rate:** Шаг обучения.
  - По умолчанию: 0.001 (Adam).
  - Маленький: медленное обучение.
  - Большой: модель не сходится.

### Пример:
```python
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
history = model.fit(X_train, y_train, epochs=10, batch_size=64, validation_data=(X_test, y_test))
```

💡 **Совет:** Используйте `validation_data`, чтобы отслеживать переобучение.

## 🧪 Практика: Обучение CNN на CIFAR-10
### Шаг 1: Визуализация данных

In [None]:
import matplotlib.pyplot as plt

# Показ изображения
plt.imshow(X_train[0])
plt.title(f'Метка: {np.argmax(y_train[0])}')
plt.axis('off')
plt.show()

### Шаг 2: Создание модели

In [None]:
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout

# Архитектура CNN
model = Sequential([
    Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)),
    MaxPooling2D((2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    MaxPooling2D((2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    Flatten(),
    Dense(64, activation='relu'),
    Dropout(0.5),
    Dense(10, activation='softmax')
])

### Шаг 3: Компиляция и обучение

In [None]:
# Компиляция
model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# Обучение
history = model.fit(X_train, y_train, 
                  epochs=10,
                  batch_size=64,
                  validation_data=(X_test, y_test))

### Шаг 4: Визуализация обучения

In [None]:
import matplotlib.pyplot as plt

# График точности
plt.plot(history.history['accuracy'], label='Train Accuracy')
plt.plot(history.history['val_accuracy'], label='Test Accuracy')
plt.legend()
plt.title('Accuracy по эпохам')
plt.xlabel('Эпохи')
plt.ylabel('Accuracy')
plt.grid(True)
plt.show()

# График потерь
plt.plot(history.history['loss'], label='Train Loss')
plt.plot(history.history['val_loss'], label='Test Loss')
plt.legend()
plt.title('Loss по эпохам')
plt.xlabel('Эпохи')
plt.ylabel('Loss')
plt.grid(True)
plt.show()

## 📦 Сохранение и загрузка модели
- **Сохранение:**
  ```python
  model.save('cifar10_cnn.h5')
  ```
- **Загрузка:**
  ```python
  from keras.models import load_model
  loaded_model = load_model('cifar10_cnn.h5')
  ```
- **Зачем?** Чтобы не обучать модель заново, а использовать сохраненную для предсказаний или дообучения.

## 📝 Домашнее задание
### Задача 1: Измените архитектуру сети
Добавьте ещё один `Conv2D(128, (3, 3))` и `MaxPooling2D`.

In [None]:
# Ваш код здесь
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout

# Измененная архитектура
modified_model = Sequential([
    Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)),
    MaxPooling2D((2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    MaxPooling2D((2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    # Добавьте сюда новый слой
    # Conv2D(128, (3, 3), activation='relu'),
    # MaxPooling2D((2, 2)),
    Flatten(),
    Dense(64, activation='relu'),
    Dropout(0.5),
    Dense(10, activation='softmax')
])

### Задача 2: Добавьте аугментацию изображений
Используйте `ImageDataGenerator` для поворотов, сдвигов и отражений.

In [None]:
from keras.preprocessing.image import ImageDataGenerator

# Аугментация
datagen = ImageDataGenerator(
    rotation_range=15,
    width_shift_range=0.1,
    height_shift_range=0.1,
    horizontal_flip=True
)
datagen.fit(X_train)

# Обучение с аугментацией
history_aug = model.fit(datagen.flow(X_train, y_train, batch_size=64),
                        epochs=10,
                        validation_data=(X_test, y_test))

## ✅ Рекомендации по выполнению
- **Задача 1:** После добавления новых слоев сравните `loss` и `accuracy` до и после.
- **Задача 2:** Проверьте, как аугментация влияет на `val_loss` и `val_accuracy`.
- **Подсказка:** Используйте `model.summary()` для анализа архитектуры.