# 🧠 Урок 19: Введение в фреймворки глубокого обучения: TensorFlow и Keras
**Цель урока:** Познакомиться с основами фреймворков глубокого обучения, понять, как работают TensorFlow и Keras, и научиться создавать простые нейросети с помощью Keras. Подходит для новичков.

## 📌 Что такое фреймворк для машинного обучения?
- **Фреймворк** — это набор готовых инструментов и библиотек, которые упрощают создание и обучение моделей.
- **Зачем?** Без фреймворков вы бы писали всё с нуля: матричные операции, градиенты, оптимизаторы.
- **Преимущества:**
  - Быстрая разработка.
  - Готовые слои и функции активации.
  - Поддержка GPU/TPU для ускорения вычислений.

💡 **Аналогия:** Представьте, что вы строите дом. Фреймворк — это как набор строительных блоков (кирпичей, бетона), а не ломайте голову, как добывать песок и воду.

## 📦 Обзор TensorFlow и Keras
### 1. TensorFlow
- **Что это?** Мощный фреймворк от Google для глубокого обучения и вычислений с тензорами (многомерными массивами).
- **Особенности:**
  - Поддержка CPU/GPU/TPU.
  - Гибкость: позволяет создавать любые архитектуры.
  - Высокоуровневые и низкоуровневые API.
- **Использование:** Для создания и обучения нейросетей любой сложности [[4]].

### 2. Keras
- **Что это?** Высокоуровневое API для создания нейросетей, встроенное в TensorFlow.
- **Особенности:**
  - Простой синтаксис.
  - Поддерживает Sequential и Functional API.
  - Позволяет быстро экспериментировать [[1]][[7]].
- **Использование:** Для создания моделей без углубления в низкоуровневые детали.

### 3. Кто кого "обертывает"?
- **Keras** — это оболочка над **TensorFlow**.
- **Sequential API** — как LEGO-конструктор: легко собирать модели из готовых блоков.
- **Functional API** — как строительство дома: гибкость, но сложнее для новичков.

## 🛠️ Установка TensorFlow и Keras
### Установка через pip
```bash
pip install tensorflow
```
- **Что устанавливается?** `tensorflow` включает Keras и все необходимые зависимости [[2]][[4]].

### Проверка установки
```python
import tensorflow as tf
print(tf.__version__)
```
- **Если версия не отображается:** Проверьте, активировано ли виртуальное окружение и установлен ли пакет [[2]].

## 🧱 Основные компоненты Keras
### 1. Модель `Sequential`
- **Что это?** Последовательная модель, где слои добавляются один за другим.
- **Пример:**
  ```python
  from tensorflow.keras.models import Sequential
  model = Sequential([
      tf.keras.layers.Dense(64, activation='relu', input_shape=(10,)),
      tf.keras.layers.Dense(1)
  ])
  ```
- **Когда использовать?** Для простых моделей, например, регрессия или классификация [[7]].

### 2. Functional API
- **Что это?** Более гибкий способ создания моделей с нестандартными связями.
- **Пример:**
  ```python
  from tensorflow.keras.layers import Input, Dense
  from tensorflow.keras.models import Model
  
  inputs = Input(shape=(10,))
  x = Dense(64, activation='relu')(inputs)
  outputs = Dense(1)(x)
  model = Model(inputs=inputs, outputs=outputs)
  ```
- **Когда использовать?** Для сложных моделей, например, с несколькими входами или выходами.

## 🧩 Слои в Keras
### 1. `Dense` — Полносвязный слой
- **Что делает?** Каждый нейрон связан со всеми нейронами предыдущего слоя.
- **Где используется?** В задачах регрессии и классификации.
- **Пример:**
  ```python
  tf.keras.layers.Dense(units=64, activation='relu', input_shape=(10,))
  ```

### 2. `Conv2D` — Сверточный слой
- **Что делает?** Обнаруживает локальные паттерны в изображениях.
- **Где используется?** В компьютерном зрении (распознавание лиц, объектов).
- **Пример:**
  ```python
  tf.keras.layers.Conv2D(filters=32, kernel_size=(3, 3), activation='relu')
  ```

### 3. `Flatten` — Преобразование данных
- **Что делает?** Преобразует многомерные данные в одномерные для последующих слоев.
- **Где используется?** После сверточных слоев перед полносвязными [[7]].
- **Пример:**
  ```python
  tf.keras.layers.Flatten()
  ```

## ⚙️ Компиляция модели
### 1. Оптимизатор
- **Что это?** Алгоритм, который минимизирует функцию потерь.
- **Примеры:** `Adam`, `SGD`, `RMSprop`.
- **Как выбрать?** `Adam` — хороший старт для новичков [[7]].

### 2. Функция потерь
- **Для регрессии:** `mse` (среднеквадратичная ошибка).
- **Для классификации:** `binary_crossentropy` (бинарная), `categorical_crossentropy` (многоклассовая).
- **Пример:**
  ```python
  model.compile(optimizer='adam', loss='mse', metrics=['mae'])
  ```

### 3. Метрики
- **accuracy** — для классификации.
- **mae** (средняя абсолютная ошибка) — для регрессии.
- **Пример:**
  ```python
  model.compile(optimizer='adam', loss='mse', metrics=['mae'])
  ```

💡 **Совет:** Метрики не влияют на обучение, только на оценку качества.

## 🧪 Практика: Создание и обучение модели
### Шаг 1: Генерация искусственных данных
```python
import numpy as np
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

# Искусственные данные
X = np.random.rand(1000, 10)
y = np.sum(X, axis=1) + np.random.normal(0, 0.1, 1000)  # Регрессия: y = сумма признаков + шум
```

### Шаг 2: Создание и компиляция модели
```python
# Создание модели
model = Sequential([
    Dense(64, activation='relu', input_shape=(10,)),
    Dense(64, activation='relu'),
    Dense(1)
])

# Компиляция
model.compile(optimizer='adam', loss='mse', metrics=['mae'])
```

### Шаг 3: Обучение модели
```python
# Разделение на обучающую и тестовую выборки
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# Обучение
history = model.fit(X_train, y_train, epochs=10, batch_size=32, validation_data=(X_test, y_test))
```

### Шаг 4: Визуализация обучения
```python
import matplotlib.pyplot as plt

# График loss
plt.plot(history.history['loss'], label='Train Loss')
plt.plot(history.history['val_loss'], label='Test Loss')
plt.legend()
plt.title('Loss по эпохам')
plt.xlabel('Эпохи')
plt.ylabel('MSE')
plt.show()
```

## 📈 Что такое `epochs` и `batch_size`?
- **Epochs** — полный проход по обучающим данным. Например, 10 эпох = модель учится 10 раз на всех данных.
- **Batch size** — количество данных, обрабатываемых за одну итерацию. Чем больше батч, тем быстрее обучение, но выше требования к памяти.
- **Аналогия:** Эпохи — это как прохождение курса обучения, batch_size — как порция данных за раз (например, чашка кофе вместо всей канистры).

### Пример:
```python
history = model.fit(X_train, y_train, epochs=10, batch_size=32)
```
- **epochs=10:** Модель учится 10 раз на всех данных.
- **batch_size=32:** Каждую эпоху данные разбиваются на порции по 32 элемента.

## 📊 Вывод результатов обучения
- **loss:** Ошибка на обучающей выборке.
- **val_loss:** Ошибка на тестовой выборке.
- **metrics:** Метрики, выбранные при компиляции (например, `mae`, `accuracy`).
- **Пример вывода:**
  ```
  Epoch 1/10
  25/25 [==============================] - 0s 10ms/step - loss: 1.2345 - mae: 0.8765 - val_loss: 1.1111 - val_mae: 0.7654
  ```
- **Как читать?**
  - `loss` — уменьшается по мере обучения.
  - `val_loss` — показывает, как модель работает на тестовых данных.
  - `mae` — средняя ошибка предсказания.

## 📝 Домашнее задание
**Задача 1:** Прочитайте документацию Keras по [Sequential API](https://keras.io/guides/sequential_model/ ).
**Задача 2:** Измените архитектуру модели:
- Увеличьте число нейронов во втором слое до 128.
- Добавьте ещё один `Dense(32, activation='relu')`.
- Как меняется `loss` и `val_loss`?
- Как меняется время обучения?
- Нарисуйте график обучения.

💡 **Рекомендации:**
- При изменении архитектуры следите за переобучением (рост `val_loss` при падении `loss`).
- Используйте `plt.plot()` для визуализации.
- Попробуйте разные `batch_size`: 16, 32, 64.

## 🧠 Дополнительная теория: Почему важно использовать GPU?
- **GPU** (графические процессоры) ускоряют вычисления в 10–100 раз по сравнению с CPU.
- **Зачем?** Обучение нейросетей требует множества математических операций, которые GPU выполняет параллельно.
- **Как проверить?**
  ```python
  from tensorflow.python.client import device_lib
  print(device_lib.list_local_devices())  # Покажет доступные устройства (CPU, GPU).
  ```
- **Как использовать GPU?** Убедитесь, что установлена версия TensorFlow с поддержкой GPU (`tensorflow-gpu`).
- **Практика:** В Google Colab можно включить GPU в настройках исполнения.

## 📉 Что такое переобучение и как его избежать?
- **Переобучение (Overfitting):** Модель идеально запоминает тренировочные данные, но плохо работает на тестовых.
- **Причины:**
  - Слишком сложная модель.
  - Недостаток данных.
- **Как бороться:**
  - Упрощение модели.
  - Добавление регуляризации (например, `Dropout`, `L2`).
  - Увеличение данных (например, аугментация).
- **Как обнаружить?** Если `val_loss` растет, а `loss` падает — переобучение!

### Пример:
```python
from tensorflow.keras.layers import Dropout

model = Sequential([
    Dense(64, activation='relu', input_shape=(10,)),
    Dropout(0.2),  # Отключает 20% нейронов на каждой эпохе
    Dense(64, activation='relu'),
    Dense(1)
])
```

## 📊 Как выбрать лучшую модель?
- **Точность (Accuracy):** Подходит для сбалансированных классов.
- **F1-score:** Для несбалансированных задач.
- **ROC-AUC:** Для бинарной классификации.
- **Скоринг в GridSearchCV:** Используйте параметр `scoring` для выбора метрики.
- **Пример:**
  ```python
  from sklearn.model_selection import GridSearchCV
  grid = GridSearchCV(KerasClassifier(build_fn=create_model), param_grid, cv=3, scoring='neg_mean_squared_error')
  ```

## 📈 Графики обучения: как читать и интерпретировать
- **Overfitting:** `loss` падает, `val_loss` растет.
- **Underfitting:** Оба значения высокие, accuracy низкая.
- **Хорошее обучение:** Оба значения стабильны и низкие.
- **Пример:**
  ```python
  import matplotlib.pyplot as plt
  
  # График loss
  plt.plot(history.history['loss'], label='Train Loss')
  plt.plot(history.history['val_loss'], label='Validation Loss')
  plt.legend()
  plt.title('Loss по эпохам')
  plt.xlabel('Эпохи')
  plt.ylabel('MSE')
  plt.show()
  ```

## 🧪 Практика: Обучение модели на регрессии
### Шаг 1: Создание модели
```python
model = Sequential([
    Dense(64, activation='relu', input_shape=(10,)),
    Dense(64, activation='relu'),
    Dense(1)
])
```

### Шаг 2: Компиляция модели
```python
model.compile(optimizer='adam', loss='mse', metrics=['mae'])
```

### Шаг 3: Обучение модели
```python
history = model.fit(X_train, y_train, epochs=50, batch_size=32, validation_data=(X_test, y_test))
```

### Шаг 4: Визуализация обучения
```python
import matplotlib.pyplot as plt

# График loss
plt.plot(history.history['loss'], label='Train Loss')
plt.plot(history.history['val_loss'], label='Validation Loss')
plt.legend()
plt.title('Loss по эпохам')
plt.xlabel('Эпохи')
plt.ylabel('MSE')
plt.grid(True)
plt.show()
```

## 📝 Домашнее задание (расширенное)
**Задача 1:** Прочитайте документацию Keras по [Sequential API](https://keras.io/guides/sequential_model/ ).
**Задача 2:** Измените архитектуру модели:
- Увеличьте число нейронов до 128.
- Добавьте `Dropout(0.2)` после каждого `Dense`.
- Как меняется `loss` и `val_loss`?
- Как меняется время обучения?
- Нарисуйте график обучения.
- Визуализируйте предсказания на тестовой выборке.

💡 **Рекомендации:**
- Используйте `plt.scatter(y_test, y_pred)` для визуализации.
- Следите за `val_loss`: если он растет — уменьшите `batch_size` или добавьте `Dropout`.
- Используйте `history.history.keys()` для анализа доступных метрик.

## ✅ Рекомендации по выполнению домашнего задания
- **Задача 1:** Убедитесь, что вы понимаете, как работают слои и оптимизаторы.
- **Задача 2:** Попробуйте разные значения `units` и `activation`.
- **Визуализация:** Используйте `sns.heatmap` для матрицы ошибок.
- **Подсказка:** Чем больше `units`, тем сложнее модель, но выше риск переобучения.