# Домашнее задание

Ознакомьтесь с приведёнными ниже примерами использования алгоритмов МО и НС для решения задачи распознавания рукописных цифр.

## Порядок выполнения ДЗ

1. Сделайте копию данного блокнота себе на диск. Далее работайте со своей копией блокнота. Сохраняйте вносимые в неё изменения.
2. Ознакомьтесь с теоретическим текстом и кодом из настоящего блокнота.
3. Перенесите примеры кода в отдельные кодовые ячейки и выполните их.
4. Создайте тестовую ячейку, куда запишите ответы на теоретические вопросы.
5. Расшарьте блокнот и используйте ссылку как ответ на ДЗ.

### Учебный пример: Рещение задачи классификация рукописных цифр с использованием машинного обучения, глубокого обучения и нейронных сетей

В этом задании мы будем использовать набор данных MNIST, который содержит изображения рукописных цифр (от 0 до 9). Мы реализуем три различных подхода к классификации этих изображений:

1. **Машинное обучение**: Используем метод k-ближайших соседей (k-NN).
2. **Глубокое обучение**: Используем многослойный перцептрон (MLP).
3. **Нейронные сети**: Используем сверточную нейронную сеть (CNN).

### Шаг 1: Установка библиотек

Установите необходимые библиотеки:

```bash
pip install numpy pandas scikit-learn tensorflow keras
```

### Шаг 2: Загрузка и предобработка данных

```python
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.datasets import fetch_openml
from sklearn.preprocessing import StandardScaler
from tensorflow.keras.utils import to_categorical

# Загрузка данных MNIST
mnist = fetch_openml('mnist_784', version=1)
X, y = mnist.data / 255.0, mnist.target.astype(int)

# Разделение данных на обучающую и тестовую выборки
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```

### Шаг 3: Алгоритм машинного обучения (k-NN)

```python
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score

# Создание и обучение модели k-NN
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)

# Прогнозирование на тестовой выборке
y_pred_knn = knn.predict(X_test)
accuracy_knn = accuracy_score(y_test, y_pred_knn)

print(f'Accuracy of k-NN: {accuracy_knn:.4f}')
```

### Шаг 4: Глубокое обучение (MLP)

```python
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten

# Предобработка меток для MLP
y_train_mlp = to_categorical(y_train, 10)
y_test_mlp = to_categorical(y_test, 10)

# Создание модели MLP
model_mlp = Sequential([
    Flatten(input_shape=(784,)),
    Dense(128, activation='relu'),
    Dense(64, activation='relu'),
    Dense(10, activation='softmax')
])

# Компиляция и обучение модели MLP
model_mlp.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
model_mlp.fit(X_train, y_train_mlp, epochs=10, batch_size=32, validation_split=0.2)

# Оценка модели на тестовой выборке
loss_mlp, accuracy_mlp = model_mlp.evaluate(X_test, y_test_mlp)

print(f'Accuracy of MLP: {accuracy_mlp:.4f}')
```

### Шаг 5: Нейронные сети (CNN)

```python
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Dropout

# Предобработка данных для CNN
X_train_cnn = X_train.values.reshape(-1, 28, 28, 1)
X_test_cnn = X_test.values.reshape(-1, 28, 28, 1)
y_train_cnn = to_categorical(y_train, 10)
y_test_cnn = to_categorical(y_test, 10)

# Создание модели CNN
model_cnn = Sequential([
    Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=(28, 28, 1)),
    MaxPooling2D(pool_size=(2, 2)),
    Dropout(0.25),
    Conv2D(64, kernel_size=(3, 3), activation='relu'),
    MaxPooling2D(pool_size=(2, 2)),
    Dropout(0.25),
    Flatten(),
    Dense(128, activation='relu'),
    Dropout(0.5),
    Dense(10, activation='softmax')
])

# Компиляция и обучение модели CNN
model_cnn.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
model_cnn.fit(X_train_cnn, y_train_cnn, epochs=10, batch_size=32, validation_split=0.2)

# Оценка модели на тестовой выборке
loss_cnn, accuracy_cnn = model_cnn.evaluate(X_test_cnn, y_test_cnn)

print(f'Accuracy of CNN: {accuracy_cnn:.4f}')
```

### Заключение

В этом задании мы реализовали три различных подхода к классификации изображений рукописных цифр с использованием средств машинного обучения (k-NN), глубокого обучения (MLP) и нейронных сетей (CNN). Мы увидели, что каждый из этих подходов имеет свои преимущества и недостатки, и что сложные модели глубокого обучения могут значительно улучшить точность классификации по сравнению с простыми моделями машинного обучения.

### Теоритические вопросы

1. Какие преимущества и недостатки использованных методов вы увидели?
2. В чем, на ваш взгляд, заключается принципиальная разница между многослойным перцептроном и сверточной нейронной сетью?
3. Какие методы предобработки данных были использованы в этом задании?


Установка библиотек


In [4]:
!pip install numpy pandas scikit-learn tensorflow keras



Шаг 2: Загрузка и предобработка данных

In [5]:
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.datasets import fetch_openml
from sklearn.preprocessing import StandardScaler
from tensorflow.keras.utils import to_categorical

# Загрузка данных MNIST
mnist = fetch_openml('mnist_784', version=1)
X, y = mnist.data / 255.0, mnist.target.astype(int)

# Разделение данных на обучающую и тестовую выборки
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

Шаг 3: Алгоритм машинного обучения (k-NN)

In [6]:
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score

# Создание и обучение модели k-NN
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)

# Прогнозирование на тестовой выборке
y_pred_knn = knn.predict(X_test)
accuracy_knn = accuracy_score(y_test, y_pred_knn)

print(f'Accuracy of k-NN: {accuracy_knn:.4f}')

Accuracy of k-NN: 0.9713


Шаг 4: Глубокое обучение (MLP)

In [7]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten

# Предобработка меток для MLP
y_train_mlp = to_categorical(y_train, 10)
y_test_mlp = to_categorical(y_test, 10)

# Создание модели MLP
model_mlp = Sequential([
    Flatten(input_shape=(784,)),
    Dense(128, activation='relu'),
    Dense(64, activation='relu'),
    Dense(10, activation='softmax')
])

# Компиляция и обучение модели MLP
model_mlp.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
model_mlp.fit(X_train, y_train_mlp, epochs=10, batch_size=32, validation_split=0.2)

# Оценка модели на тестовой выборке
loss_mlp, accuracy_mlp = model_mlp.evaluate(X_test, y_test_mlp)

print(f'Accuracy of MLP: {accuracy_mlp:.4f}')

  super().__init__(**kwargs)


Epoch 1/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m17s[0m 11ms/step - accuracy: 0.8608 - loss: 0.4745 - val_accuracy: 0.9474 - val_loss: 0.1767
Epoch 2/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m19s[0m 10ms/step - accuracy: 0.9650 - loss: 0.1141 - val_accuracy: 0.9632 - val_loss: 0.1150
Epoch 3/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m17s[0m 12ms/step - accuracy: 0.9781 - loss: 0.0721 - val_accuracy: 0.9693 - val_loss: 0.0973
Epoch 4/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m12s[0m 9ms/step - accuracy: 0.9847 - loss: 0.0520 - val_accuracy: 0.9705 - val_loss: 0.0969
Epoch 5/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m24s[0m 12ms/step - accuracy: 0.9877 - loss: 0.0405 - val_accuracy: 0.9706 - val_loss: 0.1009
Epoch 6/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m18s[0m 13ms/step - accuracy: 0.9897 - loss: 0.0317 - val_accuracy: 0.9734 - val_loss: 0.0928
Epoch

Шаг 5: Нейронные сети (CNN)

In [8]:
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Dropout

# Предобработка данных для CNN
X_train_cnn = X_train.values.reshape(-1, 28, 28, 1)
X_test_cnn = X_test.values.reshape(-1, 28, 28, 1)
y_train_cnn = to_categorical(y_train, 10)
y_test_cnn = to_categorical(y_test, 10)

# Создание модели CNN
model_cnn = Sequential([
    Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=(28, 28, 1)),
    MaxPooling2D(pool_size=(2, 2)),
    Dropout(0.25),
    Conv2D(64, kernel_size=(3, 3), activation='relu'),
    MaxPooling2D(pool_size=(2, 2)),
    Dropout(0.25),
    Flatten(),
    Dense(128, activation='relu'),
    Dropout(0.5),
    Dense(10, activation='softmax')
])

# Компиляция и обучение модели CNN
model_cnn.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
model_cnn.fit(X_train_cnn, y_train_cnn, epochs=10, batch_size=32, validation_split=0.2)

# Оценка модели на тестовой выборке
loss_cnn, accuracy_cnn = model_cnn.evaluate(X_test_cnn, y_test_cnn)

print(f'Accuracy of CNN: {accuracy_cnn:.4f}')

Epoch 1/10


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m320s[0m 227ms/step - accuracy: 0.8102 - loss: 0.5767 - val_accuracy: 0.9801 - val_loss: 0.0658
Epoch 2/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m312s[0m 223ms/step - accuracy: 0.9634 - loss: 0.1230 - val_accuracy: 0.9825 - val_loss: 0.0561
Epoch 3/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m323s[0m 224ms/step - accuracy: 0.9732 - loss: 0.0896 - val_accuracy: 0.9865 - val_loss: 0.0426
Epoch 4/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m318s[0m 222ms/step - accuracy: 0.9772 - loss: 0.0747 - val_accuracy: 0.9882 - val_loss: 0.0404
Epoch 5/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m282s[0m 201ms/step - accuracy: 0.9800 - loss: 0.0640 - val_accuracy: 0.9890 - val_loss: 0.0347
Epoch 6/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m357s[0m 226ms/step - accuracy: 0.9819 - loss: 0.0582 - val_accuracy: 0.9897 - val_loss: 0.0337
Epo

"""Теоритические вопросы
1. Какие преимущества и недостатки использованных методов вы увидели?
2. В чем,на ваш взгляд, заключается принципиальная разница между многослойным перцептроном и сверточной нейронной сетью?
3. Какие методы предобработки данных были использованы в этом задании?
                        ОТВЕТ
1. Преимущества и недостатки использованных методов
                     Преимущества:
Метод k-ближайших соседей (k-NN): Простота и легкость в реализации. Не требует предварительного обучения модели, что
позволяет быстро проводить тестирование. Может быть эффективным на небольших наборах данных.
Многослойный перцептрон (MLP): Способен моделировать сложные нелинейные зависимости. После обучения предсказания
выполняются быстро, так как не требуется анализировать всю обучающую выборку. Гибкость в применении для различных задач
классификации и регрессии.
Сверточная нейронная сеть (CNN): Эффективно извлекает пространственные признаки из изображений, что значительно улучшает
качество классификации. Автоматически определяет важные признаки, что снижает необходимость в ручной предобработке.
Способна обрабатывать изображения с различными размерами и ориентацией.

                        Недостатки:
Метод k-ближайших соседей (k-NN): Высокая вычислительная сложность при предсказании, особенно на больших наборах данных,
так как нужно сравнивать новое значение с каждым элементом обучающей выборки. Чувствителен к шуму и выбросам в данных.
Неэффективен при высокой размерности данных (проклятие размерности).
Многослойный перцептрон (MLP): Требует значительного объема данных для достижения хороших результатов и предотвращения
переобучения. Не оптимизирован для обработки изображений, так как не учитывает пространственные связи между пикселями.
Сверточная нейронная сеть (CNN): Сложность архитектуры и процесса обучения, требующая больше времени и вычислительных
ресурсов. Зависит от подбора гиперпараметров и архитектуры, что может требовать значительных усилий для оптимизации.
Может быть подвержена переобучению при недостаточном количестве данных.

2. Принципиальная разница между многослойным перцептроном и сверточной нейронной сетью.
Основная разница между многослойным перцептроном (MLP) и сверточной нейронной сетью (CNN) заключается в способе
обработки данных:
MLP:
Состоит из полносвязных слоев, где каждый нейрон связан со всеми нейронами предыдущего слоя. Не учитывает
пространственные зависимости, что делает его менее эффективным для обработки изображений. Для работы с изображениями
требуется предварительное преобразование в векторный формат, что может привести к потере информации о пространственной
структуре. CNN:
Использует свертки, которые сосредоточены на локальных участках изображения и позволяют модели выявлять
пространственные зависимости. Содержит слои подвыборки (пулинга), которые уменьшают размерность данных и позволяют
сосредоточиться на наиболее значимых признаках. Имеет меньшую сложность в плане параметров по сравнению с MLP,
что позволяет лучше обобщать на новых данных.

3. Методы предобработки данных В этом задании были использованы следующие методы предобработки данных:
Нормализация:
Данные изображения были нормализованы путем деления на 255, чтобы привести значения пикселей в диапазон от 0 до 1.
Это улучшает сходимость алгоритмов обучения. Разделение выборки:
Данные были разделены на обучающую и тестовую выборки с использованием функции train_test_split, что позволяет оценить
производительность модели на невидимых данных.
Преобразование меток:
Метки классов для MLP были преобразованы в формат one-hot с использованием функции to_categorical, что позволяет
модели корректно интерпретировать многоклассовую задачу.
Изменение формы данных для CNN:
Данные были преобразованы в трехмерный формат (28, 28, 1), что соответствует формату изображений с одним цветовым
каналом (градации серого), позволяя CNN обрабатывать данные должным образом. GPT-4o mini"""