# Домашнее задание

Ознакомьтесь с приведёнными ниже примерами использования алгоритмов МО и НС для решения задачи распознавания рукописных цифр.

## Порядок выполнения ДЗ

1. Сделайте копию данного блокнота себе на диск. Далее работайте со своей копией блокнота. Сохраняйте вносимые в неё изменения.
2. Ознакомьтесь с теоретическим текстом и кодом из настоящего блокнота.
3. Перенесите примеры кода в отдельные кодовые ячейки и выполните их.
4. Создайте тестовую ячейку, куда запишите ответы на теоретические вопросы.
5. Расшарьте блокнот и используйте ссылку как ответ на ДЗ.

### Учебный пример: Рещение задачи классификация рукописных цифр с использованием машинного обучения, глубокого обучения и нейронных сетей

В этом задании мы будем использовать набор данных MNIST, который содержит изображения рукописных цифр (от 0 до 9). Мы реализуем три различных подхода к классификации этих изображений:

1. **Машинное обучение**: Используем метод k-ближайших соседей (k-NN).
2. **Глубокое обучение**: Используем многослойный перцептрон (MLP).
3. **Нейронные сети**: Используем сверточную нейронную сеть (CNN).

### Шаг 1: Установка библиотек

Установите необходимые библиотеки:

```bash
pip install numpy pandas scikit-learn tensorflow keras
```

### Шаг 2: Загрузка и предобработка данных

```python
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.datasets import fetch_openml
from sklearn.preprocessing import StandardScaler
from tensorflow.keras.utils import to_categorical

# Загрузка данных MNIST
mnist = fetch_openml('mnist_784', version=1)
X, y = mnist.data / 255.0, mnist.target.astype(int)

# Разделение данных на обучающую и тестовую выборки
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```

### Шаг 3: Алгоритм машинного обучения (k-NN)

```python
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score

# Создание и обучение модели k-NN
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)

# Прогнозирование на тестовой выборке
y_pred_knn = knn.predict(X_test)
accuracy_knn = accuracy_score(y_test, y_pred_knn)

print(f'Accuracy of k-NN: {accuracy_knn:.4f}')
```

### Шаг 4: Глубокое обучение (MLP)

```python
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten

# Предобработка меток для MLP
y_train_mlp = to_categorical(y_train, 10)
y_test_mlp = to_categorical(y_test, 10)

# Создание модели MLP
model_mlp = Sequential([
    Flatten(input_shape=(784,)),
    Dense(128, activation='relu'),
    Dense(64, activation='relu'),
    Dense(10, activation='softmax')
])

# Компиляция и обучение модели MLP
model_mlp.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
model_mlp.fit(X_train, y_train_mlp, epochs=10, batch_size=32, validation_split=0.2)

# Оценка модели на тестовой выборке
loss_mlp, accuracy_mlp = model_mlp.evaluate(X_test, y_test_mlp)

print(f'Accuracy of MLP: {accuracy_mlp:.4f}')
```

### Шаг 5: Нейронные сети (CNN)

```python
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Dropout

# Предобработка данных для CNN
X_train_cnn = X_train.values.reshape(-1, 28, 28, 1)
X_test_cnn = X_test.values.reshape(-1, 28, 28, 1)
y_train_cnn = to_categorical(y_train, 10)
y_test_cnn = to_categorical(y_test, 10)

# Создание модели CNN
model_cnn = Sequential([
    Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=(28, 28, 1)),
    MaxPooling2D(pool_size=(2, 2)),
    Dropout(0.25),
    Conv2D(64, kernel_size=(3, 3), activation='relu'),
    MaxPooling2D(pool_size=(2, 2)),
    Dropout(0.25),
    Flatten(),
    Dense(128, activation='relu'),
    Dropout(0.5),
    Dense(10, activation='softmax')
])

# Компиляция и обучение модели CNN
model_cnn.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
model_cnn.fit(X_train_cnn, y_train_cnn, epochs=10, batch_size=32, validation_split=0.2)

# Оценка модели на тестовой выборке
loss_cnn, accuracy_cnn = model_cnn.evaluate(X_test_cnn, y_test_cnn)

print(f'Accuracy of CNN: {accuracy_cnn:.4f}')
```

### Заключение

В этом задании мы реализовали три различных подхода к классификации изображений рукописных цифр с использованием средств машинного обучения (k-NN), глубокого обучения (MLP) и нейронных сетей (CNN). Мы увидели, что каждый из этих подходов имеет свои преимущества и недостатки, и что сложные модели глубокого обучения могут значительно улучшить точность классификации по сравнению с простыми моделями машинного обучения.

### Теоритические вопросы

1. Какие преимущества и недостатки использованных методов вы увидели?
2. В чем, на ваш взгляд, заключается принципиальная разница между многослойным перцептроном и сверточной нейронной сетью?
3. Какие методы предобработки данных были использованы в этом задании?


In [None]:
#Создайте необходимое количество кодовых ячеек и исполните в них приведенный выше код

# Выполнение ДЗ:

---

# **1. Установим необходимые библиотеки:**

In [None]:
!pip install numpy pandas scikit-learn tensorflow keras



# **2. Загрузка и предобработка данных:**

In [None]:
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.datasets import fetch_openml
from sklearn.preprocessing import StandardScaler
from tensorflow.keras.utils import to_categorical

# Загрузка данных MNIST
mnist = fetch_openml('mnist_784', version=1)
X, y = mnist.data / 255.0, mnist.target.astype(int)

# Разделение данных на обучающую и тестовую выборки
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

#**3. Алгоритм машинного обучения (k-NN)**

In [None]:
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score

# Создание и обучение модели k-NN
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)

# Прогнозирование на тестовой выборке
y_pred_knn = knn.predict(X_test)
accuracy_knn = accuracy_score(y_test, y_pred_knn)

print(f'Accuracy of k-NN: {accuracy_knn:.4f}')

Accuracy of k-NN: 0.9713


# **4. Глубокое обучение (MLP)**

In [None]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten

# Предобработка меток для MLP
y_train_mlp = to_categorical(y_train, 10)
y_test_mlp = to_categorical(y_test, 10)

# Создание модели MLP
model_mlp = Sequential([
    Flatten(input_shape=(784,)),
    Dense(128, activation='relu'),
    Dense(64, activation='relu'),
    Dense(10, activation='softmax')
])

# Компиляция и обучение модели MLP
model_mlp.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
model_mlp.fit(X_train, y_train_mlp, epochs=10, batch_size=32, validation_split=0.2)

# Оценка модели на тестовой выборке
loss_mlp, accuracy_mlp = model_mlp.evaluate(X_test, y_test_mlp)

print(f'Accuracy of MLP: {accuracy_mlp:.4f}')

  super().__init__(**kwargs)


Epoch 1/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m7s[0m 4ms/step - accuracy: 0.8580 - loss: 0.4861 - val_accuracy: 0.9583 - val_loss: 0.1340
Epoch 2/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m9s[0m 4ms/step - accuracy: 0.9664 - loss: 0.1107 - val_accuracy: 0.9679 - val_loss: 0.1053
Epoch 3/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m7s[0m 5ms/step - accuracy: 0.9793 - loss: 0.0697 - val_accuracy: 0.9712 - val_loss: 0.0939
Epoch 4/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m8s[0m 3ms/step - accuracy: 0.9834 - loss: 0.0523 - val_accuracy: 0.9679 - val_loss: 0.1073
Epoch 5/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m8s[0m 5ms/step - accuracy: 0.9868 - loss: 0.0417 - val_accuracy: 0.9718 - val_loss: 0.0973
Epoch 6/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m7s[0m 5ms/step - accuracy: 0.9902 - loss: 0.0308 - val_accuracy: 0.9722 - val_loss: 0.0984
Epoch 7/10
[1m1

# **5. Нейронные сети (CNN)**

In [None]:
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Dropout

# Предобработка данных для CNN
X_train_cnn = X_train.values.reshape(-1, 28, 28, 1)
X_test_cnn = X_test.values.reshape(-1, 28, 28, 1)
y_train_cnn = to_categorical(y_train, 10)
y_test_cnn = to_categorical(y_test, 10)

# Создание модели CNN
model_cnn = Sequential([
    Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=(28, 28, 1)),
    MaxPooling2D(pool_size=(2, 2)),
    Dropout(0.25),
    Conv2D(64, kernel_size=(3, 3), activation='relu'),
    MaxPooling2D(pool_size=(2, 2)),
    Dropout(0.25),
    Flatten(),
    Dense(128, activation='relu'),
    Dropout(0.5),
    Dense(10, activation='softmax')
])

# Компиляция и обучение модели CNN
model_cnn.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
model_cnn.fit(X_train_cnn, y_train_cnn, epochs=10, batch_size=32, validation_split=0.2)

# Оценка модели на тестовой выборке
loss_cnn, accuracy_cnn = model_cnn.evaluate(X_test_cnn, y_test_cnn)

print(f'Accuracy of CNN: {accuracy_cnn:.4f}')

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


Epoch 1/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m55s[0m 37ms/step - accuracy: 0.8259 - loss: 0.5354 - val_accuracy: 0.9798 - val_loss: 0.0659
Epoch 2/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m52s[0m 37ms/step - accuracy: 0.9644 - loss: 0.1153 - val_accuracy: 0.9849 - val_loss: 0.0480
Epoch 3/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m82s[0m 37ms/step - accuracy: 0.9754 - loss: 0.0843 - val_accuracy: 0.9863 - val_loss: 0.0442
Epoch 4/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m81s[0m 36ms/step - accuracy: 0.9791 - loss: 0.0716 - val_accuracy: 0.9882 - val_loss: 0.0357
Epoch 5/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m82s[0m 36ms/step - accuracy: 0.9796 - loss: 0.0664 - val_accuracy: 0.9896 - val_loss: 0.0329
Epoch 6/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m81s[0m 36ms/step - accuracy: 0.9850 - loss: 0.0496 - val_accuracy: 0.9877 - val_loss: 0.0395
Epoc

# **Выводы:**

**Теоретические вопросы:**

`1.Какие преимущества и недостатки использованных методов вы увидели?`

Для классификации изображений рукописного ввода используем несколько подходов

Машинное обучение: Используем метод k-ближайших соседей (k-NN).
Глубокое обучение: Используем многослойный перцептрон (MLP).
Нейронные сети: Используем сверточную нейронную сеть (CNN).
Каждый из способов показывает хороший результат точности, но у каждого есть свои плюсы и минусы.

Метод k-ближайших соседей (k-NN)

Плюсы: Алгоритм прост, легко реализуем и имеет достаточную точность для проверки гипотез. Алгоритм универсален - его можно использовать для задач классификации и регрессии. Не чувствителен к выбросам данных. Быстро работает на небольшом объеме данных

Минусы: Алгоритм работает значительно медленнее при увеличении объема данных. Всегда нужно определять оптимальное значение k. Имеет точность ниже чем у других методов

Многослойный перцептрон (MLP)

Плюсы: Небольшое количество скрытых слоев. Короткое время обучения по сравнению со сверточными сетями. Работает на обычных графических устройствах. Имеют бОльшую точность по сравнению с методом k-ближайших соседей.

Минусы: Низкая скорость обучения по сравнению с методом k-ближайших соседей. Необходимость выбирать структуру сети под конкретную задачу. Чувствителен к масштабированию функций, поэтому настоятельно рекомендуется масштабировать данные

Cверточная нейронная сеть (СNN)

Плюсы: Хорошо справляются с огромными наборами данных и эффективно обучаются на графических процессорах за счёт параллельных вычислений. Могут обучаться с помощью различных методов для достижения лучших результатов точности. Могут решать задачи различного характера. Имеют более высокие показатели точности.

Минусы: Продолжительное время обучения (несколько дней и более) для нейронной сети с числом слоёв свёртки свыше двух. Большая вероятность переобучения сети при недостаточном количестве примеров при обучении с учителем. Слишком много варьируемых параметров сети, которые подбираются эмпирическим путем для каждой новой задачи\



---



**`2.В чем, на ваш взгляд, заключается принципиальная разница между многослойным перцептроном и сверточной нейронной сетью?`**

Основным отличием многослойного прецептрона(MLP) от сверточных нейронных сетей(CNN) является продолжительность и сложность обучения. Также у них разная архитектура нейроных слоев. Каждый нейрон в MLP принимает на вход все значения из предыдущего слоя и вычисляет свой выход с использованием активационной функции. Таким образом, сеть может обрабатывать данные в виде плоского вектора. CNN используют свертку (convolution) для извлечения признаков из входных данных.
У MLP данные обрабатываются целиком, у CNN фрагментами. Каждый узел MLP напрямую связан с последующим, в отличии от CNN, которая использует не индивидуальные веса, а разделённые веса - матрицы весов небольшого размера


---



**`3.Какие методы предобработки данных были использованы в этом задании?`**

В приведенном коде используется несколько методов предобработки данных.

1.Нормализация данных:

X, y = mnist.data / 255.0, mnist.target.astype(int)

Здесь данные нормализуются путём деления каждого пикселя изображения на 255, чтобы привести значения пикселей в диапазон от 0 до 1. Это часто используется для улучшения работы моделей машинного обучения, так как уменьшает разброс данных и ускоряет процесс обучения.
Также метки классов (целевые переменные y) преобразуются в целые числа с помощью astype(int), поскольку изначально они могли быть строковыми значениями.

2.Разделение данных на обучающую и тестовую выборки:

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

Здесь используется метод train_test_split для разделения данных на обучающий набор (X_train, y_train) и тестовый набор (X_test, y_test). Аргумент test_size=0.2 означает, что 20% данных используются для тестирования, а 80% — для обучения.
random_state=42 обеспечивает воспроизводимость результата