In [5]:
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.datasets import fetch_openml
from sklearn.preprocessing import StandardScaler
from tensorflow.keras.utils import to_categorical

# Загрузка данных MNIST
mnist = fetch_openml('mnist_784', version=1)
X, y = mnist.data / 255.0, mnist.target.astype(int)

# Разделение данных на обучающую и тестовую выборки
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [2]:
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score

# Создание и обучение модели k-NN
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)

# Прогнозирование на тестовой выборке
y_pred_knn = knn.predict(X_test)
accuracy_knn = accuracy_score(y_test, y_pred_knn)

print(f'Accuracy of k-NN: {accuracy_knn:.4f}')

Accuracy of k-NN: 0.9713


In [3]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten

# Предобработка меток для MLP
y_train_mlp = to_categorical(y_train, 10)
y_test_mlp = to_categorical(y_test, 10)

# Создание модели MLP
model_mlp = Sequential([
    Flatten(input_shape=(784,)),
    Dense(128, activation='relu'),
    Dense(64, activation='relu'),
    Dense(10, activation='softmax')
])

# Компиляция и обучение модели MLP
model_mlp.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
model_mlp.fit(X_train, y_train_mlp, epochs=10, batch_size=32, validation_split=0.2)

# Оценка модели на тестовой выборке
loss_mlp, accuracy_mlp = model_mlp.evaluate(X_test, y_test_mlp)

print(f'Accuracy of MLP: {accuracy_mlp:.4f}')

  super().__init__(**kwargs)


Epoch 1/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m11s[0m 7ms/step - accuracy: 0.8643 - loss: 0.4737 - val_accuracy: 0.9552 - val_loss: 0.1467
Epoch 2/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m14s[0m 10ms/step - accuracy: 0.9657 - loss: 0.1143 - val_accuracy: 0.9651 - val_loss: 0.1165
Epoch 3/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m12s[0m 4ms/step - accuracy: 0.9762 - loss: 0.0783 - val_accuracy: 0.9693 - val_loss: 0.1064
Epoch 4/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m10s[0m 4ms/step - accuracy: 0.9837 - loss: 0.0538 - val_accuracy: 0.9706 - val_loss: 0.1036
Epoch 5/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m8s[0m 6ms/step - accuracy: 0.9868 - loss: 0.0412 - val_accuracy: 0.9723 - val_loss: 0.0980
Epoch 6/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m9s[0m 4ms/step - accuracy: 0.9890 - loss: 0.0334 - val_accuracy: 0.9685 - val_loss: 0.1117
Epoch 7/10


In [4]:
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Dropout

# Предобработка данных для CNN
X_train_cnn = X_train.values.reshape(-1, 28, 28, 1)
X_test_cnn = X_test.values.reshape(-1, 28, 28, 1)
y_train_cnn = to_categorical(y_train, 10)
y_test_cnn = to_categorical(y_test, 10)

# Создание модели CNN
model_cnn = Sequential([
    Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=(28, 28, 1)),
    MaxPooling2D(pool_size=(2, 2)),
    Dropout(0.25),
    Conv2D(64, kernel_size=(3, 3), activation='relu'),
    MaxPooling2D(pool_size=(2, 2)),
    Dropout(0.25),
    Flatten(),
    Dense(128, activation='relu'),
    Dropout(0.5),
    Dense(10, activation='softmax')
])

# Компиляция и обучение модели CNN
model_cnn.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
model_cnn.fit(X_train_cnn, y_train_cnn, epochs=10, batch_size=32, validation_split=0.2)

# Оценка модели на тестовой выборке
loss_cnn, accuracy_cnn = model_cnn.evaluate(X_test_cnn, y_test_cnn)

print(f'Accuracy of CNN: {accuracy_cnn:.4f}')

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


Epoch 1/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m56s[0m 38ms/step - accuracy: 0.8070 - loss: 0.5895 - val_accuracy: 0.9773 - val_loss: 0.0732
Epoch 2/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m79s[0m 37ms/step - accuracy: 0.9643 - loss: 0.1195 - val_accuracy: 0.9840 - val_loss: 0.0515
Epoch 3/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m50s[0m 35ms/step - accuracy: 0.9739 - loss: 0.0867 - val_accuracy: 0.9858 - val_loss: 0.0455
Epoch 4/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m51s[0m 37ms/step - accuracy: 0.9780 - loss: 0.0737 - val_accuracy: 0.9864 - val_loss: 0.0415
Epoch 5/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m85s[0m 39ms/step - accuracy: 0.9804 - loss: 0.0645 - val_accuracy: 0.9880 - val_loss: 0.0391
Epoch 6/10
[1m1400/1400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m81s[0m 38ms/step - accuracy: 0.9824 - loss: 0.0561 - val_accuracy: 0.9887 - val_loss: 0.0363
Epoc

1. Какие преимущества и недостатки использованных методов вы увидели?

k-NN алгоритм нахождения к ближайших соседей. Прост в использовании (в реализации необходимо задать лишь количество соседей n_neighbors). Однако из-за своей простоты дает посредственную точность и при больших объемах данных медленно работает, т.е. нам необходимо находить расстояния каждой элемента с каждым.
MLP Classificator глубокое машинное обучение. Строит многослойный перцептрон с методом градиентного спуска функции погрешности. Точность хорошая, однако при увеличении входных параметров, количество рассчитываемых весов в многослойной структуре так же увеличивается, как и объем вычислений.
CNN(сверточная нейросеть). Наиболее приспособленная из всех представленных к задачам распознавания изображений. Которая с помощью функций свертки уменьшающие изображения сохраняя важные признаки. Точность выше, чем у двух других.

2. В чем, на ваш взгляд, заключается принципиальная разница между многослойным перцептроном и сверточной нейронной сетью?

Принципиальная разница между многослойным перцептроном и сверточной сетью заключается в том, что сверточная сеть обобщает ряд признаков исходного набора данных и позволяет распознавать более сложные структуры.

3. Какие методы предобработки данных были использованы в этом задании?

Для разделения обучающих и тестовых данных используется функция train_test_split библиотеки sklearn, 20% тестовых и 80% обучающих.