In [1]:
%matplotlib inline


# Визуализация весов MLP на MNIST


Иногда, глядя на изученные коэффициенты нейронной сети, можно получить представление о поведении обучения. Например, если веса выглядят неструктурированными, возможно, некоторые из них вообще не использовались, или если существуют очень большие коэффициенты, возможно, регуляризация была слишком низкой или скорость обучения слишком высокой.

В этом примере показано, как построить некоторые веса первого слоя в классификаторе MLP, обученном на базе набора данных MNIST.

Входные данные состоят из 28x28 пикселей рукописных цифр, что приводит к 784 объектам в наборе данных. Поэтому матрица весов первого слоя имеет форму (784, hidden_layer_sizes[0]).  Таким образом мы можем визуализировать один столбец весовой матрицы в виде изображения размером 28х28 пикселей.

Чтобы этот пример работал быстрее, мы используем очень мало скрытых единиц и тренируем только в течение очень короткого времени. Длительность обучения приведет к увеличению веса с более плавным пространственным видом.



In [2]:
import matplotlib.pyplot as plt
from sklearn.datasets import fetch_openml
from sklearn.neural_network import MLPClassifier

print(__doc__)

# Load data from https://www.openml.org/d/554
X, y = fetch_openml('mnist_784', version=1, return_X_y=True)
X = X / 255.

# rescale the data, use the traditional train/test split
X_train, X_test = X[:60000], X[60000:]
y_train, y_test = y[:60000], y[60000:]

# mlp = MLPClassifier(hidden_layer_sizes=(100, 100), max_iter=400, alpha=1e-4,
#                     solver='sgd', verbose=10, tol=1e-4, random_state=1)
mlp = MLPClassifier(hidden_layer_sizes=(50,), max_iter=10, alpha=1e-4,
                    solver='sgd', verbose=10, tol=1e-4, random_state=1,
                    learning_rate_init=.1)

mlp.fit(X_train, y_train)
print("Training set score: %f" % mlp.score(X_train, y_train))
print("Test set score: %f" % mlp.score(X_test, y_test))

fig, axes = plt.subplots(4, 4)
# use global min / max to ensure all weights are shown on the same scale
vmin, vmax = mlp.coefs_[0].min(), mlp.coefs_[0].max()
for coef, ax in zip(mlp.coefs_[0].T, axes.ravel()):
    ax.matshow(coef.reshape(28, 28), cmap=plt.cm.gray, vmin=.5 * vmin,
               vmax=.5 * vmax)
    ax.set_xticks(())
    ax.set_yticks(())

plt.show()

ImportError: cannot import name 'fetch_openml' from 'sklearn.datasets' (C:\ProgramData\Anaconda3\lib\site-packages\sklearn\datasets\__init__.py)