![](http://sigdelta.com/assets/images/sages-sd-logo.png)

# Analiza danych i uczenie maszynowe w Python

Autor notebooka: Jakub Nowacki.

## Obraz

Oprócz danych numerycznych i tekstowych, używa się uczenia maszynowego do klasyfikacji obrazu. Jednym z tradycyjnych zadań klasyfikacji obrazu jest [MINST](https://en.wikipedia.org/wiki/MNIST_database). Dane są dostępne do pobrania za pomocą narzędzi scikit-learn.

In [None]:
import matplotlib.pyplot as plt
from sklearn.datasets import fetch_mldata
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import classification_report
import numpy as np
%matplotlib inline

mnist = fetch_mldata("MNIST original")

mnist.data[0]

In [None]:
np.unique(mnist.target)

Podzielmy dane w sposób tradycyjny.

In [None]:
X, y = mnist.data / 255., mnist.target
X_train, X_test = X[:60000], X[60000:]
y_train, y_test = y[:60000], y[60000:]

Dane są w istocie obrazami w rozmiarze 28 na 28 pikseli i są to liczby od 0 do 9. 

In [None]:
sample_data = np.array([mnist.data[mnist.target == c][np.random.randint(0, 1000)] for c in range(10)])
fig, axes = plt.subplots(3, 3, figsize=(10, 8))
for data, ax in zip(sample_data, axes.ravel()):
    ax.matshow(data.reshape(28, 28), cmap=plt.cm.gray)
    ax.set_xticks(())
    ax.set_yticks(())

### Wielowarstwowy perceptron

Wielowarstwowy perceptron ([multi-layer perceptron (MLP)](http://scikit-learn.org/stable/modules/neural_networks_supervised.html#multi-layer-perceptron)) jest prostą siecią neuronową, która składa się z przynajmniej 3 warstw:

* wejściowej
* ukrytej (których może być wiele)
* wyjściowej

Najczęściej stosowaną funkcją aktywacyjną jest sigmoida w postaci tangensa hyperbolicznego.

![](http://scikit-learn.org/stable/_images/multilayerperceptron_network.png)

MLP stosuje się zarówno do klasyfikacji jak i do regresji, niemniej, przykładzie wykorzystamy [klasyfikator](http://scikit-learn.org/stable/modules/generated/sklearn.neural_network.MLPClassifier.html#sklearn.neural_network.MLPClassifier).

In [None]:
mlp = MLPClassifier(hidden_layer_sizes=(50,), max_iter=10, alpha=1e-4,
                    solver='sgd', verbose=10, tol=1e-4, random_state=1,
                    learning_rate_init=.1)

mlp.fit(X_train, y_train)
print("Training set score: %f" % mlp.score(X_train, y_train))
print("Test set score: %f" % mlp.score(X_test, y_test))
print(classification_report(y_test, mlp.predict(X_test)))

fig, axes = plt.subplots(4, 4, figsize=(10, 8))

vmin, vmax = mlp.coefs_[0].min(), mlp.coefs_[0].max()
for coef, ax in zip(mlp.coefs_[0].T, axes.ravel()):
    ax.matshow(coef.reshape(28, 28), cmap=plt.cm.gray, vmin=.5 * vmin,
               vmax=.5 * vmax)
    ax.set_xticks(())
    ax.set_yticks(())

### Zadanie

1. Zmień ilość warstw ukrytych i ilość neuronów; zobacz jak to wpływa na model.
1. Użyj `GridSearchCV` do przeszukania parametrów modelu.
1. Zmień skalowanie danych i zobacz jak model się zachowuje.
1. Wypróbuj inną metodę rozwiązującą `solver`.