<a href="https://colab.research.google.com/github/Sylwiaes/machine-learning-bootcamp/blob/main/07_uczenie_glebokie/02_keras.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

* @author: krakowiakpawel9@gmail.com  
* @site: e-smartdata.org

### Tensorflow
>Strona biblioteki: [https://www.tensorflow.org/](https://www.tensorflow.org/)  
>Dokumentacja: [https://www.tensorflow.org/api_docs](https://www.tensorflow.org/api_docs)  
>
>Szybko rozwijająca się biblioteka do uczenia maszynowego i uczenia głębokiego rozwijana przez Google.
>
>Aby zainstalować bibliotekę tensorflow, użyj polecenia poniżej:
```
pip install tensorflow
```

### Keras
>Strona biblioteki: [https://keras.io/](https://keras.io/)  
>
>Wysokopoziomowy interfejs do budowy sieci neuronowych. Działa zarówno na Tensorflow, Theano oraz CNTK.
>
>Aby zainstalować bibliotekę keras, użyj polecenia poniżej:
```
pip install keras
```

### Model sekwencjny (Sequential Model):
1. [Wprowadzenie - pierwszy model](#a0)
2. [Funkcje aktywacji](#a1)
3. [Kompilacja modelu](#a2)
4. [Trenowanie modelu](#a3)
5. [Przykład - klasyfikacja binarna](#a4)
6. [Przykład - klasyfikacja wieloklasowa](#a5)
7. [Przykład - regresja](#a6)



Załadowanie biblioteki tensorflow


In [None]:
%tensorflow_version 2.x
import tensorflow as tf
import numpy as np
import pandas as pd
import plotly.express as px
tf.__version__

'2.5.0'

### <a name='a0'></a>Wprowadzenie - pierwszy model
Model sekwencyjny to nic innego jak liniowy stos warstw.

In [None]:
# utworzenie instancji klasy Sequential; klasa polega na budowaniu kolejnych warstw
from tensorflow.keras.models import Sequential

model = Sequential()
print(model)

<tensorflow.python.keras.engine.sequential.Sequential object at 0x7f4dc1fe3310>


Podstawowym elementem składowym modelu są warstwy. Aby dodać najbardziej standardową warstwę - warstwę gęsto połączoną należy użyć warstwy **Dense**. Aby dodać warstwę do modelu należy użyć metody *.add()*

In [None]:
from tensorflow.keras.layers import Dense

model.add(Dense(units=4, input_shape=(10,))) #w 1 warstwie dodajemy parametr input_shape z wartością zmiennych opisujących naszą zmienną docelową 

Wyświetlenie podsumowania modelu: metoda *.summary()*

In [None]:
model.summary() #wyswietlamy informacje o modelu

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 4)                 44        
Total params: 44
Trainable params: 44
Non-trainable params: 0
_________________________________________________________________


Dodanie kolejnej warstwy

In [None]:
model.add(Dense(units=2))

model.summary()
#obliczenie Param-bierzemy kształt wyjściowej 1 warstwy=4, dodajemy 1 i mnożymy przez kształt warstwy 2

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 4)                 44        
_________________________________________________________________
dense_1 (Dense)              (None, 2)                 10        
Total params: 54
Trainable params: 54
Non-trainable params: 0
_________________________________________________________________


### <a name='a1'></a>Funkcje aktywacji
Istotnym elemenem sieci neuronowych jest dobór odpowiednich funkcji aktywacji. Funkcje aktywacji jak sama nazwa wskazuje są odpowiedzialne za aktywowanie odpowiednich neuronów podczas procesu uczenia.

Jeżeli nie określimy podczas dodawania warstwy funkcji aktywacji, domyślnie stosowana jest liniowa funkcja aktywacji, tzn. $a(x)=x$

Warstwa z liniową funkcją aktywacji może uczyć się tylko liniowych przekształceń danych wejściowych. Dlatego stosuje się różne funkcje aktywacji aby rozwiazywać problemy nieliniowe.

[Keras: Funkcje aktywacji](https://keras.io/activations/)

In [None]:
from tensorflow.keras.activations import linear #jesli nie stosujemy żadnej warstwy, to będzie stosowana domyślnie funkcja liniowa

random_data = np.linspace(start=-3, stop=3, num=300)
data = pd.DataFrame({'data': random_data, 'linear': linear(random_data)})
data.head()

Unnamed: 0,data,linear
0,-3.0,-3.0
1,-2.979933,-2.979933
2,-2.959866,-2.959866
3,-2.939799,-2.939799
4,-2.919732,-2.919732


In [None]:
px.line(data, x='data', y='linear', width=500, height=400, range_y=[-3, 3])

In [None]:
from tensorflow.keras.activations import sigmoid

data = pd.DataFrame({'data': random_data, 'sigmoid': sigmoid(random_data)})
data.head()

Unnamed: 0,data,sigmoid
0,-3.0,0.047426
1,-2.979933,0.048341
2,-2.959866,0.049272
3,-2.939799,0.050221
4,-2.919732,0.051187


In [None]:
px.line(data, x='data', y='sigmoid', width=500, height=400, range_y=[-0.5, 1.5])

In [None]:
from tensorflow.keras.activations import relu #funkcja relu zeruje wartości ujemne
#funkcja relu pozwala poprawić działanie sieci neuronowej i pozwala pracować z problemami nieliniowymi

data = pd.DataFrame({'data': random_data, 'relu': relu(random_data)})
data.head()

Unnamed: 0,data,relu
0,-3.0,0.0
1,-2.979933,0.0
2,-2.959866,0.0
3,-2.939799,0.0
4,-2.919732,0.0


In [None]:
px.line(data, x='data', y='relu', width=500, height=400, range_y=[-0.5, 1.5])

In [None]:
from tensorflow.keras.activations import tanh #funkcja tangensa hiperbolicznego, stosowana jako zamiennik do funkcji sigmoid lub relu, w przypadku, gdy nie radzą sobie z problemem

data = pd.DataFrame({'data': random_data, 'tanh': tanh(random_data)})
data.head()

Unnamed: 0,data,tanh
0,-3.0,-0.995055
1,-2.979933,-0.994853
2,-2.959866,-0.994643
3,-2.939799,-0.994424
4,-2.919732,-0.994196


In [None]:
px.line(data, x='data', y='tanh', width=500, height=400, range_y=[-1.5, 1.5])

In [None]:
model = Sequential()
model.add(Dense(units=8, activation='relu', input_shape=(10,)))
model.add(Dense(units=1, activation='sigmoid'))
model.summary()

Model: "sequential_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_2 (Dense)              (None, 8)                 88        
_________________________________________________________________
dense_3 (Dense)              (None, 1)                 9         
Total params: 97
Trainable params: 97
Non-trainable params: 0
_________________________________________________________________


### <a name='a2'></a>Kompilacja modelu
Przed rozpoczęciem trenowania sieci należy odpowiednio skonfigurować proces uczenia. W tym kroku określamy:
* rodzaj optymalizatora ([Keras - Optymalizatory](https://keras.io/optimizers/)) - minimalizuje funkcję straty
* funkcję straty ([Keras - Funkcje Straty](https://keras.io/losses/))
* metryki, które będziemy obserwować podczas trenowania sieci ([Keras - Metryki](https://keras.io/metrics/)) - najczęście stosowana metryka to accuracy

In [None]:
# klasyfikacja binarna
model.compile(optimizer='rmsprop',
              loss='binary_crossentropy',
              metrics=['accuracy'])

# klasyfikacja wieloklasowa
model.compile(optimizer='rmsprop',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# regresja
model.compile(optimizer='rmsprop',
              loss='mse')

### <a name='a3'></a>Trenowanie modelu
Za dane wejściowe do modelu należy przekazać Numpy arrays:
* **epochs** - krotność przejścia danych przez sieć w procesie uczenia
* **batch_size** - rozmiar wsadu po którym następuje aktualizacja wag, domyślna wartość=32
* **validation_split** - część danych treningowych, które zostaną wykorzystane jako zbiór walidacyjny; ustalony opcjonalnie, ale warto go dodać, bo widzimy jak nasz model działa na danych, których nie widział; domyślnie to wartość 0.2 oznacza, że będziemy mieć 20% danych przeznaczonych na zbiór walidacyjny
* **validation_data** - (x_val, y_val) - dane wykorzystane do walidacji modelu

In [None]:
# model.fit(data, labels, epochs=10, batch_size=32)
# model.fit(data, labels, epochs=10, batch_size=32, validation_split=0.2)
# model.fit(data, labels, epochs=10, batch_size=32, validation_data=(x_val, y_val))

### <a name='a4'></a> Przykład - klasyfikacja binarna

In [None]:
data = np.random.randn(10000, 150) #10000 próbek i 150 danych niezależnych
labels = np.random.randint(2, size=(10000, 1))

print(data.shape)
print(labels.shape)

(10000, 150)
(10000, 1)


In [None]:
data[:3]

In [None]:
labels[:10]

array([[0],
       [0],
       [1],
       [1],
       [0],
       [0],
       [1],
       [0],
       [0],
       [0]])

In [None]:
model = Sequential() #budujemy instancję modelu
model.add(Dense(units=32, activation='relu', input_shape=(150,))) #wrzucamy 1 warstwę z 32 neuronami
model.add(Dense(1, activation='sigmoid')) #w ostatniej warstwie mamy 1 neuron; funkcja sigmoid zwróci nam prawdopodobieństwa klas

model.compile(optimizer='rmsprop',    #kompilacja modelu
              loss='binary_crossentropy',
              metrics=['accuracy'])

model.fit(data, labels, epochs=20) #dane przejdą 20 razy przez sieć

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<tensorflow.python.keras.callbacks.History at 0x7f4dbc73c150>

In [None]:
model = Sequential()
model.add(Dense(units=32, activation='relu', input_shape=(150,)))
model.add(Dense(1, activation='sigmoid'))

model.compile(optimizer='rmsprop',
              loss='binary_crossentropy',
              metrics=['accuracy'])

model.fit(data, labels, epochs=20, batch_size=64) #dodajemy parametr batch_size, czyli liczba wsadów, czyli aktualizujemy wagi co 64 próbki, wcześniej był to domyślnie 32

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<tensorflow.python.keras.callbacks.History at 0x7f4dbbe0f9d0>

In [None]:
model = Sequential()
model.add(Dense(units=32, activation='relu', input_shape=(150,)))
model.add(Dense(1, activation='sigmoid'))

model.compile(optimizer='rmsprop',
              loss='binary_crossentropy',
              metrics=['accuracy'])

model.fit(data, labels, epochs=20, batch_size=32, validation_split=0.2) #dodajemy parametr validation_split
#z poniższego wygenerowania widać, że accuracy na zbiorze treningowym się poprawia, ale na zbiorze walidacyjnym pogarsza

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<tensorflow.python.keras.callbacks.History at 0x7f4dbca41190>

In [None]:
model = Sequential()
model.add(Dense(units=32, activation='relu', input_shape=(150,)))
model.add(Dense(1, activation='sigmoid'))

model.compile(optimizer='rmsprop',
              loss='binary_crossentropy',
              metrics=['accuracy'])

history = model.fit(data, labels, epochs=20, batch_size=32, validation_split=0.2, verbose=0) #dodanie parametru verbose-pozwala na wyświetlenie finalnego tekstu
history 

<tensorflow.python.keras.callbacks.History at 0x7f4dbbeb07d0>

In [None]:
metrics = history.history
metrics.keys()

dict_keys(['loss', 'accuracy', 'val_loss', 'val_accuracy'])

In [None]:
model = Sequential()
model.add(Dense(units=32, activation='relu', input_shape=(150,)))
model.add(Dense(1, activation='sigmoid'))

model.compile(optimizer='rmsprop',
              loss='binary_crossentropy',
              metrics=['accuracy'])

history = model.fit(data, labels, epochs=20, batch_size=32, validation_split=0.2, verbose=1) #użycie parametru verbose=1

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


In [None]:
test_data = np.random.randn(5, 150)
test_labels = np.random.randint(2, size=(5, 1))

In [None]:
model.predict(test_data) #funkcja predict pokazuje nam prawdopodobieństwo danej klasy i w zależności, czy prawdopod. jest bliżej 1, czy 0, to przypisujemy tę klasę

array([[0.78603625],
       [0.38159966],
       [0.8606045 ],
       [0.24683797],
       [0.10432845]], dtype=float32)

In [None]:
model.predict_proba(test_data) #identyczna funkcja do powyższej


`model.predict_proba()` is deprecated and will be removed after 2021-01-01. Please use `model.predict()` instead.



array([[0.78603625],
       [0.38159966],
       [0.8606045 ],
       [0.24683797],
       [0.10432845]], dtype=float32)

In [None]:
model.predict_classes(test_data) #zwraca konkretne klasy


`model.predict_classes()` is deprecated and will be removed after 2021-01-01. Please use instead:* `np.argmax(model.predict(x), axis=-1)`,   if your model does multi-class classification   (e.g. if it uses a `softmax` last-layer activation).* `(model.predict(x) > 0.5).astype("int32")`,   if your model does binary classification   (e.g. if it uses a `sigmoid` last-layer activation).



array([[1],
       [0],
       [1],
       [0],
       [0]], dtype=int32)

### <a name='a5'></a> Przykład - klasyfikacja wieloklasowa

In [None]:
data = np.random.random((10000, 150))
labels = np.random.randint(10, size=(10000, 1))

In [None]:
print(data.shape)
print(labels.shape)

(10000, 150)
(10000, 1)


In [None]:
labels[:10]

array([[7],
       [9],
       [5],
       [8],
       [0],
       [7],
       [7],
       [0],
       [8],
       [1]])

In [None]:
from tensorflow.keras.utils import to_categorical #funkcja, która konwertuje klasy do tablicy numpy; wartość 1 będzie pojawiać się na miejscu w zależności od powyższej klasy labels
labels = to_categorical(labels, num_classes=10)
labels

array([[0., 0., 0., ..., 1., 0., 0.],
       [0., 0., 0., ..., 0., 0., 1.],
       [0., 0., 0., ..., 0., 0., 0.],
       ...,
       [0., 0., 0., ..., 0., 0., 0.],
       [0., 1., 0., ..., 0., 0., 0.],
       [0., 1., 0., ..., 0., 0., 0.]], dtype=float32)

In [None]:
labels[1]

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 1.], dtype=float32)

In [None]:
model = Sequential()
model.add(Dense(units=32, activation='relu', input_shape=(150,)))
model.add(Dense(units=10, activation='softmax')) #dodajemy tyle neuronów, ile mamy klas

model.compile(optimizer='rmsprop',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

model.fit(data, labels, batch_size=32, epochs=30, validation_split=0.2)

Epoch 1/30
Epoch 2/30
Epoch 3/30
Epoch 4/30
Epoch 5/30
Epoch 6/30
Epoch 7/30
Epoch 8/30
Epoch 9/30
Epoch 10/30
Epoch 11/30
Epoch 12/30
Epoch 13/30
Epoch 14/30
Epoch 15/30
Epoch 16/30
Epoch 17/30
Epoch 18/30
Epoch 19/30
Epoch 20/30
Epoch 21/30
Epoch 22/30
Epoch 23/30
Epoch 24/30
Epoch 25/30
Epoch 26/30
Epoch 27/30
Epoch 28/30
Epoch 29/30
Epoch 30/30


<tensorflow.python.keras.callbacks.History at 0x7f4dbcda4a90>

In [None]:
test_data = np.random.random((10, 150))

model.predict(test_data) #tam, gdzie prawdopodobieństwo będzie maksymalne, tam będzie nasza etykieta

array([[0.06440148, 0.05232339, 0.12625988, 0.12429369, 0.08980099,
        0.10967834, 0.13849577, 0.11009382, 0.09001628, 0.09463636],
       [0.11406983, 0.10864137, 0.10551243, 0.11036746, 0.09602603,
        0.06573106, 0.11372243, 0.09847464, 0.1092097 , 0.07824507],
       [0.16929969, 0.1948275 , 0.10558943, 0.11020967, 0.04946987,
        0.0525309 , 0.08560979, 0.08562473, 0.07357266, 0.07326572],
       [0.12289037, 0.07078976, 0.11899021, 0.05263653, 0.08295916,
        0.15647534, 0.08808529, 0.06708514, 0.1357374 , 0.10435077],
       [0.1535669 , 0.1412117 , 0.09607241, 0.07167321, 0.09187589,
        0.1234692 , 0.08570006, 0.14989997, 0.03326533, 0.05326533],
       [0.1046429 , 0.08695292, 0.13640529, 0.11639301, 0.06385175,
        0.09680387, 0.10870943, 0.11176197, 0.07263844, 0.10184035],
       [0.05852167, 0.10281017, 0.10081221, 0.14451665, 0.10252757,
        0.04582871, 0.19748726, 0.08656445, 0.13065286, 0.0302784 ],
       [0.07701448, 0.10776655, 0.0664231

In [None]:
model.predict_classes(test_data) 


`model.predict_classes()` is deprecated and will be removed after 2021-01-01. Please use instead:* `np.argmax(model.predict(x), axis=-1)`,   if your model does multi-class classification   (e.g. if it uses a `softmax` last-layer activation).* `(model.predict(x) > 0.5).astype("int32")`,   if your model does binary classification   (e.g. if it uses a `sigmoid` last-layer activation).



array([6, 0, 1, 5, 0, 2, 6, 8, 6, 0])

### <a name='a6'></a> Przykład - regresja

In [None]:
data = np.random.random((10000, 150))
labels = 50 * np.random.random(10000)

In [None]:
labels[:10]

array([18.70666695, 19.88601801, 45.7715002 , 44.70766776, 14.43237131,
        8.97566539,  5.59726128, 34.41694501, 40.45244519, 26.87133692])

In [None]:
model = Sequential()
model.add(Dense(units=32, activation='relu', input_shape=(150,)))
model.add(Dense(units=1))

model.compile(optimizer='rmsprop',
              loss='mse') #funkcja straty średniogo błędu kwadratowego

model.fit(data, labels, epochs=30, batch_size=32, validation_split=0.2)

Epoch 1/30
Epoch 2/30
Epoch 3/30
Epoch 4/30
Epoch 5/30
Epoch 6/30
Epoch 7/30
Epoch 8/30
Epoch 9/30
Epoch 10/30
Epoch 11/30
Epoch 12/30
Epoch 13/30
Epoch 14/30
Epoch 15/30
Epoch 16/30
Epoch 17/30
Epoch 18/30
Epoch 19/30
Epoch 20/30
Epoch 21/30
Epoch 22/30
Epoch 23/30
Epoch 24/30
Epoch 25/30
Epoch 26/30
Epoch 27/30
Epoch 28/30
Epoch 29/30
Epoch 30/30


<tensorflow.python.keras.callbacks.History at 0x7f4db3730c50>

In [None]:
model = Sequential()
model.add(Dense(units=32, activation='relu', input_shape=(150,)))
model.add(Dense(units=1))

model.compile(optimizer='rmsprop',
              loss='mae',
              metrics=['mse'])

model.fit(data, labels, epochs=10, batch_size=32, validation_split=0.2)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<tensorflow.python.keras.callbacks.History at 0x7f4db2df5790>

In [None]:
test_data = np.random.random((10, 150))

model.predict(test_data)

array([[25.710756],
       [24.376913],
       [22.324171],
       [24.472927],
       [21.625185],
       [25.945913],
       [27.040735],
       [22.436934],
       [24.231878],
       [25.026926]], dtype=float32)