<a href="https://colab.research.google.com/github/MikolajKasprzyk/data_science_bootcamp/blob/main/06_TensorFlow_Keras/02_keras_wprowadzenie.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
%tensorflow_version 2.x
import tensorflow as tf
import numpy as np
import pandas as pd
import plotly.express as px
tf.__version__

Colab only includes TensorFlow 2.x; %tensorflow_version has no effect.


'2.12.0'

# Model sekwencyjny to liniowy stos warstw

In [None]:
# utworzenie instancji klasy Sequential
from tensorflow.keras.models import Sequential

model = Sequential()
print(model)

<keras.engine.sequential.Sequential object at 0x7a87e9a46ad0>


In [None]:
# podastawowym elementami sieci neuronowej są warstwy
# najbardziej podstaowowa warstwa gesto polaczona Dense
from tensorflow.keras.layers import Dense

model.add(Dense(units=4, input_shape=(10,)))
# units to liczba neuronow, input shape to rozmiar danych wejsciowych
# czyli 10 cech to bedzie (10,) jesli to obraz to podajemy jego rozmiar np (28,28)

In [None]:
# podstawowy opis modelu

model.summary()

Model: "sequential_2"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_5 (Dense)             (None, 4)                 44        
                                                                 
Total params: 44
Trainable params: 44
Non-trainable params: 0
_________________________________________________________________


In [None]:
model.add(Dense(units=2))

model.summary()

Model: "sequential_2"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_5 (Dense)             (None, 4)                 44        
                                                                 
 dense_6 (Dense)             (None, 2)                 10        
                                                                 
Total params: 54
Trainable params: 54
Non-trainable params: 0
_________________________________________________________________


### <a name='a1'></a>Funkcje aktywacji
Istotnym elemenem sieci neuronowych jest dobór odpowiednich funkcji aktywacji. Funkcje aktywacji jak sama nazwa wskazuje są odpowiedzialne za aktywowanie odpowiednich neuronów podczas procesu uczenia.

Jeżeli nie określimy podczas dodawania warstwy funkcji aktywacji, domyślnie stosowana jest liniowa funkcja aktywacji, tzn. $a(x)=x$

Warstwa z liniową funkcją aktywacji może uczyć się tylko liniowych przekształceń danych wejściowych. Dlatego stosuje się różne funkcje aktywacji aby rozwiazywać problemy nieliniowe.

[Keras: Funkcje aktywacji](https://keras.io/activations/)

In [None]:
from tensorflow.keras.activations import linear # domyslna funkcja aktywacji

random_data = np.linspace(start=-3, stop=3, num=300)
data = pd.DataFrame({'data': random_data, 'linear': linear(random_data)})
data.head()

# ta funcja w sumie nic nie robi, zwraca to samo

Unnamed: 0,data,linear
0,-3.0,-3.0
1,-2.979933,-2.979933
2,-2.959866,-2.959866
3,-2.939799,-2.939799
4,-2.919732,-2.919732


In [None]:
px.line(data, x=data['data'], y=data['linear'],width=500, height=400)

In [None]:
from tensorflow.keras.activations import sigmoid # popularna funkcja w ostanich warstwach jesli chcemy zwracac prawdopodobienstwo

random_data = np.linspace(start=-3, stop=3, num=300)
data = pd.DataFrame({'data': random_data, 'sigmoid': sigmoid(random_data)})
print(data.head())

# ta funcja w sumie nic nie robi, zwraca to samo

px.line(data, x=data['data'], y=data['sigmoid'],width=500, height=400)

       data   sigmoid
0 -3.000000  0.047426
1 -2.979933  0.048341
2 -2.959866  0.049272
3 -2.939799  0.050221
4 -2.919732  0.051187


In [None]:
from tensorflow.keras.activations import relu # zeruje wartosci ujemne, radzi sobie z nieliniowoscia

random_data = np.linspace(start=-3, stop=3, num=300)
data = pd.DataFrame({'data': random_data, 'relu': relu(random_data)})
print(data.head())

# ta funcja w sumie nic nie robi, zwraca to samo

px.line(data, x=data['data'], y=data['relu'],width=500, height=400)

       data  relu
0 -3.000000   0.0
1 -2.979933   0.0
2 -2.959866   0.0
3 -2.939799   0.0
4 -2.919732   0.0


In [None]:
from tensorflow.keras.activations import tanh # jak sigmoid sobie nie radzi to moze byc dobre zastepstwo

random_data = np.linspace(start=-3, stop=3, num=300)
data = pd.DataFrame({'data': random_data, 'tanh': tanh(random_data)})
print(data.head())

# ta funcja w sumie nic nie robi, zwraca to samo

px.line(data, x=data['data'], y=data['tanh'],width=500, height=400)

       data      tanh
0 -3.000000 -0.995055
1 -2.979933 -0.994853
2 -2.959866 -0.994643
3 -2.939799 -0.994424
4 -2.919732 -0.994196


# Tworzymy nowy model

In [None]:
model = Sequential()
model.add(Dense(units=8, activation='relu', input_shape=(10,)))
model.add(Dense(units=1, activation='sigmoid')) # jedna klasa do przewidzenia czyli klasyfikacja binarna
model.summary()

Model: "sequential_3"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_7 (Dense)             (None, 8)                 88        
                                                                 
 dense_8 (Dense)             (None, 1)                 9         
                                                                 
Total params: 97
Trainable params: 97
Non-trainable params: 0
_________________________________________________________________


<a name='a2'></a>Kompilacja modelu
Przed rozpoczęciem trenowania sieci należy odpowiednio skonfigurować proces uczenia. W tym kroku określamy:
* rodzaj optymalizatora ([Keras - Optymalizatory](https://keras.io/optimizers/))
* funkcję straty ([Keras - Funkcje Straty](https://keras.io/losses/))
* metryki, które będziemy obserwować podczas trenowania sieci ([Keras - Metryki](https://keras.io/metrics/))

In [None]:
# klasyfikacja binarna
model.compile(optimizer='rmsprop',
              loss='binary_crossentropy',
              metrics=['accuracy'])

# klasyfikacja wieloklasowa
model.compile(optimizer='rmsprop',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# regresja
model.compile(optimizer='rmsprop',
              loss='mse') # metryka tu bedzie tez mse

### <a name='a3'></a>Trenowanie modelu
Za dane wejściowe do modelu należy przekazać Numpy arrays:
* **epochs** - krotność przejścia danych przez sieć w procesie uczenia
* **batch_size** - rozmiar wsadu po którym następuje aktualizacja wag
* **validation_split** - część danych treningowych, które zostaną wykorzystane jako zbiór walidacyjny, dzieki temu widac przy uczeniu modelu jak zachowuje sie z danymi których nie widział
* **validation_data** - (x_val, y_val) - dane wykorzystane do walidacji modelu, juz na gotowym zbiorze danych walidacyjnych

In [None]:
# model.fit(data, labels, epochs=10, batch_size=32)
# model.fit(data, labels, epochs=10, batch_size=32, validation_split=0.2)
# model.fit(data, labels, epochs=10, batch_size=32, validation_data=(x_val, y_val))

### <a name='a4'></a> Przykład - klasyfikacja binarna

In [None]:
data = np.random.randn(10000, 150) # 10000 samples, 150 columns
labels = np.random.randint(2, size=(10000, 1))

print(data.shape)
print(labels.shape)

(10000, 150)
(10000, 1)


In [None]:
data[:3]

In [None]:
model = Sequential()
model.add(Dense(units=32, activation='relu', input_shape=(150,)))
model.add(Dense(1, activation='sigmoid')) # jedna klasa do przewidzenia, chcemy prawdopodobienstwa sad sigmoid
model.compile(optimizer='rmsprop', loss='binary_crossentropy',
              metrics=['accuracy'])
model.fit(data, labels, epochs=20)

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<keras.callbacks.History at 0x7a87d557b0a0>

In [None]:
# dodawanie kolejnych parametrow
model.fit(data, labels, epochs=20, batch_size=64)


Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<keras.callbacks.History at 0x7a87d2343130>

In [None]:
# model = Sequential()
model.add(Dense(units=32, activation='relu', input_shape=(150,)))
model.add(Dense(1, activation='sigmoid')) # jedna klasa do przewidzenia, chcemy prawdopodobienstwa sad sigmoid
model.compile(optimizer='rmsprop', loss='binary_crossentropy',
              metrics=['accuracy'])
# tu dostajemy tez accuracy i loss na zbiorze walidacyjnym co jest bardziej miarodajne niz na danych trningowych
# tu jako ze dane sa losowe widac ze accuracy poprawia sie na zbiorze treningowym ale na walidacyjnym nie
# wiec mozna sie spodziewac ze taki model jest nie dzialajacy
model.fit(data, labels, epochs=20, batch_size=32, validation_split=0.2)

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<keras.callbacks.History at 0x7a87d22c8700>

In [None]:
model = Sequential()
model.add(Dense(units=32, activation='relu', input_shape=(150,)))
model.add(Dense(1, activation='sigmoid')) # jedna klasa do przewidzenia, chcemy prawdopodobienstwa sad sigmoid
model.compile(optimizer='rmsprop', loss='binary_crossentropy',
              metrics=['accuracy'])
# nie wyswieltamy tekstu podczas trenowania
model.fit(data, labels, epochs=20, batch_size=32, validation_split=0.2, verbose=0)

<keras.callbacks.History at 0x7a87d51bb730>

In [None]:
# takie modele zwracaja obiekt keras.callbacks.History ktory mozna przpisac do zmiennej
model = Sequential()
model.add(Dense(units=32, activation='relu', input_shape=(150,)))
model.add(Dense(1, activation='sigmoid')) # jedna klasa do przewidzenia, chcemy prawdopodobienstwa sad sigmoid
model.compile(optimizer='rmsprop', loss='binary_crossentropy',
              metrics=['accuracy'])
# nie wyswieltamy tekstu podczas trenowania
history = model.fit(data, labels, epochs=20, batch_size=32, validation_split=0.2, verbose=0)
# teraz do danych z trenowania mozna dostac sie przez ta zmienna

In [None]:
history.history # w atrybucie history sa zaoisane dane z trenowania

{'loss': [0.7545412182807922,
  0.6917606592178345,
  0.6703227758407593,
  0.6528350114822388,
  0.6380449533462524,
  0.6219736933708191,
  0.6071222424507141,
  0.5917048454284668,
  0.5756685137748718,
  0.5608251690864563,
  0.5467976927757263,
  0.5322830080986023,
  0.5191525220870972,
  0.506120502948761,
  0.4933156371116638,
  0.48157644271850586,
  0.47018855810165405,
  0.45914801955223083,
  0.44859495759010315,
  0.43933430314064026],
 'accuracy': [0.5051249861717224,
  0.5566250085830688,
  0.5853750109672546,
  0.6131250262260437,
  0.6388750076293945,
  0.6620000004768372,
  0.675000011920929,
  0.6977499723434448,
  0.7124999761581421,
  0.7237499952316284,
  0.7310000061988831,
  0.7463750243186951,
  0.7543749809265137,
  0.7647500038146973,
  0.768875002861023,
  0.7757499814033508,
  0.7871249914169312,
  0.7892500162124634,
  0.7921249866485596,
  0.8017500042915344],
 'val_loss': [0.7215569615364075,
  0.719264805316925,
  0.7203945517539978,
  0.723952531814575

In [None]:
# takie modele zwracaja obiekt keras.callbacks.History ktory mozna przpisac do zmiennej
model = Sequential()
model.add(Dense(units=32, activation='relu', input_shape=(150,)))
model.add(Dense(1, activation='sigmoid')) # jedna klasa do przewidzenia, chcemy prawdopodobienstwa sad sigmoid
model.compile(optimizer='rmsprop', loss='binary_crossentropy',
              metrics=['accuracy'])
# nie wyswieltamy tekstu podczas trenowania
history = model.fit(data, labels, epochs=20, batch_size=32, validation_split=0.2, verbose=1)
# teraz do danych z trenowania mozna dostac sie przez ta zmienna

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


In [None]:
test_data = np.random.randn(5, 150)
test_labels = np.random.randint(2, size=(5,1))

In [None]:
model.predict(test_data)



array([[0.61694264],
       [0.6943955 ],
       [0.5675323 ],
       [0.11363933],
       [0.37193477]], dtype=float32)

# Klasyfikacja wieloklasowa

In [None]:
data = np.random.randn(10000, 150) # 10000 samples, 150 columns
labels = np.random.randint(10, size=(10000, 1)) # tutaj mamy 10 klas do przewidzenia

print(data.shape)
print(labels.shape)

(10000, 150)
(10000, 1)


In [None]:
labels[:10]

array([[1],
       [1],
       [6],
       [1],
       [4],
       [7],
       [3],
       [5],
       [7],
       [7]])

In [None]:
# tworzy z kazdej klasy odpowiednio kolumne i przypisuje 1 w miejscu odpowiadajacym klasie
from tensorflow.keras.utils import to_categorical
labels = to_categorical(labels, num_classes=10)
labels

array([[0., 1., 0., ..., 0., 0., 0.],
       [0., 1., 0., ..., 0., 0., 0.],
       [0., 0., 0., ..., 0., 0., 0.],
       ...,
       [0., 0., 1., ..., 0., 0., 0.],
       [0., 0., 0., ..., 0., 0., 1.],
       [0., 0., 0., ..., 1., 0., 0.]], dtype=float32)

In [None]:
labels[1] #index 1 - klasa 1

array([0., 1., 0., 0., 0., 0., 0., 0., 0., 0.], dtype=float32)

In [None]:
model = Sequential()
model.add(Dense(units=32, activation='relu', input_shape=(150,)))
model.add(Dense(10, activation='softmax'))
# 10 klas do przewidzenia, chcemy prawdopodobienstwa i jest softmax

model.compile(optimizer='rmsprop', loss='categorical_crossentropy',
              metrics=['accuracy'])

model.fit(data, labels, batch_size=32, epochs=30, validation_split=0.2)

Epoch 1/30
Epoch 2/30
Epoch 3/30
Epoch 4/30
Epoch 5/30
Epoch 6/30
Epoch 7/30
Epoch 8/30
Epoch 9/30
Epoch 10/30
Epoch 11/30
Epoch 12/30
Epoch 13/30
Epoch 14/30
Epoch 15/30
Epoch 16/30
Epoch 17/30
Epoch 18/30
Epoch 19/30
Epoch 20/30
Epoch 21/30
Epoch 22/30
Epoch 23/30
Epoch 24/30
Epoch 25/30
Epoch 26/30
Epoch 27/30
Epoch 28/30
Epoch 29/30
Epoch 30/30


<keras.callbacks.History at 0x7a87d4e38fa0>

In [None]:
test_data = np.random.random((10,150))
test_data

array([[0.41262391, 0.32577614, 0.31161635, ..., 0.40710442, 0.50107294,
        0.74723279],
       [0.73995862, 0.3417131 , 0.41225676, ..., 0.09906019, 0.17496678,
        0.46060977],
       [0.03575729, 0.418204  , 0.94223411, ..., 0.78281068, 0.86934358,
        0.59294551],
       ...,
       [0.78529396, 0.82106605, 0.31580102, ..., 0.65562953, 0.52299584,
        0.18896786],
       [0.73688068, 0.50214931, 0.53107982, ..., 0.18891377, 0.72744301,
        0.46264225],
       [0.40904646, 0.43945995, 0.25989162, ..., 0.59846135, 0.31149513,
        0.36298992]])

In [None]:
y_pred = model.predict(test_data) # zwraca prawdopodobienstwa dla danej klasy



In [None]:
y_pred_class = np.argmax(y_pred, axis=1)
y_pred_class

array([6, 3, 2, 3, 3, 3, 3, 3, 2, 6])

# Regresja

In [None]:
data = np.random.random((10000, 150))
labels = 50 * np.random.random(10000)

print(data.shape)
print(labels.shape)

(10000, 150)
(10000,)


In [None]:
model = Sequential()
model.add(Dense(units=32, activation='relu', input_shape=(150,)))
model.add(Dense(units=1)) # przy prsewidywaniu ciaglych dajemy tu 1, aktywacja domyslnie liniowa

model.compile(optimizer='rmsprop', loss='mse') # metryka domyslnie taka sama mse

model.fit(data, labels, epochs=30, batch_size=32, validation_split=0.2)

Epoch 1/30
Epoch 2/30
Epoch 3/30
Epoch 4/30
Epoch 5/30
Epoch 6/30
Epoch 7/30
Epoch 8/30
Epoch 9/30
Epoch 10/30
Epoch 11/30
Epoch 12/30
Epoch 13/30
Epoch 14/30
Epoch 15/30
Epoch 16/30
Epoch 17/30
Epoch 18/30
Epoch 19/30
Epoch 20/30
Epoch 21/30
Epoch 22/30
Epoch 23/30
Epoch 24/30
Epoch 25/30
Epoch 26/30
Epoch 27/30
Epoch 28/30
Epoch 29/30
Epoch 30/30


<keras.callbacks.History at 0x7a87d5103760>

In [None]:
model = Sequential()
model.add(Dense(units=32, activation='relu', input_shape=(150,)))
model.add(Dense(units=1)) # przy prsewidywaniu ciaglych dajemy tu 1, aktywacja domyslnie liniowa

model.compile(optimizer='rmsprop', loss='mae', metrics=['mse'])

model.fit(data, labels, epochs=10, batch_size=32, validation_split=0.2)
# tu widzimy i funkcje straty i metrics

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x7a87d4eecb80>